Я провел довольно много исследований, но я не могу понять точную связь между 3. Кроме того, теперь, когда W3C официально признал RDFa, вы бы рекомендовали его вместо микроданных, принимая во внимание, что он соответствует функциям микроданных и многое другое?
Какая связь между RDF, RDFa, микроформатами и микроданными
Ответы (3)
‹сарказм>Не могу представить, что вас так сбивает с толку‹/сарказм> (изменить: раньше эти теги были невидимы)
Очень кратко:
- Микроформаты Способ использования html-страниц в качестве удобочитаемого документа и машиночитаемых данных без повторения (например, вставка CSV в элемент заголовка) .
- RDF Модель данных, разработанная для Интернета. Без схемы, использует URL-адреса для именования типов и отношений.
- RDFa Способ кодирования (записи) RDF в формате html, следуя стилю микроформатов (т. е. сводя к минимуму повторения). Работает путем добавления нескольких атрибутов в html.
- Микроданные Альтернатива RDFa, использующая другие атрибуты и другую модель данных.
Короче говоря, RDF появился в результате попыток сделать данные «паутинными». Был даже плагин для просмотра предшественника RDF MCF (любопытно, что от Apple). Модель данных была разработана таким образом, чтобы вы могли писать то, что хотите, без необходимости заранее договариваться о том, как называть имена столбцов или ключевые значения со всеми остальными в Интернете. Стандартно RDF был написан (сериализован) с использованием XML (хотя доступны и другие, более приятные форматы).
Таким образом, в этом мире у вас может быть удобочитаемая домашняя страница (me.html
) и домашняя страница данных (me.rdf
) для компьютеров. Эти машины не поймут значения <p>I live in <a href="http://example.com/Chicago">Chicago</a></p>
, но они смогут использовать :me ex:livesIn <http://example.com/Chicago>
, если найдут «livesIn».
Микроформаты также пытаются сделать данные «паутинными», или, возможно, это должно быть веб-«данные-у». Понимание здесь заключается в том, что на веб-страницах есть много данных между прозой. Если у вас есть несколько подсказок, машина может понять, что этот фрагмент html выше в основном является адресом. Эти подсказки — микроформаты. Обычно они используют соглашения вокруг имен классов html, чтобы указать, что содержимое представляет собой нечто большее, чем текст.
Таким образом, микроформаты не нуждаются в отдельной веб-странице для машин. Но микроформаты охватывают только несколько типов данных (адреса, ссылки друзей, положение...) из-за того, как они работают. Каждая из них представляет собой особое соглашение, которое необходимо согласовать. При неосторожном использовании они также могут плохо смешиваться.
RDFa — это попытка получить как гибкость RDF, так и простоту микроформатов. Микроданные были ответом на RDFa, но с другой моделью данных (примерно массивы и хэши, а не реляционная модель). В отличие от микроформатов, они не определяют, какая информация предоставляется, а только то, как она кодируется.
Чтобы дополнить недостающее, теперь у нас есть schema.org, инициатива крупных поисковых систем (Google, Bing, Yahoo, Yandex) для индексации веб-данных. schema.org координирует эти значения, чтобы поисковая система знала, что, скажем, у событий есть местонахождение. Первоначально микроданные использовались schema.org, но теперь поддерживаются как микроданные, так и RDFa.
В наши дни я бы проигнорировал микроформаты и выбрал schema.org. Мой личный вкус - кодировка RDFa, но либо она, либо микроданные должны работать нормально.
Я предлагаю вообще игнорировать семантическую паутину. Из-за этого поисковые системы не будут присылать вам больше посетителей. Вместо этого они будут использовать идеально организованные данные, чтобы предоставить ответ, вообще не отправляя вам посетителей.
Сегодня вы можете увидеть проблему со следующим примером «кинобокса»: https://www.google.com/search?q=The+Godfather
Отображаются рейтинги IMDb и Rotten Tomatoes. Фрагмент из Википедии, а также. Хорошо для пользователей, плохо для этих сайтов. Или как часто вы посещали IMDb в прошлом и сегодня?
И не забывайте. Отображаемые данные взяты не только из IMDb или Rotten Tomatoes. Даты, режиссер, награды, музыка, изображения и т. д. были собраны с других сайтов. Например, поисковая система может легко найти в своей базе данных «Крестный отец» + «Режиссер», и если 99 из 100 веб-сайтов содержат имя «Фрэнсис Форд Коппола», легко проверить ответ без какого-либо ручного вмешательства.
Наконец, поисковые системы могут создавать собственный контент, не платя и не упоминая авторов. А семантической классификацией вы облегчите им задачу.
все три являются попыткой сделать веб-контент более семантичным.
rdfa столкнулась со многими препятствиями для входа; у него были те же проблемы роста, что и у xml (rdfa основан на xml) в первые годы существования Интернета, только, вероятно, более значительные, потому что в него было вовлечено меньше разработчиков.
я недостаточно знаю о rdfa, чтобы рекомендовать его микроданным. я предвзято отношусь к микроданным, потому что Google, Yahoo! и Microsoft (теперь Bing) объединились и создали его. rdfa разрабатывалась, и было сделано предложение по микроформатам. кроме того, микроформаты уже находились в массовом производстве и потреблении в Интернете. поэтому большая тройка решила вступить в сговор и придумала микроданные. я немного пресыщен, я думаю, потому что я принципиально не понимаю, почему от микроформатов отказались. звучит как куча дыма и зеркал.
поэтому я рекомендую микроформаты всем. они ооооочень легкие. и так здорово. чего можно добиться с помощью микроданных, чего нельзя добиться с помощью микроформатов?
тем не менее ... я бы предпочел микроданные rdfa, потому что они так же просты. а атрибуты данных намного превосходят классы html. на самом деле, может быть, это большой бонус? атрибуты данных? как и в случае с вашим небольшим исследованием, я долго и усердно искал причины, лежащие в основе микроданных, но все, что я могу найти, это нормальные шаблонные сообщения.