Resource Description Framework
Resource Description Framework (RDF, «среда описания ресурса»[1]) — это разработанная консорциумом Всемирной паутины модель для представления данных, в особенности — метаданных[2]. RDF представляет утверждения о ресурсах в виде, пригодном для машинной обработки. RDF является частью концепции семантической паутины.
Ресурсом в RDF может быть любая сущность — как информационная (например, веб-сайт или изображение), так и неинформационная (например, человек, город или некое абстрактное понятие). Утверждение, высказываемое о ресурсе, имеет вид «субъект — предикат — объект» и называется триплетом[1]. Утверждение «небо голубого цвета» в RDF-терминологии можно представить следующим образом: субъект — «небо», предикат — «имеет цвет», объект — «голубой». Для обозначения субъектов, отношений и объектов в RDF используются URI.
Множество RDF-утверждений образует ориентированный граф, в котором вершинами являются субъекты и объекты, а рёбра отображают отношения.
История
История появления RDF имеет своё начало в 1990 году, когда Тим Бернерс-Ли предложил отмечать типы ссылок между документами для облегчения автоматической обработки. Типы ссылок однако не были включены в первую спецификацию HTML, но идея была подхвачена в системе описания метаданных MCF. Обобщённое представление метаданных нашло отражение в рекомендации W3C по RDF в 1999 году. С тех пор стандарты RDF развиваются, появляются новые средства для работы с RDF[3].
Набор стандартов
С 10 февраля 2004 года следующие разделы имеют статус стандартов[4]:
- Среда описания ресурса (RDF): понятия и абстрактный синтаксис (англ. Resource Description Framework (RDF): Concepts and Abstract Syntax);
- Семантика RDF (англ. RDF Semantics);
- Информативное введение в RDF (англ. RDF Primer);
- Язык описания словарей RDF (англ. RDF Vocabulary Description Language 1.0: RDF Schema);
- Описание синтаксиса RDF/XML (пересмотренное)(англ. RDF/XML Syntax Specification (Revised));
- Набор тестовых данных RDF (англ. RDF Test Cases).
Модель данных
RDF сам по себе является не форматом файла, а только лишь абстрактной моделью[2]. Для записи и передачи RDF используется несколько форматов, в том числе:
- RDF/XML — запись в виде XML-документа;
- RDF/JSON — запись в виде JSON-данных;
- RDFa (англ. RDF in attributes) — запись внутри атрибутов произвольного HTML- или XHTML-документа;
- N-Triples, Turtle, N3 — компактные[5] формы записи утверждений.
Для обработки данных, представленных в RDF, могут использоваться языки запросов: SPARQL (стандарт W3C), RQL, RDQL.
Семантика
RDF предоставляет средства для построения информационных моделей, но не касается семантики описываемого. Взятый в отдельности граф RDF можно понимать только как граф. Толкование значения основывается на способности пользователей RDF интерпретировать URI, строковые литералы и структуру графа.
Для выражения семантики требуются словари (англ. vocabularies), таксономии (англ. taxonomies) и онтологии (англ. ontologies).
Словарь представляет собой собрание определённых используемых терминов, имеющих одинаковый смысл во всех контекстах.
Таксономия — это словарь иерархически организованных терминов.
Онтология использует предопределённый зарезервированный словарь терминов для определения концепций и отношений между ними для конкретной предметной области. Онтологии можно использовать для выражения семантики терминов словаря, их взаимоотношений и контекстов использования.
RDF Schema[6] предоставляет специальный словарь для RDF, который может быть использован для определения таксономий классов, свойств, контейнеров, реификации (от англ. reification — воплощение). Для записи семантики предметных областей в онтологиях служит язык OWL[7].
RDF-хранилища
Для хранения RDF-данных используются два основных вида хранилищ: нативные (native, «родные») и неродные (non-native). Родные хранилища позволяют достичь большей степени оптимизации, но более трудоёмки в проектировании, так как строятся специльно для работы с RDF. Неродные хранилища более просты в проектировании (например, за счёт использования механизмов реляционных СУБД или решений NoSQL), но менее оптимизированы. Нативные хранилища могут оперировать с данными, целиком находящимися в оперативной памяти (in-memory) или же использовать и внешнюю память (например, жёсткий диск)[8].
Системы для работы с RDF разрабатываются как в рамках исследований, так и для производственного использования. К основным хранилищам, пригодным для производственного использования, относятся[8]:
- решения от Oracle
- сервер приложений Virtuoso
- 4Store
- Stardog
- bigdata
- GraphDB (ранее OWLIM)
- Sesame
- Jena TBD
- Allegrograph
Применение
Список примеров в этой статье не основывается на авторитетных источниках, посвящённых непосредственно предмету статьи. |
Оформление баз знаний или представления их данных в рамках различных проектов в множестве институтов, университетов и иных организаций. В основном, в научно-исследовательских целях.
Поисковые системы предлагают веб-мастерам использовать RDF и аналогичные языки разметки страниц для повышения информативности ссылки на их сайт в результатах поиска.
Социальные сети, с подачи Facebook, предлагают веб-мастерам использовать RDF для описания свойств страниц, так же позволяющих красиво оформить ссылку на неё в записи пользователя социальной сети.
В форме RSS, формат RDF широко используется для краткого представления перечня новых записей на периодически пополняющихся сайтах типа блогов, новостных лент или интернет-журналов.
Кроме вышеперечисленного, в формате RDF представляют данные для анализа и/или интеграции в информационных системах предприятий, что даёт возможность исследовать их при помощи SPARQL (см. проект http://d2rq.org/, например), а при опоре на отраслевой стандарт, например, ISO 15926 позволяет унифицированно обмениваться данными различных предприятий на уровне отрасли.
Форматы
Проекты
Инструменты
Примечания
- ↑ 1 2 Среда Описания Ресурса (RDF): Понятия и Абстрактный Синтаксис
- ↑ 1 2 RDF Primer (англ.). Консорциум Всемирной паутины (10 февраля 2004). — Рекомендация W3C, информативное введение в RDF. Дата обращения: 22 ноября 2009. Архивировано 2 июня 2012 года.
- ↑ Segaran, Evans, Taylor, 2009, pp. 63-64.
- ↑ Статус W3C стандартов RDF
- ↑ Шон Палмер. Notation3: A Rough Guide to N3 (англ.). — Введение в Notation3. Дата обращения: 22 ноября 2009. Архивировано 2 июня 2012 года.
- ↑ RDF Schema
- ↑ Hebeler, Fisher, Blace, Perez-Lopez, 2009, pp. 98-100.
- ↑ 1 2 Curé, Blin, 2014, Chapter V..
Ссылки
- Официальная страница RDF (англ.)
- Краткое введение в RDF
- Материалы статей о RDF. Способы автоматизированной обработки RDF
- Серия статей о микроразметке — о различных способах размещения RDF-триплетов на HTML-страницах, их назначении, видах и пользе.
- Как устроен мир семантической микроразметки — обзор доступных словарей (онтологий), на которые может опираться микроразметка, и позволяющих понимать её смысл при использовании.
- Сложный и противоречивый мир синтаксиса микроразметки. Почему стандартов так много? Опыт Яндекса — обзор вариантов синтаксиса разметки RDF-триплетов на HTML-страницах.
- Зачем на самом деле используют микроразметку. Обзор от Яндекса — обзор систем, извлекающих практическую пользу из наличия RDF-триплетов в HTML-страницах.
Литература
- Toby Segaran, Colin Evans, Jamie Taylor. Programming the Semantic Web. — O’Reilly Media, 2009. — 302 с. — ISBN 978-0-596-15381-6.
- John Hebeler, Matthew Fisher, Ryan Blace, Andrew Perez-Lopez. Semantic Web Programming. — John Wiley & Sons, 2009. — 648 с. — ISBN 9780470418017.
- Olivier Curé, Guillaume Blin. RDF Database Systems. — Morgan Kaufmann, 2014. — 256 с. — ISBN 978-0-12-800470-8.
Для улучшения этой статьи по информационным технологиям желательно:
|