Resource Description Framework

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая РоманСузи (обсуждение | вклад) в 18:43, 28 мая 2015 (дополнение). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску

Resource Description Framework (RDF, «среда описания ресурса»[1]) — это разработанная консорциумом Всемирной паутины модель для представления данных, в особенности — метаданных[2]. RDF представляет утверждения о ресурсах в виде, пригодном для машинной обработки. RDF является частью концепции семантической паутины.

Ресурсом в RDF может быть любая сущность — как информационная (например, веб-сайт или изображение), так и неинформационная (например, человек, город или некое абстрактное понятие). Утверждение, высказываемое о ресурсе, имеет вид «субъект — предикат — объект» и называется триплетом[1]. Утверждение «небо голубого цвета» в RDF-терминологии можно представить следующим образом: субъект — «небо», предикат — «имеет цвет», объект — «голубой». Для обозначения субъектов, отношений и объектов в RDF используются URI.

Триплет RDF

Множество RDF-утверждений образует ориентированный граф, в котором вершинами являются субъекты и объекты, а рёбра отображают отношения.

История

История появления RDF имеет своё начало в 1990 году, когда Тим Бернерс-Ли предложил отмечать типы ссылок между документами для облегчения автоматической обработки. Типы ссылок однако не были включены в первую спецификацию HTML, но идея была подхвачена в системе описания метаданных MCF. Обобщённое представление метаданных нашло отражение в рекомендации W3C по RDF в 1999 году. С тех пор стандарты RDF развиваются, появляются новые средства для работы с RDF[3].

Набор стандартов

С 10 февраля 2004 года следующие разделы имеют статус стандартов[4]:

  • Среда описания ресурса (RDF): понятия и абстрактный синтаксис (англ. Resource Description Framework (RDF): Concepts and Abstract Syntax);
  • Семантика RDF (англ. RDF Semantics);
  • Информативное введение в RDF (англ. RDF Primer);
  • Язык описания словарей RDF (англ. RDF Vocabulary Description Language 1.0: RDF Schema);
  • Описание синтаксиса RDF/XML (пересмотренное)(англ. RDF/XML Syntax Specification (Revised));
  • Набор тестовых данных RDF (англ. RDF Test Cases).

Модель данных

RDF сам по себе является не форматом файла, а только лишь абстрактной моделью[2]. Для записи и передачи RDF используется несколько форматов, в том числе:

  • RDF/XML — запись в виде XML-документа;
  • RDF/JSON — запись в виде JSON-данных;
  • RDFa (англ. RDF in attributes) — запись внутри атрибутов произвольного HTML- или XHTML-документа;
  • N-Triples, Turtle, N3 — компактные[5] формы записи утверждений.

Для обработки данных, представленных в RDF, могут использоваться языки запросов: SPARQL (стандарт W3C), RQL, RDQL.

Семантика

RDF предоставляет средства для построения информационных моделей, но не касается семантики описываемого. Взятый в отдельности граф RDF можно понимать только как граф. Толкование значения основывается на способности пользователей RDF интерпретировать URI, строковые литералы и структуру графа.

Для выражения семантики требуются словари (англ. vocabularies), таксономии (англ. taxonomies) и онтологии (англ. ontologies).

Словарь представляет собой собрание определённых используемых терминов, имеющих одинаковый смысл во всех контекстах.

Таксономия — это словарь иерархически организованных терминов.

Онтология использует предопределённый зарезервированный словарь терминов для определения концепций и отношений между ними для конкретной предметной области. Онтологии можно использовать для выражения семантики терминов словаря, их взаимоотношений и контекстов использования.

RDF Schema[6] предоставляет специальный словарь для RDF, который может быть использован для определения таксономий классов, свойств, контейнеров, реификации (от англ. reification — воплощение). Для записи семантики предметных областей в онтологиях служит язык OWL[7].

RDF-хранилища

Для хранения RDF-данных используются два основных вида хранилищ: нативные (native, «родные») и неродные (non-native). Родные хранилища позволяют достичь большей степени оптимизации, но более трудоёмки в проектировании, так как строятся специльно для работы с RDF. Неродные хранилища более просты в проектировании (например, за счёт использования механизмов реляционных СУБД или решений NoSQL), но менее оптимизированы. Нативные хранилища могут оперировать с данными, целиком находящимися в оперативной памяти (in-memory) или же использовать и внешнюю память (например, жёсткий диск)[8].

Системы для работы с RDF разрабатываются как в рамках исследований, так и для производственного использования. К основным хранилищам, пригодным для производственного использования, относятся[8]:

  • решения от Oracle
  • сервер приложений Virtuoso
  • 4Store
  • Stardog
  • bigdata
  • GraphDB (ранее OWLIM)
  • Sesame
  • Jena TBD
  • Allegrograph

Применение

Оформление баз знаний или представления их данных в рамках различных проектов в множестве институтов, университетов и иных организаций. В основном, в научно-исследовательских целях.

Поисковые системы предлагают веб-мастерам использовать RDF и аналогичные языки разметки страниц для повышения информативности ссылки на их сайт в результатах поиска.

Социальные сети, с подачи Facebook, предлагают веб-мастерам использовать RDF для описания свойств страниц, так же позволяющих красиво оформить ссылку на неё в записи пользователя социальной сети.

В форме RSS, формат RDF широко используется для краткого представления перечня новых записей на периодически пополняющихся сайтах типа блогов, новостных лент или интернет-журналов.

Кроме вышеперечисленного, в формате RDF представляют данные для анализа и/или интеграции в информационных системах предприятий, что даёт возможность исследовать их при помощи SPARQL (см. проект http://d2rq.org/, например), а при опоре на отраслевой стандарт, например, ISO 15926 позволяет унифицированно обмениваться данными различных предприятий на уровне отрасли.

Форматы

Проекты

Инструменты

Примечания

  1. 1 2 Среда Описания Ресурса (RDF): Понятия и Абстрактный Синтаксис
  2. 1 2 RDF Primer (англ.). Консорциум Всемирной паутины (10 февраля 2004). — Рекомендация W3C, информативное введение в RDF. Дата обращения: 22 ноября 2009. Архивировано 2 июня 2012 года.
  3. Segaran, Evans, Taylor, 2009, pp. 63-64.
  4. Статус W3C стандартов RDF
  5. Шон Палмер. Notation3: A Rough Guide to N3 (англ.). — Введение в Notation3. Дата обращения: 22 ноября 2009. Архивировано 2 июня 2012 года.
  6. RDF Schema
  7. Hebeler, Fisher, Blace, Perez-Lopez, 2009, pp. 98-100.
  8. 1 2 Curé, Blin, 2014, Chapter V..

Ссылки

Литература

  • Toby Segaran, Colin Evans, Jamie Taylor. Programming the Semantic Web. — O’Reilly Media, 2009. — 302 с. — ISBN 978-0-596-15381-6.
  • John Hebeler, Matthew Fisher, Ryan Blace, Andrew Perez-Lopez. Semantic Web Programming. — John Wiley & Sons, 2009. — 648 с. — ISBN 9780470418017.
  • Olivier Curé, Guillaume Blin. RDF Database Systems. — Morgan Kaufmann, 2014. — 256 с. — ISBN 978-0-12-800470-8.