Социализируемся

Я в Google+ Я в Twitter Я в Facebook

Wednesday, November 3, 2010

SW-applications-3

РАЗРАБОТКА РАСПРЕДЕЛЕННЫХ СЕМАНТИЧЕСКИХ ПРИЛОЖЕНИЙ КАК СТРАТЕГИЯ РАЗВИТИЯ СОВРЕМЕННОГО WEB (Продолжение)


Начало    -- 2 --     3      -- 4 --      -- 5 --



Язык запросов становится более мощным за счет разрешения запросов, включающих знаки подстановки (wild cards), диапазоны (ranges) и подзапросы. Например, запрос

[[Category:Conference]] [[start date:=>May 18 2010]] [[program chair::[[member of::НАНУ]]]]

означает выбрать все конференции, которые начались после 18 мая 2010 года и которые находятся под руководством организаций-членов Национальной Академии Наук Украины. Нужно также отметить, что запросы категории членства (category membership) дадут ограниченную (но не полную) форму аргументации для учета отношений подкласса (subclass relationships). 

Возможности SMW в построении запросов могут использоваться для встраивания в страницы динамического контента, что является основным преимуществом по сравнению с традиционными вики-системами. Для того, чтобы это сделать, достаточно поместить в теги изапрос, написанный как вики-текст. В статье (на странице), которая содержит запрос, теги будут заменены на результаты выполнения данного запроса. Более того, синтаксис запросов предполагает утверждения для отображения дальнейших свойств полученных результатов и для изменения формы выдачи внутри страницы. 

Например, главная страница ontoworld.org отображает предстоящие события, их даты и места проведения. Эти результаты генерируются динамически: производится поиск конференций, дата начала которых больше текущей, результаты упорядочиваются в соответствии с датами и выводятся первые пять результатов [3].

Как указывалось выше, каждая статья представляет собой онтологический элемент, т.е. элемент одного из RDF-классов - Thing, Class, ObjectProperty, DatatypeProperty, AnnotationProperty. Кроме того, каждой статье нужен URI, который во избежание путаницы между понятиями и HTML-страницами отличается от своего URL. Каждый URL в SMW инъективно отображается в URI, который при запросе броузера перенаправляется к первоначальному URL. URL не может использоваться, поскольку OWL/RDF требует использования в качестве идентификаторов XML URI, которые, в свою очередь, не могут использовать все символы, разрешенные в URL.

Тип элементов для большинства видов аннотаций является фиксированным. Обычно статьи являются только OWL-экземплярами, категории становятся классами, а отношения становятся OWL-отношениями (object properties) между статьями. Атрибуты, в зависимости от своего типа в вики-системе, могут иметь свойства типа данных (datatype), свойство аннотации, или объекта (object properties).

Исходя из этого отображения, для любой страницы SMW по запросу генерирует OWL/RDF. Простейший способ получить этот RDF - использовать ссылку "Просмотреть как RDF" ("View as RDF"), находящуюся в нижней части каждой проаннотированной страницы. Более подробную информацию о настройках экспорта, который также позволяет осуществлять черновой экспорт основной части (bulk), включение обратных ссылок и рекурсивный экспорт, можно найти на специальной странице [2]. Эта страница также выступает в качестве конечной точки (endpoint) для внешних сервисов (внешней точки доступа), которые хотят получить доступ к семантическим данным вики.

Поскольку SMW совместима с моделью знаний OWL DL, то существует возможность использования в вики-проектах существующих онтологий. Это возможно двумя путями: 
  • импорт онтологии (ontology import), который позволяет создавать и модифицировать страницы в вики-системе для представления отношений, заданных в некотором существующем OWL DL-документе;
  • повторное использование словаря (vocabulary reuse) - позволяет пользователям отображать (задавать соответствия) вики-страницы на элементы существующих онтологий.

Функция импорта онтологии для чтения RDF-документов использует инструментарий RAP toolkit [3]. Он извлекает RDF-утверждения, которые могут быть представлены в вики-системе. Наименования статей импортируемых элементов извлекаются из их меток (labels) или, в случае отсутствия метки, из идентификатора раздела их URI. Основной целью импорта является инициализация (автоматическая загрузка) основы-шаблона для заполнения контента вики-проекта. Кроме того, импорт онтологии вставляет специальные аннотации, которые генерируют эквивалентные утверждения в OWL (т.е.. owl:sameAs, owl:equivalentClass, или owl:equivalentProperty). Импорт онтологий разрешен только для администраторов сайта, поскольку это может быть использовано для спама вики-проекта тысячами новых статей.

Импорт словаря позволяет пользователям идентифицировать элементы вики-системы, указав связь с элементами существующих онтологий. Например, Category:Person напрямую экспортируется в класс foaf:Person словаря Friend-Of-A-Friend. Вики-пользователи могут решать, какие вики-страницы должны иметь внешнюю семантику, однако набор имеющихся внешних элементов управляется только администраторами. Вводя в словарь вики-проекта некоторый новый элемент, они должны удостовериться в том, что повторное использование словаря соотносится с типами ограничений OWL DL. Например, внешние классы, такие как foaf:Person, не могут быть импортированы в Отношения.

Экспорт в OWL/RDF является средством обеспечения внешнего повторного использования данных вики-систем, но только практическое приложение этой функции может показать качество генерируемого RDF. С этой целью для выдачи RDF разработчики системы использовали ряд инструментов Semantic Web. SMW хорошо сотрудничало с наиболее оттестированными приложениями, такими, как FOAF Explorer, Tabulator RDF browser или расширением броузера Piggy Bank RDF. Подробная информация об испытанных инструментариях, включая их основные функции и URL, приведены в [4].

Кроме того, SMW предоставляет сервис SPARQL-запросов. Система базируется на автономном (stand-alone) RDF-сервере Joseki, который синхронизирован с семантически размеченным содержимым вики-системы. Синхронизация заключается в том, что генерируется RSS-фид с отчетом о последних изменениях в вики-проекте, для того, чтобы быстро перезагрузить измененные статьи. Таким образом, SPARQL-точка (endpoint) демонстрирует возможность зеркально отобразить (to mirror) RDF-контент вики-проекта при помощи небольших пошаговых обновлений, и предлагает точку доступа для семантических проектов, повторно использующих данные.

Необходимо также упомянуть и другие функции Semantic MediaWiki, такие как использование семантических шаблонов или поддержка единиц измерения[4]

Несмотря на множество вышеперечисленных достоинств, Semantic MediaWiki является специализированным решением для конкретных типов информационных ресурсов, которые строятся на базе вики-систем. В то же время необходимо отметить стремительный рост количества программных средств низкоуровнего управления триплетами RDF. Эти средства получили название хранилища триплетов (triple store) и представляют собой функциональный аналог традиционных реляционных СУБД.

Рассмотрим вариант создания семантического приложения на базе хранилищ триплетов.

Дальше


Начало    -- 2 --     3      -- 4 --      -- 5 --



No comments:

Post a Comment

Популярное

Использование материалов сайта

Информация, представленная на сайте, может свободно использоваться и распространяться при обязательном указании активной прямой ссылки на сайт http://in-search-of-semantics.blogspot.com/, а тексты научных статей – при указании авторства и ссылки на бумажную публикацию.

При размещении текстов статей на своих сайтах, блогах и пр., пожалуйста, присылайте ссылки.
Комментарии перед публикацией предварительно модерируются.

Хотите сказать спасибо автору? Не откажусь :) - Поставьте ретвит на пост, или другую социальную закладку. Спасибо.