Социализируемся

Я в Google+ Я в Twitter Я в Facebook

Wednesday, November 3, 2010

SW-applications-1

РАЗРАБОТКА РАСПРЕДЕЛЕННЫХ СЕМАНТИЧЕСКИХ ПРИЛОЖЕНИЙ КАК СТРАТЕГИЯ РАЗВИТИЯ СОВРЕМЕННОГО WEB

И.Ю.Гришанова1, С.С. Щербак2

1Институт программных систем НАН Украины
2Харьковский национальный университет радиоэлектроники

Рассмотрены технологические аспекты применения программных средств в гипертекстовом Web и проведен анализ существующих реализаций семантических приложений. Представлено интенсиональное определение приложения Semantic Web, принятое на данный момент, его архитектура, определен перечень обязательных к реализации функций семантических приложений Web, а также их спецификация. Предложен унифицированный шаблон семантического приложения и приведены рекомендации по его применению. 

Ключевые слова: OWL, RDF store, онтологии, триплеты, семантика, интеллектуальный поиск

Введение. Роль парадигмы Semantic Web в развитии современного WWW


Последние несколько лет  характеризуются повышенным вниманием к перспективной концепции Semantic Web, которая позволяет применить интеллектуальные мультиагентные системы для решения практических задач на основе данных, распределенных по WWW.
Основные исследования, проводимые в рамках Semantic Web, направлены на представление информации в машинно-обрабатываемой форме, а именно в виде связанных данных, структура и семантика которых явно определена с помощью онтологий. О подобном машинно-понятном представлении говорят, что оно  семантически размечено.

На сегодняшний день в Web накоплено большое количество семантически размеченной информации. Причем наблюдается постоянный рост объемов подобной информации, что отчасти стимулируется внедрением поддержки технологий Semantic Web современными машинами поиска, такими как Google и Yandex. В то же время наблюдается отсутствие четкой стратегии и рекомендаций по использованию такой информации в программных приложениях, что затрудняет их создание и использование. В качестве решения этой задачи авторы предлагают ряд рекомендаций и шаблон семантического приложения. 

Необходимо также отметить, что данная работа направлена на поддержку в актуальном состоянии интенсионального определения семантического приложения Web, а также позволяет более точно определить характеристики современных семантических приложений.


Интероперабельные семантические приложения современного Web


Современный Web представляет собой огромный часто обновляемый источник информации, но зачастую этой информацией просто невозможно воспользоваться, поскольку ее объемы даже на узкоспециализированные запросы могут быть очень большими. Пусть нас интересует информация о некотором событии в нашем городе, но в результате поиска мы получим сотни различных ссылок на документы, которые могут весьма косвенно относиться к нашему запросу.

Естественно, заниматься перебором всех документов не имеет смысла, так как это приведет к большим затратам времени. Например, даже при поиске в вики-системах, подобных Википедии, содержащих тысячи страниц, поиск подобной информации может сильно затянуться. 

Для решения подобных проблем и была предложена концепция Semantic Web, в рамках которой каждый документ размечается или аннотируется с помощью одного из языков семантической разметки. Например, с помощью RDF или RDFa. Это позволяет проводить машинам поиска не полнотекстовый поиск по документам, а выполнять специализированные запросы на языке Sparql к источникам семантически размеченной информации или семантическим хранилищам

Необходимо отметить, что количество подобных источников меньше, чем количество тематических информационных ресурсов, но их число постоянно растет.  В то же время, запрос, составленный на Sparql  дает более точный результат, и мы можем надеятся получить факт или набор фактов, которые дадут нам точный ответ о всех потенциальных событиях, которые должны произойти в городе. 

Подобные технологии открывают широкие возможности по организации использования информации в различных прикладных задачах. С другой стороны, процедура семантической разметки документов весьма трудоемка и требует специализированных знаний, что служило долгое время препятствием для ее повсеместного внедрения.  В настоящее время большинство пользователей для управления своим информационным ресурсом пользуется либо автономной системой управления контентом (CMS), либо использует один из множества сервисов по ведению бесплатных блогов, сайтов или сообществ, что позволяет централированно внедрять поддержку интерфейсов по автоматической или автоматизированной семантической разметке публикуемых в блоге или на сайте документов. Рассмотрим в качестве примера расширение популярной вики-системы Semantic MediaWiki.


1   -- 2 --    ---  3 ---      -- 4 --        -- 5 --

No comments:

Post a Comment

Популярное

Использование материалов сайта

Информация, представленная на сайте, может свободно использоваться и распространяться при обязательном указании активной прямой ссылки на сайт http://in-search-of-semantics.blogspot.com/, а тексты научных статей – при указании авторства и ссылки на бумажную публикацию.

При размещении текстов статей на своих сайтах, блогах и пр., пожалуйста, присылайте ссылки.
Комментарии перед публикацией предварительно модерируются.

Хотите сказать спасибо автору? Не откажусь :) - Поставьте ретвит на пост, или другую социальную закладку. Спасибо.