Социализируемся

Я в Google+ Я в Twitter Я в Facebook

Showing posts with label Semantic Web. Show all posts
Showing posts with label Semantic Web. Show all posts

Friday, January 18, 2013

Is Google Hijacking Semantic Markup/Structured Data?

    На заметку
Интересная статья - анализ с предысторией стратегия Google на пути к Semantic Web

Is Google Hijacking Semantic Markup/Structured Data?

Jan 17, 2013 at 3:54pm ET by Barbara Starr,
http://searchengineland.com

Tuesday, May 22, 2012

Социальные сети как источник информации

    Презентация "Социальные сети как источник информации для пополнения онтологий и персонализации семантического поиска"
XІI международная научная конференция ИАИ -2012 им.Т.А.Таран


Monday, May 21, 2012

About Google Knowledge Graph

    Итак, Гугл анонсировал Граф Знаний от Гугла - Google Knowledge Graph, знакомьтесь:

Для нас (в рунете) увы пока еще эту опцию не включили, но уже можно ознакомиться по картинкам в презентации и статье Майка Бергмана, каким теперь будет страница с поисковыми результатами.



Ну и на закуску:
Deconstructing the Google Knowledge Graph Майка Бергмана - разбор Графа Знаний (на англ)

Как видим, страница поиска будет расширена добавлением блоков результатов по сущностям, выделенным из поискового запроса, из Википедии, Freebase, Factbook и еще нескольких источников.

Майк Бергман выделил пока только такой скудный список базовых сущностей (типов):

Entity types that I observed were in these categories:
  • People
  • Chemical Compounds
  • Directors
  • Some Companies
  • Some National Parks
  • Places
  • Musicians/Musical Groups
  • Actors
  • Some Government Agencies
  • Many Local Businesses
  • Animals
  • Movies
  • Albums
  • Notable Landmarks
  • Who Knows What Else

Entity types that I expected to see, but did not find include:
  • Products
  • Most Companies
  • Who Knows What Else
  • Songs
  • Most Government Agencies
  • Concepts
  • Non-government Organizations

Пока оценить такую страницу можно только пройдя по этой ссылке:

Полностью поддерживаю Майка Бергмана в его мнении:
Welcome to the semantic technology space, Google! I look forward to learning much from you.

Добро пожаловать, Гугл, в мир семантических технологий! С нетерпением жду, чтобы побольше изучить и узнать у тебя! :)

Ну и попроще объяснение про Google Knowledge Graph для бизнеса и SEO. (тоже англ)

Google Translate вам в помощь, guys! :)

Tuesday, March 6, 2012

Что такое Google+

Сейчас идет уйма баталий между сторонниками разных социальных сетей, критики Google и новой его сети Г+. Хочется поделиться замечательной презентацией, где очень хорошо образно и доходчиво показано, что такое Г+, и каковы ее цели и суть, и отличия от Facebook. Ну и конечно прослеживается (кто в теме) связь с последующим развитием и переходом от Social Web к Semantic Web. (Граф совместных интересов).

Tuesday, November 1, 2011

Подборка базовой литературы по онтологиям

Отобрала список базовой литературы по онтологиям:

Изучаем онтологии

1. Базовой книгой по всей видимости является
Handbook on Ontologies (International Handbooks on Information Systems) Steffen Staab, Rudi Studer

Она есть на озоне:
OZON.ru - Книги | Handbook on Ontologies | Steffen Staab, Rudi Studer | Купить книги: интернет-магазин / ISBN 3540408347OZON.ru - Книги | Handbook on Ontologies | Steffen Staab, Rudi Studer | Купить книги: интернет-магазин / ISBN 3540408347
На Амазоне: Handbook on Ontologies (International Handbooks on Information Systems)
читать в гугле: Handbook on Ontologies


2. Теоретический базис по дескриптивным логикам - основам онтологий:

The Description Logic Handbook: Theory, Implementation and Applications
Franz Baader (Editor), Diego Calvanese (Editor), Deborah L. McGuinness (Editor), Daniele Nardi (Editor), Peter F. Patel-Schneider (Editor) June 28, 2010
На Амазоне: The Description Logic Handbook: Theory, Implementation and Applications
читать в гугле: The Description Logic Handbook



Ontological Engineering: with examples from the areas of Knowledge Management, e-Commerce and the Semantic Web. First Edition (Advanced Information and Knowledge Processing)
Asuncion Gomez-Perez (Author), Mariano Fernandez-Lopez (Author), Oscar Corcho (Author)
Ontological Engineering: with examples from the areas of Knowledge Management, e-Commerce and the Semantic Web. First Edition (Advanced Information and Knowledge Processing)

Knowledge Representation and Reasoning (The Morgan Kaufmann Series in Artificial Intelligence)  Ronald Brachman (Author), Hector Levesque (Author)

Knowledge Representation and Reasoning (The Morgan Kaufmann Series in Artificial Intelligence)



Organising Knowledge: Taxonomies, Knowledge and Organisational Effectiveness (Chandos Knowledge Management)
Patrick Lambe (Author)

Organising Knowledge: Taxonomies, Knowledge and Organisational Effectiveness (Chandos Knowledge Management)




Typologies and Taxonomies: An Introduction to Classification Techniques (Quantitative Applications in the Social Sciences)
Kenneth D. Bailey (Editor)

Typologies and Taxonomies: An Introduction to Classification Techniques (Quantitative Applications in the Social Sciences)




Semantic Web for the Working Ontologist, Second Edition: Effective Modeling in RDFS and OWL

Semantic Web for the Working Ontologist, Second Edition: Effective Modeling in RDFS and OWL



Enterprise Ontology: Theory and Methodology
Jan L.G. Dietz (Author)
Enterprise Ontology: Theory and Methodology








Owl: Representing Information Using the Web Ontology Language Lee W. Lacy (Author)

Owl: Representing Information Using the Web Ontology Language








Ontology Learning and Population from Text: Algorithms, Evaluation and Applications
Philipp Cimiano (Author)

Ontology Learning and Population from Text: Algorithms, Evaluation and Applications






Model Driven Architecture and Ontology Development
Dragan Gaevic (Author), Dragan Djuric (Author), Vladan Devedic (Author), Bran V. Selic (Foreword)

Model Driven Architecture and Ontology Development





Ontologies for Software Engineering and Software Technology
Coral Calero (Editor), Francisco Ruiz (Editor), Mario Piattini (Editor)

Ontologies for Software Engineering and Software Technology






 
Probabilistic Graphical Models: Principles and Techniques (Adaptive Computation and Machine Learning series)
Daphne Koller (Author), Nir Friedman (Author)

Probabilistic Graphical Models: Principles and Techniques (Adaptive Computation and Machine Learning series)




И походу интересное попалось:

Building Search Applications: Lucene, LingPipe, and Gate
Manu Konchady (Author)

Building Search Applications: Lucene, LingPipe, and Gate









Wikinomics: How Mass Collaboration Changes Everything
Don Tapscott (Author), Anthony D. Williams (Author)

Wikinomics: How Mass Collaboration Changes Everything

Thursday, September 29, 2011

Alchemy Aims to Add More API Wizardry - semanticweb.com

Alchemy Aims to Add More API Wizardry - semanticweb.com

Orchestr8’s NLP- and machine learning-based AlchemyAPI service for analyzing content and extracting semantic metadata has added some new capabilities.
One new feature is dubbed Relation Extraction
....

it processes natural language, and converts documents and web pages into actionable, semantically enriched “Subject-Action-Object” data


.....

The service also has enhanced its sentiment analytics capabilities to include directional sentiment analytics – that is, that one entity is emitting negative or positive sentiment to another entity mentioned.

Report from SemTechBiz UK - semanticweb.com

Last news:

Report from SemTechBiz UK - semanticweb.com

The first Semantic Technology and Business Conference in the United Kingdom (#semtechbiz) wrapped up in London this week, and there are some themes that emerged from the presentations and networking conversations.

SemTechBiz UK 2011 agenda

Tuesday, July 19, 2011

Mindmaps visualization

Играемся с визуализацией карт памяти

Визуализатор карт памяти, свободный и бесплатный www.spicynodes.org позволяет он-лайн создавать довольно быстро визуальные динамические карты памяти, редактировать их и потом размещать на своих ресурсах (embed). Вот такая карта сходу получилась у меня за 5 минут по тематике Semantic Web (одной из интерпретаций этого понятия).



Контент можно импортировать-экспортировать при помощи XML, поддерживается кириллица.

Ресурс интересен и может использоваться для публикации он-лайн схем карти памяти, таксономий и др. схем.

    

Friday, June 24, 2011

Microdata4Google

На пути к Semantic Web. Microdata.
(Также полезно для SEO, семантическое ядро сайта, семантическая разметка сайта)

Одним из важных шагов к достижению Семантического Веба (Semantic Web) с времен разработки RDF, стало создание лидерами поисковой индустрии Google, Bing и Yahoo! ресурса schema.org. Schema.org является вендорной спецификацией набора из около 300 мини-схем (или структурированных мета-данных), которые можно использовать для разметки (тегирования) информации, представленной на веб-страницах. Эти схемы организованы в небольшую стройную иерархию и покрывают (охватывают) множество популярных предметных областей (ПрО) – от представления организаций, отдельных людей и до продуктов, товаров и творческой деятельности – то, про что можно написать и охарактеризовать и опубликовать в вебе.

Эти спецификации схем данных основаны на стандартах микроданных (microdata), входящих в состав спецификации HTML5. Микроданные – это набор записей, содержащих описания, представленных парами ключ-значение (тег-значение), который можно включать (внедрять) (embedded) в html-код веб-страницы. Эти схемы микроданных подобны микроформатам, однако они шире в покрытии тем и более расширяемы. Помимо этого, микроданные проще, чем RDFa – другой спецификации W3C, которую организаторы schema.org называют “… расширяемым и очень выразительным, но значительная сложность языка является причиной медленного принятия общественностью».

(Про микроформаты и микроданные, инструментарий от Яндекса, Гугла и т.п.)

Появление микроданных вызвало большую бурю в научном сообществе о том, что эта инициатива нивелирует труд десятилетий по развитию и популяризации RDF и RDFa. На наш взгляд, эта инициатива не является отказом от RDF, а есть логичное развитие идей семантического веба с учетом развития, достижений и изменения уровня понимания проблемы и накопленных знаний.

RDF и его модель представления данных тройками есть простейший и наиболее выразительный способ представления любых данных и связей между данными. Поэтому, RDF и его развития, такие как OWL и онтологии, предоставляет ясную и гибкую каноническую модель данных для представления существующих данных или схем данных. Вне зависимости от исходной формы исходной информации, ее можно разбить, выделить и представить в формате RDF, а также связать с любой другой информацией. Поэтому часто RDF называют универсальным языком представления данных.

Однако зачастую простейшие данные не нуждаются в сложности RDF. Научное сообщество W3C не раз аргументированно заявляло о важности наивных структур представления данных. Большинство из таких типов представляют собой простые пары ключ-значение, а объект высказывания предполагается. К этому типу относятся и структурированные записи в Википедии, называемые инфобоксами (infoboxes). Также простые форматы данных имеют JSON и много других простейших форматов данных.

Основным является утверждение, что RDF предоставляет универсальную модель данных для любого вида данных, а также средство обмена данными. Получившие распространение форматы обмена данными, в отличие от RDF, легко понимаемы, легко выразимы и, следовательно, получили широкое применение. Заявка про использование микроданных лидерами поисковых систем веба означает реальное изменение в возможностях  и выразительности структурированных данных, представленных в вебе. Количество структурированной информации резко возрастет.

Чем больше появляется структурированной информации, тем больше получает распространение, внимание и развитие применение RDF, который, с наступлением своего времени, будет использоваться повсеместно для взаимодействия с этими данными. Скоро должны появиться множество утилит, инструментов и сервисов, позволяющих автоматически добавлять такие структуры (структурированные данные) к веб-страницам с помощью одного клика. 

Google все больше внимания уделяет структурированным данным. С каждым днем все больше структурированных данных появляется в результатах выдачи Google; компания запустила очень активную программу по извлечению структурированных данных из текстовых данных и таблиц. Google видит, что поисковые потребности постепенно отходят от поиска по ключевм словам к структурам, взаимосвязям, а также фильтрации и таргетировании результатов. Эти преимущества и возможности вытекают из структур, так же как и семантические взаимосвязи между сущностями.

Многие задаются вопросом, почему Google проталкивает микроданные, а не микроформаты или RDFa или более ранние их варианты. Конечно, Google имеет коммерческие интересы в расширении и увеличении полезности веба. Заявив об использовании микроданных, которые проще в понимании и использовании рядовыми пользователями, поисковые магнаты способствуют ускорению публикации таких данных в вебе, генерированию таких данных и т.п. В дальнейшем, когда придет время и количество опубликованных структурированных данных достигнет необходимого количества (т.е. Структурированный веб начнет становиться семантическим), эти монстры откажутся от них и перейдут к более универсальному, гибкому и продуманному RDF
Модель данных заявленных микроданных достаточно общая и получена из RDF Schema (которая в свою очередь получена из Cycl) (Data Model, http://www.schema.org/docs/datamodel.html).

Она содержит:
    1. набор типов, организованных в иерархию множественного наследования, где каждый тип может быть подклассом множества классов.
    2. набор свойств, где:
-         - каждое свойство может иметь одно или более типов в качестве доменов (domain). Свойство может использоваться для экземпляров любого из этих типов.
-         - каждое свойство может иметь одно или более типов в качестве диапазонов (range). Значение/я свойства должны быть экземплярами как минимум одного из этих типов.

Выбор решения разрешить использовать множественные домены и диапазоны носит чисто прагматический характер. Поскольку вычислительные свойства систем с одним доменов и диапазоном проще в понимании, на практике, это будет способствовать созданию множества искуственных типов, которые могут быть использованы напрямую как домены или диапазоны некоторых свойств.

Микроданные, по заявлению авторов, имеют отображение на RDFa RDFa версии 1.1 разметки «почти» изоморфно версии микроданных. Схема микроданных имеет описание в OWL-формате.

Иерархия типов, представленная на сайте, как заявляют авторы, не направлена стать глобальной онтологией мира. Она только охватывает типы сущностей, которые по мнению организаторов (Microsoft, Yahoo! и Google) могут представлять интерес и быть обработанными их поисковыми системами в ближайшем будущем.

Основным девизом этого начинания, можно сказать, является фраза с сайта schema.org:
In the spirit of "some data is better than none", we will accept this markup and do the best we can.

Имхо, судя по всему, заявление о поддержке микроданных и появлении schema.org является отправной вехой на пути к Semantic Web.
По материалам сайта schema.org и обсуждений научного сообщества Semantic Web.     

Tuesday, May 17, 2011

Semantic Web books



Для начинающих:

Semantic Web For Dummies [Paperback] Jeffrey T. Pollock

общий взгляд на Semantic Web с точки зрения мат логик и т.п.:

Thinking on the Web: Berners-Lee, Gödel and Turing
by H. Peter Alesso December 3, 2008

и углубленно

Semantic Web Programming by John Hebeler Paperback

Foundations of Semantic Web Technologies (Chapman & Hall/CRC Textbooks in Computing) by Pascal Hitzler Hardcover

NEW!!!

Linked Data (Synthesis Lectures on the Semantic Web: Theory and Technology)
or read the free HTML version of the book, the most recent of which is always available at http://linkeddatabook.com/book.


The Social Semantic Web
by John G. Breslin Hardcover Springer; 1 edition (October 16, 2009)
...conclude with observations on how the application of Semantic Web technologies to the Social Web is leading towards the "Social Semantic Web" (sometimes also called "Web 3.0"), forming a network of interlinked and semantically-rich content and knowledge.

Еще практика:


Semantic Web for the Working Ontologist, Second Edition: Effective Modeling in RDFS and OWL
Dean Allemang (Author), James Hendler (Author)
Morgan Kaufmann; 2 edition (June 15, 2011)


New in this edition:

* Coverage of the latest Semantic Web tools for organizing, querying, and processing information - see details in TOC below

* Detailed information on the latest ontologies used in key web applications including ecommerce, social networking, data mining, using government data, and more

* Updated with the latest developments and advances in Semantic Web technologies for organizing, querying, and processing information, including SPARQL, RDF and RDFS, OWL 2.0, and SKOS

* Detailed information on the ontologies used in today's key web applications, including ecommerce, social networking, data mining, using government data, and more

* Even more illustrative examples and case studies that demonstrate what semantic technologies are and how they work together to solve real-world problems


Organising Knowledge: Taxonomies, Knowledge and Organisational Effectiveness (Chandos Knowledge Management)
by Patrick Lambe Paperback Neal-Schuman Publishers (February 1, 2007)


The Accidental Taxonomist
by Heather Hedden Publisher: Information Today, Inc. (May 3, 2010)


Networks, Crowds, and Markets: Reasoning About a Highly Connected World
by David Easley, Jon Kleinberg (Authors)
Publisher: Cambridge University Press (July 19, 2010)


Algorithms of the Intelligent Web by Haralambos Marmanis


Beautiful Data: The Stories Behind Elegant Data Solutions by Toby Segaran Paperback

Search Patterns: Design for Discovery [Paperback]
Peter Morville (Author), Jeffery Callender (Author)

    

Популярное

Использование материалов сайта

Информация, представленная на сайте, может свободно использоваться и распространяться при обязательном указании активной прямой ссылки на сайт http://in-search-of-semantics.blogspot.com/, а тексты научных статей – при указании авторства и ссылки на бумажную публикацию.

При размещении текстов статей на своих сайтах, блогах и пр., пожалуйста, присылайте ссылки.
Комментарии перед публикацией предварительно модерируются.

Хотите сказать спасибо автору? Не откажусь :) - Поставьте ретвит на пост, или другую социальную закладку. Спасибо.