Социализируемся

Я в Google+ Я в Twitter Я в Facebook

Wednesday, April 21, 2010

Види пошуку в веб-середовищі

Методи і засоби інформаційного пошуку в Semantic Web (продовження, стор. 6)




Поява та розвиток інтернету сприяли розширенню поняття пошуку та появі більш специфічного поняття веб-пошуку. Оскільки в контексті веб фактори взаємодії людини з комп'ютером та когнітивні аспекти грають найважливішу роль, корисно деталізувати цю модель, як показано на Рис. 3.

Рис. 3. Класична модель інформаційного пошуку, поширена на інтернет-мережу (веб).

Як було зазначено раніше, інформаційна потреба асоціюється (викликається) з деякою задачею. Ця потреба вербалізується (найбільш часто це виконується ментально та не дуже чітко) та транслюється в запит, що надається пошуковому механізму. Цей процес висвітлення та створення запиту з інформаційної потреби, в контексті веб здобув велику увагу: в статті Хольстера та Струбе [10] вказується на тому, що досвідчені користувачі та новачки конструюють запити по-різному. Наварро-Пьєтро та інш. [11] вивели когнітивну модель для веб-пошуку, Мурамату та Прат [12] дослідили ментальну модель користувачів пошукових механізмів, тощо. Див. також [13] Однак всі ці дослідження базуються на припущенні, що веб-пошуковці мотивовані (спонукаємі) інформаційною потребою.
Таксономія веб-пошуку.
В контексті веб, вираз “потреба спонукає запит” часто не є інформативною. В 2002 році автор [14] класифікував запити в відповідності до їх намірів на три наступних класи:

  • навігаційні запити. Такі запити мають на меті негайний намір побачити певний сайт,
  • інформаційні запити. Вони виражають намір одержати деяку інформацію, яка вважається існуючою на одній або більше веб-сторінках,
  • транзакційні запити. Ці запити виражають намір виконати якусь веб-опосередковану діяльність – покупку в інтернет-магазині, завантаження файлів, тощо.


Навігаційні запити.
Метою таких запитів є дістатися певного сайту, який користувач має в своїх голові. Це визначено тим, що користувач можливо відвідував цей сайт в минулому, або він припускає, що такий сайт існує. Наприклад:



Запит Можливий результат
compaq Http://www.compaq.com
Фуршет http://www.furshet.ua/
Газета по-киевски http://mycityua.com


Цей тип пошуку іноді вважається, як пошук “загальновідомого предмету” в класичному ІП. Прикладом такого пошуку стало завдання “Пошук домашньої веб-сторінки”, яке регулярно проводиться при тестуванні пошукових систем при Конференції з текстового пошуку (Text Retrieval Conference).
Навігаційні запити зазвичай мають тільки один вірний результат.

Транзакційні запити.
Мета таких запитів полягає в тому, щоб досягти місця (сайту), де можливо провести подальшу взаємодію (транзакція) для досягнення певної мети. До основних категорій для таких запитів можна віднести здійснення покупок, пошук різних веб-опосередкованих сервісів, завантаження різного типу файлів (зображень, пісень і т.д.), доступ до деяких баз даних (наприклад, типу Yellow Pages), пошук серверів (наприклад, для ігор) і т.д.
Результати таких запитів з точки зору класичного ІП дуже важко оцінити. Все, що можливо – це бінарне значення оцінки, скажімо, відповідно чи не відповідно. Проте найбільш важливі для користувачів зовнішні чинники (наприклад, ціна товару, швидкість обслуговування, якість і т.інш.), як правило, в загальних пошукових системах недоступні.

Інформаційні запити.

Метою таких запитів є знайти інформацію, яка припускається існує в вебі в статичній формі. В подальшому взаємодій ніяких не передбачається, за винятком читання. Під статичною формою мається на увазі, що цільовий документ не створюється як відповідь на запит користувача. Ця різниця дещо розмита, оскільки змішування результатів, що характерно для третього покоління пошукових систем, можливо, призведе до використання динамічних сторінок.
В любому випадку, інформаційні запити – найбільш приближені до класичного поняття Інформаційного Пошуку (Informational Retrieval – IR), і тому вони далі будуть розглянуті детальніше.
На відміну від звичайного пошуку, більшість інформаційних запитів, що здійснюються в інтернеті, семантично є надзвичайно широкими, наприклад, “автомобілі” або “Сан-Франциско”, в той час як деякі можуть бути вузькими, наприклад “normocytic anemia” або “метрична система”. Досліди інформаційних запитів, проведені в [14] відзначають, що майже 15% всіх пошуків за бажану мету вважають гарну колекцію посилань за заданою темою, ніж один добрий документ.
Експериментальні результати дослідження типів запитів надані в таблиці на Рис.4.




Type of query User Survey Query Log Analysis
Navigational 24.5% 20%
Informational ?? (estimated 39%) 48%
Transactional > 22%
(estimated 36%)
30%

Рис. 4. Класифікація запитів користувачів.

Пошукові системи необхідні для вирішення всіх трьох типів запитів, хоча кожен тип задовільнюється досить різними результати. Розуміння цієї таксономії має важливе значення для успішного розвитку веб-пошуку. Сучасні пошукові системи добре вирішують інформаційні та навігаційні запити, але транзакційні запити задовольняються лише опосередковано. Шлях підвищення ефективності пошуку лежить в удосконаленні семантичного аналізу (тобто розуміння того, про що запит) та змішування різних зовнішніх баз даних.

Begin
2 3 4 5 6 Next>>
...
13 14 Last (15)

No comments:

Post a Comment

Популярное

Использование материалов сайта

Информация, представленная на сайте, может свободно использоваться и распространяться при обязательном указании активной прямой ссылки на сайт http://in-search-of-semantics.blogspot.com/, а тексты научных статей – при указании авторства и ссылки на бумажную публикацию.

При размещении текстов статей на своих сайтах, блогах и пр., пожалуйста, присылайте ссылки.
Комментарии перед публикацией предварительно модерируются.

Хотите сказать спасибо автору? Не откажусь :) - Поставьте ретвит на пост, или другую социальную закладку. Спасибо.