Социализируемся

Я в Google+ Я в Twitter Я в Facebook

Wednesday, April 21, 2010

Визначення пошуку в веб-середовищі

Методи і засоби інформаційного пошуку в Semantic Web (продовження, стор. 7)




В зв`язку з появою веб, поняття пошуку в середовищі інтернету набув іншого змісту. Поняття пошукової системи стало більш широким та глибшим. Наведемо декілька новітніх визначень поняття пошукової системи (Search Engine), що прийнятні зараз в західній науковій літературі.

Пошукова система – це комп’ютерна програма, яка отримує (retrieves) файли або документи, або дані з бази даних або з комп'ютерної мережі (зокрема, з інтернету) [15].

Пошукова система – це комп’ютерна програма, яка знаходить (finds) інформацію в Інтернеті шляхом пошуку слів, які були введені (як запит – прим. автору) [16].

Пошукова система – це комп'ютерне програмне забезпечення для пошуку даних (з текстів або баз даних) для отримання конкретної інформації, а також: сайт у веб-мережі, який використовує таке програмне забезпечення для пошуку ключових слів на інших сайтах [17].

В контексті веб з огляду на тезу, що „потреба спонукає запит”, в клас поняття пошукових систем почали включати системи „запитання-відповідь” (answer engine), які дуже часто є фактографічними ПС. Але деякі системи для отримання результату пошуку вже починають використовувати процедури логічного виводу.

Таким чином, пошукова система, в контексті веб, використовує спеціалізоване програмне забезпечення, яке має на вході від користувача пошуковий/і термін/и і на виході надає список веб-сторінок, які вважаються найбільш релевантними. Більшість пошукових систем мають величезні бази даних мільярдів веб-сторінок. Розрізняють два типи веб-пошукових систем.

Пошукові системи, базовані на кроулінгу (Crawler-based). Такі системи створюють свої списки веб-сторінках автоматично. Вони "сканують" (crawl) інтернет за допомогою робота-"павука" (spider, програма, яка відвідує веб-сторінки, читає їх і слідує далі за посиланнями, знайденими на веб-сторінці), і повертають користувачу результати пошуку, які ранжовані у порядку важливості. Павук повторно відвідує веб-сторінки кожні кілька місяців для найчастішого оновлення своєї індексної бази відповідно до внечених на веб-сторінки змін. Головна перевага пошукових систем, базованих на кроулінгу, полягає у тому, що будь-які зміни, які внесені до веб-сторінки, будуть впливати на його базу і відповідно – результати пошуку. Таким чином, актуальність змісту веб-сторінок збігається з ключовими словами, що використовуються для пошуку.

Каталоги, створені людиною (human based directory), залежать від людей, що його створили та поповнюють. Вони виконують пошук за ключовими словами в коротких описах веб-сторінок, представлених веб-майстерами та спеціалістами, що рецензують та перевіряють каталог. Разом з цим, веб-сторінки переглядаються людиною і розміщуються в відповідну ієрархію категорій. Таким чином, зміни, внесені до веб-сторінки, на відміну від скануючи пошукових систем, не будуть мати ніякого впливу на збережений в каталозі опис. Отже, хоча на веб-сторінці і міститься відповідна інформація, яка відповідає запиту, але вона не буде відображена в списку результатів пошуку доки веб-майстер не змінить опис веб-сторінки. Саме з цієї причини один з найперших та найбільших каталог, сформований людиною Yahoo! перетворено у більш популярну пошукову систему на базі сканеру. Таким чином утворюються комбіновані пошукові системи. Оскільки каталоги містять інформацію, перевірену людиною, ця інформація використовується для фільтрування та ранжування результатів пошуку.

Типи пошукових механізмів:
  • - пошукові системи;
  • - веб-каталоги;
  • - віртуальні бібліотеки;
  • - мета-пошукові механізми.
Пошукові системи (Search Engines) є найбільш широким класом ІПС та найбільш популярним і загальновживаним. Вони характеризуються наступними властивостями:
  • - мають базу даних веб-сторінок;
  • - пошук здійснюють за ключовими словами;
  • - мають скануючого робота.
Яскравим прикладом такої системи є пошукова система Google.

Веб-каталоги (Web Directories). Як було вказано вище, вони:
  • - мають колекцію веб-ресурсів;
  • - організовані за тематичними категоріями в ієрархію;
  • - організація в категорії та інш. провадиться вручну.
Приклад такого каталогу – загальновідомий каталог Yahoo.

Віртуальні бібліотеки (Virtual Libraries). Такі бібліотеки характеризуються наступними ознаками:
  • - мають колекцію веб-джерел;
  • - оцінюються фахівцями з предметної області;
  • - слабо автоматизовані, живляться людськими ресурсами.
Приклад типової бібліотеки – бібліотечний індекс інтернету - Librarians Index to the Internet www.lii.org.

Мета-пошукові механізми (Meta-Search Tools). З назви видно, що такі механізми використовують ресурси інших пошукових систем, а результати фільтрують та ранжують згідно своїх заданих правил. Такі системи характеризуються:
  • - не мають власної бази даних;
  • - вони здійснюють запити до інших пошукових механізмів, розташованих в вебі;
  • - мають дуже поганий дизайн і можуть тільки змінювати порядок ранжування результатів.
Класичний приклад такої системи є MetaCrawler.com. Такі системи користуються попитом, оскільки вони повертають більш короткий список посилань, що психологічно більш прийнятно для людини.

Begin
2 3 4 5 6 7 Next>>
...
13 14 Last (15)

No comments:

Post a Comment

Популярное

Использование материалов сайта

Информация, представленная на сайте, может свободно использоваться и распространяться при обязательном указании активной прямой ссылки на сайт http://in-search-of-semantics.blogspot.com/, а тексты научных статей – при указании авторства и ссылки на бумажную публикацию.

При размещении текстов статей на своих сайтах, блогах и пр., пожалуйста, присылайте ссылки.
Комментарии перед публикацией предварительно модерируются.

Хотите сказать спасибо автору? Не откажусь :) - Поставьте ретвит на пост, или другую социальную закладку. Спасибо.