Проблеми семантичного пошуку
Лабараторна робота №5
Тема: Пошукові системи: склад, функції, принципи роботи
Мета виконання: Розглянути яким чином функціонують пошукові системи, визначити проблеми семантичного пошуку, порівняти різні пошукові системи.
Загальні поняття про пошукові системи:
Пошукові системи надають можливість пошуку інформації на сайтах Всесвітньої павутини, але також є системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.
Розглянемо популярні пошукові системи
Google - найбільша пошукова система, яка допоможе знайти текстові файли, зображення, новини, відео. Можна створити собі електронну скриньку у цій пошуковій системі. Зручно працювати, реклама не відволікає. Для тих, кому потрібен перекладач, також можете використовувати цю пошукову систему. Інформацію можна шукати різними мовами.
Яндекс - сайт російської ІТ-компанії, яка має Інтернет-портал та систему пошуку. Користується великою популярністю, адже виконує більше 30 сервісів. Цей сайт україномовний, у компанії є російськомовний та англомовний сайти. Окрім пошуку, можна прочитати найсвіжіші новини міста, з якого користувач заходить на сторінку, помістити свою рекламу, зареєструвати поштову скриньку. Реклама не заважає працювати на сайті пошукової системи.
Принцип роботи пошукових систем.
Для ефективного використання можливостей пошукових систем, необхідно знати, як вони працюють “з середини”, ознайомитись з їх принципами пошуку і з’ясувати, які вони використовують структури баз даних.
Існує угода, неофіційний стандарт - Standart for Robot Exclusion (SRE), якого дотримуються практично усі розробники Веб- роботів промислових систем. Ця угода описує протокол, що дозволяє адміністраторам вузлів заборонити роботам доступ до зазначених областей їх Веб-серверів. Для забезпечення інтерактивного доступу користувачів до інформації, зібраної роботами, використовуються пошукові механізми - основні складові інформаційно-пошукових систем.
Ефективність і швидкодія пошукових механізмів багато в чому визначається структурою баз даних, що використовуються у певній інформаційно-пошуковій системі.
Розглянемо пошуковик від Google:
Особливості функціонування Google: Невеликий розмір сторінки. Невелика сторінка швидше завантажується і відображається браузером. Традиційно сторінки Google мають мінімалістичний дизайн, бо надлишкові елементи інтерфейсу уповільнюють роботу сторінки, не приносячи особливої користі. Поєднання складних алгоритмів з простотою представлення результатів. Багато пошукових функції вимагають реалізації великої кількості складних обчислювальних і аналітичних алгоритмів. Google приховує всю цю складність за ясним, інтуїтивно зрозумілим інтерфейсом. Виправлення правопису, опис сторінок, посилання на сайти та уточнення запитів - ці функції постійно розвиваються і вимагають складних алгоритмів. Пошук, практично непомітно для користувача, починає працювати краще.
Функції працюють повсюдно. Функції повинні бути влаштовані таким чином, щоб алгоритми та спосіб представлення результатів могли працювати на всіх мовах і у всіх країнах світу.
Проблеми семантичного пошуку
Семантичний пошук - це метод інформаційного пошуку, в якому релевантність документа запитом визначається семантично, а не синтаксично.
Існує проблема масштабування семантичної бази даних. Як правило, семантичні запити накладають обмеження на зв'язку між поняттями. На кожному вузлі розподіленої семантичної бази даних повинна бути необхідна запитом інформація.
3.Можливості систем стосовно змістовного пошуку в текстах, документах, картинках.
На одинаків запит дві системи видають схожі результати відносно зображень ,відео ,та документів.
Пошук зображень
Пошук зображень в Інтернеті вже давно став звичним: користувач очікує від пошукової системи точної, швидкої і повної відповіді подібно до пошуку текстової інформації. Більшість популярних пошукових систем поруч з пошуком веб-сторінок з текстовою інформацією втілюють можливість пошуку зображень.
Яндекс. Картинки https://yandex.ua/images/search?text=Франція&parent-reqid=1482671866159736-9435661638323729125314733-iva1-0880
4. Аналітичні висновки щодо властивостей сучасних пошуковиків та отриманих результатів.
Отже, пошукова система – спеціальний веб-сайт, на якому користувач по заданому запиту може отримати посилання на сайти, відповідні цим запитом. Існує достатня кількість інтерфейсів для цієї мети на будь-який смак. Зазвичай користувач вибирає самий зручний інтерфейс і користується ним все життя.
Головним завданням пошукової системи є здатність надавати користувачам саме ту інформацію, яку вони шукають. А навчити користувачів робити «правильні» запити до пошукової системи, які відповідають її принципам роботи неможливо. Тому, розробники створюють такі алгоритми і принципи роботи пошукових систем, які найкраще пристосовані до поведінки і ходу думок користувача.