Пошук інформації в Інтернет
Лекція з теми. Засоби пошуку інформації в Інтернеті.
Щоб переглядати інформацію в Інтернет потрібно мати як мінімум одну програму, що називається браузер. Серед найпоширеніших слід відмітити такі браузери, як:
- Internet Explorer - популярний, оскільки є частиною операційної системи Windows та має російськомовний інтерфейс;
- Opera - є комерційною програмою, більш зручна та захищена, порівняно з Internet Explorer. Якщо завантаження файлу було завчасно припинено, то Opera, на відміну від Internet Explorer, дозволяє продовжити завантаження.
- Mozilla Firefox - безкоштовний браузер, що з'явився останнім часом і стрімко набирає шанувальників.
До типових елементів кожного вікна в операційній системі у інтерфейсі браузерів додано рядок адреси або поле для вводу адреси сторінки. Дуже типо-вою є і панель інструментів з кнопками повернення до попередньої сторінки, зупинки завантаження.
Вікна браузерів мають різну будову, але такі елементи є спільними:
1. Панель меню - серед найбільш вживаних команд зберігання сторінки на ло-кальному комп'ютері, зміна кодування (якщо текст не читається),
2. Панель інструментів - найбільш вживані команди повернення до попередньої сторінки, припинення завантаження сторінки.
3. Рядок адреси - саме сюди ви вводите адресу потрібної сторінки.
4. Кнопка для переходу по набраній адресі - можна і не використовувати, а на-тискати на клавіатурі "Enter".
5. Робоче поле - відображається сторінка.
6. Рядок стану - при наведенні курсору на посилання тут з'являється адреса, що при деякому досвіді дозволяє зрозуміти, куди веде посилання (інший сайт, той самий сайт, інше місце на той самій сторінці).
Для того, щоб отримати доступ до Інтернет - ресурсів, необхідно знати їх мережеву адресу. Оскільки Інтернет постійно поновлюється і розвивається, в ньому не може буди єдиного каталогу, так само як немає єдиної світової теле-фонної книги. Водночас в Інтернеті є різні інформаційно-пошукові системи, що допомагають користувачам знайти потрібну інформацію.
Прикладами таких пошукових систем можуть бути:
- тематичні каталоги;
- пошукові системи.
Тематичні каталоги.
Якщо потрібна загальна інформація із глобальної теми або деяких її областей, доцільно користуватися пошуковими тематичними каталогами. Тематичні ката-логи - це інформаційно-довідкові системи, які створюються вручну редакторами на основі інформації, зібраної на серверах Інтернету. Вони мають деревовидну структуру. Всі галузі людської діяльності поділяються на групи: наука, техніка, мистецтво, економіка, політика, спорт тощо, а ті, в свою чергу, - на підрозділи. Наприклад, мистецтво - це література, театр, живопис, музика, архітектура. Далі йде детальніша класифікація. Так, до театрального мистецтва належать опера, балет, драма, мюзикл та ін. В тематичних каталогах Інтернету, як і в бібліотечній справі, не існує єдиних стандартів класифікації.
Каталоги організуються за темами і, як правило, містять гіперпосилання для повернення на верхній рівень web-сайту каталогу, а не на окремі сторінки у ме-жах цього web-сайту. Користувачі каталогів починають пошук, вибираючи за-гальну тему чи відповідну тематичну категорію, а потім крок за кроком зву-жують межі пошуку.
Працювати з пошуковими каталогами нескладно. Пошук інформації корис-тувачем відбувається на інтуїтивному рівні і практично завжди закінчується ус-піхом. Однак за цією простотою приховується складність, пов'язана з розробкою і веденням каталогу. Пошукові каталоги створюються, як правило, вручну. Висо-кокваліфіковані редактори особисто переглядають інформаційний простір Інтер-нету, відбирають те, що, на їх думку, становить загальний інтерес, і заносять ад-реси таких публікацій до каталогу. Як правило, каталоги ресурсів складаються на основі експертних оцінок.
Основною перевагою такого засобу пошуку є чітка відповідність змісту сайтів тематиці, оголошеній для кожного розділу. Недоліком є неповне охоплення існу-ючих у мережі ресурсів, оскільки відслідкувати весь обсяг інформації, наявної в Інтернеті, практично нереально навіть для значної кількості персоналу, яких об-слуговує сервер. Якщо в одному тематичному каталозі не одержано задовільних результатів, слід звернутися до іншого. Результати пошуку в тематичних катало-гах часто бувають дуже різними, оскільки web - сайти, що включаються до кож-ної тематичної категорії, обираються вручну людьми, а не системами.
Тематичні каталоги є початковими засобами пошуку інформації і дозволяють розв'язувати стандартні задачі - пошук сайтів певного тематичного призначення, на яких можна знайти колекцію тематичних посилань. Для полегшення процесу знаходження можна використати пошук у каталозі.
Список деяких тематичних каталогів:
· Yahoo! Directory (http://dir.yahoo.com/),
· MavicaNET (http://www.mavicanet.com/),
· російські каталоги Яндекс (http://yaca.yandex.ru/),
Апорт (http://www.aport.ru/),
· українські Мета (http://meta.ua/) і
UaPortal (http://www.uaportal.com/ukr/Catalog/).
Пошукові системи.
Якщо відома конкретна назва, фраза або термін, то для одержання інформації щодо предмета пошуку слід використовувати пошукові системи. Пошук на таких системах здійснюється за допомогою спеціально розроблених програм. Завдання програм полягає у безперервному відвідуванні web - сайтів Інтернету з метою створення каталогів web-сторінок. У більшості випадків для визначення місце-знаходження певної інформації, наприклад, якогось відомого документа, зобра-ження або фрази, а не загальної теми, найкраще застосовувати пошукові системи.
Пошукові системи працюють з використанням автоматичних засобів при докладанні мінімуму ручної праці. З одного боку, це дає можливість порівняно швидко опрацьовувати велику кількість web - документів і створювати бази да-них розміром у сотні мільйонів web - документів. З другого боку, ніхто не може гарантувати, що наявність у документі певних слів, за якими здійснюється по-шук користувачем, вказує на належність документа до конкретної теми. Тому точність пошуку інформації в таких базах даних залишає бажати кращого. А по-шукові системи зручні для використання лише тоді, коли користувач знає ім'я автора документа, його точну назву або якусь цитату з нього. Разом з тим бази даних у пошукових систем значно більші за бази даних тематичних каталогів. Та й поновлюються вони частіше.
Як свідчить практика, пошукові системи дозволяють провести найбільш глибокий пошук у рамках заданої теми. Робота пошукової системи проводиться в три етапи. На першому етапі сканується інформаційний простір і збираються копії web-ресурсів. На другому етапі бази даних, складені за результатами скану-вання, змінюються таким чином, щоб у них можна було проводити прискорений пошук. На третьому етапі пошукова система приймає запит від користувача, проводить пошук у своїх базах даних і видає web - сторінку з оформленими результатами пошуку.
Приклади деяких пошукових систем:
google.com.ua - на теперішній час найкраща пошукова система, пошук на укра-їнській, російській, англійській мові, швидке завантаження сторінки;
rambler.ru - фаворит минулого року, пошук на українській, російській, англійсь-кій мовах, містить також пошуковий каталог і багато сервісів;
meta.ua- найкраща для пошуку офіційних україномовних документів, містить пошуковий каталог та сервіси;
yandex.ru - пошук на українській, російській, англійській мовах, містить також пошуковий каталог та багато сервісів;
aport.ru
Формування запиту до пошукових систем.
Пошук за одним словом у більшості випадків призводить до формування величезного списку web-сторінок. Наприклад, пошук за словом погода за допо-могою google.com.ua дає 26600000 сторінок з цим словом.Знайти в ньому потріб-ні ресурси непросто, і тому пошук за одним словом малоефективний. Набагато ефективнішим є пошук за кількома словами, але тут важливу роль відіграє пра-вило, що вказує пошуковій системі, як опрацювати групу слів.
Для ефективного пошуку за кількома ключовими словами потрібні спеціальні вказівки, які дозволяють зв'язати окремі слова між собою. Ці вказівки в пошуко-вих системах утворюють спеціальну мову запитів, що містить кілька вказівок.
Кожна пошукова система має свою власну мову запитів, і при використанні різних пошукових систем треба знати особливості кожної. Тому доцільно перег-лянути сторінку із довідковою інформацією про методи здійснення пошуку.
Загальні правила розширеного пошуку:
- краще використовувати початкову форму слова, інші будуть знайдені автома-тично (тобто, запит зі словом університет дозволить знайти сторінки з словами університет, в університеті, університетом тощо);
- не має значення, з якої літери (великої/малої) писати слово, будуть знайдені всі варіанти;
- якщо в запиті кілька слів, то буде знайдено документи що містять обидва слова. Спочатку будуть запропоновані сторінки, де ці два слова розміщено один біля одного;
- якщо кілька слів запиту взято у лапки, то буде знайдено всі документи, де ці два слова обов'язково поряд;
- якщо перед одним зі слів запиту набрати знак мінус, то будуть знайдені доку-менти де є інші слова запиту, але немає слова з мінусом.
Для більш ефективного пошуку інформації можна використати розширений пошук, в якому задаються необхідні параметри.
Правила ефективного пошуку в Інтернеті.
Документи, що відповідають запиту, називаються релевантними. Релевантність – це ступінь відповідності змісту документа, який знайдений в результаті інформаційного пошуку, змісту інформаційного запиту.
Пошукові запити (ключові слова) це основа для написання інформаційного наповнення веб-сайту, оскільки саме вони виражають інформаційну потребу користувача. Тому одне з головних завдань при створенні інформаційного наповнення для тексту – вміти не просто включати в текст сайту пошукові запити, а максимально повно і точно розкривати і задовольняти інформаційну потребу, в тому числі за допомогою ключових слів. Всі запити до ПС у WWW можна розділити на типи відповідно до цілей користувача:
- перехід на конкретний сайт;
- отримання інформації (або відповіді на питання );
- вчинення дії.
Розглянемо пошук за ключовими словами. Наприклад, дізнатися, якою буде погода завтра у Києві, достатньо ввести через пропуск (або знак « + ») у відповідне поле пошуку два слова (погода Київ або погода + Київ) і натиснути на клавішу вводу чи кнопку Поиск. Отримаємо список посилань на сайти, які мають шукану метеоінформацію. Тепер достатньо вибрати одне з них або декілька для порівняння.
Щоб дізнатися про результати ігор або плани футбольного клубу «Динамо» Київ, достатньо трьох (або й двох) ключових слів — футбол Динамо Київ.
Під час пошуку система розглядає корені слів. Тому результати пошуку можуть містити слова у відмінках і у різному порядку. Не розглядаються введені користувачем прийменники. Якщо отримують дуже багато посилань, то для ефективнішого пошуку застосовують так званий розширений пошук, накладаючи додаткові умови. Наприклад, якщо деякого слова не має бути в ресурсі, то в рядку пошуку перед ним ставлять знак «-». Наприклад, пошук за ключовими словами (футбол Динамо–Київ) дасть список ресурсів про всі футбольні клуби «Динамо», крім київського. Щоб знайти ресурс, що містить фразу дослівно, її треба взяти у лапки. Правила розширеного пошуку в конкретній пошуковій системі описані в її довідковій службі.
Отже, головний принцип пошуку інформації на web-cepвepax полягає у використанні тем (розділів, категорій) пошукових систем (спорт, музика, погода, фільми, освіта, політика тощо); ключових слів чи повної назви об'єкта пошуку. Таку повну назву беруть у лапки, наприклад, «Шевченко Тарас Григорович».
У навчальних цілях пошук у мережі здійснюють з метою збору матеріалів для підготовки рефератів з різних предметів. Зазначимо важливе правило етикету: у списку літератури обов'язково потрібно вказувати web-aдpecи використаних ресурсів.
Оператори для формування запитів
Оператор | Синоніми | Коментар |
І | AND & | За запитом будуть знайдені документи, що містять обидва ключових слова. Його можна і не писати. Наприклад, запит: інформатика і підручник еквівалентний інформатика підручник |
АБО | OR | | Проводиться пошук тих документів, в яких викорис-товується будь-яке з вказаних слів або обидва слова одночасно . |
НЕ | NOT - ~ | Пошук обмежується документами, що не містять слово, вказане після оператора. |
"" | '' | Подвійні або одинарні лапки дозволяють знаходити словосполучення. |
Дата = | дата: date = | Пошук обмежується документами, що потрапляють в заданий інтервал дат. Приклад 1. валюта дата = 01/02/2002-01/03/2002. За цим запитом будуть видані документи, що містять слово "валюта" та мають дату від 1 лютого 2002 р. до 1 березня 2002 Приклад 2. date = 01/03/2002 валюта Приклад 3. дата: <02/03/2002 валюта |
Збереження сторінок.
Робота з папкою Избранное і з журналом Завантаживши потрібну сторінку, її можна переглянути, надрукувати, зберегти у власній папці на диску як набір файлів. Часто потрібно зберегти посилання на сторінку в папці вибраних сторінок. Таку папку називають Избранное. Збереження можна зробити за допомогою контекстного меню чи кнопки. Вибрані ресурси відкривають шляхом активізації відповідного раніше збереженого посилання у папці. Избранное.
Для структуризації вибраних посилань у папці Избранное варто створювати додаткові (особисті чи тематичні) папки командою Добавить в папку Избранное... → Создать папку.
Для перегляду сторінок, які відкривали раніше, корисним є журнал обліку відвіданих ресурсів. Браузер веде його автоматично. Він містить у хронологічному порядку за днями тижня чи в іншому порядку назви й адреси всіх сайтів, які відвідував користувач протягом певного часу. Журнал відкривають командою Вид → Панель обозревателя → Журнал. Активізувавши тут адресу сайту, відкриється список назв відвіданих па ньому сторінок. Якщо назва сторінки сірого кольору, то це лише посилання на ресурс. Якщо ж звичайне написания, то це ресурс, що с в пам'яті комп'ютера па диску. Його можна відкрити в автономному режимі (off-line), тобто не під'єднуючись до Інтернету.
Налаштовування браузера.
Браузер налаштовує користувач до своїх потреб засобами команд Сервис → Свойство браузера.
Тут можна:
1)задати обмеження доступу неповнолітнім щодо перегляду сайтів для дорослих; 2)створити профіль з особистими даними, якщо користувач хоче популяризувати інформацію про себе в Інтернеті;
3)задати рівень безпеки доступу до сертифікованих інформаційних ресурсів (високий, середній, низький);
4)вибрати одне з можливих підключень до Інтернету;
5)задати правила зберігання у журналі відвіданих за певну кількість днів сторінок;
6)вимкнути режим відображення рисунків з метою прискорення роботи браузера;
7)вимкнути відтворення звуку, відео та анімації;
8)заблокувати контакт з окремими адресами тощо.
Кодування. Якщо текст україно- чи російськомовної сторінки відображається неправильно, то потрібно змінити спосіб кодування сторінки командами Вид, Кодирование. Тип кодування потрібно з меню підбирати навмання з-поміж таких способів кодування (кодових сторінок):
Кирилиця (Windows);
Юнікод;
Кирилиця (DOS);
Кирилиця (KOI8-U);
Кирилиця (K0I8-R) тощо.
Література:
- Інформатика: 9 кл.: підруч. для загальноосвіт. навч. закл./ Й.Я. Ривкінд, Т.І. Лисенко, Л.А. Чернікова, В.В. Шакотько; за заг. ред. М.З.Згуровського. – К. Генеза, 2009.
2.Інформатика: Підручник для 10-11 кл. загальноосвіт. навч. закладів/
І.Т.Зарецька., А.М. Гуржій ,О.Ю. Соколов: У 2 ч.- Х: Факт, 2004. – 1ч.
3. Гаевский А.Ю. Информатика: 7 – 11 кл.: Учеб. пособие.- 2-е узд., доп.- К.:
А.С.К., 2005.
4. Інформатика в означеннях, таблицях і схемах, 10-11 класи.- 7-е вид. – Х.: Веста: Видавництво «Ранок», 2008.