Практична робота№ 8. Пошук інформації в Internet
Мета роботи: навчитися застосовувати різні стратегії пошуку інформації в Internet, набути практичних навичок використання різних пошукових систем.
Теоретичні відомості
World Wide Web (WWW, всесвітня павутина) – це розподілена по всьому світу інформаційна система з гіперзв’язками, існуюча на технічній базі мережі Internet і протоколі передавання даних http. Мережа Internet отримала своє суттєве поширення завдяки всесвітній павутині.
WWW – децентралізована система, в якій часто складно знайти потрібну інформацію. Мета пошуку – швидко знайти потрібну інформацію. Зараз створено потужні пошукові інструменти, наприклад, каталоги сайтів, бази знань, пошукові машини, пошукові роботи – програми, які читають WWW-документи, індексують їхній зміст та ін.
Інформаційно-пошукові системи – це системи мережі Internet, які надають можливість відшукати користувачеві потрібну інформацію у WWW. Для роботи інформаційно-пошукових систем використовуються пошукові служби, які можуть бути реєстраційними серверами іпошуковими роботами (спайдерами). Спайдери різних пошукових систем по- різному індексують документи. Тому результати пошуку інформації в різних пошукових системах можуть відрізнятися.
Пошукова служба здійснює каталогізацію Web-сторінок мережі Internet. Пошукова служба постійно оновлює і поповнює інформацію.
Сьогодні існує багато пошукових систем, першою серед яких була AltaVista, яка почала функціонувати в 1995 р. (рис. 5.25).
Рисунок 5.25 – Перша пошукова система
У даний час інформацію в AltaVista можна шукати 41 мовою, здійснювати розширений пошук.
Серед міжнародних пошукових систем найбільш відомими є:
- Google (http://www.google.com);
- InfoSeek (http://www.infoseek.com);
- Lycos (http://www.lycos.com) (рис. 5.26);
Рисунок 5.26 – Міжнародна пошукова система Lycos
- WebCrawler (http://www.webcrawler.com);
- Yahoo (http://www.yahoo.com);
- Open Text (http://www.opentext.com);
- HotBot (http://www.hotbot.com).
Серед російських пошукових систем найбільш відомими є:
- Rambler (http://www.rambler.ru) (рис. 5.27);
Рисунок 5.27 – Російська пошукова система Rambler
- Яndex (http://www.yandex.ru);
- Апорт (http://www.aport.ru);
- ListRu (http://www.list.ru);
- Hi (http://www.hi.ru).
Серед українських пошукових систем найбільш відомими є:
- МЕТА (www.meta.ua) (рис. 5.28);
Рисунок 5.28 – Українська пошукова система МЕТА
- Uaport (http://uaport.net);
- Холмс (http://www.holms.ukrnet.net);
- UaList (http://www.ualist.com);
- Sesna (http://www.uazone.net/sesna);
- Ping (http://www.topping.com.ua).
Інформацію в мережі Internet можна шукати різними способами. Найшвидше знайти потрібну інформацію можна, якщо точно відома адреса документа. Набагато довше можна шукати потрібну інформацію за гіперпосиланнями на сайтах, які близькі за змістом. Найпоширений спосіб пошуку інформації – це використання пошукових систем.
У каталогах зберігаються тематично систематизовані колекції посилань на різні мережеві ресурси. На відміну від пошукових систем, складання каталогу проводиться людьми (модераторами). Люди намагаються зробити свої колекції найбільш повними, включають всі доступні ресурси на кожну тему. В результаті користувачу достатньо знайти запитання, яке його цікавить в систематизованому каталозі.
Серед українських каталогів найбільш відомими є:
- http://catalog.online.ua (рис. 5.29);
Рисунок 5.29 – Український каталог
Серед російських каталогів найбільш відомими є:
- http://list.mail.ru/index.html (рис. 5.30);
Рисунок 5.30 – Російський каталог
- http://www.ru/rus/index.html;
Серед зарубіжних каталогів популярними є:
Для пошуку в базах відразу кількох пошукових систем можна використовувати системи мета-пошуку.
Системи мета-пошуку – це пошукові машини, які посилають запит користувача на багато різних пошукових систем, обробляють отримані результати, видаляють адреси ресурсів, що повторюються, і подають більш широкий спектр того, що представлено в мережі Internet.
Приклад системи мета-пошуку http://www.search.com наведено на рисунку 5.31.
Рисунок 5.31 – Система мета-пошуку
Ще однією технологією пошуку інформації є системи пошуку людей.
Система пошуку людей – це спеціальний сервер, що здійснює пошук людей в Internet, користувач може вказати П.І.Б. людини і отримати його адресу електронної пошти та URL-адресу.
Але системи пошуку людей, в основному, беруть інформацію про електронні адреси з відкритих джерел. Найбільш відомі системи пошуку людей є такими:
- Whowhere (http://www.whowhere.com) (рис. 5.32):
Рисунок 5.32 – Система пошуку людей
- Four 11 (http://www.four11.com);
- Poiski (http://www.poiski.ru);
- Iaf.net (http://peoplesearch.iaf.net/white-pages.html).
Пошукові інструменти – це особливе програмне забезпечення, основна мета якого – забезпечити найбільш оптимальний і якісний пошук інформації для користувачів Internetу. Пошукові інструменти розміщуються на спеціальних web-серверах, кожен з яких виконує певну функцію:
- аналіз web-сторінок та занесення результатів аналізу до бази даних пошукового сервера;
- пошук інформації за запитом користувача;
- забезпечення зручного інтерфейсу для пошуку та перегляду інформації користувачем.
Інтерфейс пошукового інструменту подано у вигляді сторінки з гіперпосиланнями, рядком пошуку для введення запиту та інструментами активізації запиту.
Індекс пошукової системи – це інформаційна база, складена за певними правилами, в якій розміщуються результати аналізу web-сторінок.
Незважаючи на те, що база даних постійно оновлюється, пошуковий інструмент не може проіндексувати всі Web-документи: їх число дуже велике. Тому завжди існує ймовірність, що шуканий ресурс просто невідомий конкретній пошуковій системі.
Запит – це ключове слово чи фраза, яку вводить користувач у рядок пошуку.
Для формування різних запитів можуть використовуватися спеціальні символи або мова запитів. Синтаксис мови запитів у різних пошукових системах може відрізнятися, зазвичай в довідкових даних на пошуковому сервері наводиться інформація про синтаксис запитів.
Для пошуку інформації користувач набирає ключову фразу або слово, активізує пошук та отримує список документів за запитом, що ранжується за певними критеріями. Вгорі списку виводяться документи, які найбільше відповідають запиту користувача.
Більшість пошукових інструментів пропонують простий пошук (simple search) і розширений пошук (advanced search) (рис. 5.33, 5.34).
Рисунок 5.34 – Розширений пошук у Google
Розширений пошук дає можливість шукати документи певною мовою, змінені в певний час або подані у певному форматі, наприклад Word-документ або презентацію Power Point.
Пошук інформації за одним ключовим словом використовується рідко, оскільки формує довгі списки Web-сторінок, на яких воно зустрічається. Такий пошук доцільний тільки при маловживаних словах або власних іменах. Тому частіше використовується пошук за кількома ключовими словами. При такому пошуку користувачеві часто буває складно створити запит. Таким чином, для пошуку за кількома ключовими словами часто використовують мову запитів.
Розглянемо основні відомості про пошук на прикладі Google (http://www.google.com). Для пошуку потрібно ввести в рядок пошуку запит і натиснути клавішу Enter або кнопку Пошук. Google виконає пошук в Internetі відповідно до вашого запиту. В таблиці 5.1 наведено рекомендації Google, які допоможуть якомога краще скористатися наявними можливостями пошуку.
Таблиця 5.1 – Рекомендації Googlе щодо покращення пошуку
Рекомендація Googlе щодо пошуку |
|
1 |
При пошуку ніколи не враховується регістр символів. Пошуковий запит [Вінницький національний технічний університет] нічим не відрізняється від пошукового запиту [Вінницький національний технічний УНІВЕРСИТЕТ]. |
2 |
Розділові знаки, як правило, не враховуються, як і спеціальні символи, такі як # $ % ^ & * ( ) = + [ ] \ @ @ @ |
Продовження таблиці 5.1
Рекомендація Googlе щодо пошуку |
|
3 |
Запити повинні бути простими. Для більшості запитів зовсім не потрібні рідкісні оператори або витончений синтаксис. |
4 |
Подумайте, які слова присутні на сторінці, яку Ви шукаєте. Пошукова система не людина. Це програма, яка порівнює слова, які Ви вводите, і слова, які є на web-сторінках. Використовуйте слова, які з найбільшою ймовірністю можуть бути присутніми на шуканій сторінці. |
5 |
Опишіть, що вам потрібно, використовуючи якомога менше слів. |
6 |
Підбирайте більш інформативні слова. |
7 |
Пошук за словосполученням (" "). Якщо ви укладаєте набір слів у подвійні лапки, то тим самим даєте команду розглядати зазначені слова саме в такому порядку, без змін. |
8 |
Пошук в межах певного web-сайта (site:). Google дозволяє вказувати, що результати пошуку повинні бути із вказаного web-сайта. |
9 |
Пошукові слова, які потрібно виключити (-). Додання знака мінуса прямо перед словом призведе до того, що сторінки, що містять це слово, не будуть з’являтися в ваших результатах пошуку. Вказуйте знак мінуса безпосередньо перед словом. Знак «-» можна використовувати для виключення не лише слів. Наприклад, поставте його перед оператором "site:" (без пропуску), щоб виключити певний сайт із результатів пошуку. |
10 |
Заповнення порожніх місць (*). Якщо в запиті вказати зірочку (*), то вона буде означати будь-яке невідоме пошукове слово, що дозволяє знайти найкращі відповідності. Наприклад, запит [Google *] видасть результати по багатьох продуктах Google (на кількох сторінках). |
11
|
Пошук точної відповідності (+). Google автоматично виключає синоніми. Якщо поставити знак + безпосередньо перед словом (без пропуску після +), Google знайде точні відповідності саме цьому слову. |
12 |
Оператор OR. За замовчуванням Google враховує всі слова в запиті (оператор AND використовується за замовчуванням). Якщо ви хочете дозволити будь-які з кількох слів, то можете використовувати оператор OR. |
Пошук рідко буває абсолютним. Пошукові системи використовують різні методи для імітації людського мислення і для моделювання поведінки людей. Як результат – у більшості правил є винятки. Наприклад, запит [to be or not to be] буде інтерпретуватися не як запит OR, а як фраза з відомої трагедії Шекспіра. За запитом [34 * 87] Google видасть результати операції множення і не буде використовувати * для заповнення порожніх місць.
Такі часто вживані слова, як артиклі, зазвичай ігноруються (вони називаються стоп-словами). Але у запиті [А і Б сиділи на трубі] "і", найімовірніше, є частиною загадки, і Google буде шукати всю фразу із цим сполучником. А в запиті [використання букв Е і Є] "і" має набагато менше значення і Google може його проігнорувати.
Синоніми можуть заміняти деякі слова в початковому тексті. (Додання + перед словом відключає синоніми.)
Певне слово може не бути присутнім на сторінці в результатах, якщо є достатньо підстав вважати, що ця сторінка релевантна. Ці підстави можуть виникнути з аналізу мови, який виконав Google, чи багатьох інших джерел. Наприклад, запит [вигляд басейну зверху] видасть прекрасні вигляди басейну зверху на сторінках, які не включають слово "зверху".
Пунктуація не ігнорується в популярних пошукових запитах, що мають певне значення, наприклад [C + +] або [C #] (обидва приклади – назви мов програмування).
Знак долара ($) використовується для вказання цін. Запити [ФЕД 50] і [ФЕД $50] повернуть різні результати.
Знак тире – іноді означає, що два слова навколо нього нерозривно пов’язані один з одним.
Символ нижнього підкреслення _ не ігнорується, якщо він з’єднує два слова, наприклад [швидке_сортування].
Мета компанії Google – зробити так, щоб користувачі отримували при пошуку зрозумілі та легкі для сприйняття результати. Результат пошуку зазвичай складається з назви, яка є одночасно посиланням на web-сторінку, короткий опис або цитату з web-сторінки, а також URL-адреси сторінки.
Із невеликої компанії, яка заснована у вересні 1998 р. Ларрі Пейджем і Сергієм Бріном, Google перетворилася на найбільший галузевий концерн, що пропонує послуги простого і швидкого пошуку інформації в Internet та багато інших, не менш цікавих сервісів.
Можливості Google не обмежені лише традиційним пошуком із розширеними налаштуваннями та новинами, а мають багато сучасних сервісів, які постійно поповнюються, а їх якість вдосконалюється (http://www.google.com.ua/intl/uk/options).
На сайті www.google.com люди з усього світу шукають як найсвіжіші новини, так і маловідому інформацію. Провівши аналіз, у цьому потоці часто можна виявити цікаві тенденції, моделі та найнесподіваніші речі. Ці списки дозволяють на підставі пошукових запитів, які йдуть з усіх кінців світу, швидко отримати загальне уявлення про пошукову поведінку користувачів Google.
Хід роботи
1. Завантажити браузер Internet Explorer.
2. Відкрити пошукові сайти і ознайомитися з їх структурою, налаштуваннями та довідковою системою.
3. Провести пошук за ключовими словами та фразами.
4. Застосувати для пошуку оператори мови пошуку.
5. Ознайомитися з результатами пошуку.
6. Порівняти можливості пошукових систем.
7. Знайти відповіді на такі за запитання.
- Справжнє прізвище Кіра Буличева.
- Місце та дата народження математика М. І. Лобачевського.
- В якому році і яку школу закінчила Алла Пугачова ?
- В якому році і де народився Мішель Нострадамус ?
- Засновники фірми Honda і рік її створення.
- Назвати видавця та розробника гри «Брати пілоти».
- Який король правив Францією під час походу Жанни д’Арк на Орлеан ?
- В якому році А. Сахаров став лауреатом Нобелівської премії світу ?
- В якому році Алла Пугачова отримала Гран-прі фестивалю «Золотий Орфей» із піснею «Арлекіно» ?
- Коли і де народився Олександр Ісайович Солженіцин ?
- Коли і за що Олександр Ісаєвич Солженіцин отримав Нобелівську премію?
- Коли і де народився Петро Аркадійович Столипін ?
- Коли і де народився Дж. Р. Р. Толкієн – англійський письменник ?
- Коли і де народився Володимир Висоцький ?
- Коли і де відбулися перші зарубіжні гастролі групи Beatles ?
- В якому році була написана картина Айвазовського «Море. Коктебельская бухта» ?
Контрольні запитання
1. Що таке WWW ?
2. Що таке інформаційно-пошукова система ?
3. Із чого складається інформаційно-пошукова система ?
4. Що таке пошукова служба ?
5. Що таке спайдер ?
6. Яка пошукова система була першою ?
7. Наведіть приклади міжнародних пошукових систем.
8. Назвіть українські пошукові системи.
9. Вкажіть російські пошукові системи.
10. Для чого використовуються каталоги ?
11. Наведіть приклади каталогів.
12. Для чого використовують системи мета-пошуку ?
13. Які Вам відомі системи пошуку людей ?
14. Що таке пошукові інструменти ?
15. Що таке інтерфейс пошукового інструменту ?
16. Що таке індекс пошукової системи ?
17. Що таке запит ?
18. Що може використовуватися для формування різних запитів ?
19. Які є види пошуку ?
20. Наведіть рекомендації щодо покращення пошуку.