Интернет іздеу жүйесі
Ақпаратты іздеу әдістері
Интернет желі пайда болғанымен, іздеу жүйесінің мәселесі үлкейе бастады. Интернет – бірлік ақпараттық ортаны қамтама ететін дүние жүзілік компьютерлік желі. Әр бір есепті шешу үшін оны мүмкін болатын әдістерін зерттеу керек. Интернетте ақпаратты іздеу бірнеше әдістермен орындалуы мүмкін. Олар сапасы, тиімділігі және ақпаратты алу түріне байланысты болады. Кейбір жағдайларда жұмысы күрделі әдістерді қолдану керек болады, бірақ та оның нәтижесі тиімді болады.
Ақпараттық жүйе келесідей бөлімдерді қамтамасыз етуі тиіс: техникалық қамтамасыз ету, математикалық қамтамасыз ету, программалық қамтамасыз ету, ақпараттық қамтамасыз ету, құқықтық қамтамасыз ету.
Сурет-1 - Ақпараттық жүйенің жалпы құрылымы
Интернетте ақпаратты табу келесі негізгі әдістерден тұрады:
- гиперсілтеме арқылы іздеу. WWW ортасында барлық сайттар бір-бірімен байланыста болады, осы байланысқан сайттарды браузер арқылы ақпаратты іздеуге болады. Каталогтарды, тақырып жиынтығын және де басқа анықтамаларды қолдану осы түрге жатады;
- іздеу машинасын қолдану. Бұл әдіс кілттік сөздерге негізделген. Серверлік машинаға аргумент ретінде не іздеу керектігін жібереді. Барлығын дұрыс жасау үшін кілттік сөздерге тезаурусты құру керек;
- әдістемелі жабдық қолдану арқылы іздеу. Бұл толық автоматтан-дырылған әдіс. Жоғарыда айтылып кеткендей сайттар бір-бірімен гипертекст байланысы арқылы ақпаратты автоматты түрде іздейді;
- жаңа ресурстарды зерттеу. Жаңа ақпарат көзіне қол жеткізу үшін іздеу циклін қайталауды қажет етеді. Осының көмегімен іздеу машиналары индекстерін жаңартып отырады.
Google іздеу жүйесі
Google – қоғамдағы интернет іздеу жүесінің ең үлкен жүйелерідің бірі болып табылады. Оның интерфейсі шамамен он шақты тілде таралған. Қазақ тілі де қарастырылған. Жаңа іздеу жүйесі құру үшін алдымен сайтта тіркеуден басталады. Әдейі формада іздеу атын жазып, іздеуге қысқаша андатпа және кілттік сөздер жинағын беру керек. Іздеу жүйесі үш тәртіпте жұмыс істейді. Оларға: барлық Google дерекқор бойынша қарапайым іздеу, тек сайтта қосымша қосылған индекс бойынша іздеу, Google базасы бойынша бірінші қадамдағы қосылыған индекстің шығыс мәліметтерін көрсету. Дегенмен Google-де дайын индекс базасы қолданылады.
Google екі баптау файлдар жүйесі қарастырылады: «контекст», тегтер сипаттамасы мен жалпы толық іздеу өлшемдерінен тұрады, сонымен бірге «андатпа», бұл жерде сайттардың индекстеріне қосылған тізбектен және олардың жеке күйлерінен тұрады.
Файл жүйесін тура түзету үшін XML тілін аз да болса да білу керек, бірақ іздеу жүйесін толық басқару мүмкіндігі еліктіреді. Қазірігі кезде тегтер саны онша көп емес, бірақ беретін нәтижелері жоғары. Мысалға, BOOST тегі нәтиже беру бетте анықталған сайтың орналасуын бағыттай алады. Қалыпты жағдайда Google іздеу жұмысы стандарты алгоритмдері қолданылады, бірақ олар тақырып бойынша іздеу үшін әрқашанда тиімді болмайды. Яғни толық мазмұны жағынан сәйкес болғанымен, қысқа маңызды жерлері жіберіліп қалуы мүмкін. Ал BOOST тегі көмегімен дәл осындай мәліметтерді нәтиже бетінде бірінші орындарға шығаруға мүмкіндік береді. Ол үшін алдымен XML-файлда «контекст» бөлімінде <Background Labels> табу керек және <Labels> </Labels> контейнер көмегімен жаңа аты бар, белгіні құру керек. Оның өлшемі сан ретінде қолданылған белгі арқылы нәтиже салмағы қойылады. Мүмкін болатын интервалы -1-ден 1-ге дейін. Бір мағынасы табылған сайттар бірінші орындарда болады. Кейін «андатпа» тура түзету жүйесі орындалады. Бұл жерде бірінші орынға түсетін сайттарға құрған белгіні қосу керек. Орналасқан адресі: http://www.google.kz/.
Сурет-1.1 - Google ортасы
Yahoo іздеу жүйесі
Yahoo! - ең атақты іздеу жүйелердің бірі. Бұл сайт каталог және кілтті сөздерден тұрады. Басты бетінде пайдалы ақпарат мазмұнынан тұрады. Дерекқоры жаңалықтардан, карталардан, жарнама ақпараттарынан, анықтамалардан тұрады. Құрамы жағынан интернет ресурстардың URL адрестерден және оларға қысқаша мағұлматтардан тұрады. Yahoo қарапайым іздеу терезесін ұсынып қоймай, сонымен қатар Usenet немесе Email адрестерді іздеуге болады. Белгілі іздеу уақыт арасындағы шекті қою мүмкіндігі бар. Қосымша булдік операторлары және тізбек іздеу жүйелерден тұрады. Ескерте айта кететін нәрсе Yahoo іздеу жүйесінде керек мәлімет көзі табылмаса, автоматты түрде Alta Vista іздеу жүйесі жұмысын жалғасытырады, егерде оң нәтижелерін берсе, онда Yahoo іздеу жүйесіне нәтижелерін қайтарады. Орналасқан адресі: http://www.yahoo.com/.
1.2-сурет - Yahoo ортасы