Разработка стратегии поиска
На этом этапе следует, прежде всего, выбрать БД или файлы (во всех крупных информационных системах база данных называется файлом), в которых целесообразно искать требуемую информацию и которые доступны в рамках применяемой онлайновой системы. Здесь помогают справочно-информационные материалы с описанием структуры файлов и их предметного наполнения. Их обычно предоставляет Вендор после заключения контракта.
Затем следует наметить основные шаги информационного исследования и последовательность их выполнения (т.е. разработать стратегию поиска). Это наиболее сложная задача, требующая знания структуры и содержания файлов, методов работы с документами или записями, из которых состоит файл, знания ценовых факторов (формы контракта с Вендором). Далее необходимо по каждому шагу составить задание на поиск (см. ниже), конкретизировать составленный стратегический план в командах поисковой системы, используемой на Host-компьютере для поиска информации. Фактически разработанная стратегия поиска позволяет сделать понятными поисковой системе вербализованные и алгоритмизированные информационные потребности пользователя.
Это своего рода информационный фильтр. Всю эту работу необходимо выполнить, не соединяясь с Host-компьютером. После этого можно приступать непосредственно к решению задачи. Чем тщательнее была проведена подготовительная работа, тем точнее будут полученные результаты и тем меньше времени и средств будет затрачено на ее решение.
Стандартный формат задания на поиск имеет следующий вид:
Таблица №2
Для | LEXIS –NEXIS <имя библиотеки> <имя файла> <поисковый запрос> | для | QUESTEL-ORBIT <имя файла> <поисковый запрос> |
В LEXIS -NEXIS библиотека - это несколько десятков или сотен файлов, объединенных по тематическому признаку. В файл включена информация или из одного информационного источника, например, газета "The New York Times" с 1982 года, или, как в случае файла PROMT, информация из полутора тысяч информационных источников. Границы между файлами или библиотеками размыты, что создает как некоторое неудобство, так и гибкость при работе с системой. Файлы состоят из документов, а те, в свою очередь, из сегментов или параграфов.
В QUESTEL-ORBIT нет разделения на библиотеки. Пользователь работает только с файлами. При этом файл в QUESTEL-ORBIT почти всегда содержит практически все информационные источники по проблеме. Например, файл CAS - Chemical Abstract Services включает в себя все статьи, доклады на конференциях, пресс-релизы компаний и тому подобную информацию, связанную с научными и коммерческими вопросами химии. Всего CAS обрабатывает более 9000 информационных источников. В QUESTEL-ORBIT файл состоит из записей.
Перечень библиотек, файлов, их полные и сокращенные имена, сведения о том, какого рода информация входит в тот или иной файл, содержатся в специальных справочных руководствах. Эти руководства пользователь получает от компании, с которой он заключил контракт на информационное обслуживание.
Рассмотрим теперь последний компонент задания на поиск - поисковый запрос. В поисковом запросе формулируется и записывается по определенным правилам концепция поиска. В общем случае концепция поиска представляет собой достаточно сложное образование. Главным (иногда единственным) элементом концепции поиска и соответственно поискового запроса является ключевое слово или сочетание слов, которые определяют эту концепцию. Слова или их сочетания должны с большой степенью вероятности содержаться в тексте искомого документа.
Так, например, запись поискового запроса в виде software инициирует поиск всех документов, содержащих этот термин (software-программное обеспечение), а по запросу lazer (laser) technologies будет осуществляться поиск документов, где упоминаются лазерные технологии.
Для того, чтобы составить задание на поиск, необходимо владеть английской терминологией, характерной для данной предметной области, знать точные английские эквиваленты ключевых слов и понятий, которые будут использоваться при поиске необходимой информации. Например, интересуясь такой темой как "запоминающие устройства для ЭВМ" вам надлежит применять термины, принятые в английском языке для этого понятия - "memory" и "storage". При этом следует определиться, какой из них подходит для вашего случая. Точный выбор ключевого слова - непростая задача. В большинство баз данных документы (записи) поступают из многих источников, а в разных регионах (странах) разными авторами публикаций для воспроизведения одного и того же понятия могут быть использованы отличные друг от друга термины. Для облегчения этой задачи в некоторых онлайновых системах (LEXIS-NEXIS) применяются встроенные вспомогательные словари и тезаурусы, в других (QUESTEL-ORBIT) - реализована возможность просмотра словаря файла.
Важным инструментом для формулирования поисковой концепции являются знаки логических операций "and" (и - логическое умножение) и "or" (или - логическое сложение), которые служат для соединения двух или нескольких ключевых слов или концепций. Поясним их использование на примерах.
Поисковый запрос "small business" (малый бизнес) and "investments" (инвестиции) вызовет поиск документов (записей), в которых упоминаются оба записанных слова.
Запрос "small business" and "Petersburg or Moscow" приведет к поиску документов, в которых наряду со словами "малый бизнес" будут также встречаться название городов "Санкт-Петербург" или "Москва". Таким образом, с помощью <and> можно уточнить поиск, сузить его область, а по операции <or> расширить ее.
Кроме вышеперечисленных операций <and> и <оr> в поисковых запросах используются и другие средства, например, операция контекстной близости W. Эти операции составляют ядро любой поисковой системы и знание их уже достаточно для решения широкого класса задач. По мере того, как приобретается опыт, можно использовать более сложные элементы поисковых систем, позволяющие различать единственное и множественное число, строчные и заглавные буквы, контролировать частоту появления ключевых слов в документе, проводить статистический анализ и перекрестный поиск.
Существуют различные формы поиска: в виде стандартного логического поиска, в режиме меню (ответы на предлагаемые системой вопросы), формулировки задачи на естественном языке (английском), в технике вербальной формулировки задачи (речевой интерфейс).
Отметим, что в LEXIS-NEXIS язык поисковой системы достаточно прост, так как большинство файлов являются полнотекстовыми, но требования к корректной формулировке стратегии поиска здесь строже. В QUESTEL-ORBIT большую часть информации составляют патенты, товарные знаки, структурные химические формулы. Файлы обладают более сложной структурой и в целом язык поисковой системы сложней, чем в LEXIS -NEXIS. С другой стороны, он предоставляет пользователю большие возможности (например, средства для статистического анализа найденной информации, перекрестного поиска и т.д.).
Решение задачи
Сеанс работы в онлайновом режиме начинается с соединения с узлом компьютерной сети, а затем с Host-компьютером выбранной информационной системы. После ввода своего пароля возможен доступ к информационным ресурсам системы. Методы решения задачи в онлайн режиме могут быть различными. Выбор метода зависит как от квалификации и опыта пользователя, так и формы контракта между пользователем и Вендором. Начинающему пользователю рекомендуется следующая простейшая схема. Прежде всего, надо позаботиться о сохранении на винчестере найденных в процессе решения задач документов. Это весьма просто и большинство коммуникационных программ, которые вы получаете при подписании контракта, имеют простые команды, позволяющие сохранять тексты, поступающие к вам на экран компьютера.
Затем следует шаг за шагом вводить задания на поиск, которые входят в предварительно составленный стратегический план. Введенное задание на поиск выполняется практически мгновенно. После каждого шага необходимо просмотреть полностью или частично найденные документы и сохранить их у себя на винчестере. Существует также форма сохранения найденных документов без их просмотра на экране компьютера. Это удобно при работе с большими отчетами, длина которых может составлять до нескольких сотен страниц.
Отметим, что при этом подходе минимизируется онлайновое время сеанса (иногда весьма дорогое), сама процедура поиска выполняется достаточно быстро. В итоге, после нескольких минут работы в онлайн режиме, можно получить солидную порцию информации, требующую для ее внимательного просмотра и анализа нескольких часов, или даже дней. Просмотрев полученные результаты, можно модифицировать свою стратегию, если она была не очень удачной, составить новый план и новые задания на поиск и повторить описанную выше процедуру в следующем онлайновом сеансе.
Как правило, только специалисты, хорошо знающие исследуемую предметную область и четко представляющие себе, какого рода информация им нужна и что является "лишним", могут себе позволить работу в полноценном интерактивном режиме по схеме типа: "запрос - ответ - беглый просмотр и анализ результатов - новый уточненный запрос и т.д.".
Иногда решение задачи не приводит к ожидаемому результату - найти нужную информацию не удается. Однако чаще всего это вовсе не свидетельствует об ее отсутствии в БД. Уточнив формулировку, изменив подход к решению задачи, скорректировав стратегию поиска, можно выйти на искомую информацию.
В любом случае очевидно, что результативность, точность решения, затраченные время и средства, в конечном счете, определяются опытом и знаниями пользователя, его способностью квалифицированно сформулировать задачу, умением ориентироваться в информационном пространстве, навыками построения грамотной стратегии поиска, анализа получаемой информации.
Информация научно-технических баз данных (например, патентных) применяется, в том числе, при изучении рынка - при реализации метода деловой и конкурентной разведки.
Одной из составных частей маркетинга является сбор информации о стратегии конкурентов, в то время как получить эту информацию из аналитических отчетов или открытой печати достаточно трудно: рыночная стратегия компании, как правило, представляет собой коммерческую тайну. Для сбора подобной информации о своих конкурентах фирмы применяют различные методы коммерческой разведки. И здесь мощным инструментом могут стать БД с информацией об интеллектуальной собственности (патенты и товарные знаки).
Часто патент бывает первой публикацией о разработке, исследовании, изобретении. Анализ описаний патентов позволяет судить о направлениях инновационной деятельности фирмы-конкурента, которая обычно направлена на создание нового продукта. По этим описаниям специалист вполне может составить представление о новом продукте задолго до его появления на рынке.
Согласно результатам исследований патентного ведомства ФРГ, около 30% всех затрат на исследование ежегодно тратятся на параллельные разработки и почти 18 млрд. марок ежегодно расходуются напрасно на продукты и процессы, которые уже запатентованы. Компании, использующие БД для тщательного контроля своих разработок, увеличивают выход своих исследовательских программ по меньшей мере, на 30 %.
Маркетинговую стратегию конкурентов анализируют, в первую очередь, по патентам, в которых фактически описано ноу-хау нового продукта. При этом название страны, в которой патент зарегистрирован, следует рассматривать, как символ того, что компания собирается работать на конкретной территории.
Большие компании для выхода на новые рынки или для продвижения нового продукта на уже освоенном рынке действуют скрытно, учреждая дочерние компании, иногда с новыми именами, для того, чтобы выяснить реакцию на новый продукт или оценить возможность работы на этих новых рынках. Классическими информационными средствами довольно трудно выявить такие скрытые намерения. Патентный поиск будет незаменимым и здесь.
При формировании файла WPATIWPIL производитель этой базы данных, компания Dewent, часто присваивает патентующим фирмам определенный универсальный код. Все дочерние подразделения этой компании, также будут иметь этот код, он-то и является тем средством, которое позволяет выявлять компании избегающие публичного освещения своей деятельности.
Ниже приводится список российских онлайновых баз данных, которые можно найти в Gale Directory of Databases. Большинство баз данных содержат новости (7 БД), информацию о компаниях, экономические проекты и деловые предложения (8 БД), а также информацию по определенным отраслям промышленности (10 БД). Наиболее крупные производители информации в России: Международный центр научной и технической информации (МЦНТИ) - 13 БД и агентство Russica - 8 БД. Продают российские БД на международном рынке LEXIS-NEXIS, MagnaTex Communicate, Wistlaw и др. Кроме онлайновых БД в Gale Directory приведены еще около 60 БД, распространяемых на CD-ROM, дискетах или других носителях.
Краткая характеристика некоторых БД, производимых в России и доступных пользователям в онлайновом режиме через системы LEXIS-NEXIS, Westlaw, MagnaTex Communicate, DataStar, DIMDI, STN:
BizEkon News-Soviet Business Directory. Содержит информацию о более чем 33 тыс. компаниях, вовлеченных в международный бизнес. (PDR - Russica; VE - LEXIS-NEXIS, GBI, MagnaTex Communicate);
GARANT. Тексты около 1500 законов и правительственных постановлений в различных областях экономики (PDR - Гарант-Сервис; VE - LEXIS -NEXIS);
RusLegisLine. Полные тексты торговых законов и декретов стран СНГ. Информация о патентах, лицензировании, недвижимом имуществе, торговых марках (PDR - Russica; VE - LEXIS -NEXIS , GBI, MagnaTex Communicatel, Westlaw);
Who is who in Russia and the Commonwealth of Independent States. Биографические данные более чем 500 политиков и военных, а также ученых, спортсменов, артистов и т.д. (PDR - Russica; VE - LEXIS -NEXIS, MagnaTex Communicate);
RUSMED Articles. Более 300 тыс. ссылок на "Российский биомедицинский журнал", материалы конференций и исследовательские статьи. (PDR - Центральная научно-медицинская библиотека; VE - DIMDI).