Персональный обмен сообщениями

Наиболее популярный тип телекоммуникаций состоит в электронном общении индивидов с другими индивидами, индивидов с группами, групп с группами. Многие из телекоммуникационных проектов используют электронную почту (иногда посредством дискуссионных групп на list-серверах) как единую среду общения. В других проектах преподаватели и учащиеся используют телеконференции и связанные сInternet «доски объявлений». Можно выделить следующие основные разновидности телекоммуникационных проектов.

Свободная переписка. Возможно, это наиболее часто используемая структура телекоммуникационной деятельности, аналогичная переписке по обычной почте. Поскольку переписка между учащимися требует большего внимание, чем многие преподаватели могут ей уделить, можно развернуть свободный обмен электронной почтой между группами. Свободная переписка является прекрасным источником при изучении иностранных языков, культурных традиций различных народов и т.д.

Вот пример вводного сообщения от группы французских учащихся, желающих узнать о том, как в других странах изучаются компьютерные технологии :

«Здравствуйте! Мы -группа 13-16-летних учащихся технологической школы им. Ромена Роллана в пригороде Парижа. На занятиях по технологиям ученики должны разработать проект, связанный с технологиями и компьютерами.Мы хотим переписываться с вами, чтобы узнать о вас больше:

• Что представляет собой ваш класс?

• Где находится ваша школа?

• Изучаете ли вы технологии?

• Что вам больше всего нравится делать?

Мы хотели бы также переписываться о различных компьютерных играх».

Глобальный класс. При этой разновидности структуры переписки два или более класса (находящиеся где угодно) могут совместно изучать одну иту же тему, обсуждая то, что они сейчас изучают по заранее определенному графику.

Вот пример «электронного расписания» месячных проектов по ознакомлению с опасностью СПИДа :

1-15 февраля. Регистрация.

1- 5 марта. Что представляет собой вирус СПИДа?

8-12 марта. СПИД и образование.

15- 19 марта. Выявление СПИДа.

22 - 26 марта. Обмен мнениями о СПИДе.

Предложения для обсуждения и отработки на весь срок проекта включаются в план. Хорошо бы вывесить на стенд сообщения от учащихся, преподавателей и ученых на тему проекта. Побуждайте своих учащихся готовить сообщения на эту тему или на любую другую, которую они хотели бы обсудить. Эти сообщения должны быть красиво оформлены на специальном стенде, чтобы их могли видеть другие учащиеся, родители, администрация, посетители. Учащиеся и учителя участвуют в обсуждении темы через электронную почту.

Электронные «встречи». Электронная почта, телеконференции, электронные доски объявлений могут также дополняться синхронным общением в реальном времени. При этом общение между учащимися и их «гостем» происходит путем поочередной печати на клавиатуре с использованием возможности «переговоров», допускаемой многими системами электронной почты.

Электронное обучение.Специалисты различных профилей из вузов, частных и государственных учреждений, предприятий или школ, связанные через Internet, могут служить «электронными преподавателями» для учащихся, желающих познакомиться со специальными темами в интерактивном режиме. Так, например, в учебных целях может быть организовано общение учащихся с руководителями, политиками, писателями и другими экспертами в определенной сфере деятельности. Другая разновидность такого рода проекта - когда в качестве «электронных педагогов» выступают студенты старших курсов некоторых вузов по отношению к школьникам в других городах и даже странах. Получила известность поисковая служба под названием «Электронные Эмиссары», спонсируемая Техасским центром образовательных технологий и Техасским университетом в Остине. Она помогает желающим найти и установить контакты с экспертами в различных областях знаний во всех странах мира. С ее помощью преподаватели и их классы находят друг друга, разрабатывают структуру учебного проекта и обучаются посредством электронной почты.

Ролевые игры. В проектах, основанных на ролевых играх, участники общаются друг с другом, играя определенную роль. К примеру, профессор истории университета Вирджинии Дженнингс Ваггонер становится Томасом Джефферсоном для нескольких классов средних школ, изучающих историю. В проекте, спонсируемом госдепартаментом образования штата Небраска и университетом Небраски в Омахе, студенты старших курсов по электронной почте играют роли главных персонажей книг, которые учащиеся средних школ Восточной Небраски изучают со своими учителями. Существует большое число таких проектов исторической направленности.

ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ

Некоторые из наиболее успешных образовательных телекоммуникационных проектов построены на сборе, обработке, сопоставлении учащимися различного рода информации.

Информационный обмен. Имеется много примеров тематического обмена информацией, которые могут рассматриваться как телекоммуникационые проекты.

Учащиеся всего мираи их учителя собирают

• народные игры;

• жаргонные слова;

• шутки;

• пословицы;

• народные сказки;

• местную сельскохозяйственную информацию;

• информацию о здоровье;

• описания местныхи национальных праздников;

• афоризмы;

• туристическую информацию о городах.

В проектах этого типа может участвовать много классов и управление ими не становится чрезмерно сложной задачей для учителей. Это весьма плодотворное приложение телекоммуникационных средств, поскольку дети оказываются одновременно создателями и потребителями информации, которой они обмениваются. Проекты такого типа обычно начинаются с приглашения к участию, которое рассылается учителем одного из классов.

Электронные публикации. Другой вид сбора и обмена информацией связан с электронной подготовкой и публикацией общего труда, такого как газета, альманах или литературный журнал. Имеется много примеров таких проектов. Так, известен проект совместного написания «Всемирной поэмы мира». Такая электронная поэма несколько раз обходит весь земной шар от класса к классу, которые добавляют к ней по куплету, прочитав ранее созданное другими классами.

Создание базы данных. Некоторые проекты обмена информацией используют не только сбор информации, но и ее организацию в виде базы данных, которую участники проекта и другие учащиеся могут использовать для обучения. Примером такого проекта является проект «Времена года», имеющий целью привести учащихся к пониманию причин смены времен года и их особенностей в различных климатических зонах. В ходе проекта учащиеся собирают данные и создают базу данных, содержащую информацию о погоде. Отметим, что удачные проекты этого типа хорошо структурированы; они имеют определенное расписание, ясно сформулированные условия участия, побуждают учителей (часто путем заполнения регистрационных форм) следовать определенным руководствам.

Телекоммуникационные экскурсии. Ряд телекоммуникационных проектов, проводимых в Internet, построен на обмене учителей и учеников наблюдениями и впечатлениями от экскурсий в музеи, исторические места, парки, зоопарки и т.д. с учителями и учащимися из других мест, городов и стран. В Internet составляется месячное расписание передачи информации об экскурсиях, пересылаемой из школ, и направляется заинтересованным учителям. Если экскурсия дала информацию, полезную для каких-либо уроков, можно в соответствии с расписанием задать вопросы детям, совершившим эту экскурсию,

Путешествия и экспедиции, совершаемые специалистами, также обсуждаются в Internet. Так, международный арктический поход через Северный Ледовитый Океан на собачьих упряжках и каноэ описывался учителями - участниками экспедиции - через list-сервер. Во время недавней экспедиции, предпринятой двумя исследователями из Великобритании, классы-участники еженедельно получали детальное описание хода путешествия, наблюдений, впечатлений. По возвращении путешественников в Великобританию их ждало множество электронных писем с вопросами от детей со всего мира.

Совместный анализ данных (в том числе обзоры). Информационный обмен особенно плодотворен, когда данные собираются в различных местах, а затем подвергаются сопоставлению и/или числовому анализу. Простейшие типы таких проектов привлекают учащихся к электронной подготовке обзоров, сбору данных, анализу результатов, отчетов о том, что было обнаружено. Проекты по совместному сбору данных также могут включать:

• проекты по определению кислотности воды (дождевая или грунтовая вода собирается на различных участках, проверяется на кислотность, а затем проводится анализ, в каком месте и когда вода была наиболее загрязненной);

• проекты, проводимые несколькими различными организациями в месяцы, предшествующие выборам; в этих проектах учащиеся голосуют электронным способом, а затем результаты сопоставляются с реальными результатами голосования;

• проекты определения всемирной потребительской корзины (учащиеся сравнивают цены стандартного набора товаров в различных регионах планеты, а затем пытаются обосновать причины различия цен);

• телекоммуникационные олимпиады (учащиеся разных школ проводят соревнования типа олимпийских игр, а затем сопоставляют результаты соревнований, для того чтобы определить победителей каждого виртуального состязания);

• эксперимент Эратосфена (учащиеся со всего мира повторяют геометрическую процедуру Эратосфена по оценке длины окружности Земли, измеряя угол тени вертикально установленной на земле палочки в полдень осеннего (или весеннего) равноденствия);

• проект по определению миграции бабочек одного вида (наблюдается и прослеживается миграция бабочек с помощью их маркировки и отбора экземпляров из групп мигрирующих бабочек).

Очевидно, что этот тип проектов является очень многообещающим с точки зрения привлечения учащихся к крупномасштабным исследованиям для получения ответов на сложные и интересные вопросы.

СОВМЕСТНОЕ РЕШЕНИЕ ЗАДАЧ

Совместное решениезадач может оказаться новым, очень перспективным наполнением образовательной телекоммуникационной среды. Проекты могут быть основаны как на соревновании, так и на сотрудничестве, но примеры существующих проектов показывают, что учителя и учащиеся предпочитают сотрудничество.

Поиск информации. В on-line проектах этого типа учащиеся должны использовать различные источники информации (электронные или бумажные) для решения задач. Им дается также ключ к решению. Известна географическая игра, в которой каждой из 20 участвующих групп учащихся дается однотипный набор информации о месте размещения их школы (широта, долгота, часовой пояс, численность населения, расстояние до столицы страны и т.д.). Координаторы игры перемешиваютэтиданные, а все учащиеся, используя справочную информацию (карты, атласы, географические справочники и т.д.) находят города и ставят им в соответствие информацию. Побеждает тот класс, который установит наиболее точное соответствие.

Электронное сочинение. Известны канадские проекты, в которых классы регулярно посылают сочинения в телеконференции. Другие учащиеся могут следить за работой такой электронной литературной секции. К проекту привлекаются профессиональные писатели, которые дают свои критические конструктивные заметки, делятся секретами мастерства, публикуют отрывки из своих произведений, над которыми они работают.

Одновременное выполнение заданий (в том числе конкурсы). В этом типе проектов учащимся, находящимся в разных местах, предлагают одинаковые задания для их выполнения. Затем происходит электронный обмен решениями. Получили известность архитектурные проекты такого, например, типа: «Какую самую высокую конструкцию вы сможете построить из спичек, чтобы она

1) могла нести на себе яйцо;

2) выдерживала, если на нее сильно подуют»?

При этом можно использовать только определенный клей. Яйцо должнобытьсварено вкрутую и не очищено. Для оценки высылаются описание и рисунок.

Моделирование. On-line моделирование - это такие телекоммуникационные проекты, которые требуют, возможно, наибольшей координации и поддержки,. Однако эффективность обучения и увлеченность участников вполне оправдывают дополнительные затраты времени и усилий со стороны организаторов проекта. Среди успешных проектов on-line моделирования назовем следующий.

Моделируется космическая программа «Шаттл». Школы всего мира играют различные роли в моделируемом полете космического корабля «Шаттл». Исследование включает маневр стыковки с другим «Шаттлом», управление полетом с наземного пульта управления, приземление в различных местах, наблюдение обсерватории солнечных возмущений и т.д. Координация и коммуникации между пультом управления «Шаттла» и другими школами осуществляется через распределенную конференцию на индивидуальных интерактивных сетевых системах. Электронная почта пересылается очень быстро, ежечасно публикуются отчеты, даже возможны электронные переговоры в реальном масштабе времени между пультом управления, астронавтами и вспомогательными подразделениями.

Известна прекрасная серия проектов моделирования международных событий и проблем, а также разрешения глобальных конфликтов. Упомянем проект IDEALS, основанный на моделировании учащимися деятельности и поведения высокопоставленных дипломатов, представляющих различные страны на международной конференции. Они должны, например, выработать текст договора об использовании океанских ресурсов или о будущем Антарктиды.

Социальные проекты. У граждан мира. живущих в конце XX века, не должно вызывать удивления то, что Internet служит средой для гуманитарных межкультурных телекоммуникационных проектов, ориентированных на деятельность, в которых участвуют будущие руководители планеты - наши дети. Так, проект Planetиспользует консорциум шести связанных с Internet образовательных сетей, представители которых работают вместе над созданием проектов полезной, важной общественной деятельности, в которой дети впервые ощущают ответственность за решение глобальных проблем огромной важности.

В течение первых месяцев работы проекта Planet его участники писали в ООН петиции протеста против событий в Югославии, методом мозгового штурма разрешали политическую ситуацию в Сомали, планировали и искали источники финансирования орошения засушливых местностей Никарагуа. Потенциал таких проектов для мультиднсциплинарного, устремленного в будущее, построенного на истинном сотрудничестве обучения несомненен.

К сожалению, большинство учебных компьютерных проектов, функционирующих вInternet и разработанных в США, в России неизвестно. Некоторую известность у нас получили учебные проекты сети KIDNET. Недостатком такого типа проектов является их ориентация на традиции, сложившиеся в образовании США: прагматичность, поверхностность, бессистемность. Такие проекты с трудом вписываются в предметную систему российского образования.

В ближайшие годы наилучшими перспективами обладают такие технологии обучения с использованием компьютерных телекоммуникаций, которые основаны на телекоммуникационной поддержке традиционных форм обучения и носят характер коллективно выполняемых под руководством педагога учебных проектов.

Такой характер имеют, в частности, получившие известность российские телекоммуникационные образовательные проекты, ориентированные на среднюю школу, такие как телекоммуникационная олимпиада по программированию. проведенная в Переславле-Залесском, олимпиада по физике, поддерживаемая в Красноярске, экономические игры МЭМ ( моделирование экономики и менеджмента ), методическое обеспечение которых выполняется в КУДИЦ (Москва), телекоммуникационные викторины (олимпиады) по ряду школьных предметов, экономическая бесконкурентная игра «экономические связи», проект изучения английского языка в переписке с американскими школьниками, методика которых разработана в Воронежском госпедуниверситете.

Очевидно, что на начальных этапах внедрения образовательных технологийнаоснове компьютерных телекоммуникаций могут возникнуть существенные трудности и помехи, среди которых

• недостаточно насыщенный компьютерный парк учебных учреждений и индивидуальных пользователей,

• недостаточное развитие компьютерных телекоммуникационных сетей в России, их нестабильность,

• недостаточная компьютерная грамотность и информационная культура населения, что создает дополнительные психологические барьеры в развитии телекоммуникационных методов обучения.

Однако главной проблемой развития телекоммуникационного обучения является создание новых методов и технологий обучения, отвечающих телекоммуникационной среде общения. В этой среде ярко проявляется то обстоятельство, что учащиеся не просто пассивно потребляют информацию, в процессе обучения они создают собственное понимание предметного содержания обучения. В настоящее время требуется коррекция устаревшей модели обучения, которая характеризовалась тем,что

• в центре технологии обучения - учитель;

• между учащимися идет негласное соревнование;

• учащиеся играют пассивную роль на занятиях;

• суть обучения - передача знаний (фактов).

На смену устаревшей модели должна прийти новая модель обучения, основанная на следующих положениях:

• в центре технологии обучения - учащийся;

• в основе учебной деятельности - сотрудничество;

• учащиеся играют активною роль в обучении;

• суть технологии - развитие способности ксамообучению. Основные группы задач, решаемых с помощью сети, включаютв себя

• поддержку учебной работы учащихся;

• обеспечение взаимодействия между педагогами,обмен педагогическим опытом и дидактическими материалами;

• обеспечение доступа всех участников учебно-воспитательного процесса к быстро растущим информационным фондам, хранящимся в централизованных информационных системах;

• информационное обеспечение решения задач управления.

Контрольные вопросы и задания

1. Каковы перспективы использования компьютерных сетей в образовании?

2. В чем состоит учебное значение электронной почты?

3. Что называется учебным телекоммуникационным проектом?

4. Охарактеризуйте основные виды учебного использования Internet.

5. С какими проблемами сталкивается учебное применение телекоммуникаций в России?

6. Предложите идею своего собственного телекоммуникационного проекта.

Дополнительная литература к главе 5

1. ВеттигД. Novell Netware.-Киев: BHV, М., Бином, 1994. -

2. Вычислительные комплексы, системы и сети. /А.М.Ларионов , С.А.Майоров., Г.И. Новиков: Учеб. для вузов.-Л.: Энергоатомиздат, 1987.

3. Глобальные сети: информация и средства доступа. - Пермь: ПГТУ, 1994.

4. Гольц Г. Рабочие станции и информационные сети. - М.: Машиностроение, 1990.

5.Дансмур М., Дейвис Г. Операционная система UNIX и программирование на языке Си. М.: - Радио и связь, 1989.

6. Интернет. Всемирная компьютерная сеть. Практическое пособие и путеводитель. - М.: Синтез, 1995.

7. Каракозов С. Д. Введение в компьютерные сети. - Барнаул, БГПУ, 1996.

8. Компьютерные сети. Учебный курс Microsoft Corporation/ Пер. с англ. - М.: Издательский отдел «Русская Редакция» ТОО «Channel Trading Ltd.». - 1997.

9. Kpoл Эд. Все об INTERNET. Руководство и каталог. - Киев: BHV, 1995.

10.Ларионов A.M.. Майоров С. А.. Новиков Г. И. Вычислительные комплексы, системы, сети. - М.: Энергоатомиздат, 1987.

11. Морозов В. К, Долганов А. В. Основы теории информационных сетей. - М.: Высшая школа, 1987.

12. Нанс Бэрри. Компьютерные сети. - М.: БИНОМ, 1996.

13. Рассохин Д., Лебедев A. World Wide Web - всемирная информационная паутина в сети Internet. - М.: МГУ, 1997.

14. Самойленко С. И. Сети ЭВМ. - М.: Наука, 1986.

15. Свириденко С. С. Современные информационные технологии. - М.: Радио и связь, 1989.

16. Сетевые средства Windows NT. - С.-Пб.: BHV-Санкт-Петербург, 1996.

17. Стандарты по локальным вычислительным сетям. Справочник / Под ред. С.И.Самойленко. - М.: Радио и связь, 1990.

18. Телекоммуникационная сеть в системе образования Пермской области. Информационно-справочное пособие. Часть 1. - Пермь: ОЦПИ, 1995.

19. Телекоммуникация и информатизация общества. Серия «Информация. Наука. Общество». - М.: ИНИОН, J990.

20. Уваров А. Ю. Организация и проведение учебных телекоммуникационных проектов. - Барнаул, БГПУ, 1996.

21. Уваров А.Ю. Учебные телекоммуникационные проекты в классе. - Барнаул, БГПУ, 1996.

22. Хромцов П. Лабиринты Internet. - М.: Электронинформ. 1996

23. Электронная почта в системе MS-DOS. Официальное руководство компании Редком. 1995г.

24. Журнал «Компьютеруик-Москва», с 1995 г.

ГЛАВА 6

ИНФОРМАЦИОННЫЕ СИСТЕМЫ

ВВЕДЕНИЕ

В узком смысле, следуя традиции, под информационными понимают системы, предназначенные для хранения информации в специальным образом организованной форме и обеспечивающие ее ввод и различные манипуляции с ней, включая поиск по некоторым признакам, подготовку сводок (отчетов) и т.д.

Сама идея информационных систем и некоторые принципы их организации возникли задолго до появления ЭВМ. Библиотеки, архивы, адресные бюро, телефонные справочники, словари - все это информационные системы.

В современной информатике рассматриваются такие информационные системы, которые используют для хранения и обработки информации компьютерную технику. Именно компьютеризация придала информационным системам их современный облик, на несколько порядков повысила эффективность и расширила сферу их применения.

К информационным системам относят, в частности,

• информационно-справочные и информационно-поисковые системы;

• системы, обеспечивающие автоматизациюдокументооборота и учета, в томчисле бухгалтерского;

• автоматизированныесистемы управления;

• экспертные системы;

• системы автоматизации научных исследований и автоматизированного проектирования, геоинформационные системы.

В последнее десятилетие большое развитие получил представляющий для нас особый интерес класс программных средств, которые также можно отнести к информационным - обучающие (информационно-обучающие) системы. Они также будут рассмотрены в этой главе.

Общей функцией всех информационных систем является сбор, накопление и хранение информации, ее обработка (в частности, поиск) и выдача в той или иной форме. Важнейшими подсистемами информационных систем являются банки информации. Ведущее направление развития информационных систем - совершенствование их интеллектуальных функций, облегчающих работу с ними, а также их сопровождение и развитие. Такими интеллектуальными функциями являются

• интерфейс с информационной системой на естественном языке (речевой ввод и вывод информации, формирование запросов на естественном языке);

• поддержка принятия решений, решения задач на основе информации, имеющейся в информационной системе.

В предыдущих главах мы остановились на таких аспектах представления и обработки данных с помощью компьютера, как информационное моделирование, базы данных и СУБД, языки управления реляционными базами данных, понятия и системы искусственного интеллекта, а также кибернетические аспекты информатики. Эти вопросы часто относят к единому разделу информатики под названием «Информационные системы»; туда же можно отнести и часть функций локальных и глобальных сетей. Таким образом, ниже внимание будет сосредоточено лишь на тех аспектах информационных систем, которые не обсуждались ранее.

БАНКИ ИНФОРМАЦИИ

БАНКИ ДАННЫХ

Банк данных - наиболее характерный пример информационной системы. В банке данных хранится достаточно универсальная, необходимая для решения разнообразных прикладных задач, информация об определенной предметной области в специальном представлении, чаще всего предполагающем хранение и обработку с помощью компьютеров. При этом сами данные образуют базу данных, а банк, наряду с базой, содержит программные средства обработки данных и реализации запросов, т.е. систему управления базой данных (СУБД). Как правило, банки данных являются системами коллективного пользования. К информации, хранимой в них, часто можно получить доступ по телекоммуникационным сетям.

В современном мире существует огромное число банков данных. В них содержатся сведения коммерческого характера, данные по библиотечным фондам, системам здравоохранения, транспорта и т.д. Быстро развиваются банки, содержащие сведения о системах образования - национальных, региональных (в России они называются «банки педагогической информации»).

Итак, основа банка - база данных. Определение базы данных, основные понятия, связанные с различными моделями данных, уже обсуждались в гл. 2 и это обсуждение будет продолжено ниже в этой главе.

Остановимся на классификации банков информации. Эта классификация может быть проведена с разных точек зрения. Поназначению можно выделить следующие классы банков информации:

• информационно-справочные системы (общего назначения и специализированные);

• банки данных в автоматизированных системах управления (предприятий и организаций, технологическими процессами и т.д.);

• банки данных в системах автоматизации научных исследований.

Однако такая классификация является не вполне строгой и завершенной. Порежиму функционирования можно рассматривать банки информации пакетного, диалогового и смешанного типов, В связи с широким распространением персональных компьютеров, локальных и глобальных сетей ЭВМ подавляющее распространение получили диалоговые системы.

Поархитектуре вычислительной среды различают централизованные и распределенные банки информации.

К настоящему времени сложились следующие три основных типа банков информации: банки документов, банки данных и банки знаний.

Исторически первым типом банков информации явились банки документов или документальные информационно-поисковые системы. Документальные информационно-поисковые системы бурно развивались в 60-е годы, они широко используются в качестве справочного инструмента пользователей научно-технической информацией, в информационном обслуживании управленческих работников, специалистов и др. В настоящее время интерес к этим системам возобновился в связи с развитием глобальных информационных сетей (Internet) и появлением гипертекстовых серверов типа WWW, Gopher и т.д.. которые вместе с соответствующими поисковыми системами {Archie, Whatis и т.д.) можно отнести к распределенным банкам документов.

Объектом хранения в таких системах является документ (научная статья, монография, приказ, циркуляр, письмо и т.д.) или факты, извлеченные из документов. Для обеспечения поиска и доступа к таким документам необходима их предварительная семантическая обработка - индексация. Индексация до настоящего времени остается неавтоматизированной процедурой и выполняется специалистами -людьми, индексирующими документы и запросы.

БАНКИ ДОКУМЕНТОВ

В документальной информационно-поисковой системе выделяют следующие компоненты:

• массив документов (текстов) или фактов, выступающих в качестве объектов хранения и поиска;

• информационно-поисковый язык, предназначенный для отображения содержания документов и операций над ними, в том числе и запросов для поиска документов;

• правила, алгоритмы, методы индексирования и поиска документов, позволяющие описывать документы и операция над ними на информационно-поисковом языке;

• комплекс программных и аппаратных средств, с помощью которых реализуются процессы накопления, хранения и поиска документов;

• обслуживающий персонал, включающий администраторабанка документов, системных аналитиков, программистов и индексаторов. Банки документов работают обычно в двух режимах:

1) избирательного распределения информации, обеспечивающего регулярное текущее информирование пользователей банка о новых поступлениях документов;

2) ретроспективного поиска информации по разовым запросам во всем массиве документов.

Важнейший этап обработки нового документа при поступлении его в хранилище документальной информационно-поисковой системы - индексирование документа -слагается из следующих действий:

1) выявления основного смыслового содержания документа (с учетом точки зрения автора документа и информационных потребностей пользователя системы);

2) описания смыслового содержания документа на информационно-поисковом языке (ИПЯ) и получения соответствующего поискового образа документа (ПОД).

При выполнении ретроспективного поиска производится

1) выявление смыслового содержания запроса;

2) получение поискового обзора запроса (ПОЗ) на информационно-поисковом языке системы.

Результатами индексирования документов и запросов являются их поисковые образы (ПОД и ПОЗ). Поиск документов по запросу означает сопоставление ПОД и ПОЗ. Качество поиска зависит от критериев смыслового соответствия документа запросу (критериев выдачи).

Различают

• теоретико-множественные критерии, основанные на оценкестепени совпадениялексических единиц ИПЯ (слов), используемых в ПОД и в ПОЗ;

• критерии, учитывающие с помощью «весовых коэффициентов» относительную информационную значимость отдельных лексических единиц, входящих в ПОЗ;

• логические критерии, основанныена использовании логических операций (дизъюнкции, конъюнкции, импликации и др.).

Информационно-поисковые языки (ИПЯ), которые используются в настоящее время, можно разделить на три большие группы:

• классификационные языки;

•дескрипторные;

• комбинированные.

Языки классификационного типа, в свою очередь, делятся по структуре:

• ИПЯ иерархической структуры;

• ИПЯ фасетной структуры;

• эмпирические (неиерархические) языки.

Классификационные системы. В иерархических классификационных системах лексические единицы (термины) находятся между собой в отношениях включения. При записи они располагаются в порядке постепенного перехода от общих к более частным. Существуют иерархические системы, в которых рубрики включают по 20 и более подклассов, рубрик и подрубрик в нисходящем порядке. Примером такой иерархической классификационной системы является универсальная десятичная классификация (УДК), широко используемая в библиотечном деле и документальных поисковых системах. УДК охватывает весь спектр знаний.

Шифры УДК, которые можно увидеть на обороте титульного листа всех книг, перед заголовками статей в журналах и сборниках, имеют более чем столетнюю историю. В 1905 г. в Брюсселе на французском языке вышло первое сводное издание таблиц десятичной классификации. Эти таблицы были созданы на основе таблиц десятичной классификации Мельвиля Дьюи, впервые изданных в 1876 г.

Каждый класс (первая ступень деления) в УДК содержит группу более или менее близких наук, например, класс 5 - математику и естественные науки, класс 6 -прикладные науки: технику, в том числе информатику, сельское хозяйство, медицину. Каждая последующая присоединяемая цифра не меняет значения предыдущих, а лишь уточняет их, обозначая более частное понятие. УДК настоящего текста: 681.3:62-52.

В основе фасетной классификации лежит многоаспектное распределение понятий какой-либо отрасли науки или техники по однородным взаимно исключающим друг друга фасетам.

Примером эмпирической (неиерархической) классификации может быть алфавитно-предметная классификация. Словарный запас такой классификации состоит из упорядоченного по алфавиту множества слов, словосочетаний и фраз естественного языка, обозначающих предметы какой-либо отрасли науки или практической деятельности. Каждому предмету или вопросу при этом отводится только один индекс, собирающий всю информацию относительно данного предмета или вопроса независимо от аспекта рассмотрения. В предметных классификациях используются следующие термины:

• предметная рубрика (заголовок) - слово или фраза естественного языка, используемая для обозначения основного предмета документа (или запроса);

• предметный подзаголовок - слово или фраза, обозначающая аспект рассмотрения предмета, указанного в предметном заголовке или в подклассе предметов, входящих в класс, обозначенный предметным заголовком;

•предметный словник - упорядоченное по алфавиту множество предметных заголовков, используемых для построения какого-либо каталога или указателя.

Система предметных заголовков и подзаголовков и более мелких разделов создает сложную предметную классификацию по аспектам рассмотрения предмета, т.е. имеет некоторые черты фасетных классификаций.

Дескрипторные информационно-поисковые языки. Дескрипторные информационно-поисковые языки основаны на методе координатного индексирования, сущность которого сводится к тому, что смысловое содержание документа может быть с достаточной точностью и полнотой выражено списком ключевых слов, содержащихся в тексте.

Ключевое слово - это лексическая единица информационно-поискового языка, являющаяся существительным, прилагательным, глаголом, наречием, числительным или местоимением естественного языка или словосочетанием. Основной критерий отбора ключевых слов из текста - степеньих полезности для индексирования документа или запроса.

Координатное индексирование выполняется с помощью ключевых слов и логических операции конъюнкции и дизъюнкции. Близкие по смыслу ключевые слова образуют классы условной эквивалентности, имена которых также являются единицами поискового языка и называются дескрипторами. Дескрипторы вместе с набором ключевых слов языка и семантических связей между ними образуют тезаурус - систематизированный набор данных об области знания, позволяющий в ней ориентироваться.

В дескрипторной статье тезауруса обычно устанавливаются следующие виды семантических отношений:

• отношение синонимии;

• отношение подчинения;

• отношение ассоциации.

Такие связи служат для увеличения полноты представления содержания документов и позволяют формировать запрос не обязательно в ключевых словах документа.

Пример дескрипторной статьи:

языки алгоритмические синонимы: алгоритмические языки

машинно-ориентированные языки проблемно-ориентированные языки вышестоящие: программное обеспечение

языки формальные нижестоящие: автокоды

алгол паскаль фортран си бейсик ассоциации: алгоритмы

программирование

Целесообразность применения того или иного языка во многом зависит от назначения информационной системы, степени ее автоматизации. Для описания документов в библиотеках, общих и технических архивах обычно применяют классификационные языки. В автоматизированных информационно-поисковых системах используются, главным образом, дескрипторные языки.

Наши рекомендации