Информационные сети и их типология.
Рассмотрим понятие "информационная сеть".
Ä Информационной сетью называется совокупность взаимодействующих ИС.
Как правило, при объединении систем в сеть эффективность информационной деятельности повышается за счет устранения непроизводительного дублирования процессов обработки и хранения информации. В отличие от ИС информационная сеть может не иметь единого органа управления ее функционированием. Координация деятельности элементов сети обеспечивается системой принципов и соглашений, устанавливаемых на двусторонней или многосторонней основе.
Взаимодействие ИС означает такой режим их функционирования, при котором состояния входов, выходов, процессов и массивов одной ИС определяются состоянием входов, выходов, процессов и массивов других ИС сети.
Каждая ИС может иметь большое разнообразие входов, выходов, массивов и режимов работы. В частности, ИС может функционировать в режиме подготовки и выпуска информационных изданий (РЖ, обзоров, переводов и т. д.), в режиме избирательного распространения информации (ИРИ) и в режиме "запрос-ответ". ИС может подготавливать и поставлять другим ИС программы обработки и поиска информации, тезаурусы, фрагменты массивов и т. д.
Взаимодействие ИС между собой предполагает:
1) существование канала связи между ИС, обеспечивающего физическую возможность передачи исходных, промежуточных или конечных продуктов ИС;
2) существование договоренности между ИС, регламентирующей процессы их функционирования.
Существуют следующие варианты передачи входных, промежуточных и выходных продуктов между ИС:
- обмен массивами первичных документов, вторичных документов, поисковых образов (ПО) документов;
- обмен заданиями (запросами на информационное обслуживание) в форме исходных текстов и поисковых образов (ПО) заданий;
- обмен программами ввода, обработки и поиска информации;
- обмен тезаурусами.
Указанные формы обмена продуктами ИС могут быть реализованы: - в виде печатных документов;
- на машинных носителях ( магнитных лентах, магнитных дисках и т. д.);
- по каналам связи (телефону, телеграфу, телетайпу, вычислительной сети и т. д.).
Приведенные варианты передачи продуктов ИС соответствуют формам взаимодействия ИС по входам (обмен массивами), выходам(обмен заданиями) ипроцессам (обмен программами и тезаурусами). Обмен массивами приводит к координации взаимодействия входов ИС. Если в автономном режиме каждая ИС определяет свои входы независимо от других ИС, то в режиме сети входы одних ИС устанавливаются с учетом входов других ИС. Это позволяет перераспределить деятельность элементов по вводу и обработке информации, существенно сохранить затраты на функционирование сети, повысить полноту комплектования и доступа при постоянных затратах. С точки зрения затрат, это наиболее важная форма взаимодействия ИС.
Обмен заданиями означает перераспределение групп потребителей между элементами сети (координация выходов), что приводит к специализации ее элементов и соответственно к повышению качества информационного обслуживания при одновременном снижении затрат. Кроме того, это создает предпосылки перехода сети к режиму "энергосети", при котором потребитель информации сможет с одинаковым успехом "подключаться" в любую точку сети.
Обмен программами и тезаурусами приводит к координации основных информационных процессов, их типизации и унификации. Это способствует повышению качества работы сети, сокращению затрат и времени на разработку программ и тезаурусов.
По степени однородности функций ИС можно рассматривать однородные и неоднородные сети.
Ä Сеть считается однородной, если все составляющие ее ИС выполняют одинаковые функции, имеют одни и те же выходы, обладают одинаковыми статусами.
Ä Сеть неоднородна, если каждой составляющей ее ИС свойственны собственные функции, определенные выходы и статус.
Если существует иерархия статусов, то можно говорить об иерархической сети. Частным случаем неоднородной сети является сеть с центральной ИС и совокупностью ее филиалов. Можно говорить о вырожденной сети, т. е. о сети с одним процессом, установленным в центральной ИС, и совокупностью удаленных терминалов.
Каждый из вариантов взаимодействия ИС возможен только при обеспечении соответствующих форм совместимости - информационной, языковой, программной и технической (одной или нескольких одновременно). Если такой совместимости нет, то обмен не имеет смысла, так как продукты одной ИС не могут быть использованы в другой ИС. Обеспечение заданного вида совместимости заранее несовместимых ИС требует дополнительных затрат на разработку соответствующих "интерпретаторов" и на собственно процесс "интерпретации". Например, на разработку устройств (или программного обеспечения) перевода с языка одной ИС на язык другой ИС и на собственно процесс перевода.
Состав и структура ИС и АИС
ИС реализует следующие основные функции: отбор, ввод, обработка/переработка, хранение, поиск и выдача информации.
Учитывая специфику организации, управления и технологии выполнения каждой из указанных функций в ИС целесообразно выделять три самостоятельных функциональных подсистемы.
Подсистема отбора информации.Информационная система может обрабатывать/перерабатывать только ту информацию, которая в нее введена. Качество работы ИС определяется не только ее способностью находить и перерабатывать нужную информацию в собственном массиве и выдавать ее пользователю, но и способностью отбирать релевантную информацию из внешней среды. Такой отбор осуществляет подсистема отбора информации, которая накапливает данные об информационных потребностях пользователей ИС (внутренних и внешних), анализирует и упорядочивает эти данные, образуя информационный профиль ИС. Аналогично на основании данных о потоках информационной среды формируется описание входных потоков информации.
При заданном критерии качества функционирования ИС и соответствующей системы ограничений в процессе управления ИС решается задача оптимизации комплектования информационного массива ИС, которая определяет алгоритм (или оператор) отбора информации. Указанный оператор осуществляет преобразование входных потоков в информационный массив ИС. К сожалению, многие действующие ИС слабо придерживаются описанной процедуры отбора документов. Отбор информации, как правило, носит слабоуправляемый характер, базируется на интуиции специалистов. Это является следствием сложности и слабой структурируемости как собственно процессов отбора, так и управления этими процессами.
Функции именно этой подсистемы ИС практически не поддаются автоматизации. Исключение составляют только ИС информационного обеспечения управления технологическими процессами и техническими системами.
Подсистема ввода, обработки/переработки и хранения информации осуществляет преобразования входной информации и запросов, организацию их хранения и переработки с целью удовлетворения информационных потребностей абонентов ИС.
Реализация функций данной подсистемы предполагает наличие аппарата описания информации (систем кодирования, языка описания данных (ЯОД) и т. д.), организации и ведения информации (логическая и физическая организация, процедуры ведения и защиты информации и т. д.), аппарата обработки и переработки информации (алгоритмы, модели и т. д.).
Все три указанные составляющие определяются двумя параметрами ИС: характером обрабатываемой информации и функциями ИС.
Документальные ИС для описания информации используют информационно-поисковые языки (ИПЯ) и систему индексирования, методология построения и использования которых существенно отличается от методологии и принципов использования ЯОД, обеспечивающих описание данных в фактографических ИС. Логическая организация данных фактографических ИС имеет мало общего с организацией информации в документальных ИС. Наконец, различны и аппараты обработки и переработки документальной и фактографической информации. Если в фактографических ИС преимущественно используются математические алгоритмы, то в документальных - эвристические процедуры, требующие затрат интеллектуальной энергии.
Подсистема подготовки и выдачи информации непосредственно реализует удовлетворение информационных потребностей пользователей ИС (внутренних и внешних). Для выполнения этой задачи подсистема проводит изучение и анализ информационных потребностей, определяет формы и методы их удовлетворения, оптимальный состав и структуру выходных информационных продуктов, организует сам процесс информационного обеспечения и сопровождения. Выполнение указанных функций требует наличия аппарата описания и анализа информационных потребностей и их выражения на языке ИС (в том числе ЯОД, ИПЯ, языке индексирования и т. д.), а также аппарата непосредственно информационного обеспечения (процедуры поиска и выдачи информации, языки манипулирования данными и т. д.).
Все эти и многие другие составляющие рассматриваемой подсистемы, выполняя одинаковые функции в ИС разных типов, тем не менее существенно отличаются между собой. Особенно заметно это различие при сравнении документальных и фактографических ИС.
Из предыдущего рассмотрения следует, что многие функции различных подсистем ИС дублируются или пересекаются, что является предметом оптимизации при проектировании ИС. Автоматизация ИС в связи с этим сопровождается перераспределением элементов ИС.
Автоматизация предполагает формализованное представление (структуризацию) как функций ИС, так и самой обрабатываемой в ИС информации, которое и позволяет осуществлять ввод, обработку/переработку, хранение и поиск информации с использованием ЭВМ.
Однако любая формализация характеризуется тем или иным уровнем адекватности создаваемого образа реальной действительности (модели) самой действительности. Причем, адекватность модели реальной действительности определяется как свойствами самой действительности, так и возможностями используемого аппарата ее формализованного представления.
С этой точки зрения "уровень автоматизации" ИС тесно связан со "степенью структурируемости" как самой информации, являющейся предметом обработки, хранения и т. д., в ИС, так и самих функций ИС (обработки, хранения и т. д.).
В соответствии с уровнем современных знаний в области формализованного представления информации можно различать информацию трех уровней структурируемости:
1. Жесткоструктурируемая информация - информация, формализованное представление которой современными средствами ее структурирования (в частности, языками описания данных) не приводит к потере адекватности создаваемого образа информации (модели) самой исходной информации. Жесткоструктурируемую информацию будем в дальнейшем называть данными.
2. Слабоструктурируемая информация- информация, формализованное представление которой современными средствами описания информации (в частности, ИПЯ) приводит к значительным потерям адекватности модели информации самой исходной информации. Обработка и поиск такой информации предполагает специальные меры по оценке степени неадекватности модели информации. (В АИПС этой цели служат меры смысловыразительной способности (семантической силы) ИПЯ).
3. Неструктурируемая информация - информация, для которой в настоящее время не существует средств ее формализованного представления с приемлемым на практике уровнем адекватности. Средства представления такой информации должны обладать высокими смысловыразительными способностями. Разработка таких средств в настоящее время идет по линии создания языков описания знаний и ИПЯ с высокой семантической силой.
Приведенная классификация информации по степени ее структурируемости достаточно условна. Однако сама идея учета структурируемости информации оказывается полезной при анализе сущности современных АИС.
Анализ функций ИС показывает, что с точки зрения возможностей алгоритмизации, функции ИС можно разбить на три категории:
а) жесткоструктурируемые функции (ввод, обработка, хранение информации), выполнение которых не связано с затратами интеллектуального труда и легко алгоритмизуется;
б) слабоструктурируемые функции (поиск и переработка информации, учет и анализ потребностей, анализ потоков информации и т. д.), выполнение которых можно алгоритмизировать без существенных потерь в качестве их выполнения;
в) неструктурируемые функции, требующие для своего выполнения существенных затрат интеллектуальной энергии, алгоритмизация которых приводит к невосполнимым потерям в качестве их выполнения. Это функции, связанные с научным анализом и/или синтезом информации, оценкой уровня продукции, прогнозированием развития различных направлений науки и техники.
Если с этих позиций рассмотреть функции подсистем ИС, то нетрудно видеть, что большинство жесткоструктурируемых функций сосредоточено в подсистеме ввода, обработки/переработки и хранение информации. Две другие подсистемы связаны с реализацией, в основном, слабоструктурируемых и неструктурируемых функций.
Легкость автоматизации функций второй подсистемы ИС на основе использования электронно-вычислительной и телекоммуникационной техники ввода, обработки, хранения и передачи информации привела к неоправданно быстрому и вседовлеющему развитию этих составляющих ИС в ущерб развитию двух других (не менее, а может быть и более важных) ее составляющих. В большинстве современных АИС эти две подсистемы настолько неразвиты, что по сути дела это уже не АИС, а организационно-обособленные подсистемы ввода, обработки, хранения и поиска информации. В дальнейшем будет показано, что говоря об этих системах, целесообразно называть их не АИС, а банки данных или АИПС.
АИПС, банки и базы данных
Термины "автоматизированная система управления" (АСУ), " база данных" (БД), "банк данных" (БнД), " информационно-поисковая система" (ИПС), "фактографическая ИПС" (ФИПС), "абстрактная ИПС" (АБИПС), "программная система" (ПС), " пакет прикладных программ" (ППП), " система управления базами данных" (СУБД) и др. стали появляться в "будущей" информатике уже с начала 60-х гг.
Понятия ИПС, ФИПС, АБИПС, ПС, ППП появились с развитием автоматизации информационных процессов в сфере систем НТИ и утвердились в науке и практике несколько ранее понятий АСУ и СУБД, связанных с автоматизацией процессов управления.
Несмотря на то, что за истекшие три десятилетия интенсивного развития индустрии информации было создано огромное разнообразие действующих ИС, тем не менее до сих пор нет четкости в определениях и связях этих понятий. Анализ теоретических и практических работ по АИС показывает, что смысловые содержания этих понятий сильно пересекаются между собой.
На основе анализа существующей терминологии предлагаются следующие определения элементов АИС, как основы для их дальнейшего уточнения. При этом делается акцент на "степень структурируемости" информации, что является весьма важным при выяснении единства и различий существующих АИС.
База данных - совокупность специально организованных и логически взаимосвязанных элементов фактографической и/или документальной информации, представленных на машиночитаемых носителях.
Система управления базами данных - комплекс языковых, логических и программных средств, предназначенных для описания, ввода, переработки, ведения, хранения и выборки специально организованных и логически взаимосвязанных данных (жесткоструктурируемой информации) в целях их многоаспектного коллективного использования.
Банк данных - комплекс языковых, логических, программных, информационных, технических и организационных средств ввода, переработки, ведения, хранения, поиска и выдачи информации в целях ее многоаспектного коллективного использования.
Говоря об АИПС необходимо отметить существование двух понятий - конкретная и абстрактная АИПС.
Конкретная АИПС - взаимосвязанная совокупность критерия смыслового соответствия, языковых, логических, программных, информационных, технических и организационных средств ввода, переработки, ведения, хранения, поиска и выдачи специально организованной и логически взаимосвязанной слабоструктурируемой информации в целях ее многоаспектного коллективного использования.
Абстрактная АИПС- взаимосвязанная совокупность языковых, логических и программных средств и критерия смыслового соответствия, предназначенная для описания, ввода, переработки, ведения, хранения, поиска и выдачи специально организованной и логически взаимосвязанной слабоструктурируемой информации.
Абстрактная АИПС в отличие от конкретной не предполагает наличия информационного массива (базы данных), технических и организационных средств реализации функций АИПС. Фактическая реализация АБИПС в конкретной АИПС является логико-семантическим комплексом данной конкретной АИПС. Абстрактная АИПС - основа создания некоторой совокупности конкретных АИПС. В дальнейшем, там, где это не вызовет непонимания, конкретные АИПС будем называть просто АИПС.
Фактографическая АИПС- то же, что и банк данных, но по обработке жесткоструктурируемой информации.
Программная система (ПС) - комплекс программ реализации на ЭВМ некоторой совокупности информационных процессов ввода, переработки, ведения, хранения, выборки и поиска слабоструктурируемой информации, подготовки и выдачи выходных информационных продуктов, т. е. это пакет прикладных программ (ППП) реализации технологических процессов ИС.
Из предложенных определений следует, что БнД и АИПС являются основными составляющими АИС в целом, с той лишь разницей, что БнД оперирует с жесткоструктурируемой информацией (данными), в то время как АИПС - со слабоструктурируемой информацией. БД - основной элемент как БнД, так и АИПС, и может содержать как жесткоструктурируемую (в случае работы в составе БнД), так и слабоструктурируемую (в условиях работы в составе АИПС) информацию; СУБД и абстрактная АИПС осуществляют управление базами данных, содержащими жесткоструктурируемую (в случае БнД) или слабоструктурируемую (в случае АИПС) информацию.
Различия между БнД и АИПС, равно как и между СУБД и АБИПС, являются следствием того, что АИПС и АБИПС имеют дело со слабоструктурируемой информацией, в то время как БнД и СУБД оперируют с данными (жесткоструктурируемой информацией).
Различия в языковых и логических средствах адекватного представления слабоструктурируемой и жесткоструктурируемой информации и порождают определенные различия между БнД и АИПС.
Из сказанного, конечно, не следует, что БнД не могут работать со слабоструктурируемой, а АИПС - с жесткоструктурируемой информацией. Обе они, в любом случае, работают в той или иной мере со структурированной информацией. Однако их аппараты (логические и языковые средства) структурирования (формализованного представления) информации различны.
Аппарат БнД - аппарат структурирования жесткоструктурируемой информации. Его применение для представления слабоструктурируемой информации приводит к определенному снижению эффективной обработки и поиска информации. К аналогичным последствиям приводит и применение АИПС для обработки и поиска жесткоструктурируемой информации.
Тенденции развития АИС требуют создания интегрированных систем, способных одинаково эффективно оперировать как с жестроструктурируемой, так и со слабоструктурируемой информацией. Это предполагает создание логических и языковых средств адекватного и эффективного представления информации независимо от степени ее структурируемости. Это сложная задача. Завтра мы научимся интегрировать сегодняшние БнД и АИПС, создав эффективные средства формализованного представления информации, которая сегодня была слобоструктурируемой. Но одновременно будут созданы средства структурирования информации, которая еще вчера была неструктурируемой. Тем самым, неструктурируемая информация перейдет в разряд слабоструктурируемой и, следовательно, появятся АИПС для ее обработки и поиска.
Выше было подчеркнуто различие в терминах БнД и АИПС. Это сделано специально с тем, чтобы обратить внимание на принципиальное (на сегодняшний день) различие средств и методов структурирования и обработки жесткоструктурируемой и слабоструктурируемой информации. В то же время в приведенном выше определении БнД нет упоминания о структурируемости информации. Следовательно БнД может иметь дело и со слабоструктурируемой информацией. С этой точки зрения АИПС - это тоже БнД, но связанная с обработкой слабоструктурируемой информации. В дальнейшем при упоминании БнД мы будем иметь ввиду любую из двух типов систем. При необходимости подчеркнуть характер обрабатываемой информации будем говорить о документальной БнД (АИПС) или фактографической БнД (ФИПС).
Следует подчеркнуть еще раз, что в рамках развиваемой терминологии системы БнД и АИПС это не АИС в целом, а только элементы составляющие ее ядро. Для функционирования БнД и АИПС как информационных систем необходим соответствующий аппарат, обеспечивающий их взаимосвязи с внешней средой, в том числе и с другими ИС: изучение и анализ информационных потребностей, отбор информации для ввода в систему, определение оптимального состава и структуры выходных информационных продуктов, форм и методов информационного обслуживания, организация процессов функционирования АИС как систем.