Информатика и программирование
ИНФОРМАТИКА И ПРОГРАММИРОВАНИЕ
Информатика как научная дисциплина. ее цели и задачи
Научной дисциплиной, изучающей движение, структуру и свойства семантической информации, является информатика. Информатика в определенной степени связана с математической теорией информации, основы которой были разработаны Клодом Шенноном. Более того, методы математической теории информации широко применяются в информатике. Однако следует различатьматематическую теорию информации и информатику.
Центральным моментом математической теории информации являются понятия информации и меры для измерения ее количества. Математическая теория информации целиком и полностью отвлекается от содержательной, семантической стороны информации, тогда как в информатике именно эта сторона является наиболее существенной. Информатика, кроме количественных характеристик информации, рассматривает также ее качественную особенность, ее смысловое (семантическое) значение, важность информации для потребителей. В информатике понятие информации ассоциируется со знанием со всеми присущими ему свойствами: старением, достоверностью, соответствием достигнутому научно-техническому уровню и т. д.
Понятие информации
Понятие информации весьма широко и многосторонне, поэтому оно имеет целый ряд определений и синонимов.
До настоящего времени каждая попытка дать универсальное определение информации терпит крах из-за неразрешимости основного вопроса: един ли для всех "приемников" информации предлагаемый критерий отбора из всего множества воздействий материального мира тех и только тех воздействий, которые несут информацию для данного "приемника"?
В настоящее время наиболее распространено убеждение, что такого универсального критерия и, следовательно, универсального определения информации не существует.
Специфика информации определяется в первую очередь основной целью функционирования системы.
С этой точки зрения информацией являются все сведения об объекте, полезные "приемнику" (человеку, коллективу, человеко-машинной системе) для решения задачи (достижения цели).
Если данные сведения не нужны, они представляют собой "шум", а не информацию.
Если данные сведения способствуют принятию неправильного решения, они представляют собой дезинформацию.
В отличие от информации, имеющиеся данные - это зарегистрированные на любых носителях сведения об объекте (реальном или вымышленном) независимо от того, дошли они до какого-нибудь приемника и интересуют ли они его. В такой трактовке информация понимается как данные, ценные для получателя (приемника). Это определение оказывается наиболее целесообразным для анализа информационных процессов, подчеркивает относительную "важность" той или иной информации для решения конкретных задач. В такой трактовке данные представляют собой потенциальную информацию, и с этой точки зрения в информационных системах накапливается не информация, а данные (потенциальная информация). Информацией они становятся лишь по предоставлению их некоторому потребителю. В приведенном определении информация не отождествляется со знаниями. Информация - собрание данных, тогда как знание предполагает постижение действительности сознанием, организующим данные путем их анализа.
О знаниях невозможно говорить в отрыве от определения приемника информации. Например, можно говорить о знаниях студента, ученого и т. д., т. е. о знаниях любого конкретного человека, можно говорить о знаниях, накопленных человечеством, но трудно говорить о знаниях дрессированной мыши или о знаниях ЭВМ. В первом случае мы имеем дело с сознанием человека или общества в целом, во втором - такое сознание отсутствует. Можно представить себе машину с искусственным интеллектом, способную организовать данные. Однако нельзя говорить о "сознании" такой машины, поскольку аппарат организации данных предопределен сознанием ее создателей.
Основные понятия
Независимо от сферы деятельности человека выполнение любой работы и решение любой проблемы всегда связано с использованием уже существующей и созданием новой информации. С этой точки зрения любая основная деятельность человека связана с его информационной деятельностью, т. е. с деятельностью по сбору и обработке существующей и созданию новой информации. Иными словами, информационная деятельность неразрывно связана с основной деятельностью, а субъект основной деятельности (СОД) всегда выполняет три взаимосвязанных функции: потребителя (приемника) информации, собственно исполнителя основной работы (деятельности) и генератора (источника) информации.
Следовательно, понятие информации тесно связано с понятием потребителя (приемника) информации, генератора (источника) информации, информационной потребности и другими понятиями, определяющими степень соответствия информации, полученной потребителем, его информационным потребностям.
Под потребителем (приемником) информации понимают отдельное лицо, коллектив, машинную или человеко - машинную (организационную) систему, использующие информацию/данные в целях выполнения определенной работы в процессе основной деятельности. Иными словами потребителем информации является любой субъект основной деятельности.
В отличие от потребителя информации генератором (источником) информации является отдельное лицо, коллектив, машинная или человеко-машинная система, создающая сообщения в ходе (или в результате) выполнения той или иной деятельности.
Ä Информационная потребность (ИП) - совокупность элементов информации/данных, необходимая и достаточная для эффективного выполнения заданной работы (решения задач) субъектом основной деятельности.
ИП зависит от степени подготовленности СОД к выполнению заданной работы, его знаний, умений, наличия уже собранной информации/данных, а также от трудоемкости и сложности заданной работы, ее внутреннего многообразия и взаимосвязей с внешней средой.
Информационная потребность СОД удовлетворяется в результате поиска сообщений в информационной среде по информационному запросу, сформулированному на естественном языке, и в той или иной мере отражающему информационную потребность. Степень адекватности (соответствия) информационного запроса информационной потребности определяется различными факторами, основным из которых является способность СОД сформулировать свою информационную потребность на естественном языке с учетом специфики как стоящей перед СОД проблемы, так и информационной среды.
Найденные в результате информационного поиска сообщения в той или иной мере соответствуют информационному запросу и информационной потребности.
Ä Характеристика степени соответствия сообщения информационной потребности носит название пертинентности.
Ä Характеристика степени соответствия сообщения информационному запросу получила название релевантности.
В силу того, что информационный запрос практически никогда не соответствует полно и точно информационной потребности, (информационный запрос может быть адекватен информационной потребности только в единственном случае, когда СОД абсолютно полно и точно знает свою информационную потребность и может ее сформулировать, но это может быть только после получения им всей необходимой информации) релевантность информации всегда отличается от ее пертинентности.
Понятия пертинентности и релевантности информации тесно связана с понятиями количества информации и ее ценности с точки зрения решаемой СОД проблемы.
Тезаурус найденного сообщения может иметь мало общего с тезаурусами как задачи, так и информационной потребности. Цель информационного поиска состоит в поиске множества сообщений, совокупный тезаурус которых должен соответствовать тезаурусу информационной потребности, который, в свою очередь, вместе с тезаурусом потребителя должен покрывать тезаурус решаемой задачи. Информационный запрос (и его тезаурус) служат промежуточным звеном между потребителем и информационной средой, обеспечивающим поиск необходимой информации.
Количество информации, по Шрейдеру, определяется степенью изменения тезауруса потребителя (ТП) под воздействием тезауруса сообщения (ТИС), т. е. рассогласованием нового тезауруса потребителя (ТП), являющегося результатом воздействия сообщения, и исходного тезауруса ТП.
В отличие от количества информации, ценность сообщения (информации) определяется по отношению к решаемой задаче и, следовательно, ее можно оценить при рассмотрении взаимоотношения тезаурусов сообщения и задачи. Ценность сообщения, кроме того, зависит от большой совокупности различных факторов и, прежде всего, от важности самой решаемой задачи.
Основные процессы преобразования информации
С информационной точки зрения любая деятельность человека или человеко-машинной системы включает следующие этапы :
1.Поиск сообщений. Внешняя среда с точки зрения СОД представляет собой некоторый генератор потока сообщений, представленных на языке коммуникаций, в общем случае, не тождественном "внутреннему языку" потребителя информации, связанному с конкретной решаемой проблемой. Целью данного этапа является отбор из внешнего потока сообщений тех из них, которые могут быть использованы при выполнении основной деятельности. На этапе поиска сообщений используются услуги различных информационных систем и неформальные каналы, доступные конкретному потребителю информации.
2.Интерпретация сообщений. В связи с конкретным характером решаемой задачи и тезауруса потребителя информации, имеет место упомянутое различие "языка коммуникаций" и "внутреннего языка". Данный этап заключается в адаптации сообщений, интерпретации в терминах "внутреннего языка", т. е. в конечном итоге - в извлечении из сообщений информации, необходимой для решения поставленной задачи. Этап 2 приводит к созданию информационного обеспечения решаемой задачи, которое должно привести к повышению эффективности ее решения. (В более узком смысле информационным обеспечением можно считать результат этапа 2 - построение совместными усилиями СОД и информационной системы некоторой совокупности сообщений, релевантных (потенциально полезных) задачам СОД).
3.Решение задачи. На данном этапе, используя полученную информацию, собственные знания и опыт, а также материальные, энергетические, трудовые и иные ресурсы, СОД вырабатывает новую информацию, которая является результатом решения задачи. Эта информация зафиксирована на "языке задачи" и без дополнительных затрат труда, как правило, не представляет ценности при выходе за пределы конкретной задачи, являясь достоянием СОД или достаточно ограниченного множества лиц (организаций), связанных с конкретной проблемой.
4.Создание сообщений.На данном этапе СОД интерпретирует полученный результат на "языке коммуникаций", т. е. подготавливает сообщение в стандартной форме, принятой на данном этапе развития системы научной коммуникации вообще и систем научно-технической информации (НТИ), в частности. Это может быть подготовка статьи, отчета, выступления на научной конференции, семинаре и т. д. Новая информация, зафиксированная в форме сообщения (например, документальной), потенциально представляет собой общественную ценность для решения большого круга задач, так или иначе связанных с задачей, в результате решения которой она получена.
5. Распространение и преобразование сообщений. Автор сообщения вступает в активное взаимодействие с системой коммуникации, затрачивая определенные усилия (в основном организационного характера) по вводу сообщения в один (или несколько) из доступных каналов коммуникации (депонирование сообщения, публикация, выступление и т. д.). Эффективность данного этапа деятельности определяется как степенью усилий, предпринимаемых СОД, так и теми возможностями, которые ему предоставляет система коммуникации.
Очевидно, что в общем случае данные этапы реализуются сложным последовательно-параллельным образом. Вышеизложенное отображает обобщенную логику рассматриваемого процесса, но необязательно - последовательность его реализации во времени. Кроме того, в конкретных ситуациях процесс решения задачи необязательно включает все указанные этапы, или, по крайней мере, не все они предполагают сравнимые затраты труда (времени).
Этапы 1 и 5 приведенной декомпозиции деятельности являются этапами собственно информационной деятельности. Этап 3 - собственно основная деятельность. Этапы 2 и 4 носят пограничный, диффузный характер и могут быть отнесены как к основной, так и к информационной деятельности.
Информационные системы
Усложнение организационных систем различных уровней и процессов их функционирования и развития приводит к необходимости организационного обособления основной и информационной деятельности. Этот процесс столь же закономерен, как и процесс иерархизации, т. е. иерархического построения самих организационных систем, и, по сути дела, является его следствием.
Естественная декомпозиция системы на управляемую и управляющую части соответствует разделению деятельности на информационную и основную. Наиболее отчетливо это разделение наблюдается в чисто технических системах, где четко выделяется объект управления и устройство управления. В организационных системах провести грань между основной и информационной деятельностью значительно труднее. Представим себе организационную структуру завода: нижние уровни иерархии такой структуры заняты в основном производственной деятельностью, верхние - информационной. Даже здесь трудно провести грань между этими двумя видами деятельности, но еще сложнее обстоит дело в научно-исследовательской организации. Тем не менее в любой организационной системе верхние уровни ее иерархии заняты в основном информационной деятельностью, что позволяет говорить о ее организационном обособлении.
Информационной системой(ИС) назовем систему, предназначенную для сбора, обработки и распространения информации. Цель функционирования ИС - информационное обслуживание или обеспечение основной деятельности системы информационного обмена.
Функционирование ИС предполагает наличие исходных, промежуточных и конечных информационных продуктов, технологических процессов и ресурсов. Необходимой составляющей ИС является подсистема управления, обеспечивающая ее эффективное функционирование (необходимое разнообразие, объем и качество выходных информационных продуктов). В отличие от системы обмена в ИС не включены как поставщики (источники), так и потребители (приемники) информации. ИС объединяет элементы, только преобразующие информацию, т. е. ввода, обработки, хранения, поиска, вывода и распространения информации.
В соответствии с общей теорией систем, информационную систему (ИС) можно определить как совокупность информационных элементов ввода, обработки, переработки, хранения, поиска, вывода и распространения информации, находящихся в отношениях и связях между собой и составляющих определенную целостность, единство.
Если рассматривать ИС как подсистему ОС(организационной системы), то вторую часть этого определения целесообразно расшифровать указанием роли и места ИС как подсистемы более общей системы, которые и обеспечивают ее "целостность" и "единство".
Ä ИС - это взаимосвязанная совокупность элементов ввода, обработки, переработки, хранения, поиска, вывода и распространения информации, цель функционирования которой состоит в информационном обеспечении эффективной деятельности организационной системы, подсистемой которой она является.
Как система ИС естественно обладает основными свойствами систем, такими как иерархичность, централизация и децентрализация, целостность и независимость.
Выделение ИС из системы обмена как самостоятельной системы является следствием организационного обособления основной и информационной деятельности. Существующие автоматизированные документальные и фактографические информационно-поисковые системы (ИПС), АСУ, банки данных (БД), отделы научно-технической информации (ОНТИ), системы НТИ в целом организационно обособлены. Возникает вопрос, как рассматривать поставщиков и потребителей этих систем: как элементы собственно систем или как элементы внешней среды? Этот вопрос в настоящее время решается по-разному. Рассматривают даже внешних и внутренних потребителей этих систем, внешних и внутренних поставщиков информации.
Если считать, что потребители информации являются элементами систем НТИ, АСУ, БД и т. д., то необходимо предположить, что данные системы могут управлять их информационными потребностями. В действительности это не так. Системы могут только изучать эти потребности и приспосабливаться к ним. Функции управления по отношению к потребителям реализует система более высокого уровня - система информационного обмена. Для системы существенно взаимодействие ее элементов для достижения общей цели. Если этого взаимодействия нет, то нет и системы. С другой стороны, потребители ОНТИ, БТИ (бюро технической информации), АСУ, БД и т. д. организационно не принадлежат этим системам. Возникает вопрос: как можно эффективно управлять функционированием системы, имеющей элементы, организационно не принадлежащей ей? Ответ может быть только один - рассматривать эти элементы как элементы внешней среды. То же можно сказать и в отношении поставщиков информации.
Исключая из ИС потребителей и поставщиков информации, получаем возможность четко сформулировать ее цели, задачи и критерии качества функционирования. В соответствии с введенным определением ИС внутренними источниками и потребителями ИС являются те, которые входят в состав элементов данной системы информационного обмена, т. е. системы более высокого уровня, по отношению к которой ИС является подсистемой. Элементы внешней по отношению к данной системе обмена среды являются внешними источниками и потребителями информации. Такое определение в максимальной степени соответствует сложившейся практике.
Задачи и функции ИС.При организационном обособлении ИС может решать две группы задач.
Первая группа задач связана с чисто информационным обеспечением основной деятельности (этапы 1 и 5): отбор необходимых сообщений, их обработка, хранение, поиск и выдача субъекту основной деятельности с заранее заданной полнотой, точностью и оперативностью в наиболее приемлемой для СОД форме.
Вторая группа задач связана с обработкой полученной информации/данных в соответствии с теми или иными алгоритмами или программами с целью подготовки решений задач, стоящих перед субъектом основной деятельности (так называемых "пользовательских" задач или задач блоков 2 и 4). Для решения таких задач ИС должна обладать необходимой информацией о предметной области СОД, стоящих перед ним проблемах, она должна уметь использовать существующие модели решения задач субъекта основной деятельности или самостоятельно строить такие модели. Для решения таких задач ИС должна обладать определенным искусственным или естественным интеллектом. С развитием вычислительной техники и ее программного обеспечения, упрощением технологии работы с ВТ задачи второй группы все чаще выполняют сами субъекты основной деятельности. Однако существует определенный спектр задач второй группы любой из сфер основной деятельности, решение которых целесообразно возлагать на ИС. Задачи первой группы - это задачи информатизации общества "вширь". Задачи второй группы - задачи информатизации общества "вглубь".
Для решения поставленных задач ИС должна выполнить следующие функции:
- отбор сообщений из внутренней и внешней среды, необходимых для реализации основной деятельности;
- ввод информации в ИС;
- хранение информации в памяти ИС, ее актуализация и поддержание целостности;
- обработка, поиск и выдача информации в соответствии с заданными СОД требованиями. Обработка может включать и подготовку вариантов решения пользовательских прикладных задач по соответствующим алгоритмам/программам.
Типология ИС
Говоря об ИС, всегда необходимо иметь ввиду, что ИС не существует сама по себе. Она является подсистемой более общей системы - системы информационного обмена (СИОБ).
Необходимой составляющей ИС как системы являются подсистема управления, обеспечивающая ее эффективное функционирование (необходимое разнообразие, объем и качество выходных информационных продуктов) и являющаяся, в свою очередь, подсистемой системы управления СИОБ .
Практически бесконечное многообразие организационных систем порождает огромное разнообразие ИС как их подсистем. Более того, как было сказано ранее, в реальных условиях ИС, помимо функций этапов 1 и 5, берут на себя часть функций этапов 2 и 4 и даже этапа 3. Это приводит к еще большему разнообразию ИС и практически не позволяет провести в общем случае грань между основной и информационной деятельностью ОС.
Еще сложнее обстоит дело, когда мы говорим об автоматизированных или автоматических ИС.
Ä Автоматизированными ИС (АИС) называют ИС, выполнение некоторых функций которых автоматизированно (с помощью электронной или любой иной техники).
Степень автоматизации может быть разная. Наиболее легко автоматизируются функции этапов 1 и 5. Более сложна автоматизация функций этапов 2 и 4 , поскольку такая автоматизация может потребовать алгоритмизации и/или моделирования некоторых составляющих и/или аспектов ОД.
Ä Автоматические ИС (АВИС)- это такие ИС, все функции в которых выполняются автоматически. На практике в настоящее время большей степенью автоматизации отличаются ИС технических систем и технологических процессов. В организационных системах, имеющих дело с неструктурируемыми проблемами, высокие уровни автоматизации ИС пока еще недостижимы.
Из сказанного следует, что классификация ИС в современных условиях практически невозможна. Более целесообразно говорить о типологии ИС, характеризуя тип системы множеством существенных параметров, определяющих место конкретной ИС в множестве существующих и потенциально возможных ИС. Исходя из определения ИС, как информационной системы, обеспечивающей функционирование СИОБ, а также из рассмотрения специфических особенностей в составе и структуре ИС, изложенных в предыдущем разделе, целесообразно рассматривать следующие существенные параметры ИС:
А - масштаб ИС (определяется масштабом СИОБ);
В - область/отрасль обслуживаемой СИОБ;
C - характер решаемых ИС задач;
Д - совокупность выполняемых ИС функций;
Е - степень автоматизации функций ИС;
К - характер (степень структурируемости) обрабатываемой информации;
М - вид информации.
А. С точки зрения масштаба можно рассматривать ИС: всемирные,
международные, республиканские, региональные, отраслевые, объединений, предприятий, подразделений.
В. По отрасли/области деятельности существуют ИС: медицины, транспорта, связи, строительства, отраслей промышленности, межотраслевые ИС, ИС комплексных проблем, проблем, задач и т. д.
В настоящее время в мире существуют ИС всех перечисленных в А и В видов. В последние годы очень активно развиваются проблемно-ориентированные ИС (ПОИС).
С. С точки зрения характера задач, решаемых ИС, можно выделить:
С. 1. ИС информационного обеспечения и сопровождения основной деятельности.
С. 2. ИС информационного обеспечения и сопровождения управления основной деятельностью.
С. 3. ИС информационного обеспечения и сопровождения основной деятельности и управления ОД.
К ИС типа С. 2. относится огромное разнообразие автоматизированных систем управления (АСУ), автоматизированных систем управления технологическими процессами (АСУП), систем обеспечения принятия решений (СОПР).
ИС типа С. 1. составляют широкий спектр систем научно-технической информации (СНТИ), систем экономической (статистика, финансы, кадры, товары, услуги и т. д. ) информации.
ИС типа С. 3. - интегрированные ИС, решающие одновременно задачи управления и информационного обеспечения ОД. Такие ИС стали развиваться лишь в последние годы. Сложность задач создания интегрированных ИС (ИИС) связана с большими трудностями объединения ИС типов С. 1. и С. 2. , базирующихся на достаточно различающихся, как это показано ранее, технология обработки, хранения и поиска информации.
Д. С точки зрения совокупности функций, выполняемых ИС, можно рассматривать очень большое разнообразие ИС. Как уже было отмечено, обособление функций основной и информационной деятельности связано с большими трудностями. Существующие ИС, в основном, берут на себя выполнение функций этапов 1 и 5 (рис. 2). Однако существуют ИС, выполняющие часть функций этапов 2 и 4. С учетом современного состояния и тенденций развития информатики с точки зрения функций ИС, целесообразно выделить следующие типы ИС.
Д. 1. Системы справочно-информационного обеспечения, выполняющие функции собственно информационной деятельности (этапов 1 и 5), т. е. сбор и приобретение инфорамации, обработка, поиск, хранение, издание, распространение. Среди ИС этого типа существует определенная специализация по следующим функциям:
- подготовки и издания первичной информации (издательства, РИО, статистические бюро, пункты сбора и накопления информации и т. д. );
- обработки первичной информации с целью подготовки вторичной информации или метаинформации (генераторы баз данных, реферативные издательства и т. д. );
- обработки, хранения и поиска вторичной информации с целью информационного обслуживания (системы информационного обслуживания, ОНТИ, бюро НТИ и т. д. );
- хранения и выдачи первичной информации (библиотеки, клиринхаузы и т. д. ).
Д. 2. Системы информационного сопровождения ОД, берущие на себя, помимо функций этапов 1 и 5, часть функций этапов 2 и 4, т. е. функций обобщенной основной деятельности (подготовка аналитических и тематических справок и обзоров, информационный анализ и синтез, анализ тенденций развития, оценка качества и технического уровня изделий, построение и анализ информационных моделей, подготовка вариантов решений и т. д. ).
К данному типу ИС относятся системы обеспечения принятия решений (СОПР), системы автоматизации проектирования (САПР).
Системы данного типа выполняют функции по математической, логической и даже интеллектуальной (содержательной) переработке информации. С этой точки зрения их можно назвать информационно-логическими ИС.
В литературе часто встречаются такие понятия как информационно-справочные системы (ИССИ), информационно-соответствующие системы (ИСС), информационно-управляющие системы (ИУС), экспертные системы (ЭС).
Информационно-справочные системы определяют как системы, которые могут выдавать только ту информацию, которая заранее в них введена. Информационно-советующими и информационно-управляющими системами называют системы, способные выдавать новую информацию, являющуюся результатом переработки входной информации.
В рамках введенной типологии информационно-справочные системы относятся к ИС типа Д. 1. , в то время, как ИСС и ИУС к типу Д. 2.
Е. По степени автоматизации функций целесообразно рассматривать ИС трех типов: неавтоматизированные ИС; автоматизированные ИС; автоматические ИС.
К. Характер обрабатываемой информации на современном этапе оказывает существенное влияние на всю идеологию построения и функционирования ИС. Состав и характер перерабатываемой информации предъявляет жесткие требования к аппарату ее описания, организации и поиска. Существенные различия в аппарате описания, организации и поиска информации реальных ИС приводят к необходимости различать:
- документальные (текстовые) ИС (слабоструктурируемая информация);
- фактографические ИС (жесткоструктурируемая информация);
- документально-фактографические ИС.
М. По видам обрабатываемой информации можно рассматривать ИС разнообразных типов. Наиболее распространено выделение ИС двух типов: ИС публикуемой информации; ИС непубликуемой информации.
Ясно, что для описания конкретных (особенно небольших) ИС может потребоваться большее число параметров и/или более глубокая их детализация.
Состав и структура ИС и АИС
ИС реализует следующие основные функции: отбор, ввод, обработка/переработка, хранение, поиск и выдача информации.
Учитывая специфику организации, управления и технологии выполнения каждой из указанных функций в ИС целесообразно выделять три самостоятельных функциональных подсистемы.
Подсистема отбора информации.Информационная система может обрабатывать/перерабатывать только ту информацию, которая в нее введена. Качество работы ИС определяется не только ее способностью находить и перерабатывать нужную информацию в собственном массиве и выдавать ее пользователю, но и способностью отбирать релевантную информацию из внешней среды. Такой отбор осуществляет подсистема отбора информации, которая накапливает данные об информационных потребностях пользователей ИС (внутренних и внешних), анализирует и упорядочивает эти данные, образуя информационный профиль ИС. Аналогично на основании данных о потоках информационной среды формируется описание входных потоков информации.
При заданном критерии качества функционирования ИС и соответствующей системы ограничений в процессе управления ИС решается задача оптимизации комплектования информационного массива ИС, которая определяет алгоритм (или оператор) отбора информации. Указанный оператор осуществляет преобразование входных потоков в информационный массив ИС. К сожалению, многие действующие ИС слабо придерживаются описанной процедуры отбора документов. Отбор информации, как правило, носит слабоуправляемый характер, базируется на интуиции специалистов. Это является следствием сложности и слабой структурируемости как собственно процессов отбора, так и управления этими процессами.
Функции именно этой подсистемы ИС практически не поддаются автоматизации. Исключение составляют только ИС информационного обеспечения управления технологическими процессами и техническими системами.
Подсистема ввода, обработки/переработки и хранения информации осуществляет преобразования входной информации и запросов, организацию их хранения и переработки с целью удовлетворения информационных потребностей абонентов ИС.
Реализация функций данной подсистемы предполагает наличие аппарата описания информации (систем кодирования, языка описания данных (ЯОД) и т. д.), организации и ведения информации (логическая и физическая организация, процедуры ведения и защиты информации и т. д.), аппарата обработки и переработки информации (алгоритмы, модели и т. д.).
Все три указанные составляющие определяются двумя параметрами ИС: характером обрабатываемой информации и функциями ИС.
Документальные ИС для описания информации используют информационно-поисковые языки (ИПЯ) и систему индексирования, методология построения и использования которых существенно отличается от методологии и принципов использования ЯОД, обеспечивающих описание данных в фактографических ИС. Логическая организация данных фактографических ИС имеет мало общего с организацией информации в документальных ИС. Наконец, различны и аппараты обработки и переработки документальной и фактографической информации. Если в фактографических ИС преимущественно используются математические алгоритмы, то в документальных - эвристические процедуры, требующие затрат интеллектуальной энергии.
Подсистема подготовки и выдачи информации непосредственно реализует удовлетворение информационных потребностей пользователей ИС (внутренних и внешних). Для выполнения этой задачи подсистема проводит изучение и анализ информационных потребностей, определяет формы и методы их удовлетворения, оптимальный состав и структуру выходных информационных продуктов, организует сам процесс информационного обеспечения и сопровождения. Выполнение указанных функций требует наличия аппарата описания и анализа информационных потребностей и их выражения на языке ИС (в том числе ЯОД, ИПЯ, языке индексирования и т. д.), а также аппарата непосредственно информационного обеспечения (процедуры поиска и выдачи информации, языки манипулирования данными и т. д.).
Все эти и многие другие составляющие рассматриваемой подсистемы, выполняя одинаковые функции в ИС разных типов, тем не менее существенно отличаются между собой. Особенно заметно это различие при сравнении документальных и фактографических ИС.
Из предыдущего рассмотрения следует, что многие функции различных подсистем ИС дублируются или пересекаются, что является предметом оптимизации при проектировании ИС. Автоматизация ИС в связи с этим сопровождается перераспределением элементов ИС.
Автоматизация предполагает формализованное представление (структуризацию) как функций ИС, так и самой обрабатываемой в ИС информации, которое и позволяет осуществлять ввод, обработку/переработку, хранение и поиск информации с использованием ЭВМ.
Однако любая формализация характеризуется тем или иным уровнем адекватности создаваемого образа реальной действительности (модели) самой действительности. Причем, адекватность модели реальной действительности определяется как свойствами самой действительности, так и возможностями используемого аппарата ее формализованного представления.
С этой точки зрения "уровень автоматизации" ИС тесно связан со "степенью структурируемости" как самой информации, являющейся предметом обработки, хранения и т. д., в ИС, так и самих функций ИС (обработки, хранения и т. д.).
В соответствии с уровнем современных знаний в области формализованного представления информации можно различать информацию трех уровней структурируемости:
1. Жесткоструктурируемая информация - информация, формализованное представление которой современными средствами ее структурирования (в частности, языками описания данных) не приводит к потере адекватности создаваемого образа информации (модели) самой исходной информации. Жесткоструктурируемую информацию будем в дальнейшем называть данными.
2. Слабоструктурируемая информация- информация, формализованное представление которой современными средствами описания информации (в частности, ИПЯ) приводит к значительным потерям адекватности модели информации самой исходной информации. Обработка и поиск такой информации предполагает специальные меры по оценке степени неадекватности модели информации. (В АИПС этой цели служат меры смысловыразительной способности (семантической силы) ИПЯ).
3. Неструктурируемая информация - информация, для которой в настоящее время не существует средств ее формализованного представления с приемлемым на практике уровнем адекватности. Средства представления такой информации должны обладать высокими смысловыразительными способностями. Разработка таких средств в настоящее время идет по линии создания языков описания знаний и ИПЯ с высокой семантической силой.
Приведенная классификация информации по степени ее структурируемости достаточно условна. Однако сама идея учета структурируемости информации оказывается полезной при анализе сущности современных АИС.
Анализ функций ИС показывает, что с точки зрения возможностей алгоритмизации, функции ИС можно разбить на три категории:
а) жесткоструктурируемые функции (ввод, обработка, хранение информации), выполнение которых не связано с затратами интеллектуального труда и легко алгоритмизуется;
<