Информология - общая теория информации

Часто понятие "информация" используют, не задумываясь о глубине егосодержания, отождествляя понятия знание, данные, информация. Очевидно, что"обиходное" употребление термина "информация” совершенно неуместно, когдаречь идет о теории или теориях информации. Нередко в этих теоретическихпостроениях термин "информация" наполнен разным смыслом, а следовательно,сами теории высвечивают лишь часть граней некоторой системы знаний, которуюможно назвать общей теорией информации или "информологией" - наукой опроцессах и задачах передачи, распределения, обработки и преобразованияинформации.Возникновение информологии как науки можно отнести к концу 50-х годов нашегостолетия, когда американским инженером Р. Хартли была сделана попытка ввестиколичественную меру информации, передаваемой по каналам связи.Рассмотрим простую игровую ситуацию. До получения сообщения о результатеподбрасывания монеты человек находится в состоянии неопределенностиотносительно исхода очередного броска. Сообщение партнера дает информацию,снимающее эту неопределенность. Заметим, что число возможных исходов вописанной ситуации равно 2, они равноправны (равновероятны) и каждый разпередаваемая информация полностью снимала возникавшую неопределенность.Хартли принял "количество информации", передаваемое по каналу связиотносительно двух равноправных исходов и снимающее неопределенность путемуказания на один из них, за единицу информации, получившую название "бит".Создатель статистической теории информации К. Шеннон обобщил результат Хартлии его предшественников. Его труды явились ответом на бурное развитие всередине века средств связи: радио, телефона, телеграфа, телевидения. Теорияинформации Шеннона позволяла ставить и решать задачи об оптимальномкодировании передаваемых сигналов с целью повышения пропускной способностиканалов связи, подсказывала пути борьбы с помехами на линиях и т.д.В работах Хартли и Шеннона информация возникает перед нами лишь в своей внешнейоболочке, которая представлена отношениями сигналов, знаков, сообщений друг кдругу - синтаксическими отношениями. Количественная мера Хартли-Шеннона непретендует на оценку содержательной (семантической) или ценностной,полезной (прагматической) сторон передаваемого сообщения.Новый этап теоретического расширения понятия информации связан с кибернетикой - наукой об управлении и связи в живых организмах, обществе имашинах. Оставаясь на позициях шенноновского подхода, кибернетика формулируетпринцип единства информации и управления, который особенно важен для анализасути процессов, протекающих в самоуправляющихся, самоорганизующихсябиологических и социальных системах.Развитая в работах Н. Винера концепция предполагает, что процесс управления вупомянутых системах является процессом переработки (преобразования) некоторымцентральным устройством информации, получаемой от источников первичнойинформации (сенсорных рецепторов) и передачи ее в те участки системы, где онавоспринимается ее элементами как приказ для выполнения того или иногодействия. По совершении самого действия сенсорные рецепторы готовы к передачеинформации об изменившейся ситуации для выполнения нового цикла управления.Так организуется циклический алгоритм (последовательность действий)управления и циркуляции информации в системе. При этом важно, что главнуюроль играет здесь содержание информации, передаваемой рецепторами ицентральным устройством.Информация, по Винеру - это "обозначение содержания, полученного из внешнегомира в процессе нашего приспособления к нему и приспособления к нему нашихчувств" .Таким образом, кибернетическая концепция подводит к необходимости оценитьинформацию как некоторое знание, имеющее одну ценностную меру по отношению квнешнему миру (семантический аспект) и другую по отношению к получателю,накопленному им знанию, познавательным целям и задачам (прагматическийаспект).Попытки построить модели понятия информации, охватывающие семантическийаспект знания, содержащегося в некотором высказывании относительнообозначаемого объекта, привели к созданию ряда так называемых логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвиллои др.). В них информация рассматривается как уменьшение или устранениенеопределенности. Естественно предположить, что средствами какого-либо языкас помощью создаваемых в нем высказываний можно описать некоторую совокупностьвозможных ситуаций, состояний, альтернатив. Семантическая информация,содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чембольше альтернатив исключает высказывание, тем большую семантическуюинформацию оно несет. Так, например, одна из возможных совокупностей ситуацийможет быть описана следующим образом: "все тела при нагревании расширяются".Высказывание "металлы при нагревании расширяются" исключает все альтернативыв которых речь может идти о неметаллах. Семантическая сила высказывания можетбыть оценена отношением все тела (все металлы). Еще более информативным будетвысказывание "железо при нагревании расширяется", так как оно исключает всеальтернативы, кроме одной.При всем многообразии логико-семантических теорий им присущи общие черты, ониуказывают путь решения трех связанных друг с другом проблем: определениясовокупности возможных альтернатив средствами выбранного языка,количественной оценки альтернатив, их относительного сопоставления(взвешивания), введения меры семантической информации.В рассмотренных теоретических конструкциях - статистической и семантическойинформации - речь шла о потенциальной возможности извлечь из передаваемогосообщения какие-либо сведения. Вместе с тем в процессах информационногообмена очень часто складываются ситуации, в которых мощность или качествоинформации, воспринимаемое приемником, зависит от того, насколько онподготовлен к ее восприятию.Понятие тезауруса является фундаментальным в теоретической моделисемантической теории информации, предложенной Ю.А. Шрейдером и учитывающей вявной форме роль приемника.Согласно этой модели, тезаурус - это знания приемника информации овнешнем мире, его способность воспринимать те или иные сообщения.Представим себе, что до получения телеграммы "Встречай завтра рейс СУ172" мыиз вчерашнего разговора по междугороднему телефону уже знали о предстоящемприезде своего родственника или друга, а наведя справки, узнали и номеравиарейса, с которым он может прибыть в город. Наш тезаурус уже содержалинформацию, заключенную в телеграмме. Следовательно он не изменился с ееполучением и семантическая ценность этой информации оказалась нулевой.Очевидно, что к подобной оценке семантического содержания информациипримешивается семантический аспект, скрытый в изначальной "установке"тезауруса на осмысление принимаемого сообщения.В прагматических концепциях информации этот аспект является центральным, чтоприводит к необходимости учитывать ценность, полезность, эффективность,экономичность информации, т.е. те ее качества, которые определяющим образомвлияют на поведение самоорганизующихся, самоуправляющихся, целенаправленныхкибернетических систем (биологических, социальных, человеко-машинных).Одним из ярких представителей прагматических теорий информации являетсяповеденческая модель коммуникации - бихевиористская модель Акоффа-Майлса.Исходным в этой модели является целевая устремленность получателя информациина решение конкретной проблемы. Получатель находится в “целеустремленномсостоянии", если он стремится к чему-нибудь и имеет альтернативные путинеодинаковой эффективности для достижения цели. Сообщение, переданноеполучателю иформативно, если оно изменяет его "целеустремленное состояние".Так как "целеустремленное состояние" характеризуется последовательностьювозможных действий (альтернатив), эффективностью действия и значимостьюрезультата, то передаваемое получателю сообщение может оказывать воздействиена все три компонента в различной степени. В соответствии с этим передаваемаяинформация различается по типам на "информирующую", "инструктирующую" и"мотивирующую". Таким образом, для получателя прагматическая ценностьсообщения состоит в том, что оно позволяет ему наметить стратегию поведенияпри достижении цели построением ответов на вопросы: что, как и почему делатьна каждом очередном шаге? Для каждого типа информации бихевиористская модельпредлагает свою меру, а общая прагматическая ценность информации определяетсякак функция разности этих количеств в "целеустремленном состоянии" до и послеего изменения на новое "целеустремленное состояние".Следующим этапом в развитии прагматических теорий информации явились работыамериканского логика Д. Харраха, построившего логико-прагматическую моделькоммуникации. Одной из слабостей бихевиористской модели является еенеподготовленность к оценке ложных сообщений. Модель Харраха предполагаетучет общественного характера человеческой коммуникации. В соответствии с нейполучаемые сообщения должны быть сначала подвергнуты обработке, после которойвыделяются сообщения "годные к употреблению". Именно с совокупности годных купотреблению сообщений должны быть применены критерии прагматическойценности.Теория информации "в смысле Шеннона" возникла как средство решения конкретныхприкладных задач в области передачи сигналов по каналам связи. Поэтому, по-существу, она являлась и является прикладной информационной наукой. Семействотаких наук, специально изучающих информационные процессы в том или ином ихспецифическом содержании и форме, во второй половине нашего века растетдовольно быстро. Это - кибернетика, теория систем, документалистика,лингвистика, символическая логика и др. Стержнем, объединяющим все этиисследования, служит общая теория информации -"информология", в основукоторой и положены синтаксические, семантические и прагматические концепцииинформации. 2.2 Формализация знаний: методы и приемы. Их эффективность, сравнительныйанализ [1]При поиске наиболее удобных, рациональных средств и форм информационногообмена человек чаще всего сталкивается с проблемой компактного и однозначногопредставления знаний.Представление знаний это процесс, конечная цель которого поместить некоторыйобъем знаний в своеобразную "упаковку" в которой он может начать движение поканалам информационного обмена, дойти до получателя, или задержаться впунктах хранения знаний. Такой упаковкой может быть фраза устной речи,письмо, книга, справочник, географическая карта, кроссворд, картина и т.п.Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество,хотя и не в одинаковой степени: упаковка призвана обеспечить сохранностьвложенного знания. Причем не только и не столько физическую, сколькосмысловую (семантическую). Для этого необходимо, чтобы отправитель иполучатель информации упакованных знаний пользовались некоторой общейсистемой правил для их представления и восприятия. Назовем такую системуправил формализмом представления знаний. Самым естественным, подходящим длячеловека формализмом является язык (устная речь и письменность).Без знаний, без постоянной работы по их упаковке в языковые конструкции языкмертв. Он живет и развивается благодаря творческой энергии человека,благодаря тому, что человеческая мысль постоянно и настойчиво ищет выхода ввыраженную в языке форму.Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет.Например, существуют десятки различных определений понятий здоровье,интеллект, мышление, информация и т.п. Отмечая эту ограниченностьвыразительных средств языка, Ф. Энгельс писал: "Дефиниции не имеют значениядля науки, потому что они всегда оказываются недостаточными".Мысль, которую нельзя выразить в языковой конструкции, не может быть включенав информационный обмен. Общение людей, таким образом, осуществляется спомощью языка как формы представления знаний. Одному и тому жесодержательному знанию можно придать различную словесную или текстовую форму.Это очень сильно проявляется, например, в художественной прозе, поэзии и т.д.Богатство языка это и богатство культуры того или иного народа.Вместе с тем, в некоторых областях деятельности людей это богатство иразнообразие выразительных средств естественного языка становится скореенедостатком, чем достоинством. Например, слова команды должны быть короткими,резкими, иметь однозначный смысл, иначе не получится согласованных и четкихсовместных действий подчиненных. В специальных отраслях науки формируютсяспецифические языковые системы, являющиеся как бы "сужением" естественногоязыка. Особо выделяется язык математики, как некоторая основа изложениясистемы знаний в точных, естественных науках. Свой язык имеют химия, физика,философия и т.д.Целесообразность применения таких суженных языковых систем (диалектов),позволяет повысить надежность процессов информационного обмена, т.к.возможность неправильного истолкования передаваемой информации снижается. Приэтом, конечно, сужается и круг получателей, поскольку для восприятияинформации необходимо владеть соответствующим диалектом. Главные достоинствасуженного языка - возможность создавать и использовать типовые, "стандартные"упаковки знаний, а также в значительной мере снять полисемию (смысловуюмногозначность), присутствующую в естественном языке. Полисемия - враг информационного обмена, фактор внесения искажения иошибок (семантического шума) на пути передачи информации. Поэтому устранениемногозначности является одним из наиболее важных направлений в разработкеформальных приемов представления знаний. Создание языка науки или языка деловойпрозы, называемого часто "концеляритом ", является естественным шагом на этомпути, огромной работой общества на протяжении ряда столетий. Сопоставление этойподсистемы естественного языка с литературным языком показывает насколько ониразличны по характеристикам, определяющим их выразительную способность.Так "канцелярит" предназначен для объективизации изложения информации,использует, как правило, переводимые категории и языковые формы, лишенсинонимии, оперирует конкретными фактами и понятиями, информативен (впротивоположность информационной избыточности), ему присуща логичность, он похарактеру алгебраичен (мысль, информация, знание развернуты впоследовательность слов и предложений, постепенно формируясь в полном,законченном виде к завершению текста). Все эти свойства не являютсяобязательными для языка литературы, которому свойственна субъективность форм,возможность применения непереводимых конструкций, бесконечно богатаясинонимия, образность (геометричность) высказываний и т.д.Дальнейшее продвижение в сторону формализации знаний приводит к понятиям класс и классификация. Классификация - распределение предметов, объектов и понятий по группам(классам) по обнаруженным свойствам.В любой складывающейся науке одним из первых принципов являлся принципсистематизации знаний. Поэтому классификация как метод научной систематикисразу же стала играть важную роль в формировании ядра знаний того или иногонаучного направления. Достаточно вспомнить классификационную систему К.Линнея в ботанике, систематику живых организмов и т.п. Классификационныесистемы такого типа имеют выраженную иерархическую структуру, в силу которойвсе объекты (понятия, факты) разделены на уровни, связанные между собойотношением "старший - младший": тип, класс, отряд, семейство, род, вид.Примером классификации такого типа где родо-видовые отношения пронизывают всюструктуру соответствующих знаний может служить известная "табель о рангах",введенная Петром 1 в 1722 г. Табель о рангах подразделяла чины на 14 рангов.Каждому чину соответствовала определенная должность. Первые 6 рангов статскойи придворной служб и первый обер-офицерский чин в армии давали право наполучение потомственного дворянства, что способствовало формированиюдворянской бюрократии.Мы видим на этом примере, что классификация может проявить себя не толькокак инструмент организации научных знаний, но и как фактор социального порядка. Поэтому существующие системы тарифов и ставок, ученых степеней и званий,структура должностей и служебных постов в гражданской службе и армии играют нетолько организующую, но и стимулирующую роль. Подобная модель знаний получила внауке и практике название "иерархической". Ее достоинства в том, что она простав освоении, легко поддерживается в рабочем состоянии (легко пополняется и"чистится"), эффективно решает задачу разнесения новых понятий по иерархическимуровням.Недостатки иерархической модели знаний:- прямые связи между понятиями соседних уровней обозначены слабо, или вовсеотсутствуют;- иерархическая классификация наиболее эффективна в тех случаях, когда припереходе от уровня к уровню работает один и тот же тип отношений, например,родо-видовой.Систематика, лежащая в основе классификации может применяться как сильноесредство направленного исследовательского поиска. Так, иногда оказываетсяполезным при рассмотрении группы объектов несколько каких-либо характерных дляних признаков выделить в качестве определяющих и ввести некоторую меру степенипроявления данных признаков. Такой подход называется морфологическим,так как использует идею разложения некоего объекта на его части (признаки).Часто подобная группировка приводит к выявлению закономерностей связывающихобъекты каждой группы, которые до этого не были известны.Благодаря такому подходу Д.И.Менделеев открыл знаменитый периодический закон.Подчеркивая доминирующую роль выделенного им признака он писал: "...по смыслувсех точных сведений о явлениях природы масса вещества есть именно такоесвойство его, от которого должны находиться в зависимости все остальныесвойства ... Поэтому ближе или естественнее всего искать зависимости междусвойствами и сходствами элементов, с одной стороны, и атомными их весами, сдругой " .Морфологический метод осуществляет как бы анатомическое исследованиеобъектов, понятий, значений путем расчленения целого на характерные,существенные части. Его цель - выяснение роли частного в целостной картине,систематизация знаний о данной реальности, составление гипотез о возможныхвариантах новых (еще не данных) знаний.Упомянутые выше недостатки иерархической модели данных свойственны иморфологическим моделям. Их удается устранить используя так называемыеветвящиеся (древовидные) структуры (модели) представления знаний. Отдельныепонятия, факты, знания, связаны между собой отношениями, выражающими сутьимеющихся между ними связей. Как в иерархической модели это могут быть родо-видовые отношения, но так же и другие типы отношений: "быть представителем","иметь", "наследовать" и т.п. Однозначность связей в древовидной структуре иразнообразие охватываемых ею отношений позволяет повысить "динамизм" системызнаний. Действительно, система знаний, представленных иерархической илиморфологической моделями статична, или, как говорят, декларативна.В древовидной структуре можно прослеживать восходящие и нисходящие ветвисвязей получая формулы дедуктивного (от частного к общему), индуктивного (отобщего к частному) и индуктивно-дедуктивного выводов. Например: "растениеможет быть цветком по имени роза"; "роза - цветок, часть растения"; "роза -цветок, имеющий лепестки".Благодаря такой организации представленные знания получают как дополнение кдекларативности процедуральность, т.е. способность к выводу общих знаний изструктуры отношений и понятий. Древовидная структура знаний, несмотря напростоту и распространенность в обиходе информационного обмена, все-такидовольно специфична. В ней, как и в предыдущей модели знаний, заложенапарадигма иерархичности. В тоже время внутреннее "мироустройство" некоторойсистемы знаний может не соответствовать этой парадигме.Рассмотрим в качестве примера понятие "трудовой коллектив". Совокупностьзнаний, описывающих конкретный трудовой коллектив, чрезвычайно разнообразна,или, как говорят, многоаспектна. Между аспектами часто не удается установитьотношений иерархии (род-вид), хотя связь между ними имеет место. Вот один извозможных аспектов: все представители трудового коллектива могут бытьвключены по алфавиту в список с указанием против фамилии и имени каждогоработника табельного номера, года рождения, образования, специальности,разряда, стажа работы и т.п. Назовем этот список - "Список 1".Другой аспект: все члены коллектива работают на условиях сдельной оплаты ивеличина их заработка определяется на основе т.н. тарифной сетки. Поэтому,составив список специальностей и разрядов с указанием стоимости одного часарабочего времени, мы формируем некоторое представление знаний о системеоплаты труда членов данного коллектива. Назовем этот список - "Список 2".Третий аспект: при начислении зарплаты каждому работнику мы должны учитыватьего фактическую выработку на протяжении некоторого периода работы (напримерза месяц). Значит третий список, составляемый, скажем, мастером участка этосписок, состоящий из табельных номеров и фактически проработанного работникомвремени. Это - “Список 3”.Понятно, что все три списка содержат необходимый объем знаний о трудовомколлективе, если речь идет о начислении заработной платы. Подобные моделипредставления знаний, состоящие из связанных друг с другом списочных структур,получили название реляционных[3].В реляционных моделях удается представить более сложные области знаний. В нихкаждый из аспектов может рассматриваться как некоторый автономный блок внутрикоторого допускается производить изменения, не затрагивая других областей ине внося при этом противоречий в общую картину знаний. Удобным средствомявляется комбинация устойчивых и изменяемых знаний. Так знания, выраженныеСписком 2 длительно устойчивы. В Списке 1 представлены знания, которые могутменяться с течением времени - текучесть кадров, изменение квалификации и т.п.Список 3 обновляется каждый раз, когда возникает необходимость очередногорасчета. Не вызывает принципиальных трудностей задача пополнения реляционноймодели новыми знаниями путем расширения уже имеющихся списков и добавленияновых списочных структур.В приведенном примере мы рассмотрели лишь задачу определения величинызаработка. Но, по-видимому ясно, что реляционные модели включающиедостаточное по содержанию и количеству число списочных структур создаютвозможность для решения большого количества разнообразных задач каждая изкоторых является по существу задачей извлечения из общей суммы вложенных вмодель знаний нужного конкретного знания по интересующему получателя вопросу.Существуют и другие формализмы представления знаний, кроме перечисленных вышеиерархических, морфологических, древовидных и реляционных моделей. Так,например, промежуточным между древовидной и реляционной моделью являются такназываемые семантические сети. С их помощью между понятиями, фактами,знаниями устанавливаются связи - отношения. Они как бы являются обобщениемдревовидных моделей т.к. отличаются от последних снятием требованийиерархичности. В то же время семантические сети могут считаться частнымслучаем реляционных моделей, т.к. именно из них могут быть построенысвязанные списочные структуры, когда понятие являющееся узлом семантическойсети расширяется в список, а соответствующее отношение с другим списком изединичного становится групповым.Все описанные приемы формализации знаний направлены на создание некоторойустойчивой "несущей конструкции" на которую может быть одета оболочка системыконкретных знаний. В случае, если между отправителем и получателем знанийдостигнуто понимание, взаимная договоренность относительно этой несущейконструкции, то информационный обмен приобретает необходимую регламентирующуюоснову, что решающим образом повышает его эффективность. Информационная технология. Под традиционной информационной технологией, как правило, понимаетсяинформационная технология на базе “жестких алгоритмов”.Под новой информационной технологией, как правило, понимаетсяинформационная технология на базе “мягких алгоритмов”, с использованиемдостижений искусственного интеллекта. Материя, энергия, информация, знания - связь понятий(2).Исходной посылкой является утверждение, что информация является семантическойсущностью материи. Понятие “материя” отождествляется с понятием “система”, вкоторую входят составными элементами - вещество, энергия, знания иинформация. Эти элементы в соответствии с законом сохранения материиподдерживают систему в равновесном состоянии путем взаимных переходов изодной в другую субстанцию системы (рис. ниже). При взаимодействии этихэлементов системы вещество выступает носителем знания, а энергия - носителеминформации. М А Т Е Р И Я
       
   
Вещество Энергия
                       
                   
                       
   
Знания Информация Информация, данные, знания - соотношение понятий. Информация - всеобщее свойство материи, проявляющееся в кибернетическихкоммуникативных процессах. Данные - это сведения, служащие для какого-либо вывода и возможногорешения. Они могут храниться, передаваться, но не выступать в качествеинформации. Знания - это результат познавательной деятельности, система приобретенныхс ее помощью понятий о действительности. Соотношение понятий информация, данные, знания.Может быть предложена следующая соответствующая логической связи указанныхпонятий образная цепочка[3] - зерно, мука, хлеб.Информация всегда носит “транспортный” оттенок передачи знания по сетям связи, знание же всегда связано с личностью его создателя.

Наши рекомендации