Классификация и кодирование информации
Тема 1. Основные понятия информатики
План
1.1. Информатика, ее структура, задачи и функции
1.2. Понятие информации
1.3. Свойства информации
1.4. Виды информации
1.5. Экономическая информация
1.6. Классификация и кодирование информации
1.7. Общая характеристика процессов сбора, передачи, обработки и накопления информации
Информатика, ее структура, задачи и функции
Информационное общество- общество, в котором большинство работников занято производством, хранением, переработкой и реализацией информации, особенно высшей ее формы - знаний.
Материальной и технологической базой информационного общества станут различного рода системы на базе компьютерной техники и компьютерных сетей, информационной технологии, телекоммуникационной связи.
Информационная технология (ИТ) - процесс, использующий совокупность средств и методов сбора, обработки и передачи данных (первичной информации) для получения информации нового качества о состоянии объекта, процесса или явления.
Информационная культура – совокупность знаний, умений и навыков, связанных с пониманием закономерностей информационных процессов в природе, обществе и технике.
Информатика - это наука о структуре, свойствах, закономерностях и методах создания, хранения, поиска, преобразования, передачи и использования информации[1].
В 1978 году международный научный конгресс официально закрепил за понятием "информатика" области, связанные с разработкой, созданием, использованием и материально-техническим обслуживанием систем обработки информации, включая компьютеры и их программное обеспечение, а также организационные, коммерческие, административные и социально-политические аспекты компьютеризации — массового внедрения компьютерной техники во все области жизни людей.
Информатику в узком смысле можно представить как состоящую из трех взаимосвязанных частей - технических средств (hardware), программных средств (software), алгоритмических средств (brainware).
Рис. 1.1. Структура информатики
Предмет информатики составляют следующие понятия:
· аппаратное обеспечение средств вычислительной техники;
· программное обеспечение средств вычислительной техники;
· средства взаимодействия аппаратного и программного обеспечения;
· средства взаимодействия человека с аппаратными и программными средствами.
Основной задачейинформатики является систематизация приемов и методов работы с аппаратными и программными средствами вычислительной техники.
Понятие информации
Информация[2] – это мера устранения неопределенности в отношении исхода интересующего нас события.
Данные[3] – это материальные объекты произвольной формы, выступающие в качестве средства представления информации.
Данные служат исходным «сырьем» для получения информации. Одни и те же данные могут нести различную информацию в зависимости от способа воспроизведения данных (рис. 1.2.) и для различных потребителей.
Рис. 1.2. Одинаковые данные несут разную информацию в результате применения разных методов форматирования
Информация от источника к получателю передается в виде сообщения посредством канала связи между ними.
Сообщение— это форма представления информации в виде речи, текстов, жестов, взглядов, изображений, цифровых данных, графиков, таблиц и т.п.
Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал. Этот сигнал посылается по каналу связи. В результате в приёмнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением.
канал связи | ||
ИСТОЧНИК | сообщение -----------> | ПРИЁМНИК |
Рис. 1.3. Схема передачи информации
Сигнал– изменяющийся во времени физический процесс.
Если параметр[4] сигнала принимает последовательное во времени конечное число значений, сигнал называется дискретным, а соответствующее сообщение – дискретным сообщением.
Если параметр сигнала непрерывная функция от времени, то сигнал – непрерывный, а соответствующая информация называется непрерывной.
При определении количества информации существуют два основных подхода: вероятностный и «объемный».
В вероятностном подходе, предложенном Клодом Шенноном, количество информации совпадает с энтропией опыта.
В «объемном» подходе, связанном с появлением ЭВМ, количество информации измеряется в битах (BInary digiT) – минимальных информационных единицах. Более крупные единицы информации – байт (8 бит), Килобайт(210=1024 байт), Мегабайт (210=1024 Кб), Гигабайт (210=1024 Мб), Терабайт (210=1024 Гб), Петабайт (210=1024 Тб).
Свойства информации
Информация характеризуется тремя категориями свойств: атрибутивными, прагматическими и динамическими.
Атрибутивные свойства- необходимые свойства, те, без которых информация не может существовать:
· это неотрывность от физического (материального) носителя,
· языковая природа,
· дискретность[5],
· непрерывность[6].
Прагматические свойства характеризуют степень полезности информации для практики:
· наличие смысла,
· новизна,
· ценность (полезность),
· кумулятивность[7].
Динамические свойства характеризуют изменение информации во времени:
· свойство роста,
· повторяемости[8],
· многократная используемость[9],
· старение,
· способность рассеиваться по различным источникам.
Динамические свойства информации в значительной мере влияют на характеристики информационных процессов.
Виды информации
Информацию можно классифицировать по различным признакам (табл.1.1).
Таблица 1.1.
Виды информации
Классификационный признак | Виды |
Сфера возникновения | Элементарная Биологическая Социальная |
Способ передачи и восприятия | Визуальная Аудиальная Тактильная |
Сфера общественного назначения | Массовая Специальная[10] Личная |
Экономическая информация
Экономическая информация (ЭИ) – это информация, отражающая и обслуживающая процессы производства, распределения, обмена и потребления материальных благ. Или экономическая информация – это объектизированное воплощение – с помощью знаков и сигналов – знаний о материальных, трудовых и стоимостных аспектах воспроизводимых в экономике процессов, устраняющих неопределенность в отношении исходов этих процессов.
Классификация ЭИ:
· по принадлежности к сфере материального производства и непроизводственной сфере (а внутри – по отраслям и подотраслям)
· по стадиям воспроизводства и элементам производственного процесса: отражающая снабжение, производство, распределение и потребление, а также материальные, трудовые и финансовые ресурсы.
· по критериям соответствияотражаемым явлениям: достоверная и недостоверная
· по полноте отражения событий: достаточная (полная), недостаточная и избыточная
· по стадии возникновения:
o исходная (первичная): планово-директивная и учетно-отчетная
o производная (вторичная): промежуточная и окончательная (результатная)
· по стабильности: постоянная (условно-постоянная) и переменная
· по технологии решения: входная, промежуточная, выходная.
Особенности ЭИ:
Ø преобладание алфавитно-цифровых знаков;
Ø необходимость оформления результатов обработки данных в форме, удобной для восприятия человеком;
Ø широкое распространение документов как носителей исходных данных и результатов их обработки;
Ø значительный объем переменных и постоянных (условно-постоянных) данных
Ø дискретность, объясняющаяся тем, что экономическая информация характеризует состояние объекта или процесса либо на определенный момент времени, либо за определенный интервал времени;
Ø организованность, вытекающая из того, что экономическая информация отражает результат интеллектуальной деятельности человека;
Ø неоднородность – в силу основного назначения информации: различать элементы и свойства отражаемых процессов;
Ø организованность, вытекающая их того, что экономическая информация отражает результат интеллектуальной деятельности человека;
Ø рассредоточенность источников и принципиальная невозможность концентрации и централизации процессов сбора данных
Ø возможность длительного хранения с воспроизведение и обновлением и т.д.
Требования, предъявляемые к ЭИ:
· адекватность информации - определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.
· репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта.
· содержательность информации отражает семантическую (смысловую) емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных.
· достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей).
· доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования.
· актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
· своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
· точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.д.
· достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
· устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности.
Кроме того, информация должна быть документальной, т.е. юридически подтвержденной в документах соответствующими подписями (визами) соответствующих должностных лиц.
Составной единицей информации(СЕИ) называют единицу информации, состоящую из совокупности других единиц информации, ассоциативно связанных между собой (т.е. по смыслу). Единицу информации, входящую в СЕИ, называют составляющей единицей информации.
Простой, элементарной составляющей единицей экономической информации является реквизит.
Свойства реквизита:
· отдельно взятый реквизит не может полностью характеризовать экономический процесс или объект;
· отдельный реквизит может входить в состав различных экономических показателей.
Характеристики реквизита: имя (наименование), тип и значение.
Классификация реквизитов:
- реквизиты-признаки, отражающие качественные свойства экономического объекта, процесса или явления;
- реквизиты-основания, характеризующие количественную сторону процесса или объекта.
Основной структурной единицей, состоящей из определенной совокупности реквизитов, характеризующей какой-либо конкретный объект, факт, процесс и т.п. с количественной и качественной стороны, является экономический показатель(рис.1.4), который включает один реквизит-основание и группу взаимосвязанных с ним и между собой по смыслу реквизитов признаков.
Классификация показателей:
- по признаку формальной характеристики: абсолютные и относительные;
- по признаку процесса: производственные, распределения, обращения и т.п.
- по признаку объекта: населения и трудовых ресурсов, природных ресурсов, продукции, основных фондов и т.п.
- по признаку получения: первичные (определяемые путем измерения, подсчета, взвешивания и т.п.) и вторичные (формируемые на основе первичных - стоимость готовой продукции, заработная плата и т.п.).
Экономический документ(ЭД) представляет собой определенным образом организованную совокупность взаимосвязанных по смыслу экономических показателей. Наиболее распространенной формой представления ЭД является табличная форма, которая включает общую, предметную и оформительскую части (рис. 1.5).
Электронный документ – сведения, представленные в форме, воспринимаемой электронными средствами обработки, хранения и передачи информации, которые имеют необходимые атрибуты для их однозначной идентификации и которые могут быть преобразованы в форму, пригодную для восприятия человеком.
Электронная цифровая подпись– определенная последовательность символов, имеющая неизменяемое соотношение с каждым символом определенного объема сведений электронного документа и предназначенная для подтверждения целостности и неизменности этого объема сведений, а также тождественности его содержания волеизъявлению заверившего его лица.
Рис. 1.4. Структура экономического показателя.
Рис. 1.5. Пример построения экономического документа табличной формы
В целях упрощения организации процессов обработки, передачи и хранения информации, содержащейся в документах, она может объединяться в виде информационных массивов (файлов – для машинных носителей).
Информационный массив – набор данных (документов) одной формы (одного названия) со всеми их значениями либо сочетание таких наборов данных, относящихся к одной задаче (укрупненный массив). В системах обработки информации массив является основной структурной единицей, предназначенной для хранения, передачи и обработки информации.
Массивы могут объединяться в более крупные структурные единицы. Самой крупной является информационная база, а самой простой формой объединения – информационный поток.
Информационный поток– совокупность информационных массивов, в том числе документов, относительно конкретной управленческой деятельности, имеющей динамический характер.
Информационная база– вся совокупность информации реального экономического объекта.
Классификация информационных массивов:
· постоянные (условно-постоянные) (содержащие нормативно-справочную информацию) и переменные (исходная и промежуточная информация, отражающая текущее состояние объекта управления);
· основные (хранящие обрабатываемые данные) и вспомогательные (результат логической обработки основных массивов);
· входные, промежуточные (внутренние)(содержащие результаты предыдущих расчетов), выходные (результатные);
· текущие (рабочие) ( информация о состоянии управляемого объекта на данный момент времени) и служебные (справочники, каталоги, нормативные документы).
Классификация и кодирование информации
Одной из операций при работе с информацией является классификация информации об объектах.
Классификация объектов- система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.
Разработаны 3 метода классификации объектов: иерархический, фасетный, дескрипторный.
Иерархическая система классификации строится следующим образом:
· исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень.
· каждый класс 1-го уровня в соответствии со своими, характерным для него классификационным признаками делится на подклассы, которые образуют 2-й уровень
· и т.д.
Пример. Иерархическая система классификации для информационного объекта «Факультет» (рис.1.6), которая позволяет классифицировать информацию о студентах по следующим признакам: факультет, на котором студент учится, возрастной состав, пол, для женщин – наличие детей.
Рис. 1.6. Пример иерархической системы классификации
Фасетная система классификации позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами. Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты (рис. 1.7.)
Рис. 1.7. Фасетная система классификации
Пример. Для объектов, использованных в предыдущем примере, разработаем фасетную классификацию (рис. 1.8.)
Рис. 1.8. Пример фасетной классификации
Дескрипторная система классификации. Для организации поиска информации, для ведения тезарусов (словарей) эффективно используется дескрипторная (описательная) система классификации. Особенно широко она используется в библиотечной системе поиска. Суть этого метода классификации в следующем:
· отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы.
· выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;
· создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Система кодирования- совокупность правил кодового обозначения объектов.
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
· длиной - число позиций в коде;
· структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака.
Можно выделить две группы методов, используемых в системе кодирования (рис. 1.9):
· классификационная система кодирования, основанная на проведении предварительной классификации объектов (иерархической или фасетной);
· регистрационная система кодирования, не требующая предварительной классификации объектов.
Рис. 1.9. Системы кодирования, использующие разные методы
Последовательное кодирование используется для иерархической системы классификации. Сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня и т.д.
Пример. Для объекта ФАКУЛЬТЕТ (см. выше) можно задать следующие коды:
131 - студенты медицинского факультета, свыше 30 лет, мужчины.
2221 - студенты факультета экономики и права, от 20 до 30, женщины, имеющие детей.
Параллельное кодирование используется для фасетной системы классификации. Все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода.
Пример. Для объекта ФАКУЛЬТЕТ код 1310 расшифровывается аналогично предыдущему, но 4-й разряд равен 0 т.к. значение для мужчин не определено.
Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда.
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые образуют серию, а затем в каждой серии производится порядковая нумерация объектов.