Классификация и кодирование информации

Тема 1. Основные понятия информатики

План

1.1. Информатика, ее структура, задачи и функции

1.2. Понятие информации

1.3. Свойства информации

1.4. Виды информации

1.5. Экономическая информация

1.6. Классификация и кодирование информации

1.7. Общая характеристика процессов сбора, передачи, обработки и накопления информации

Информатика, ее структура, задачи и функции

Информационное общество- общество, в котором большинство работников занято производством, хранением, переработкой и реализацией информации, особенно высшей ее формы - знаний.

Материальной и технологической базой информационного общества станут различного рода системы на базе компьютерной техники и компьютерных сетей, информационной технологии, телекоммуникационной связи.

Информационная технология (ИТ) - процесс, использующий совокупность средств и методов сбора, обработки и передачи данных (первичной информации) для получения информации нового качества о состоянии объекта, процесса или явления.

Информационная культура – совокупность знаний, умений и навыков, связанных с пониманием закономерностей информационных процессов в природе, обществе и технике.

Информатика - это наука о структуре, свойствах, закономерностях и методах создания, хранения, поиска, преобразования, передачи и использования информации[1].

В 1978 году международный научный конгресс официально закрепил за понятием "информатика" области, связанные с разработкой, созданием, использованием и материально-техническим обслуживанием систем обработки информации, включая компьютеры и их программное обеспечение, а также организационные, коммерческие, административные и социально-политические аспекты компьютеризации — массового внедрения компьютерной техники во все области жизни людей.

Информатику в узком смысле можно представить как состоящую из трех взаимосвязанных частей - технических средств (hardware), программных средств (software), алгоритмических средств (brainware).

Классификация и кодирование информации - student2.ru

Рис. 1.1. Структура информатики

Предмет информатики составляют следующие понятия:

· аппаратное обеспечение средств вычислительной техники;

· программное обеспечение средств вычислительной техники;

· средства взаимодействия аппаратного и программного обеспечения;

· средства взаимодействия человека с аппаратными и программными средствами.

Основной задачейинформатики является систематизация приемов и методов работы с аппаратными и программными средствами вычислительной техники.

Понятие информации

Информация[2] – это мера устранения неопределенности в отношении исхода интересующего нас события.

Данные[3] – это материальные объекты произвольной формы, выступающие в качестве средства представления информации.

Данные служат исходным «сырьем» для получения информации. Одни и те же данные могут нести различную информацию в зависимости от способа воспроизведения данных (рис. 1.2.) и для различных потребителей.

Классификация и кодирование информации - student2.ru

Рис. 1.2. Одинаковые данные несут разную информацию в результате применения разных методов форматирования

Информация от источника к получателю передается в виде сообщения посредством канала связи между ними.

Сообщение— это форма представления информации в виде речи, текстов, жестов, взглядов, изображений, цифровых данных, графиков, таблиц и т.п.

Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал. Этот сигнал посылается по каналу связи. В результате в приёмнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением.

  канал связи  
ИСТОЧНИК сообщение -----------> ПРИЁМНИК

Рис. 1.3. Схема передачи информации

Сигнал– изменяющийся во времени физический процесс.

Если параметр[4] сигнала принимает последовательное во времени конечное число значений, сигнал называется дискретным, а соответствующее сообщение – дискретным сообщением.

Если параметр сигнала непрерывная функция от времени, то сигнал – непрерывный, а соответствующая информация называется непрерывной.

При определении количества информации существуют два основных подхода: вероятностный и «объемный».

В вероятностном подходе, предложенном Клодом Шенноном, количество информации совпадает с энтропией опыта.

В «объемном» подходе, связанном с появлением ЭВМ, количество информации измеряется в битах (BInary digiT) – минимальных информационных единицах. Более крупные единицы информации – байт (8 бит), Килобайт(210=1024 байт), Мегабайт (210=1024 Кб), Гигабайт (210=1024 Мб), Терабайт (210=1024 Гб), Петабайт (210=1024 Тб).

Свойства информации

Информация характеризуется тремя категориями свойств: атрибутивными, прагматическими и динамическими.

Атрибутивные свойства- необходимые свойства, те, без которых информация не может существовать:

· это неотрывность от физического (материального) носителя,

· языковая природа,

· дискретность[5],

· непрерывность[6].

Прагматические свойства характеризуют степень полезности информации для практики:

· наличие смысла,

· новизна,

· ценность (полезность),

· кумулятивность[7].

Динамические свойства характеризуют изменение информации во времени:

· свойство роста,

· повторяемости[8],

· многократная используемость[9],

· старение,

· способность рассеиваться по различным источникам.

Динамические свойства информации в значительной мере влияют на характеристики информационных процессов.

Виды информации

Информацию можно классифицировать по различным признакам (табл.1.1).

Таблица 1.1.

Виды информации

Классификационный признак Виды
Сфера возникновения Элементарная Биологическая Социальная
Способ передачи и восприятия Визуальная Аудиальная Тактильная
Сфера общественного назначения Массовая Специальная[10] Личная

Экономическая информация

Экономическая информация (ЭИ) – это информация, отражающая и обслуживающая процессы производства, распределения, обмена и потребления материальных благ. Или экономическая информация – это объектизированное воплощение – с помощью знаков и сигналов – знаний о материальных, трудовых и стоимостных аспектах воспроизводимых в экономике процессов, устраняющих неопределенность в отношении исходов этих процессов.

Классификация ЭИ:

· по принадлежности к сфере материального производства и непроизводственной сфере (а внутри – по отраслям и подотраслям)

· по стадиям воспроизводства и элементам производственного процесса: отражающая снабжение, производство, распределение и потребление, а также материальные, трудовые и финансовые ресурсы.

· по критериям соответствияотражаемым явлениям: достоверная и недостоверная

· по полноте отражения событий: достаточная (полная), недостаточная и избыточная

· по стадии возникновения:

o исходная (первичная): планово-директивная и учетно-отчетная

o производная (вторичная): промежуточная и окончательная (результатная)

· по стабильности: постоянная (условно-постоянная) и переменная

· по технологии решения: входная, промежуточная, выходная.

Особенности ЭИ:

Ø преобладание алфавитно-цифровых знаков;

Ø необходимость оформления результатов обработки данных в форме, удобной для восприятия человеком;

Ø широкое распространение документов как носителей исходных данных и результатов их обработки;

Ø значительный объем переменных и постоянных (условно-постоянных) данных

Ø дискретность, объясняющаяся тем, что экономическая информация характеризует состояние объекта или процесса либо на определенный момент времени, либо за определенный интервал времени;

Ø организованность, вытекающая из того, что экономическая информация отражает результат интеллектуальной деятельности человека;

Ø неоднородность – в силу основного назначения информации: различать элементы и свойства отражаемых процессов;

Ø организованность, вытекающая их того, что экономическая информация отражает результат интеллектуальной деятельности человека;

Ø рассредоточенность источников и принципиальная невозможность концентрации и централизации процессов сбора данных

Ø возможность длительного хранения с воспроизведение и обновлением и т.д.

Требования, предъявляемые к ЭИ:

· адекватность информации - определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.

· репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта.

· содержательность информации отражает семантическую (смысловую) емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных.

· достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей).

· доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования.

· актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.

· своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.

· точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.д.

· достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

· устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности.

Кроме того, информация должна быть документальной, т.е. юридически подтвержденной в документах соответствующими подписями (визами) соответствующих должностных лиц.

Составной единицей информации(СЕИ) называют единицу информации, состоящую из совокупности других единиц информации, ассоциативно связанных между собой (т.е. по смыслу). Единицу информации, входящую в СЕИ, называют составляющей единицей информации.

Простой, элементарной составляющей единицей экономической информации является реквизит.

Свойства реквизита:

· отдельно взятый реквизит не может полностью характеризовать экономический процесс или объект;

· отдельный реквизит может входить в состав различных экономических показателей.

Характеристики реквизита: имя (наименование), тип и значение.

Классификация реквизитов:

- реквизиты-признаки, отражающие качественные свойства экономического объекта, процесса или явления;

- реквизиты-основания, характеризующие количественную сторону процесса или объекта.

Основной структурной единицей, состоящей из определенной совокупности реквизитов, характеризующей какой-либо конкретный объект, факт, процесс и т.п. с количественной и качественной стороны, является экономический показатель(рис.1.4), который включает один реквизит-основание и группу взаимосвязанных с ним и между собой по смыслу реквизитов признаков.

Классификация показателей:

- по признаку формальной характеристики: абсолютные и относительные;

- по признаку процесса: производственные, распределения, обращения и т.п.

- по признаку объекта: населения и трудовых ресурсов, природных ресурсов, продукции, основных фондов и т.п.

- по признаку получения: первичные (определяемые путем измерения, подсчета, взвешивания и т.п.) и вторичные (формируемые на основе первичных - стоимость готовой продукции, заработная плата и т.п.).

Экономический документ(ЭД) представляет собой определенным образом организованную совокупность взаимосвязанных по смыслу экономических показателей. Наиболее распространенной формой представления ЭД является табличная форма, которая включает общую, предметную и оформительскую части (рис. 1.5).

Электронный документ – сведения, представленные в форме, воспринимаемой электронными средствами обработки, хранения и передачи информации, которые имеют необходимые атрибуты для их однозначной идентификации и которые могут быть преобразованы в форму, пригодную для восприятия человеком.

Электронная цифровая подпись– определенная последовательность символов, имеющая неизменяемое соотношение с каждым символом определенного объема сведений электронного документа и предназначенная для подтверждения целостности и неизменности этого объема сведений, а также тождественности его содержания волеизъявлению заверившего его лица.

Классификация и кодирование информации - student2.ru

Рис. 1.4. Структура экономического показателя.

Классификация и кодирование информации - student2.ru

Рис. 1.5. Пример построения экономического документа табличной формы

В целях упрощения организации процессов обработки, передачи и хранения информации, содержащейся в документах, она может объединяться в виде информационных массивов (файлов – для машинных носителей).

Информационный массив – набор данных (документов) одной формы (одного названия) со всеми их значениями либо сочетание таких наборов данных, относящихся к одной задаче (укрупненный массив). В системах обработки информации массив является основной структурной единицей, предназначенной для хранения, передачи и обработки информации.

Массивы могут объединяться в более крупные структурные единицы. Самой крупной является информационная база, а самой простой формой объединения – информационный поток.

Информационный поток– совокупность информационных массивов, в том числе документов, относительно конкретной управленческой деятельности, имеющей динамический характер.

Информационная база– вся совокупность информации реального экономического объекта.

Классификация информационных массивов:

· постоянные (условно-постоянные) (содержащие нормативно-справочную информацию) и переменные (исходная и промежуточная информация, отражающая текущее состояние объекта управления);

· основные (хранящие обрабатываемые данные) и вспомогательные (результат логической обработки основных массивов);

· входные, промежуточные (внутренние)(содержащие результаты предыдущих расчетов), выходные (результатные);

· текущие (рабочие) ( информация о состоянии управляемого объекта на данный момент времени) и служебные (справочники, каталоги, нормативные документы).

Классификация и кодирование информации

Одной из операций при работе с информацией является классификация информации об объектах.

Классификация объектов- система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Разработаны 3 метода классификации объектов: иерархический, фасетный, дескрипторный.

Иерархическая система классификации строится следующим образом:

· исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень.

· каждый класс 1-го уровня в соответствии со своими, характерным для него классификационным признаками делится на подклассы, которые образуют 2-й уровень

· и т.д.

Пример. Иерархическая система классификации для информационного объекта «Факультет» (рис.1.6), которая позволяет классифицировать информацию о студентах по следующим признакам: факультет, на котором студент учится, возрастной состав, пол, для женщин – наличие детей.

Классификация и кодирование информации - student2.ru

Рис. 1.6. Пример иерархической системы классификации

Фасетная система классификации позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами. Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты (рис. 1.7.)

Классификация и кодирование информации - student2.ru

Рис. 1.7. Фасетная система классификации

Пример. Для объектов, использованных в предыдущем примере, разработаем фасетную классификацию (рис. 1.8.)

Классификация и кодирование информации - student2.ru

Рис. 1.8. Пример фасетной классификации

Дескрипторная система классификации. Для организации поиска информации, для ведения тезарусов (словарей) эффективно используется дескрипторная (описательная) система классификации. Особенно широко она используется в библиотечной системе поиска. Суть этого метода классификации в следующем:

· отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы.

· выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;

· создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования- совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:

· длиной - число позиций в коде;

· структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака.

Можно выделить две группы методов, используемых в системе кодирования (рис. 1.9):

· классификационная система кодирования, основанная на проведении предварительной классификации объектов (иерархической или фасетной);

· регистрационная система кодирования, не требующая предварительной классификации объектов.

Классификация и кодирование информации - student2.ru

Рис. 1.9. Системы кодирования, использующие разные методы

Последовательное кодирование используется для иерархической системы классификации. Сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня и т.д.

Пример. Для объекта ФАКУЛЬТЕТ (см. выше) можно задать следующие коды:

131 - студенты медицинского факультета, свыше 30 лет, мужчины.

2221 - студенты факультета экономики и права, от 20 до 30, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода.

Пример. Для объекта ФАКУЛЬТЕТ код 1310 расшифровывается аналогично предыдущему, но 4-й разряд равен 0 т.к. значение для мужчин не определено.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые образуют серию, а затем в каждой серии производится порядковая нумерация объектов.

Наши рекомендации