Понятие и основные системы кодирования экономической информации

Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование. Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов. Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код характеризуется следующими параметрами:

· длиной (L);

· основанием кодирования (A);

· структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;

· степенью информативности (I) , рассчитываемой как частное от деления общего количества признаков(R) к длине кода (L):

I = R/L;

· коэффициентом избыточности (Кизб), который определяется как отношение максимального количества объектов (Qмах) к фактическому количеству объектов (Qфакт):

Кизб = Qмах/ Qфакт.

Все системы кодирования можно сгруппировать в два подмножества (см. рис. 37): регистрационных и классификационных систем кодирования.

Понятие и основные системы кодирования экономической информации - student2.ru

Рисунок 37 - Схема классификации систем кодирования

Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объекта и его кода в течение длительного периода времени и защищённость кода от помех и ошибок.

Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности наиболее употребляемыми являются следующие формулы их расчета:

K = M - [åXi / M] ,

K = M - [å Xi * Bi / M],

где M - модуль (простое число, делящееся на единицу и на само себя),

Xi - информационные разряды, i- номер разряда,

Bi- вес информационного разряда.

К регистрационным системам относятся порядковая и серийная системы кодирования.

Порядковая система- это наиболее простая по своему построению система кодирования, суть использования которой заключается в последовательном присвоении каждому объекту кодируемого множества - Мо номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предварительной группировки объектов, например, по алфавиту.

Как правило, порядковую систему применяют для кодирования малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно-порядковая)система кодирования отличается от порядковой тем, что номенклатура кодируемых объектов - Мо предварительно должна быть разбита на группировки по одному признаку и каждой группировке должна быть отведена серия кодовых обозначений, в пределах которой каждому элементу присваивается свой код по порядку. Серия обозначений для каждой группировки определяются таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ, отсюда вытекают требования: однозначности отображения классификационных взаимосвязей объектов и их группировок и обеспечение максимальной простоты программирования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базируется на предварительной классификации по иерархической системе классификации, в результате использования которой коды нижестоящих группировок образуются путём добавления кодов к кодам вышестоящих группировок.

Параллельные системы кодирования характеризуется тем, что они строятся на основе использования фасетной системы классификации и коды группировок по фасетам формируются независимо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной систем кодирования.

Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе кодирования имеет место так называемое "зависимое" кодирование. Это значит, что классификационные группировки по младшим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и значением определенного числа в структуре кода. Длина кода зависит от числа ступеней классификации, от числа классификационных группировок на каждой ступени и от основания кодирования.

Комбинированная системакодирования, обладая всеми преимуществами разрядного кода, применяется для кодирования больших номенклатур (перечней) объектов, которые характеризуются многими соподчиненными или независимыми признаками. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) -это буквенные или буквенно-цифровые коды, которые характеризуется тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки информации при использовании какой-либо системы.

6.1.3. Состав и содержание операций проектирования классификаторов

Все классификаторы, разрабатываемые и используемые в ИС, имеют эталонную и рабочую формы. Эталонная форма классификатора - это официальное издание классификатора на бумажном носителе, удобное для осуществления его ведения. Рабочая форма классификатора - это весь классификатор или его раздел, занесённый на машинный носитель и удобный для обработки информации.

Весь процесс разработки системы классификаторов для ИС можно

разбить на четыре этапа (на рисунке 38 приведена блок-схема процесса разработки классификатора).

На первом этапе – “Разработка ТЗ на проектирование” выполняется две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, используемых в системе. Перечень классификаторов определяется на основе анализа реквизитного состава первичных и результатных документов и выделения всей совокупности реквизитов - признаков.

Далее определяют назначениеклассификаторов. Каждый классификатор может быть предназначен для однозначной идентификации объекта, передачи информации на расстояние по каналам связи или для поиска и логической обработки первичной информации с целью получения и выдачи результатной информации.

По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.

Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между организациями разных стран мирового сообщества. СМЭС представляет собой множество стандартных решений по классификационным группировкам и кодированию специальной и экономической информации и формированию источников этой информации. В состав СМЭС входят классификации Организации Объединенных наций (ООН) и ее специализированных образований, в том числе:

- Международная стандартная отраслевая классификация всех видов экономической деятельности (МСОК);

- Классификация основных продуктов (КОП);

- Международная стандартная торговая классификация (МСТК);

- Классификация по широким экономическим категориям (КШЭК);

- Классификация функций органов управления (КФОУ);

- Классификация функций правительства;

- Классификации продовольственных и сельскохозяйственных организаций (RAO);

- Классификации международной организации труда (МОТ);

- Классификации ООН по вопросам образования, науки и культуры (ЮНЕСКО);

- Международная стандартная классификация образования (МСКО).

К числу классификаций, разработанных другими международными организациями, относят:

- Классификация международного энергетического агентства (МЭА);

- Классификация Совета таможенного сотрудничества;

- Система описания и кодирования товаров;

- Классификация Всемирной туристической организации (ВТО);

- Классификация деятельности, связанной с туризмом.

Классификации Европейского сообщества и других международных региональных организаций относят:

- Классификацию Европейского сообщества (ЕС);

- Общую отраслевую классификацию экономической деятельности в рамках ЕС (КДЕС) и другие.

Второй класс классификаторов образуют общегосударственные (общесистемные)классификаторы,обязательные для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны, состав которых будет рассмотрен в другом разделе.

Для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли используют отраслевыеклассификаторы. В пределах отдельных предприятий используют, как правило, локальные классификаторы.

Выполнение работ второго этапа связано с определением состава исходных данных и требований к разрабатываемым классификаторам.

К числу исходных данных, используемых в процессе проектирования, классификаторов относят:

· состав задач, для которых разрабатывается классификатор;

· состав объектов классификации и мощность множества;

· состав признаков классификации и число значений каждого признака;

· наименования отдельных группировок и объектов;

· динамика процесса изменяемости состава задач, объектов и признаков.

К числу требований, которым должны удовлетворять разрабатываемые классификаторы, можно отнести:

· полноту охвата объектов и признаков классификации каждым классификатором,

· согласованность признаков деления множеств объектов с алгоритмами обработки экономической информации,

· взаимную однозначность наименований объектов и их кодовых обозначений,

· простоту кодирования и возможность автоматизации классификации и кодирования,

· возможность увязки с другими классификаторами и системами обозначений,

· эффективность использования классификатора при обработке информации.

Понятие и основные системы кодирования экономической информации - student2.ru

Рисунок 38 - Схема процесса разработки системы классификаторов

Содержанием второго этапа является “Разработка методических материалов проектирования”, который включает, прежде всего, разработку основных критериев и принципов построения каждого классификатора. К числу критериевпостроения классификатора относятся такие, как:

- критерий отнесения того или иного объекта к конкретному классифицируемому множеству;

- степень охвата кодируемого множества объектов.

Принципы построения классификатора определяются структурой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количеством ступеней и числом уровней классификации. Классификатор считается однородным, если на каждой ступени из каждой классификационной группировки выходит одинаковое количество ветвей. Кроме того, на этом этапе разрабатывается система взаимодействия классификаторов разных уровней, предназначенных обеспечивать взаимодействие ИС с внешней средой. Эта работа представляет собой разработку некоторого транслятора перехода от одного классификатора к другому. Но чтобы ее создать, необходимо провести выбор некоторой системы взаимодействия различных классификаторов, ориентированных на некоторую номенклатуру объектов. Существуют следующие системы взаимодействия:

а) Система равноправных классификаторов, которая характеризуется тем, что на каждом уровне управления для целей обработки информации используется свой локальный классификатор, а для получения или передачи информации из внешней среды используется соответствующий транслятор. Недостаток данной системы заключается в том, что та система, которая имеет на входе наибольшее количество потоков информации от различных организаций, должна иметь наибольшее количество трансляторов.

 
  Понятие и основные системы кодирования экономической информации - student2.ru

б) Система приоритетных классификаторов, применяется для предприятий одной отрасли. При этой системе на каждом предприятии этой отрасли и на каждом уровне управления имеются локальные классификаторы. Обмен информацией осуществляется в терминах классификатора вышестоящего уровня. Эта система даёт уменьшение количества трансляторов независимо от числа входных и выходных потоков. Однако трудности возникают при передаче потоков информации между предприятиями, относящимися к разным отраслям.

 
  Понятие и основные системы кодирования экономической информации - student2.ru

Понятие и основные системы кодирования экономической информации - student2.ru в) Система классификаторов-посредников, применяется при межотраслевом управлении. На каждом объекте каждого уровня управления обработка ведётся в терминах своего локального классификатора, а обмен ведётся в терминах одного классификатора-посредника. Преимущества такой системы заключаются в необходимости создания только одного транслятора для каждого предприятия и в обеспечении возможности централизованного ведения классификатора-посредника, что дает минимальное количество ошибок при кодировании информации и обеспечивает информационную совместимость ИС разных уровней.

г) Система единого классификатора для обработки информации на всех предприятиях, входящих в состав экономической макросистемы, и для передачи этой информации между ними возможна только гипотетически, но реально ее нельзя осуществить из-за необходимости осуществления кодирования всей информации, существующей в стране, используя очень громоздкие классификаторы.

 
  Понятие и основные системы кодирования экономической информации - student2.ru

К числу факторов, влияющих на выбор способа увязки классификатора, относят следующие:

- объем и характер обрабатываемой информации,

- объем и характер потоков получаемой и передаваемой информации,

- минимум трудовых и стоимостных затрат на разработку и эксплуатацию системы ведения классификаторов.

На этом же этапе осуществляется разработка методик построения классификаторов, отражающих методы и последовательность выполнения отдельных операций по созданию классификаторов, содержание которых зависит от выбранных критериев и принципов их построения.

Третий этапсвязан с работами по организации сбора и обработки исходных данных, необходимых для составления классификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных:

- определению перечня решаемых задач, использующих классификаторы,

- выделению классифицируемых объектов,

- определению состава признаков классификации и значений признаков),

- осуществлению лингвистической обработки этих данных (удаление синонимов, омонимов, полисемии, антонимов и др.),

- согласованию используемой терминологии в исходных данных с ГОСТами.

Другой работой, которую выполняют на этом этапе, является осуществление сбора и обработки данных согласно разработанным инструкциям.

На четвертом этапе “Составление классификаторов и системы их ведения” осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора.

Эталонный классификатор должен быть согласован, отпечатан типографским способом и распространен всем пользователям для кодирования информации первичных документов.

Рабочие классификаторы наносятся на машинные носители в необходимых разрезах, передаются пользователям и заносятся в файлы справочников баз данных для выполнения процедуры автоматического заполнения машинных форм первичных документов, и для декодирования результатной информации, получаемой после ее обработки.

К задачам, решаемым системой ведения классификатора, относятся следующие:

- актуализация классификатора, т.е. постоянное пополнение объектов классификации и кодирования;

- своевременное оповещение всех пользователей о всех происходящих изменениях;

- реструктуризация или пересмотр структуры классификатора, при котором осуществляется контроль на дублирование объектов классификации, контроль и выявление тупиковых ветвей, не ведущих к объекту, оптимизация резервных ветвей по всем уровням иерархии или по всем аспектам классификации;

К числу проблем, связанных с проектированием системы ведения классификаторов относят:

- разработка организационной структуры системы ведения, т.е.

- службы, которая отвечает за пополнение классификаторов;

- разработка юридических основ внесения изменений в классификатор;

- разработка информационного и программного обеспечения системы.

Все работы по проектированию классификаторов заканчиваются экспериментальной проверкой и внесением корректив, утверждением, изданием и рассылкой классификаторов всем пользователям в функциональные подсистемы.

Наши рекомендации