Понятия и основные системы кодирования экономической информации
Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование.
Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования.
Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов.
Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой.
Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода.
Различают следующие типы алфавитов: цифровой, буквенный и смешанный.
Код характеризуется следующими параметрами:
· длиной (L);
· основанием кодирования (A);
· структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;
· степенью информативности (I), рассчитываемой как частное от деления общего количества признаков (R) на длину кода (L): I=R/L;
· коэффициентом избыточности (Кизб), который определяется как отношение максимального количества объектов (Qmax) к фактическому количеству объектов (Qфакт):
Кизб = Qmax/Qфакт
Все системы кодирования можно сгруппировать в два подмножества (рис. 4.4): регистрационные и классификационные системы кодирования.
Рис 4.4. Схемаклассификации систем кодирования
Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объекта и его кода в течение длительного периода времени и защищенности кода от помех и ошибок.
Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности, наиболее употребляемыми являются следующие формулы их расчета:
, ,
где М - модуль (простое число, делящееся на единицу и на само себя); Xi - информационные разряды, i - номер разряда; Bi - вес информационного разряда.
К регистрационным системам относятся порядковая и серийная системы кодирования.
Порядковая система - это наиболее простая по своему построению система кодирования, суть использования которой заключается в последовательном присвоении каждому объекту кодируемого множества М0 номера его порядка, т.е. в присвоении чисел натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предварительной группировки объектов, например по алфавиту.
Как правило, порядковую систему применяют для кодирования малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.
Серийная (серийно-порядковая) система кодирования отличается от порядковой тем, что номенклатура кодируемых объектов М0 предварительно должна быть разбита на группировки по одному признаку, и каждой группировке должна быть отведена серия кодовых обозначений, в пределах которой каждому элементу присваивается свой код по порядку. Серия обозначений для каждой группировки определяется таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.
Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на компьютере, отсюда вытекают требования: однозначности отображения классификационных взаимосвязей объектов и их группировок и обеспечения максимальной простоты программирования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.
Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использования которой коды нижестоящих группировок образуются путем добавления кодов к кодам вышестоящих группировок.
Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы классификации и коды группировок по фасетам формируются независимо друг от друга.
Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной системы кодирования.
Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе кодирования имеет место так называемое «зависимое» кодирование. Это значит, что классификационные группировки по младшим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.
Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и значением определенного числа в структуре кода. Длина кода зависит от числа ступеней классификации, от числа классификационных группировок на каждой ступени и от основания кодирования.
Комбинированная система кодирования, обладая всеми преимуществами разрядного кода, применяется для кодирования больших номенклатур (перечней) объектов, которые характеризуются многими соподчиненными или независимыми признаками. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.
Код повторения (мнемокод) - это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.
Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки информации при использовании какой-либо системы.
4.4. Состав и содержание операций проектирования классификаторов
Все классификаторы, разрабатываемые и используемые в ЭИС, имеют эталонную и рабочую формы. Эталонная форма классификатора - это официальное издание классификатора на бумажном носителе, удобное для осуществления его ведения. Рабочая форма классификатора - это весь классификатор или его раздел, занесенный на машинный носитель и удобный для обработки информации.
Весь процесс разработки системы классификаторов для ЭИС можно разбить на четыре этапа (на рис. 4.5 приведена блок-схема процесса разработки классификатора).
На первом этапе «Разработка ТЗ на проектирование» выполняются две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, используемых в системе. Перечень классификаторов определяется на основе анализа реквизитного состава первичных и результатных документов и выделения всей совокупности реквизитов-признаков.
Далее определяют назначение классификаторов. Каждый классификатор может быть предназначен для однозначной идентификации объекта, передачи информации на расстояние по каналам связи или для поиска и логической обработки первичной информации с целью получения и выдачи результатной информации.
По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.
Рис. 4.5. Схема процесса разработки классификатора
Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между организациями разных стран мирового сообщества. СМЭС представляет собой множество стандартных решений по классификационным группировкам и кодированию специальной и экономической информации и формированию источников этой информации. В состав СМЭС входят классификации Организации Объединенных наций (ООН) и ее специализированных образований, в том числе:
· Международная стандартная отраслевая классификация всех видов экономической деятельности (МСОК);
· Классификация основных продуктов (КОП);
· Международная стандартная торговая классификация (МСТК);
· Классификация по широким экономическим категориям (КШЭК);
· Классификация функций органов управления (КФОУ);
· Классификация функций правительства;
· Классификации продовольственных и сельскохозяйственных организаций (РАО);
· Классификации международной организации труда (МОТ);
· Классификации ООН по вопросам образования, науки и культуры (ЮНЕСКО);
· Международная стандартная классификация образования (МСКО).
К числу классификаций, разработанных другими международными организациями, относятся:
· Классификация международного энергетического агентства (МЭА);
· Классификация Совета таможенного сотрудничества;
· Система описания и кодирования товаров;
· Классификация Всемирной туристической организации (ВТО);
· Классификация деятельности, связанной с туризмом.
К классификациям Европейского сообщества и других международных региональных организаций относят:
· Классификацию Европейского сообщества (ЕС);
· Общую отраслевую классификацию экономической деятельности в рамках ЕС (КДЕС) и другие.
Второй класс классификаторов образуют общегосударственные (общесистемные) классификаторы, обязательные для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны, состав которых будет рассмотрен в следующем разделе.
Для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли используют отраслевые классификаторы. В пределах отдельных предприятий используют, как правило, локальные классификаторы.
Выполнение работ второго этапа связано с определением состава исходных данных и требований к разрабатываемым классификаторам.
К исходным данным, используемым в процессе проектирования классификаторов, относятся:
· состав задач, для которых разрабатывается классификатор;
· состав объектов классификации и мощность исходного множества;
· состав признаков классификации и число значений каждого признака;
· наименования отдельных группировок и объектов;
· динамика процесса изменяемости состава задач, объектов и признаков.
К требованиям, которым должны удовлетворять разрабатываемые классификаторы, можно отнести:
· полноту охвата объектов и признаков классификации каждым классификатором;
· согласованность признаков деления множеств объектов с алгоритмами обработки экономической информации;
· взаимную однозначность наименований объектов и их кодовых обозначений;
· простоту кодирования и возможность автоматизации классификации и кодирования;
· возможность увязки с другими классификаторами и системами обозначений;
· эффективность использования классификатора при обработке информации.
Содержанием второго этапа является «Разработка методических материалов проектирования», которая включает прежде всего разработку основных критериев и принципов построения каждого классификатора. К критериям построения классификатора относятся такие, как:
· критерий отнесения того или иного объекта к конкретному классифицируемому множеству;
· степень охвата кодируемого множества объектов.
Принципы построения классификатора определяются структурой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количеством ступеней и числом уровней классификации. Классификатор считается однородным, если на каждой ступени из каждой классификационной группировки выходит одинаковое количество ветвей.
Кроме того, на этом этапе разрабатывается система взаимодействия классификаторов разных уровней, предназначенных обеспечивать взаимодействие ЭИС с внешней средой. Эта работа представляет собой разработку некоторого транслятора перехода от одного классификатора к другому. Но чтобы его создать, необходимо провести выбор некоторой системы взаимодействия различных классификаторов, ориентированных на некоторую номенклатуру объектов. Существуют следующие системы взаимодействия:
а) система равноправных классификаторов, характеризуется тем, что на каждом уровне управления для целей обработки информации используется свой локальный классификатор, а для получения или передачи информации из внешней среды используется соответствующий транслятор. Недостаток данной системы заключается в том, что та система, которая имеет на входе наибольшее количество потоков информации от различных организаций, должна иметь наибольшее количество трансляторов;
б) система приоритетных классификаторов, применяется для предприятий одной отрасли. При этой системе на каждом предприятии этой отрасли и на каждом уровне управления имеются локальные классификаторы. Обмен информацией осуществляется в терминах классификатора вышестоящего уровня. Эта система дает уменьшение количества трансляторов независимо от числа входных и выходных потоков. Однако трудности возникают при передаче потоков информации между предприятиями, относящимися к разным отраслям;
в) система классификаторов-посредников, применяется при межотраслевом управлении. На каждом объекте любого уровня управления обработка ведется в терминах своего локального классификатора, а обмен - в терминах одного классификатора-посредника. Преимущества такой системы заключаются в необходимости создания только одного транслятора для каждого предприятия и в обеспечении возможности централизованного ведения классификатора-посредника, что дает минимальное количество ошибок при кодировании информации и обеспечивает информационную совместимость ЭИС разных уровней;
г) система единого классификатора, для обработки информации на всех предприятиях, входящих в состав экономической макросистемы, и для передачи этой информации между ними возможна только гипотетически, но реально ее нельзя осуществить из-за необходимости кодирования всей информации, существующей в стране, используя очень громоздкие классификаторы.
К факторам, влияющим на выбор способа увязки классификатора, относятся следующие:
· объем и характер обрабатываемой информации;
· объем и характер потоков получаемой и передаваемой информации;
· минимум трудовых и стоимостных затрат на разработку и эксплуатацию системы ведения классификаторов.
На этом же этапе осуществляется разработка методик построения классификаторов, отражающих методы и последовательность выполнения отдельных операций по созданию классификаторов, содержание которых зависит от выбранных критериев и принципов их построения.
Третий этап связан с работами по организации сбора и обработки исходных данных, необходимых для составления классификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных:
· определение перечня решаемых задач, использующих классификаторы;
· выделение классифицируемых объектов;
· определение состава признаков классификации и значений признаков;
· осуществление лингвистической обработки этих данных (удаление синонимов, омонимов, полисемии, антонимов и др.);
· согласование используемой терминологии в исходных данных с ГОСТами.
Другой работой, которую выполняют на этом этапе, являются сбор и обработка данных согласно разработанным инструкциям.
На четвертом этапе «Составление классификаторов и системы их ведения» осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора.
Эталонный классификатор должен быть согласован, отпечатан типографским способом и распространен всем пользователям для кодирования информации первичных документов.
Рабочие классификаторы наносятся на машинные носители в необходимых разрезах, передаются пользователям и заносятся в файлы справочников баз данных для выполнения процедуры автоматического заполнения машинных форм первичных документов и для декодирования результатной информации, получаемой после ее обработки.
К задачам, решаемым системой ведения классификатора, относятся:
· актуализация классификатора, т.е. постоянное пополнение и изменение объектов классификации и кодирования;
· своевременное оповещение всех пользователей обо всех происходящих изменениях;
· реструктуризация, или пересмотр структуры классификатора, при котором осуществляются контроль за дублированием объектов классификации, контроль и выявление тупиковых ветвей, не ведущих к объекту, оптимизация резервных ветвей по всем уровням иерархии или по всем аспектам классификации;
К проблемам, связанным с проектированием системы ведения классификаторов, относятся:
· разработка организационной структуры системы ведения, т.е. службы, которая отвечает за пополнение классификаторов;
· разработка юридических основ внесения изменений в классификатор;
· разработка информационного и программного обеспечения системы.
Все работы по проектированию классификаторов заканчиваются экспериментальной проверкой и внесением коррективов, утверждением, изданием и рассылкой классификаторов всем пользователям в функциональные подсистемы.
4.5. Понятие Единой системы классификации и кодирования (ЕСКК)
Для обеспечения информационной совместимости ЭИС разных уровней разработана Единая система классификации и кодирования (ЕСКК). ЕСКК предназначена для выполнения следующих функций:
· централизованной разработки общесистемных (общегосударственных) классификаторов;
· пополнения и обновления, своевременного и систематического оповещения организаций обо всех изменениях, внесенных в классификаторы;
· ответов на разовые запросы;
· оптимизации структуры классификаторов;
· проведения работы по созданию информационно-поисковых языков.
Схема структуры ЕСКК приведена на рис. 4.6.
Рис. 4.6.Схема структуры ЕСКК
В состав ЕСКК входят три составные части.
Первая ее часть «Комплекс нормативно-технических и методологических материалов» включает в себя документы, которые регламентируют:
· состав системы, цели системы, задачи и всю используемую терминологию системы;
· принципы и методы классификации и кодирования;
· категории и сферы действия классификаторов;
· принципы сопряжения и взаимодействия классификаторов;
· структуру работ по созданию и внедрению системы.
Второй частью является «Комплекс общесистемных классификаторов (ОК)», в который входят следующие группы классификаторов:
1. Классификаторы о природных и трудовых ресурсах:
· профессии рабочих;
· должности служащих;
· кадров;
· специальностей;
· полезных ископаемых и т.д.
2. Классификаторы о продуктах труда и производственной деятельности:
· промышленной и сельскохозяйственной продукции;
· строительной продукции;
· деталей;
· услуг: в промышленности, строительстве, сельском хозяйстве, транспорте, материально-техническом снабжении;
· услуг населению.
3. Классификаторы структуры народного хозяйства и объектов административно-территориального деления:
· предприятий и организаций;
· отраслей народного хозяйства;
· стран;
· органов государственного управления;
· объектов административно-территориального деления;
· пунктов погрузки и разгрузки.
4. Классификаторы управленческой информации и документации:
· единиц измерения;
· технико-экономических показателей;
· управленческой документации;
· технической документации, обозначений стандартных и технических условий;
· технологической документации;
· операций и деталей.
Все общесистемные классификаторы в зависимости от используемой системы классификации в процессе их проектирования построены по двум принципам.
Первый принцип основывается на идентификации объектов внутри классификационных группировок. Для примера рассмотрим структуру Общесистемного классификатора промышленной и сельскохозяйственной продукции (ОКП), который основывается на использовании иерархической системы классификации и состоит из двух блоков: блока наименования и блока идентификации. Блок идентификации состоит из классификационной, регистрационной и контрольной части кода (рис. 4.7).
Ряс.4.7. Схема структуры ОКП
Классификационная часть включает группировки по следующим признакам:
· класс;
· подкласс;
· группа;
· подгруппа;
· вид.
Второй принцип основан на применении раздельной идентификации и классификации и фасетной системе классификации, что отражается в структурной формуле классификатора, которая включает три блока: идентификации, классификации и наименования. Для примера рассмотрим структуру Общесистемного классификатора предприятий и организаций (ОКПО). Этот классификатор основан на использовании фасетной системы классификации. Он состоит из трех блоков (рис. 4.8):
Рис. 4.8. Схема структуры ОКПО
1) блока идентификации, включающего в себя код отрасли, регистрационный номер предприятия и контрольную часть кода;
2) блока наименования;
3) блока классификации, состоящего из следующих фасетов:
· фасета подчиненности - Ф1, в котором можно выделить признаки: код министерства, код управления, код треста;
· фасета административно-территориальной принадлежности - Ф2;
· фасета отраслевой принадлежности - ФЗ.
В составе автоматизированной системы ведения общесистемных классификаторов (АСВОК) можно выделить три типа подсистем: объектные, функциональные и обеспечивающие.
Объектные подсистемы объединяют предприятия, отрасли, отраслевые институты, которые отвечают за передачу информации об изменениях, происходящих в заданной номенклатуре, число которых может быть равно числу общесистемных классификаторов.
Функциональные подсистемы объединяют однотипные технологические процессы по ведению общесистемных классификаторов и включают в свой состав подсистемы сбора, хранения, внесение коррективов; регулярного обслуживания абонентов; обслуживания по разовым запросам; развития АСВОК, включая оптимизацию структуры классификаторов, устранение недействительных ветвей классификаторов, стандартизацию терминологии.
Обеспечивающие подсистемы состоят из типового набора подсистем, к которым относят программное, техническое, информационное и лингвистическое обеспечение.
В состав информационного обеспечения АСВОК входят: тезаурус; сводные эталонные файлы классификаторов; дополнительные эталонные файлы дополнений и исключаемых позиций; файлы поисковых образов позиций классификаторов; файлы незанятых позиций; таблицы сопряжения классификаторов; вспомогательный файл организаций, ответственных за ведение классификаторов; таблицы периодичности оповещения организаций и вспомогательные файлы интересов абонентов.