Систематизация, кодирование и классификация
РАБОТЫ, ВЫПОЛНЯЕМЫЕ ПРИ СТАНДАРТИЗАЦИИ
Использование работ, выполняемых при стандартизации, позволяет улучшить процессы проектирования и изготовления самых разнообразных машин, агрегатов, устройств, а также разработку наукоемких производств и услуг, что значительно сократит время, необходимое для освоения новых изделий и обеспечит стабильность качества.
Основные работы, выполняемые при стандартизации:
• систематизация объектов, явлений или понятий;
• кодирование и классификация технико-экономической информации;
• унификация и симплификация деталей, сборочных единиц, узлов, агрегатов, машин, приборов;
• типизация конструкций, изделий и технологических процессов;
• агрегатирование машин и других изделий.
Систематизация объектов; явлений или понятий преследует цель расположить их в определенном порядке и последовательности, образующей четкую систему, удобную для пользования.
При систематизации необходимо учитывать взаимосвязь объектов. Наиболее простой формой систематизации является алфавитная система расположения объектов. Такую систему используют, например, в различных справочниках. Применяют также порядковую нумерацию систематизируемых объектов или расположение их в хронологической последовательности (Госстандарт России регистрирует ГОСТы по порядку номеров, после которого в каждом стандарте указывается год его утверждения или пересмотра).
Для эффективного управления народным хозяйством необходимо своевременно получать, передавать и перерабатывать большое количество самой разнообразной информации, объем которой с каждым годом растет. Для этой цели необходимо использовать автоматизированные системы управления народным хозяйством на всех уровнях, где применяют в основном вычислительную технику, а вычислительная техника работает с информацией, представленной только в закодированном виде, т.е. в виде сочетания различных цифр, букв. Кодирование информации предполагает обязательную систематизацию и классификацию.
Кодирование представляет собой образование по определенным правилам и присвоение кодов объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. С помощью кодов обеспечивается идентификация объектов максимально коротким способом, т.е. с помощью минимального числа знаков. Стремление к минимизации количества знаков, идентифицирующих объекты, способствует повышению эффективности сбора, учета, хранения, обработки информации.
Кодовое обозначение характеризуется:
• алфавитом кода;
• структурой кода;
• числом знаков — длиной кода;
• методом кодирования.
Алфавит кода представляет собой систему знаков (символов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся на клавиатуре печатающего устройства. Коды бывают цифровые, буквенные и буквенно-цифровые.
Широкое применение в отечественной и зарубежной практике кодирования информации находят цифровые коды. При этом, как правило, используются десятичные коды, т.е. когда подмножество не превышает 10 объектов, код составляет один знак — от О до 9 включительно, а когда превышает 10 объектов — два знака — от 00 до 99 включительно и т.д. Установлено, что наибольшая эффективность в процессе обработки информации обеспечивается при применении цифровых кодов из пяти и менее цифр.
Структура кода представляет собой графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления.
Структура кода для Общероссийского классификатора продукции представлена на рис 8.1.
Рис. 8.1. Структура кода для Общероссийского классификатора продукции
Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность появления новых объектов и предусматривать резервные коды.
Методы кодирования в значительной степени связаны с методами разделения множества на подмножества.
Как отмечалось выше, метод присвоения объектам порядковых цифровых номеров, при котором кодовыми обозначениями служат числа натурального ряда, обеспечивает полную идентификацию объектов, но не является информативным, так как не отражает признаков, присущих множеству. В отличие от него идентифицированные методы кодирования обеспечивают идентификацию объектов через коды, составленные по определенным правилам и включающие определенный набор кодов отдельных признаков, характеризующих эти объекты.
Коды должны удовлетворять следующим основным требованиям:
• однозначно идентифицировать объекты и (или) группы объектов, т.е. быть идентификаторами;
• иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;
• иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;
• быть удобными для использования человеком, а также для компьютерной обработки закодированной информации;
• обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.
Классификационные методы кодирования разделяются на два типа: последовательный и параллельный (независимый).
Последовательный метод используется при иерархическом методе классификации, когда множество разделяется на подмножества в нужной последовательности и когда кодовое обозначение строится по заданной структуре, определяющей последовательность и количественный состав признаков на каждом уровне деления.
К недостаткам метода следует отнести зависимость кода от установленных правил образования, необходимость иметь резервные коды на случай включения дополнительных объектов, невозможность изменения состава и количества признаков, через которые идентифицируется объект.
Параллельный метод используется при фасетной классификации объектов, когда коды присваиваются фасетам и признакам независимо друг от друга. Структура кодового обозначения определяется фасетной формулой. Параллельный метод широко применяется при машинной обработке и при решении технико-экономических задач, характер которых часто меняется, и когда необходимо анализировать различные множества объектов. Метод обеспечивает возможность независимого изменения и дополнения характеристик объектов и их различных сочетаний, необходимых для решения конкретных задач. К недостаткам параллельного метода следует отнести громоздкость фасетных формул и избыточную емкость кодов.
Необходимо отметить, что кодирование при обоих методах осуществляется путем присвоения порядковых номеров, причем параллельный метод может успешно применяться при иерархическом методе классификации, когда одинаковыми кодами кодируются одинаковые объекты (признаки), находящиеся на одном уровне деления, но в разных подмножествах.
Классификация — это разделение множества объектов на классификационные группировки по сходству или различию на основе определенных признаков в соответствии с принятыми правилами.
Основными методами классификации объектов технико-экономической и социальной информации являются иерархический и фасетный.
Иерархический метод характеризуется тем, что исходное множество объектов последовательно разделяется на подмножества (классификационные группировки), а те, в свою очередь, — на подмножества и т.д. То есть множество объектов разделяется на классы, группы, виды и т.д. по основным признакам, характеризующим эти объекты по принципу — от общего к частному, т.е. каждая группировка в соответствии с выбранным признаком (основанием деления) делится на несколько других группировок, каждая из которых по другому признаку делится еще на несколько подчиненных группировок, и т.д. Таким образом, между классификационными группировками устанавливается отношение подчинения (иерархии).
Построение иерархической классификации объектов, как правило, происходит в следующей последовательности:
• определяется множество объектов, которое необходимо классифицировать (предприятий, процессов, изделий и т.д.) для решения конкретных задач;
• выделяются основные признаки (свойства, характеристики, показатели, параметры и др.), по которым множество будет делиться на подмножества;
• выбирается порядок следования признаков — уровень деления и их количество.
При построении иерархической классификации необходимо соблюдать следующие правила:
• разделение множества на подмножества на каждом уровне производится только по одному признаку деления;
• получаемые в результате деления группировки на каждом уровне относятся только к одной вышестоящей группировке и не пересекаются, т.е. не повторяются;
• разделение множества осуществляется без пропусков очередного или добавления промежуточного уровня деления;
• классификация производится таким образом, чтобы сумма образованных подмножеств составляла делимое множество.
Наиболее сложными вопросами, возникающими при построении иерархической классификации, считают выбор системы признаков, используемых в качестве основания деления, и определение порядка их следования.
В основу иерархической классификации закладываются признаки, являющиеся необходимыми в решении задач, для которых она создается. При этом последовательность признаков определяется по принципу — от общего к частному, с учетом приоритетной вероятности обращений к разным уровням деления при решении конкретных задач.
Основные преимущества иерархической классификации заключаются в ее логичности, последовательности и хорошей приспособленности для ручной обработки информации. Недостатком является малая гибкость структуры, обусловленная фиксированностью признаков (оснований деления) и заранее установленным порядком их следования. Включение новых уровней деления по дополнительным признакам весьма затруднительно, особенно если не предусмотрены возможности расширения. Кроме того, иерархический метод не позволяет агрегировать объекты по необходимому для конкретных задач сочетанию признаков, что еще раз подтверждает его негибкость.
Фасетный метод классификации характеризуется тем, что множество объектов разделяется на независимые подмножества (классификационные группировки), обладающие определенными признаками, необходимыми для решения конкретных задач.
Последовательность построения фасетной классификации практически такая же, как при построении иерархической, т.е. определяется множество объектов, выделяются основные признаки и группы признаков этого множества и выбирается порядок следования групп признаков (фасетов) и признаков-характеристик.
Для вычисления из множества объектов конкретного подмножества, обладающего определенными признаками, необходимо выделить основные признаки-характеристики, всесторонне характеризующие объект и обеспечивающие его идентификацию, сгруппировать их по принципу однородности в фасеты, присвоить им коды, определить фасетные формулы для образования подмножеств.
Особенность фасетного метода состоит в том, что подмножества составляются по принципу "от частного к общему", т.е. на основе различных наборов конкретных характеристик объекта формируются конкретные подмножества.
Основным преимуществом фасетной классификации является гибкость, которая позволяет систематизировать объекты по необходимому набору признаков и осуществлять информационный поиск по любому сочетанию фасетов. Она также хорошо приспособлена для компьютерного формирования подмножеств на основе выбранного перечня признаков, но менее удобна для ручной обработки информации.
Порядок проведения работ по классификации и кодированию информации регламентирован комплексом государственных стандартов — Единой системой классификации и кодирования технико-экономической и социальной информации (ЕСКК ТЭИ).
ЕСКК ТЭИ регламентирует состав и содержание работ по созданию классификаторов технико-экономической информации, поддержанию их в актуальном состоянии путем внесения изменений, а также порядок разработки классификаторов и их практического применения.
Основные задачи ЕСКК ТЭИ:
• упорядочение, унификация, классификация и кодирование информации, используемой в системе управления;
• создание комплекса классификаторов, необходимых для решения задач органами управления различного уровня;
• максимальное использование международных классификаций для решения задач, связанных с международным обменом информацией;
• обеспечение условий для автоматизации процессов обработки информации, включая создание автоматизированных банков данных;
• обеспечение информационной совместимости взаимодействующих информационных систем.
По ЕСКК ТЭИ работы должны начинаться с постановки задачи по сбору, учету и анализу информации об объекте, которую должен решать орган управления. Он должен также составить техническое задание на разработку классификатора. Далее осуществляется анализ множества объектов с учетом поставленных задач,
формируются группы однородных объектов и выбираются методы классификации и кодирования множества. Следующим этапом является разработка классификатора в порядке, установленном ЕСКК ТЭИ, включая разработку систем ведения классификатора и мероприятий по его внедрению.
Классификатор представляет собой документ, содержащий систематизированный перечень кодов и наименований объектов классификации и классифицированных группировок, разработанный и утвержденный в установленном порядке, обязательный для применения на различных уровнях управления.
В зависимости от уровня утверждения и сферы применения разрабатываются классификаторы следующих категорий:
• общероссийский;
• отраслевые;
• предприятий (объединений, организаций, ассоциаций и т.д.).
По статусу утверждения и области применения классификаторы приравниваются соответственно к государственным, отраслевым и стандартам предприятий.
Общероссийские классификаторы утверждает Госстандарт России, и применение их является обязательным при обмене информацией между системами управления государственного уровня и при заполнении унифицированных форм документов, установленных государственными органами и имеющими межотраслевое применение.
Отраслевые классификаторы, как и отраслевые стандарты, действуют в рамках утвердившей их отрасли (министерства, ведомства) при заполнении отраслевых документов, а классификаторы предприятий — в рамках утвердивших их предприятий (объединений, ассоциаций и др.). В качестве классификаторов предприятий могут служить выборки из общероссийских и отраслевых классификаторов.
В число общероссийских входят классификаторы отраслей народного хозяйства, предприятий и организаций, единиц измерения, стандартов, продукции и др.
Общероссийский классификатор отраслей народного хозяйства (ОКОНХ) предназначен для обеспечения машинной обработки информации в управлении народным хозяйством, а также используется для решения задач "Автоматических систем управления" различных уровней управления и обеспечения их информационной совместимости.
ОКОНХ представляет собой свод кодов и наименований группировок видов деятельности по отраслям, отличающимся характером функций, выполняемых ими в общей системе общественного разделения труда. Внутри крупных отраслей народного хозяйства выделяются более дробные подотрасли, к которым могут быть отнесены предприятия, производящие однородную продукцию, или организации и учреждения, связанные с выполнением определенных общественных функций.
В ОКОНХ использована иерархическая классификация. Признаком деления на всех уровнях является вид деятельности. Каждый из последующих уровней группирует виды деятельности по более глубокой специализации в общественном разделении труда. В классификаторе используется пятиразрядный цифровой код (рис. 8.2).
Рис. 8.2. Структура кода для Общероссийского классификатора отраслей народного хозяйства
Общероссийский классификатор предприятий и организаций (ОКПО). Объектами классификации в ОКПО являются предприятия, организации и объединения независимо от форм собственности, включая предприятия с иностранными инвестициями, банковские учреждения, общественные объединения и другие юридические лица, проходящие государственную регистрацию на территории Российской Федерации, а также полные товарищества, филиалы, представительства, отделения и другие обособленные подразделения предприятий и организаций.
В ОКПО использована порядковая система кодирования. Длина кодового обозначения — семь знаков, которыми можно закодировать до 10 млн объектов, и контрольное число; алфавит кода — цифровой.
В качестве дополнительных признаков (фасетов) для позиций классификатора включены пятизначные коды органов государственного управления и общественных организаций, которым подчинены предприятия (организации), 11-значные (7- или 4-значные) коды территорий, на которых расположены эти объекты, и 5-знач-ные коды отраслей народного хозяйства.
Общероссийский классификатор единиц измерения (ОКЕИ). Объектами классификации являются единицы измерения, используемые в различных сферах деятельности. В ОКЕИ семь групп единиц: длины, площади, объема, массы, технические, времени, экономические.
ОКЕИ содержит два раздела и два справочных приложения.
Раздел 1 — "Международные единицы измерения, включенные в ЕСКК" — сформирован на базе международной классификации единиц измерения, содержащейся в Рекомендации № 20 РГ 4 ЕЭЕ ООН, и включает часто употребляемые в Российской Федерации единицы измерения. Оставшиеся единицы измерения из указанной международной классификации вынесены в справочное приложение.
Раздел 2 — "Национальные единицы измерения, включенные в ЕСКК" — включает дополнительные национальные единицы измерения, отсутствующие в международных классификациях.
Длина кодового обозначения — три знака, алфавит кода — цифровой. В классификаторе использована серийно-порядковая система кодирования.
Общероссийский классификатор стандартов (ОКС) соответствует Международному классификатору стандартов (МКС), утвержденному ИСО и рекомендованному к применению в странах-членах ИСО, и Межгосударственному классификатору стандартов МК (ИСО/ИНФКО МКС) 001—96. Объектами классификации являются стандарты и другие нормативные документы по стандартизации.
ОКС предназначен для использования при построении каталогов, указателей межгосударственных и национальных стандартов и других нормативных документов по стандартизации, для классификации стандартов и нормативных документов по стандартизации, содержащихся в базах данных, библиотеках и т.д.
В ОКС принят иерархический метод классификации. Длина кодового обозначения — семь знаков, алфавит кода — цифровой.
Структура кодового обозначения ОКС представлена на рис. 8.3.
В ряде случаев для обеспечения точности индексирования нормативных документов и облегчения их поиска классификационные группировки отмечают звездочкой, обозначающей пояснения и ссылки на коды других классификационных группировок.
Рис. 8.3. Структура кода для Общероссийского классификатора стандартов