Научно-методический аппарат описания экономической информации в реляционных БД
Все, что происходит в процессе функционирования материальных систем, может быть описано в форме сообщений. Появление сообщений о событиях, происходящих в материальной системе, представляет собой информационное отображение материальных процессов.
Сообщение может быть выражено на естественном языке, однако часто применяют форматированные сообщения, когда выделяются опорные свойства (параметры) происходящего события и в сообщении приводятся названия свойств и их значения.
Многие сообщения легко разделяются на компоненты и представляются в форматированном виде. Форматированные сообщения - это наиболее массовый вид сообщений, хранимых и обрабатываемых в ЭИС.
База данных (БД) - это набор сообщений, которые являются истинными для соответствующей материальной системы, непротиворечивы по отношению друг к другу и к концептуальной схеме.
Сообщения в БД обычно являются форматированными и хранятся в виде единиц информации. Единицей информации называется набор символов, которому придается определенный смысл..
Минимально необходимы две единицы информации - атрибут и составная единица информации (СЕИ).
Атрибутом называется информационное отображение отдельного свойства некоторого объекта, процесса или явления. Любое сообщение записывается в форматированном виде как указание свойств (параметров) предметов, о которых мы говорим. Поэтому информационное отображение любого явления представляет собой набор соответствующим образом подобранных атрибутов.
Составная единица информации представляет собой набор из атрибутов и, возможно, других СЕИ. Простейшими СЕИ являются таблицы. СЕИ позволяет создавать произвольные комбинации из атрибутов.
Концептуальная схема (от слова concept - понятие) представляет собой описание структуры всех единиц информации, хранящихся в БД. Под структурой понимается вхождение одних единиц информации в состав других единиц информации. Следует отметить, что БД в целом также является единицей информации. Если рассматривать единицы информации как информационные объекты, то можно говорить об их свойствах. В то же время единицы информации - это нефизические объекты, так как они не занимают место в пространстве.
Простейшими характеристиками СЕИ являются имя, структура и значение. Имя СЕИ - это ее условное обозначение в процессах обработки информации. Структурой СЕИ называется вхождение одних единиц информации в состав других единиц информации.
Аппарат СЕИ рассчитан на описание структуры экономических документов. Документом называется материальный носитель информации (обычно бланк бумаги), содержащий оформленные в установленном порядке сообщения и имеющий юридическую силу.
Существует сравнительно много способов описания структуры СЕИ. Для описания, не зависимого от конкретных языков программирования и СУБД, достаточно указывать после имени СЕИ список имен входящих в нее атрибутов и СЕИ. Будем помещать этот список в круглые скобки, а имена внутри скобок перечислять через запятую. Имя СЕИ может сопровождаться размерностью, т.е. указанием на количество одинаковых по структуре значений этой СЕИ. Размерность, если она не равна 1, указывается в скобках после имени СЕИ.
Значением СЕИ называется набор значений непосредственно входящих в нее атрибутов и набор собраний непосредственно входящих в нее СЕИ. Одно значение СЕИ при хранении ее в памяти ЭВМ часто называется записью. Все языки программирования содержат средства описания структуры СЕИ.
Переименованием единицы информации называется присвоение ей нового имени, объявление синонима - это установление второго, третьего и т.д. равноценного имени для единицы информации.
Операция над значением атрибута всего одна - это перекодирование, т.е. замена существующего кода значения на новый для всех значений.
Выборка - операция выделения подмножества значений СЕИ, которые удовлетворяют заранее поставленным условиям выборки.
Корректировка означает выполнение одной из операций:
• добавление нового значения СЕИ,
• исключение существующего значения СЕИ,
• замена некоторого значения СЕИ на новое значение.
Декомпозиция - операция преобразования исходной СЕИ в несколько СЕИ с различными структурами. Декомпозиция, как и все операции над структурой СЕИ, одновременно производит преобразование множества значений.
Композиция - операция преобразования нескольких СЕИ с различными структурами в одну СЕИ. Декомпозиция и композиция являются взаимообратными операциями.
Нормализация - это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой. Одновременно происходит перекомпоновка значений СЕИ.
Свертка - операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой.
При анализе экономических документов ставится задача разделения документа на элементарные осмысленные фрагменты, называемые показателями. Это позволяет установить смысловые взаимосвязи между различными документами, обеспечить одинаковое понимание всеми пользователями применяемых единиц информации и их единое обозначение, использовать полученные результаты для определения структуры базы данных.
Показатель представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс. Соответствующее описание произвольного свойства (необязательно количественного) называется атомарным фактом.
Чтобы точнее характеризовать атрибуты, образующие показатель, необходимо, отметить существенные различия свойств, которые отображаются атрибутами. Материальные процессы, как известно, имеют качественную характеристику и количественную характеристику. Соответственно и атрибуты должны разделяться на два класса, которые называются «атрибуты-признаки» и «атрибуты-основания». Атрибут-признак представляет собой информационное отображение качественного свойства некоторого объекта, предмета, процесса, а основание является отображением их количественного свойства. В состав показателя должны входить один атрибут-основание и несколько атрибутов-признаков, однозначно характеризующих условия существования основания.
Как единица информации показатель является разновидностью СЕИ. Схематично структура показателя П представляется выражением
П (Pl,P2,...,Pk,Q),
где Pl,P2,...,Pk - атрибуты-признаки, Q - атрибут-основание.
Если представить себе показатель с двумя, например, атрибутами-основаниями, то его можно разделить на две части, в каждой из которых будет один атрибут-основание и характеризующие его признаки. Полученные части содержат меньше атрибутов и поэтому соответствуют определению показателя.
Таким образом, в показателях отображаются количественные свойства объектов и процессов. Вместе с тем существуют документы, не содержащие атрибутов-оснований, например анкеты кадрового учета, сведения о структуре подразделений предприятия и т. д. Следовательно, не вся экономическая информация может быть представлена в форме показателей.
Минимальный набор атрибутов показателя должен содержать:
• атрибуты, отображающие идентификаторы объектов,
• атрибуты, отображающие признак времени,
• атрибут, отображающий некоторое количественное свойство объекта или взаимодействия. Для установления признаков и оснований в конкретных документах можно использовать следующие закономерности.
1. Если значение атрибута является исходным данным или результатом арифметической операции - это основание.
2. Если значение текстовое - это признак.
3. Если атрибут обозначает предмет - это признак.
4. Если атрибут в некотором показателе является признаком (основанием), - он будет играть эту роль и в других показателях.
5. Если показатели описывают сходные процессы - их признанные части совпадают.
6. Если основание показателя вычисляется по значениям других оснований, то набор признаков такого показателя есть объединение признаков, связанных с этими основаниями.
Критерием качества создания базы данных может служить минимальная избыточность хранимой информации. Обычно минимальная избыточность выражается принципом: каждое сообщение хранится в БД один раз. Соблюдение этого принципа дает ряд преимуществ:
сокращается объем памяти ЭВМ, требуемой для хранения базы данных,
сокращается трудоемкость ввода данных в ЭВМ и упрощаются проблемы контроля достоверности вводимой информации,
упрощаются алгоритмы корректировки данных, так как корректировка сообщения может быть проведена за одно обращение к базе данных.
Использование аппарата экономических показателей позволяет создать структуру БД с минимальной избыточностью, если сначала расчленить все сведения, циркулирующие в ЭИС, на показатели, а потом объединить атрибуты родственных показателей по принципу: в один файл включается группа экономических показателей с одинаковым составом атрибутов-признаков.
Одна из причин выделения показателей в особую разновидность единиц информации заключается в том, что показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность) и поэтому достаточной для образования самостоятельного документа.
Для показателей, описывающих экономические процессы (взаимодействие объектов), можно классифицировать их составные части:
• формальную характеристику, указывающую на алгоритм получения атрибута-основания в показателе;
• перечень объектов, участвующих в процессе;
• название процесса;
• единицу измерения атрибута-основания;
• определение момента времени или периода времени;
• название функции управления;
• название экономической системы, в которой происходит описываемый процесс.
Указание всех названных частей необходимо для точного обозначения показателя. Атрибуты-признаки показателя должны отображать в обязательном порядке лишь перечень объектов, участвующих в процессе, и период (момент) времени. Очень часто включается признак, отмечающий единицу измерения, а остальные характеристики показателя обычно указываются в его названии, а не в хранимых значениях.
Показатель удобно применять как обобщающую единицу измерения объема данных.
Существует аналогия между экономическими показателями и переменными с индексами, которые рассматриваются, например, в линейной алгебре. Так, показатель П (Код материала, Цена) соответствует величине C(i), где С - цена материала с i-м Кодом материала. Переменная С соответствует атрибуту-основанию Цена, индекс i - атрибуту-признаку Код материала. В общем случае переменная всегда отображает атрибут-основание, а индексы этой переменной - значения соответствующих атрибутов-признаков показателя.
Естественное отличие состоит в том, что индекс i переменной С обычно изменяется от 1 до некоторого фиксированного значения, а номенклатурные номера материалов (и вообще любые значения атрибутов-признаков) могут кодироваться многими способами, необязательно порядковыми кодами.
Закономерности, установленные в математике для арифметических операций над переменными с индексами, естественно, трансформируются в правила арифметических действий над показателями.