Средства подготовки данных
Основными носителями исходной информации явл. первичные документы. Они не могут быть непосредственно восприняты ЭВМ, поэтому подлежащие машинной обработке данные предварительно представляются на промежуточно-машинных носителях. Этот этап называется подготовкой данных. Использование данных при этом на магнитных носителях обеспечивает переход к эл.технологиям. Подготовка данных связана с выполнением нескольких процедур - набор и регистрация исходных данных, контроль фиксируемой или выводимой информации, использование различных методов контроля. Для того, чтобы устранить перенос ошибок с первичного документа используется процедура верификации данных, т.е. информация набирается повторно сравнивается с 1ым набором, исправляются ошибки, т.е. проверка на синтаксис. Так же используют семантическую проверку. Для этого используют программные средства, которые выполняют: сравнивают исходные данные с контрольными значениями, поверяют на горизонтальный и вертикальный баланс и т.д.
На этапе подготовки данных особое внимание уделяется надежности хранения и восстановления информации. Распространенный способ – копии информационных массивов.
Для считывания графической информации и преобразования ее в какую-либо из используемых форматов используется сканер. Для эффективного взаимодействия человека с ПК используется световое перо. Для получения документальной и художественной информации используются цифровые камеры.
8. Структура документов и способы их преобразования для машинной обработки
Данные в информационных системах могут храниться в свободном и фиксированном форматах. Сообщения фиксированного формата выделяют параметры и указывают названия и значения этих параметров. База данных фиксированного формата обычно имеет табличную форму. База данных свободного формата предназначены, главным образом, для визуальной диалоговой пользы за терминалом.
Записи свободного формата представляют собой машинный образ абзацев или строки документа и имеют переменную или неопределенную длину. Любой файл и жесткого и свободного форматов состоит из записей. Файл содержит однородную информацию. Для файла свободного формата порядок записей существенен, а записи жесткого формата могут располагаться в файле в любом порядке. Поэтому файл записи жесткого формата можно рассматривать как множество записей. На основе анализа документов необходимо определить количество файлов и их реквизитный состав. Для обработки данных важно знать тип и длину реквизита. Тип реквизита зависит от значения реквизита и может быть текстовым, числовым, датой, логическим типом и т.д. Длина реквизита - максимальное количество символов, отводимое под значение данного реквизита. Совокупность реквизитов, объединенную в более крупную единицу данных, называют составной единицей данных. Для того, чтобы обрабатывать любой документ, его условно разделяют на следующие разделы:
1. Общая часть документа (заголовок)
2. Предметные строки документа – множество однородных строк данных
3. Оформительская (заверительная) часть документа( подписи, печати и т.д.)
Эти элементы в файлах не хранятся!
4. Реквизиты, предназначенные для улучшения читабельности внемашинного документа и неподлежащие вводу в файл, но возможно хранящиеся в позициях файла специального вида (в поле типа МЕМО)
5. Текст в свободном формате может храниться в виде отдельного файла или в поле типа МЕМО
В каждом файле существует реквизит или группа реквизитов, значения которых не будут совпадать ни в какой паре записи файла. Такие реквизиты называют ключом файла.
В получаемом файле реквизиты могут быть реквизитами- признаками и реквизитами- основаниями. Реквизиты-признаки отображают качественные характеристики объекта, а реквизиты- основания - количественные характеристики. Р- реквизиты-признаки, Q- реквизиты-основания.
Для определения признаков и оснований в документах используют следующие правила:
1. Если значение реквизита является исходным данным или результатом арифметической операции, то это основание.
2. Если значение - текстовое, то это признак.
3. Если реквизит обозначает предмет или время- это признак.
4. Если реквизит в некотором показателе является признаком или основанием, то он будет играть ту же роль в других показателях.
5. Если показатели описывают сходные процессы, то их ПРОПУСК части совпадают.
6. Если основание показателя вычисляется по значению других оснований, то набор признаков такого показателя – объединение признаков, связанных с этим основанием.
При хранении показателей в памяти ЭВМ в подгруппу показателей с одинаковым составом реквизитов признаков выделяется один файл.