Хранение ЭД в виде изображений.
Существуют два основных способа представления графических объектов средствами вычислительной техники: векторная и растровая графика.
Векторная графика содержит не само изображение, а алгоритм его построения - математические описания (координаты) линий, создающих фигуры, и цветовых заливок (областей, залитых одним цветом и областей градиентов). Вопрос о разрешении (количестве точек, из которых состоит линия или участок цветовой заливки) и цветовой палитре решается непосредственно перед выводом файла на конкретное физическое устройство и с учетом его характеристик. При этом способе изображение требует сравнительно мало места на носителе, но связано с конкретной программой воспроизведения. По этой причине существующие в настоящее время векторные графические форматы не могут быть рекомендованы для архивного хранения данных.
Изображение в растровой графике хранится на машинном носителе в виде линейной последовательности кодов, описывающих его минимальные элементы - точки (пикселы). На экран монитора или на печать изображение выводится построчно, точка за точкой. Его основными параметрами являются разрешение (количество точек в строке) и глубина цвета (количество битов с закодированной информацией о цвете, описывающих одну точку). При воспроизведении изображения его разрешение накладывается на разрешающую способность экрана или принтера, в результате чего определяется конкретный размер отображаемых точек или, при заданном размере пикселя, размер самого изображения. Растровая графика менее компактна, чем векторная, но проще поддается унификации кодов, благодаря чему изображение может быть воспроизведено самыми разными программами.
При хранении растровых изображений требуется значительно больше места на машинных носителях, чем для текста той же площади. Поэтому изображения, как правило, хранятся в сжатом виде. Методы сжатия делятся на две группы: без потери качества и с потерей качества.
Сжатие без потери качества основано на разных алгоритмах. Для двухцветных изображений применяют, например, метод группового кодирования, при котором описывается не каждый пиксель в отдельности, а последовательность пикселей одного цвета в строке как отрезок («27 белых, 3 черных, 10 белых …» и т. п.). Для полихромных изображений с небольшой глубиной цвета (например, 8 бит на пиксель, или 256 цветов) эффективен метод, при котором попарно сравниваются каждые две последовательные строки пикселей и фиксируется только разница между ними. Существуют и более изощренные методы, позволяющие существенно сократить объем файла даже для полутоновых изображений с глубиной цвета в 24 или 32 бита на пиксел.
Сжатие с потерями качества (lossy compression) основано на отбрасывании тех элементов изображения, которые практически не влияют на его восприятие человеком. Это связано с особенностями зрительного восприятия, которые приводят к фильтрованию части информации, воспринимаемой сетчаткой, но не поступающей в мозг. Алгоритмы сжатия с потерями отбрасывают именно эту информацию. Данный способ эффективен прежде всего для полутоновых изображений высокого качества. Его не рекомендуется использовать для сжатия факсимильных изображений текстовых документов, т. к. это может привести к ухудшению их внешнего вида.
Количество форматов графических файлов весьма велико. Рекомендуется использовать наиболее распространенные форматы, поддерживаемые разными программами.
К их числу можно отнести:
• Zsoft PC PaintBrush (PCX) - один из наиболее старых и известных форматов для хранения растровой графики. Появился чуть ли не вместе с персональными компьютерами, благодаря чему является наиболее распространенным, поддерживается практически всеми программами просмотра/редактирования изображений. Использует простейший алгоритм сжатия без потери качества RLE.
• Microsoft Windows Bitmap(BMP) - формат для хранения растровой графики в среде Microsoft Windows. Допускает сжатие без потери качества.
• Таg Image File Format (TIFF) - универсальный формат для хранения растровой графики, широко используется в издательстве. Область применения: двухцветные контурные изображения фотографического качества, высокого разрешения и большого формата. Основные характеристики формата: поддержка файлов с несколькими изображениями, разнообразные методы сжатия, формат прямого доступа (быстрый доступ к любой части изображения), большой размер файлов, не поддерживает векторную графику и сжатие с потерями, открыт для расширения своего стандарта. Существует достаточно много его разновидностей, обусловленных различными алгоритмами сжатия. Наибольшей совместимостью обладает формат, использующий алгоритм LZW. Формат поддерживает два вида записи - IBM PC и Macintosh.
• Graphics Interchange Format (GIF). Разработан в 1987 г. для хранения растровой графики. Область применения: двухцветные и цветные контурные изображения с глубиной цвета до 8 бит на пиксел. Основные характеристики: мощный алгоритм сжатия, платформенная мобильность, потоковый формат, возможность быстрого просмотра на экране монитора (чтение и вывод данных по мере их поступления). Недостатки: не поддерживает изображения с глубиной цвета больше 8 бит на пиксел (фотографического качества, полутоновые), не поддерживает векторную графику и сжатие с «потерями». Реализовал один из самых эффективных для своего времени (1987) способов сжатия LZW. Позволяет выводить изображение на экран за четыре прохода, давая возможность просмотра изображения до его окончательной прорисовки. До сих пор широко используется для хранения и передачи небольших изображений (элементов оформления страниц) в сети Интернет.
•Joint Photographic Experts Group (JPEG). Растровый формат, своей популярностью обязан сильной степени сжатия исходного изображения, основанной на алгоритме сжатия с потерей качества. Однако касается это прежде всего 24- и 8-битных изображений. Областью применения формата является графика фотографического качества (true color) с глубиной цвета до 64 бит на пиксель, полутоновые изображения с мягкими переходами от одного цвета к другому. Основные характеристики формата: компактность, мощный метод сжатия с потерями, возможность изменения параметров сжатия. Недостатки формата: нечеткость или «дрожание» очертаний углов, линий, символов, отдельных мелких деталей, не поддерживает векторную графику. Существует несколько разновидностей, обусловленных разными алгоритмами сжатия и способами вывода на экран (постепенная отрисовка аналогично gif). Также широко применяется в Интернет, в основном для передачи больших изображений.
В настоящее время наиболее распространено следующее программное обеспечение, поддерживающее графические форматы (просмотр, редактирование, экспорт, импорт): Picture Publisher 4-7.0 (Micrografx), PhotoShop 3-5.0 (Adobe), CorelDraw 5-8.0, PhotoPaint (Corel) и др.
4.5.2 ЭД, сочетающие текст и графику.
Многие текстовые редакторы (в частности, Microsoft Word) позволяют оперировать с графикой и встраивать изображения непосредственно в текст, или образовывать ссылку на графический файл (подобно тому, как это происходит с электронными таблицами). В результате создаются ЭД, в которых текст и графика сосуществуют на одной странице. В таких случаях несложные изображения рекомендуется встраивать в текстовый файл с последующим сохранением в форматах RTF или PostScript (см. выше раздел 4.2.2).
При сохранении в формате RTF документов, содержащих одновременно текст и графику, следует учитывать, что он упаковывает изображения не столь компактным способом, как специализированные графические форматы со сжатием. Например, если встроить в текст размером в страницу, набранный в редакторе Microsoft Word шрифтом 14-го кегля (в формате RTF он занимает порядка 10-20 Кбайт) полихромное контурное изображение размером примерно 3 х 3 см (в формате BMP занимающее около 30 Кбайт), то размер файла увеличится более чем на 300 Кбайт. Поэтому при создании ЭД, рассчитанных на хранение в формате RTF, не стоит злоупотреблять графическими вставками без необходимости. Что касается полутоновых растровых изображений фотографического качества, включаемых в текстовый документ в качестве иллюстраций, то их предпочтительно хранить как приложения в отдельных файлах, например, в формате JPEG.
Весьма широкие возможности для использования графических вставок предоставляет язык гипертекстовой разметки HTML. При работе с графикой он также использует два подхода. Первый трактует графическое изображение как самостоятельный документ, на который делается ссылка. При втором подходе изображения включаются прямо в документ НТML. Т. к. большое количество встроенной графики существенно замедляет вывод документа на экран, то выбор между этими подходами зависит прежде всего от предполагаемой частоты использования ЭД. Если к документу обращаются часто, то целесообразно применять ссылки на графические элементы, которые можно будет активизировать при необходимости.
Звук
Звукозаписывающая и звуковоспроизводящая аппаратура воспринимает звук как изменение напряжения электрического тока. Хранение звука в машиночитаемом виде осуществляется с помощью аналого-цифрового преобразования, когда на машинный носитель записываются данные о величине напряжения через определенные промежутки времени. Размер этих промежутков задает частоту дискретизации (sampling rate) – число измерений напряжения через равные промежутки времени для преобразования звука в аналоговое напряжение в Гц.
Для воспроизведения звуковых файлов обычно используются внешние устройства разных типов, обеспечивающие обратное преобразование машинных кодов в электрический ток, а также синтезаторы, генерирующие ноты определенного тембра на основании команд компьютера. Разработан унифицированный язык таких команд, общий для синтезаторов разных типов. Он получил название MIDI -- Musical Instrument Digital Interface.
MIDI. Область применения формата - хранение и обмен звуковыми данными, воспроизводимыми с помощью синтезатора. Основные характеристики формата: компактность файлов по сравнению с файлами оцифрованного звука, файлы содержат ссылки на ноты, а не детальную запись звука. Формат General MIDI описывает около 200 инструментов, которые могут использоваться в MIDI-файлах. Недостатки формата: формат MIDI не определяет в явном виде всех тонкостей воспроизведения звука, для высококачественного и точного воспроизведения необходим мощный синтезатор и большой объем памяти на звуковой карте.
Основные форматы звуковых файлов, рассчитанных на воспроизведение внешними устройствами, являются платформно-зависимыми, т. к. в среде UNIX и Windows утвердились свои стандарты (соответственно AU и Wave).
AU - AU Sun, SND NeXT. Область применения формата - хранение и обмен звуковыми данными. Основные характеристики формата: файлы рассчитаны, как правило, на один канал 8000 Гц или на 16-битовый линейный стереозвук с частотой дискретации 22050 и 44100 Гц. Недостатки формата - ограниченная платформенная мобильность (системы NeXT, SUN, Unix), многозначность расширения (расширение .snd активно используется в других форматах).
WAVE - WAVE RIFF Microsoft Windows. Область применения формата- хранение звуковых данных Windows. Основные характеристики формата wave – специальный тип файла RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде, большой размер файлов. Недостатки формата - ограниченная платформенная мобильность (Windows).
AIFF – Audio Interchange File Format. Во многом напоминает формат WAVE, но позволяет использовать как оцифрованный по модуляциям звук, так и закодированный по нотам, с наличием образцов – шаблонов для индивидуальных нот. Поддерживает до 16 бит 44 KHz стерео, существуют приложения для платформ SGI, Windows PC и Macintosh.
Видео
Для хранения видеоданных на сегодняшний день наиболее часто используются два основных формата, разработанных фирмами Microsoft и Apple AVI и QuickTime.
AVI - Audio/Video Interleave Format. Базовый видеоформат для операционной среды Windows. Область применения формата: видеоданные и связанное с ними звуковое сопровождение. Основные характеристики формата: подсистема сжатия и восстановления видеоданных, называемая кодеками (compression/decompression - codec), жесткая, единая на весь фильм частота показа видеоданных. Недостатки формата: часто возникающее явление асинхронности в процессе распаковки и воспроизведения видео- и аудиоданных, высокие требования к аппаратному обеспечению при воспроизведении файлов.
QuickTime– формат Apple. Область применения формата: хранение видео-, аудио- и других изменяющихся во времени данных, разработка прикладных программ . Основные характеристики формата: поддержка видео, аудио и графических данных на разных носителях, поддержка нескольких параллельных аудио- и видеодорожек с данными различного типа и неодинаковой продолжительности, возможность наложения дорожек, редактирования. Недостатки формата - ограниченная платформенная мобильность (Windows, Macintosh) .
Эти форматы могут быть рекомендованы для хранения видеоданных, если не предполагается иметь дело с продуктами, связанными с разными платформами. Для межплатформенного обмена более пригоден формат, предложенный Экспертным комитетом по видеоданным ISO (Motion Picture Experts Group) в качестве стандарта высококачественного сжатия видеоматериала.
MPEG - Motion Picture Experts Group. Область применения формата: видео- и аудиоданные. Основные характеристики формата: платформенная мобильность (существуют приложения для основных операционных систем), поддержка как видео- и аудиоданных, так и объединенных аудиовидеоданных, поддержка формата сжатия с потерями, опирающегося на особенности зрительного и звукового восприятия человека. Недостатки формата: сравнительно высокие требования к скорости передачи данных, большой объем вычислений при декодировании MPEG, обилие специфических версий формата (MPEG-1, -2, -3, -4), не всегда имеющих прямую и обратную совместимость. Для кодирования видеоданных в формат MPEG нужны специализированные аппаратные средства, т. к. настольный компьютер не может обеспечить требуемую скорость вычислений.
Вопросы компрессии данных
В компрессии (архивировании) данных различают два основных понятия: упаковка (обьединение нескольких файлов в один с возможностью обратного разбиения на составляющие части) и сжатие (уменьшение первоначального размера файла с помощью кодирования).
Обе указанные процедуры или, чаще, их сочетание широко используются на стадии оперативного обращения ЭД. Сжатие предназначено прежде всего для экономии места, занимаемого ЭД на машинном носителе. Упаковка в чистом виде не приводит к существенному сокращению места, но облегчает учет файлов и дает выигрыш времени на открытие и закрытие большого числа файлов. Существует множество программ, предназначенных для сжатия и упаковки данных, называемых архиваторами (ARC, ARJ, RAR, ZIP, ZOO и др.). Они используют сочетание различных алгоритмов компрессии данных, различающихся по быстродействию и компактности физической структуры файлов.
При архивном хранении ЭД факторы компактности и быстроты обращения с файлами являются вторичными по сравнению с фактором надежности. Следует учитывать, что любая процедура компрессии данных и обратной декомпрессии таит в себе потенциальную возможность сбоя и, следовательно, утраты части данных. К тому же это влечет за собой необходимость хранить программу-архиватор и поддерживать ее работоспособность в условиях постоянной эволюции операционных систем. В силу этих соображений использование дополнительных процедур (помимо сжатия, изначально заложенного в основу многих графических форматов) в процессе архивного хранения представляется нежелательным. Они могут применяться в процессе передачи ЭД на архивное хранение, но затем файлы с данными следует распаковать, проверить на целостность и хранить в одном из форматов, указанных выше в разделе 4.2.
5 Учет и хранение электронных документов в ведомственном архиве и передача в государственный архив
Порядок учета, хранения, уничтожения и утилизации ЭД в ведомственном архиве определяется организацией, осуществляющей ведомственное хранение ЭД, и согласовывается с государственным органом по архивам и делопроизводству Республики Беларусь.
Форматы хранения ЭД должны обеспечивать доступ к ЭД, их визуализацию, распространение и сохранение во времени. Для хранения ЭД с постоянным сроком хранения должны использоваться форматы файлов, согласованные с государственным архивом. В противном случае ЭД должны быть преобразованы в требуемый формат к моменту передачи в государственный архив.
На ЭД постоянного хранения в ведомственном архиве должны составляться описи и сопроводительные документы.
Ведомственный архив должен хранить ЭД в специализированном хранилище или в специально выделенных помещениях, предназначенных для длительного хранения информации, записанной на машинных носителях. Регламентом работ ведомственного архива должно предусматриваться создание резервных копий ЭД, которые должны храниться отдельно (территориально) от ЭД, с которых были сделаны копии.
В хранилище или специально выделенных помещениях должны соблюдаться требования пожарной безопасности, предусмотренные ГОСТ 12.1.004 "ССБТ. Пожарная безопасность. Общие требования" и типовыми правилами пожарной безопасности для промышленных предприятий.
Ответственным за обеспечение сохранности ЭД должно быть лицо, назначаемое руководством организации.
По истечении срока хранения в ведомственном архиве ЭД с временным сроком хранения уничтожаются, ЭД с постоянным сроком хранения передаются на государственное хранение. Срок хранения ЭД в ведомственном архиве определяется законодательными актами Республики Беларусь.
Передача ЭД на государственное хранение должна осуществляться специалистами ведомственного архива совместно с представителями государственного архива на основании графика и согласно требованиям, разработанным государственным архивом.
В государственный архив принимаются ЭД, состоящие из одного или нескольких файлов, размещенных на машинных носителях различных типов. Форматы файлов и типы машинных носителей должны соответствовать требованиям государственного архива и обеспечивать доступ к ЭД и их визуализацию. В отдельных случаях допускается прием ЭД вместе с программными средствами визуализации ЭД.
На государственное хранение принимаются ЭД, используемые в оперативном обращении, либо формируемые по содержанию используемых в оперативном обращении баз данных, электронных таблиц и т.п..
ЭД должны передаваться в государственный архив согласно описи с сопроводительными документами.
Формы описи и сопроводительных документов, порядок их утверждения и согласования определяются нормативно-методическими документами государственного органа по архивам и делопроизводству Республики Беларусь.
Более детально вопросы, связанные с учетом ЭД, организацией их ведомственного хранения и передачей на государственное хранение, освещены в нормативных документах: “Примерная инструкция по работе с машиночитаемыми документами в организациях, на предприятиях и в ведомственных архивах Республики Беларусь" и “Правила учета и передачи электронных (машиночитаемых) документов на государственное хранение”.
Приложение