Тема 5. Обеспечение сохранности электронных документов.
Хранение ЭД может быть организовано различными способами:
1) оперативное хранение – в структурном подразделении, отвечающем за информатизацию, долговременное – в архиве;
2) оперативное и долговременное хранение в структурном подразделении, отвечающем за информатизацию при контроле со стороны службы ДОУ и архива;
3) создание специального электронного архива на правах структурного подразделения;
Хранение ЭД в общем архиве организации.
Обеспечение сохранности ЭД в краткосрочной перспективе предполагает:
· соблюдение физико-химических условий хранения;
· резервное копирование;
· стабилизация электропитания;
· антивирусную защиту;
· защиту информации от несанкционированного доступа.
-
В долговременной перспективе:
· перезапись;
· миграция;
· эмуляция;
· инкапсуляция.
Миграция – своевременный перевод электронных документов на современную технологическую платформу, в новую версию пользовательского формата или в страховой (архивный) формат. (См. тему «Электронные архивы).
Инкапсуляция – включение документов в состав файлов межплатформенного формата, например, XML.
Эмуляция – симуляция (имитация) работы в старой версии программного обеспечения при создании новой версии. Однако эмуляторы программной среды могут быть созданы не для всех программных продуктов.
Требования к температурно-влажностному режиму хранения ЭД зафиксированы в ГОСТах.
Нормативные документы | Температура | Относительная влажность |
Основные правила работы архивов организаций (М.,2002) | +15 – +20° С | 50–65% |
Основные правила работы государственных архивов (М.,2003) | +15 – +20° С | 50–65% |
РД 50-524-84 «Порядок хранения документов на машинных носителях» | 18 ° С + 2° | 60% + 5% |
ГОСТ N 28374-89 «Носители магнитной записи. Упаковка, маркировка, транспортировка и хранение» от 01.01.91 | от 10 до 25°С | от 50 до 60 %. |
Тема 6. Электронные архивы.
Рост объемов машиночитаемых документов в делопроизводстве правительственных учреждений привел к созданию архивов машиночитаемых данных (АМЧД). Историю подобного рода хранилищ начинают с Роуперовского центра по изучению общественного мнения (США, 1947 г.) В 1968 г. был создан отдел машиночитаемых документов в Национальном архиве США, в 1973 г. – в составе Государственного архива Канады. С 1968 г. МЧД комплектуется Государственный архив Англии, в Швеции при Министерстве культуры и образования создается Комитет архива данных. В структуре Национального архива Франции в Фонтенбло создан Центр хранения ДМН. Осуществляют работу с ДМН и их прием национальные архивы Швеции, Дании, Нидерландов, Финляндии. Зачастую архивы машиночитаемых данных возникали не в учреждениях государственной архивной службы, а при университетах и научных учреждениях по инициативе исследователей. Например, Международный консорциум по социальным и политическим исследованиям в Анн-Арборе (Мичиган, США), созданный в 1962 г. как сообщество исследовательского центра Мичиганского университета и 21 других университетов США. Историю создания АМЧД этой категории можно кратко представить следующей таблицей:
Год создания | Название архива | Состав документов | Хронологические границы. |
1961 г. | Центральный архив эмпирических социальных исследований в Кельне (Германия) - ZA. | Социальные науки, в том числе история | |
1962 | Международный консорциум по социальным и политическим исследованиям в Анн-Арборе (Мичиган, США) - ICPSR | МЧД организаций и личного происхождения по экономике, социологии, истории, управлению, психологии, политологии. . | Данные о выборах с 1789 г; данные о голосованиях в Конгрессе США с 1790 г., данные французских переписей XIX –нач. XX века. |
1967 г . | Британский архив Совета по экономическим и социальным исследованиям при университете Эссекса (Великобритания) – ESCR DA | Экономика, социология | |
1971 г. | Норвежский центр машиночитаемых данных по социальным наукам при Бергенском университете (Норвегия) -NSD | Социологическе опросы (с 1964 г.), демографические сведения, базы данных об организациях, политической элите Норвегии с 1814 г. | Материалы переписей населения с 1769 г. |
1972 г. | Архив Штейнмеца (Амстердам, Голландия) - STAR | Социальные науки. | |
1973 г. | Датский архив данных (Копенгаген/Оденсе, Дания) - DDA | Данные социологических обследований, демографические материалы, итоги выборов, сведения по промышленной социологии, криминологии, социальной медицине. законодательство, документы от средств массовой информации; сведения регионального масштаба — по географическим и административно-территориальным единицам. Значительная доля ДМН — статистические источники, образованные в деятельности Датского статистического управления и Датского национального института по социальным исследованиям. | Документы, начиная с Королевского финансового статуса 1660 г. (демография). |
1980 г . | Шведский центр машиночитаемых данных по социальным наукам при университете Гетеборга (Швеция) - SSD. | Социальные науки, материалы социологических обследований, выборов, база данных о членах профсоюзов, библиографическая база данных газетных статей (1938-45 гг.). | Статистика выборов с 1911 г. |
1989 г. | Нидерландский архив исторических данных при Лейденском университете (Голландия) - NHDA | Первый специализированный архив машиночитаемых данных по исторической науке в Европе. Банк данных по истории великих географических открытий, статистика торговли, демографическая статистика. | C XVI по XX век. |
К 1990-м годам архивов такого рода было около 30 – помимо США, Канады и европейских государств они появились в Австралии, Израиле, Индии. Из стран Восточной Европы первым стал архив социальных исследований TARKI в Венгрии. В 1993 г. создан Центральный архив ДМН республики Беларусь, c 1996 г. – Белорусский научно-исследовательский центр электронной документации (БелНИЦЭД).
В нашей стране до сих пор нет федерального архива электронных документов. Однако вычислительные центры при некоторых ведомствах ведут базы данных еще с советских времен (МВД, МПС). В 1980е годы Центральный государственный архив народного хозяйства СССР (ныне – Российский государственный архив экономики) в экспериментальном порядке принимал на хранение документы на магнитных носителях Министерства Приборостроения СССР и других организаций. Документы космической тематики на магнитных носителях хранились с 1980-з гг. в НИЦ ТД СССР. Другие организации начали накапливать базы данных в 1990е годы (Министерство налогов и сборов, Госкомстат, Пенсионный фонд РФ). Архивы электронных документов созданы в Министерстве налогов и сборов РФ, Государственном таможенном комитете, Министерстве по чрезвычайным ситуациям, Минкомимуществе.
В деятельности этих организаций создаются информационные ресурсы федерального значения. Например, БД «Единый государственный реестр налогоплательщиков» (ЕГРН), Единый государственный реестр юридических лиц (ЕГРЮЛ) (МНС); Реестр федерального имущества (Министерство имущественных отношений РФ), Федеральный регистр нормативных правовых актов субъектов ФР (Минюст РФ); Центральная статистическая БД Госкомстата России, БД «Цены», «Труд», «Дохлды и уровень жизни населения» и др. Большие массивы данных в мультимедийных форматах накоплены в электронных СМИ и издательствах.
Учет информационных ресурсов России осуществляется ФГУП НТЦ «Информрегистр» с 1996 г. Развитию государственных и муниципальных информационных ресурсов способствуют федеральные целевые программы («Электронная Россия» и др.) и региональные программы.
Специализированные архивы по постоянному хранению электронных документов на региональном уровне:
- Центр электронной документации Чувашской республики, г.Чебоксары (1996 г.)
Центральный архив документов на электронных носителях г.Москвы, ныне – Центральный архив аудиовизуальных и электронных документов (2002 г.);
Центр электронной документации республики Калмыкия (2002) г.
В настоящее время любая крупная или средняя организация затрачивает значительные средства на развитие и поддержание электронных ресурсов. Однако дело касается баз данных, необходимых в повседневной работе. Те БД, которые вышли из оперативного использования, как правило, погибают.
В странах США и Европы еще в 1970-е годы приступили к реализации программ по изучению проблем экспертизы ценности, отбору, описанию, учету и классификации МЧД, анализу носителей информации. Результатами этой работы стали несколько основополагающих рекомендаций по работе архивов с МЧД.
В области экспертизы ценности МЧД ученые США пришли к выводу, что экспертиза МЧД значительно отличается от отбора традиционных документов. К дополнительным, «техническим» критериям экспертизы они относили проверку читабельности магнитного носителя (ленты), проверку наличия сопроводительной документации к файлам. При экспертизе ценности МЧД в США имело значение степень агрегированности информации. Зав. отделом машиночитаемых данных Национального архива США Ч. Доллар предложил следующую четкую формулу: информационная ценность машиночитаемых документов обратно пропорциональна уровню их обобщения. Это значит, что данные переписи населения на уровне семьи более ценны, чем данные на уровне района и округа. Объясняется это просто - итоговые данные невозможно разложить на составляющие, в то время как первичные данные (данные микроуровня) - всегда можно свести при помощи ЭВМ до желаемого итога.
В Англии процесс отбора МЧД был разработан более детально и проходил в два этапа: информационный и системный анализ. В ходе информационного анализа проводилась обычная оценка содержания документов. Интересно, что информационный анализ проводился еще на стадии проектирования системы, когда оценивалось ее назначение, состав массива данных, функции и др. В ходе системного анализа на основе изучения технической документации оценивался основной файл системы, порядок его ввода и обслуживания, и, что самое важное, возможность перевода файла в единый отраслевой формат, принятый для МЧД государственным архивом Англии (Public Recods Office). Единый формат был принят для унификации данных и должен был облегчить перевод данных в новые версии (миграцию) по мере устаревания программного обеспечения. Единый стандартный архивный форматбыл принят также в США, Англии, Швеции.
Идея единого формата стала результатом «горького опыта» работы архивов МЧД на Западе, которые вступили в полосу кризиса во второй половине 1970-х - п.п.1980-х гг. Особенно обострила ситуацию «микрокомпьютерная революция» начала 1980-х г. (распространение ПЭВМ). В результате выяснилось, что революционная смена информационных технологий не влечет за собой их преемственности и документы, записанные ранее, не могут быть воспроизведены с помощью новых программных средств. Многие массивы данных были таким образом утрачены. Начались поиски выхода. Архивисты предлагали различные меры – от жесткого контроля архивной службы за системами делопроизводства в учреждениях и форматами данных до полного отказа от какого бы то ни было контроля за форматами (принимать в архив все без обиняков, а как это прочитать – проблема исследователя). Специалисты по информационным технологиям предложили свой выход – «программно независимый формат». Так, числовые данные записывались в так называемый «плоский файл» путем удаления любых иерархических или реляционных отношений, полей с переменной длиной, специальных кодов формата и т.п.Это позволяловпоследствии переводить данные в различные форматы. Все 1980-е годы архивисты обсуждали различные национальные и международные форматы.
Однако, единый формат не смог стать панацеей от всех бед, и в конце 1980-х годов архивы МЧД вступили в новый кризис. Сейчас электронный документ рассматривается как единство информации, реквизитов, носителя и метаданных. Без метаданных и реквизитов невозможно осуществить аутентификацию ЭД (установить подлинность, юридическую силу). При переводе в архивный (страховой формат) – т.н. «миграции», меняется структура документов, утрачиваются реквизиты. Поэтому этот способ сохранения ЭД подвергается сомнению.
Создание электронного архива является актуальной задачей для любой организации. Электронные архивы :
· обеспечивают надежность хранения информации;
· сводят к минимуму потери информации;
· сокращают время на поиск;
· позволяют организовать одновременную работу нескольких сотрудников с одним документом;
· позволяют организовать доступ к информации из любого пункта, оснащенного каналом и оборудованием передачи данных;
· обеспечивают достоверность информации и предоставляют сведения о том, кто является автором последних изменений;
· позволяют знать о местонахождении оригинала документа;
· позволяют проводить анализ востребованности различных документов каждым сотрудником.
Любой электронный архив состоит из следующих основных подсистем (см. рисунок):
§ Системы ввода/вывода — предназначены для преобразования бумажной документации в электронный вид и наоборот. Эти подсистемы обеспечивают ввод и регистрацию документов, создаваемых в любых используемых на предприятии приложениях.
§ Системы оперативного электронного архива — предназначены для хранения информации оперативного использования и накопления информации перед записью ее на носители долговременного хранения.
§ Системы долгосрочного хранения — предназначены для долговременного хранения больших и сверхбольших объемов данных, обращение к которым носит нерегулярный характер.
§ Системы пользовательских приложений. Как правило, на этом уровне организуется доступ к информации архива либо в файл-серверном режиме, либо посредством использования систем автоматизации, СУБД.
Опыт реализации подобных проектов позволяет рекомендовать объединение подсистем ввода и вывода данных. Современные многофункциональные устройства (МФУ) обеспечивают одновременное сканирование и печать необходимой документации различного формата. Данный подход позволяет существенно сократить издержки на создание электронного архива.
Для создания электронного архива организации необходимо выполнить ряд этапов:
· Подготовка. На данном этапе документы подготавливаются для оптимального отображения в системе хранения и наилучшего сканирования. Документы идентифицируются согласно принятой в компании структуре документооборота. Этап включает в себя:
· получение, регистрацию и сортировку документов;
· удаление скрепок и др.;
· преобразование электронных документов в общепринятые форматы;
· разработку специальных маршрутов документа;
· проверку качества.
· Сканирование. Документы сканируются с использованием сканирующих устройств (обычных или поточных сканеров, МФУ и т. д.), которые поддерживают необходимые типы и форматы документов. На этапе сканирования ведется контроль качества. Плохо отсканированные документы сканируются вновь.
· Преобразование. Отсканированный документ конвертируется в формат, удовлетворяющий требованиям системы хранения и производственным стандартам. Изображения очищаются от мусора, при необходимости осуществляется распознавание текста, файлы сжимаются.
· Атрибутирование/индексирование. На данном этапе каждому документу автоматически или вручную ставятся в соответствие ключевые слова, по которым впоследствии будет производиться поиск, или же создается полнотекстовая база данных.
· Повтор и изготовление документации. Полученные электронные документы передаются в необходимом формате либо в систему хранения (как правило, это подсоединенное к сети хранилище — NAS или сеть хранения данных — SAN). Все документы проходят дополнительную проверку во время всего процесса.
· Дополнительная проверка качества.
Значительную часть всех этих работ можно поручить аутсорсеру.
Внедрение системы электронного архива позволяет:
· существенно (с 2–3 дней до минут) сократить время, затрачиваемое на доступ к информации;
· повысить эффективность использования информации за счет уменьшения времени на поиск необходимых документов, возможности одновременной работы с документом нескольких сотрудников, создания логических связей между документами.
· повысить уровень информационной безопасности за счет определения прав сотрудников на доступ к той или иной информации;
· обеспечить доступ к информации практически из любой территориально удаленной точки, оснащенной средствами связи, так как информация в электронном виде может быть доступна по локальной сети, через Интернет, передана по электронной почте, записана на любой носитель и отправлена по обычной почте;
· повысить достоверность информации за счет регистрации вносимых в документы изменений;
· снизить риски потери или порчи важных документов.
Кроме того, электронные архивы обладают отличной масштабируемостью, так как увеличить объем дисковой памяти в сети хранения данных или сетевом хранилище значительно легче, чем выделить новые площади под архив и обеспечить необходимые условия хранения.
Электронный архив может также быть интегрирован с другими информационными системами предприятия, в том числе с системой электронного документооборота.