Обеспечение сохранности электронных документов

директор Всероссийского НИИ документоведения и архивного дела (ВНИИДАД), профессор, д.и.н.

Хранение электронных документов сопряжено с рядом проблем. Особенно сложными из них признаны устаревание техники, зависимость от программного обеспечения, износ носителей хранящейся информации. Хотя единый подход к решению этих проблем пока не выработан, существуют стратегии и способы обеспечения сохранности и доступности электронных документов.

Специфика электронных документов заключается в том, что они становятся доступными для прочтения человеком только при наличии определенного программного и технического оборудования. Поэтому когда программное и/или техническое обеспечение устаревает (а это происходит очень быстро), электронные документы могут оказаться непригодными для использования.

В целях обеспечения сохранности и доступности электронных документов, необходимо периодически перемещать их на более новые программные и технические средства. И при этом необходимо чтобы они оставались достоверными, то есть необходимо обеспечивать аутентичность их контента, структуры и контекста, обеспечивать сохранность сопровождающих документы метаданных и протоколов контроля системных процессов. Кроме того, для обеспечения сохранности записанной информации особое значение имеет правильный выбор носителя — средства хранения, а также создание контролируемой среды (соответствующих условий) хранения электронных документов.

При определении особенностей хранения документов необходимо учитывать, например, объем и рост количества документов, особенности использования, степень доступности документа, физические характеристики, стоимость хранения.

Как и бумажные документы, электронные документы требуют выработки стратегии долгосрочного (10 лет и более) обеспечения сохранности, ее нормативного закрепления в основных документах организации делопроизводства. Таких стратегий может быть несколько.

Создание «компьютерных музеев»

Для обеспечения сохранности и доступности электронных документов и их воспроизведения на оригинальном оборудовании это оборудование необходимо сохранять и поддерживать в работоспособном состоянии, то есть создавать «музеи». Стратегия, рекомендующая создание «музеев» устаревшей техники и программного обеспечения для воспроизведения документов на оригинальном оборудовании, признана большинством экспертов нереалистичной и слишком дорогостоящей. Хранение огромного количества устаревшего технического и программного обеспечения еще не гарантирует, что это обеспечение в нужный момент в случае необходимости будет работать.

Стратегия эмуляции

Эта стратегия предполагает воспроизведение документов устаревших форматов при помощи программ-эмуляторов в новой компьютерной среде. При этом под эмуляцией, согласно ГОСТ 15971-90. «Системы обработки информации. Термины и определения», понимают имитацию функционирования одного устройства посредством другого устройства или устройств вычислительной машины, при которой имитирующее устройство воспринимает те же данные, выполняет ту же программу и достигает того же результата, что и имитируемое.

Архивисты считают эмуляцию непрактичной и неэффективной стратегией, поскольку она направлена на сохранение функциональности информационной системы, а не документов как доказательства. Необходимость создавать программы-эмуляторы делает ее еще и дорогостоящей.

Создание копий электронных документов

Стратегия создания копий электронных документов на бумаге или микропленке большинством архивистов рассматривается как применимая к ограниченному числу программных приложений. Она может использоваться, если информация существует в независимом от программного обеспечения формате или в виде файлов простой однообразной структуры. И она не подходит для сохранения сложных цифровых объектов в сложных системах, поскольку может привести к потерям их уникальной функциональности (например, динамичности, взаимосвязанности, нелинейности, интегрированности).

Так, большинство веб-документов может быть представлено исключительно в цифровой форме, поскольку содержимое сайта обычно представляет собой взаимосвязанные при помощи гиперссылок элементы информации, и при распечатке веб-страницы на бумаге это уникальное свойство теряется.

Бумага позволяет сохранить содержание документа и всю необходимую информацию, определяющую юридическую силу документа, но усложняет поиск и систематизацию документов.

Конвертирование в стандартный формат

Эта стратегия предполагает конвертирование электронного документа в стандартный или открытый формат в целях обеспечения независимости документа от программного обеспечения. Предпочтительными форматами для документов в настоящее время являются SGML, XML, RTF. Эта стратегия, как и все другие, подвергается критике, поскольку форматы устаревают. Кроме того, при конвертировании имеется риск потери данных.

Тем не менее, в настоящее время большие надежды связываются с использованием формата XML в качестве стандартного для обмена электронными документами в различных сферах деятельности, особенно, в сфере государственного управления.

Миграция

Самая популярная в настоящее время стратегия, которую называют миграция. Суть ее в том, что электронные документы (цифровые материалы) периодически перемещаются с одного технического и программного обеспечения на другое или с одного поколения компьютерных технологий на последующее.

Например, документы могут быть перемещены с магнитной ленты на компакт-диск в целях обеспечения их длительной доступности. Это сложная стратегия, при которой также возможны потери структуры и функциональности документа (потери и порча информации). Однако она признана легитимной и совместно со стратегией конвертирования документов в стандартный формат наиболее перспективной, хотя и требующей дополнительных экспериментальных проверок. В частности, стратегия миграции документов на новую технологическую платформу (то есть копирования электронных документов на новые средства хранения и в некоторых случаях конвертирования в формат, подходящий для новых компьютерных систем) рекомендована для обеспечения сохранности электронных документов Международным советом архивов.

Способы обеспечения сохранности документов

Международный стандарт ИСО 15489 устанавливает 3 способа обеспечения сохранности документов:

  • копирование — создание идентичной копии документа на том же носителе (бумаге, микроносителе, электронном носителе);
  • конвертирование на другой носитель — перенос документа с одного носителя на другой (изменение формы документа) с гарантированным сохранением содержания, идентичного первоначальному (например, микрофильмирование бумажных документов, сканирование);
  • миграция — периодический перенос электронных документов с одного технического/программного средства на другое в целях обеспечения возможности использования этих документов в будущем.

При конвертировании изменяется формат электронного документа. Например, можно конвертировать документ, созданный в формате Word Perfect, сохранив его в формате RTF или MS Word. При миграции производится перемещение электронного документа с одной программной платформы или носителя на другой/-ую без изменения формата. Например, можно переместить документы с дискеты на компакт-диск. Однако и при миграции может понадобиться конвертирование электронного документа. Например, при перемещении электронного документа из операционной системы Macintosh в операционную систему Microsoft Windows необходимо конвертирование электронного документа в новый формат (например, RTF или другой).

При этом возможно три основных типа потерь, которые необходимо учитывать при хранении электронных документов:

  1. Потеря данных. При потере данных в определенной степени теряется и содержание документа. Электронный документ становится неполноценным и недостоверным.
  2. Потеря внешнего вида, структуры электронного документа. Например, при конвертировании текстовых документов в формат RTF, можно утратить некоторые особенности внешнего вида документов.
  3. Потеря связей между данными (например, в электронных таблицах, базах данных) и/или потеря доступности связанных с документом метаданных также делают документ неполноценным.

Необходимо учитывать, что копия документа может быть юридически признана таковой только в случае, если она создана проверенным способом и является точной, полноценной и надежной для длительного использования.

Формат XML позволяет перемещать электронные документы с одного типа программного и технического обеспечения на другой без потерь информации. Разработчики концепции электронного правительства в Евросоюзе считают, что основанные на XML форматы приносят пользу управлению и позволяют улучшить взаимодействие органов власти с различными организациями и населением, поэтому государственным организациям особенно рекомендуется использовать документы в XML-форматах. Российская Федерация одобрила принятие Open XML в качестве стандарта ISO/IEC 29500.

При решении задачи обеспечения сохранности электронных документов не менее важен, чем вопрос конвертирования и/или миграции, вопрос сжатия файлов (компрессии). Преимуществами сжатия файлов являются экономия занимаемого места при хранении, более быстрая и простая передача файлов. Недостатки сжатия файлов заключаются в том, что оно может привести к потере данных. Кроме того, оно вызывает необходимость использования дополнительного программного обеспечения — программ сжатия файлов, которым также присущи проблемы устаревания, многоверсионности, зависимости от платформы.

Рекомендации по выбору методов компрессии электронных образов документов содержит международный стандарт ИСО 12033.

Хранение документов электронной почты

Некоторые сообщения могут и должны быть распечатаны на бумаге. Это необходимо, например, в тех случаях, когда сообщение послужило основанием для издания другого - бумажного документа, совместно с которым формируется в дело. Но следует учитывать, что такие распечатки неадекватны документам электронной почты, поскольку электронные сообщения содержат информацию, которая может быть невидима на экране монитора и/или утрачена при копировании документа электронной почты на бумагу. Например, не все метаданные документа видны на экране, а программа MS Outlook не позволяет распечатать видимый на экране список адресатов копий сообщения из поля «Скрытая копия» в заголовке сообщения (распечатать его необходимо путем применения функции PrintScreen). Поэтому во многих случаях рекомендуется хранить сообщения электронной почты в том формате, в котором они созданы, а не на бумаге.

Кроме того, если сообщения хранятся в электронном формате, рекомендуется организовать их хранение, основываясь на классификаторе документов организации (номенклатуре дел). Это поможет сохранить связи между сообщениями электронной почты и любыми другими относящимися к этому вопросу документами организации как электронными, так и бумажными.

На практике некоторые организации устанавливают фиксированный срок хранения сообщений электронной почты у сотрудников (обычно 2—3 месяца), после чего сообщения электронной почты передаются на несетевое хранение либо уничтожаются. Это приводит к тому, что передаваемые на несетевое хранение документы электронной почты дублируются копиями, оставляемыми сотрудниками для последующего использования в работе, либо важные документы электронной почты навсегда утрачиваются. Очевидно, что сроки хранения сообщений электронной почты, как и любых других документов организации, должны зависеть от индивидуальных функций и содержания документа, быть краткими или длительными (а не универсальными) и быть зафиксированы в номенклатуре дел организации.

Сохранность баз данных

Что касается обеспечения сохранности баз данных, прежде всего, в каждом конкретном случае необходимо определить, что является полным (включающим контент, контекст и структуру) и точным (аутентичным, надежным, пригодным для использования) документом (то есть служит доказательством):

  • таблицы базы данных;
  • информация, содержащаяся в полях базы данных;
  • вся база данных.

После этого можно выбрать стратегию обеспечения сохранности документов базы данных. В случае, если база данных все еще требуется для текущей управленческой деятельности, то можно:

  • хранить отчеты базы данных (если отчеты базы данных являются документами);
  • xранить «моментные снимки» базы данных (если в базе данных документами являются данные);
  • осуществить миграцию базы данных (если вся база данных, применяемая в текущей управленческой деятельности, является документом).

Если база данных является документом и более не применяется в текущей управленческой деятельности, ее следует хранить целиком. Если база данных не является документом, она подлежит сохранению до минования надобности.

Сохранность веб-документов

Концепция обеспечения сохранности веб-документов исходит из предположения, что не все элементы сайта являются документами, поэтому только некоторые из них подлежат сохранению.
Внутри организации обязанности по сохранению веб-документов обычно распределяются между несколькими группами сотрудников, участвующими в создании, администрировании и использовании сайта:

  • веб-мастерами (техническими специалистами);
  • лицами, ответственными за информационную поддержку сайта;
  • внутренними пользователями;
  • делопроизводственным персоналом.

При этом необходимо решить, кто уполномочен принимать решение об удалении содержимого сайта, кто практически осуществляет удаление и сохранение содержимого сайта, то есть должны быть установлены формальные правила, кто, когда и почему меняет содержимое сайта.

При обеспечении сохранности веб-документов необходимо ответить на ряд вопросов:

  • Что сохранять (какие элементы сайта, только ли «рожденные» в электронной форме, всё или выборочно)?
  • Когда сохранять (на какой стадии жизненного цикла, с какой периодичностью)?
  • Как сохранять (распечатывать на бумаге, делать «моментные снимки» электронных версий при помощи специального программного обеспечения)?

Пока не существует единого подхода к решению этих проблем, но очевидно, что для разных типов сайтов (например, сайтов сетей внутреннего и общего пользования) должны существовать разные принципы обеспечения сохранности, поскольку содержание и назначение таких сайтов может значительно различаться.

Средства хранения

Хранить электронные документы сегодня обычно рекомендуется на оптических дисках с однократной записью и многократным считыванием (CD-R, DVD-R), обеспечивающих защиту данных от некорректного обращения. Однако ни одно из цифровых средств хранения не подходит для долгосрочного, архивного сохранения документов. По общим оценкам, срок их физической пригодности составляет до 30 лет. Технологически они устаревают в срок от 5 до 10 лет. Поэтому файлы необходимо регулярно перемещать на новые средства хранения.

В то же время необходимо создавать резервные копии документов. Процедуры резервного копирования защищают хранящиеся данные от утраты и повреждения.

Система резервного копирования требует специального программного и технического обеспечения. При этом лучше, если резервное копирование осуществляется на сменные носители. Однако дискеты можно использовать только для кратковременного хранения электронных документов.

Общее правило обеспечения сохранности носителей таково: чем чище, прохладнее, суше и стабильнее среда хранения документов, тем дольше предполагаемый срок хранения документов. Однако для некоторых носителей следует соблюдать предписания производителей: например, может требоваться, чтобы температура была не ниже определенного уровня или чтобы носитель периодически очищался.

При выборе носителей, программного и технического обеспечения предпочтительнее те, которые популярны и лидируют на рынке, а не те, которые новы и являются последним достижением в развитии технологий.

Место хранения

Немало споров вызывает вопрос о месте хранения электронных документов. Согласно международному стандарту ИСО 15489, для обеспечения качественного хранения документов должны быть соблюдены следующие условия:

  • документы должны быть легкодоступны и расположены в доступных местах;
  • оборудование хранилища должно соответствовать физическим форматам документов и не наносить им ущерб;
  • помещения для хранения должны обеспечивать соответствующий температурный и влажностный режим, защиту от огня, воды и прочих факторов внешнего (физического) воздействия.

Немаловажен и вопрос, как должны храниться электронные документы долгосрочной ценности: централизованно (в архиве), распределенно (по месту создания документов), комбинированно? По сути, это вопрос о том, в каких учреждениях может осуществляться правильный уход за состоянием электронных документов и их физическая сохранность. Например, по мнению немецких архивистов, учреждение - создатель электронных документов не является идеальным гарантом их длительного хранения, поскольку это не является задачей их деятельности. Альтернативное хранение электронных документов в вычислительных центрах позволяет осуществлять лучшее техническое обслуживание и уход за документами, но самым лучшим признается решение, когда полную ответственность за все вопросы хранения и предоставления электронных документов пользователям несет государственный архив.

Тем не менее, у каждого из этих вариантов есть свои приверженцы среди теоретиков архивного дела, и каждый из вариантов требует экспериментальной проверки.

© «УПРАВЛЯЕМ ПРЕДПРИЯТИЕМ»
Все права защищены. Все торговые марки являются собственностью их правообладателей.