Обезличивания баз персональных данных
Объект исследования: библиотека для обезличивания баз персональных данных разработанная автором.
Результаты, полученные лично автором: разработан алгоритм для обезличивания баз персональных данных методом перемешивания и проведено его тестирование на реальных данных.
На данный момент, в Брянской области, как и во многих других, развернута региональная информационная система (РИС), объединяющая все медицинские организации области. Объем информации, обрабатываемой в этой системе, растет с каждым днем. Сведения о здоровье граждан относятся к категории «специализированных» персональных данных, что намного увеличивает требования, предъявляемые к информационной системе, повышая требуемый уровень защищённости системы до первого [1].
Аппаратные средства для уровня защищенности 1 и 2, в первую очередь, являются довольно дорогостоящими, и не производятся в пределах РФ, что усложняет их покупку и установку. Многие бюджетные учреждения, в принципе, не могут себе их позволить. Поэтому многие специалисты в области защиты информации, а так же службы, ответственные за технический контроль, рекомендуют применять в качестве мер для понижения требований к информационным системам приемы обезличивания персональных данных.
В ходе анализа различных решений в этой области, был выбран алгоритм, основанный на методе перемешивания [2].
Для экспериментальной проверки результатов была разработана программа для тестирования полученного алгоритма на быстродействие и точность. На данном этапе программа работает с таблицами, заполненными случайными значениями. Атрибуты, присутствующие в тестовой таблице: Id, Фамилия, Имя, Отчество, Дата рождения, Адрес, номер медицинского полиса, Паспорт, СНИЛС, Телефон, Статус, Место работы.
Прототип для тестирования был так же создан на языке С#. На этапе проверки алгоритма была выбрана объектно-ориентированная технология доступа к данным Entity Framework. Entity Framework дает разработчику возможность работать с данными на более высоком уровне абстракции.
Результаты тестирования процедуры полного обезличивания таблицы разного размера представлены в таблице, где k – число деления базы данных на первом этапе, N – количество записей в тестовой базы данных.
Таблица 1
Обезличивание/деобезличение на различных объемах с различными
параметрами дробления исходного множества конфигурацией (в секундах)
k N | 1 000 | 2 000 | 3 000 | 10 000 | 100 000 |
15,35 | 33,09 | 56,56 | |||
15,18 | 32,96 | 56,01 | |||
15,03 | 31,7 | 55,07 |
Очевидно, что при использовании Entity Framework, время, необходимое на создание обезличенной таблицы, возрастает во много раз при больших объемах данных. После преобразования тестовой программы и исключения Entity Framework время, необходимое на обезличивание таблицы из 100 000 записей, уменьшилось до 14.5 минут (примерно в 6 раз).
В целом, на данном этапе алгоритм показывает хорошую производительность на средних объемах данных, его математическая модель является точной и позволяет, имея входные ключи и информацию о параметрах алгоритма, найди конкретные записи, не производя деобезличивание всей таблицы персональных данных. Следующим этапом работы будет являться оптимизация алгоритма для быстрого поиска по таблице обезличенных данных.
Создание библиотеки позволяет решить проблему актуальную для многих организаций РФ, где имеются информационные системы обработки медицинской информации или других персональных данных специализированной категории, но нет возможности использовать аппаратную защиту данных высокого уровня. Сфера применения подобной системы не ограничивается медицинскими организациями, но в сфере здравоохранения она имеет наибольшую актуальность.
Список литературы:
1. Приказ Федеральной службы по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) от 5 сентября 2013 г. N 996 г. Москва «Об утверждении требований и методов по обезличиванию персональных данных»
2. Е.А. Макарова, Д.Г, Лагерев Применение методов обезличивания персональных данных для обеспечения защиты конфиденциальной информации в медицинских организациях: Молодые ученые – ускорению научно-технического прогресса в XXI веке [Электронный ресурс]: эл. научное издание: сборник трудов IV Всероссийской научно-технической конференции аспирантов, магистрантов и молодых ученых с международным участием, Ижевск, 20-21 апреля 2016 года / ФГБОУ ВПО «ИжГТУ имени М.Т. Калашникова». – Ижевск, 2016. – с 280 – 285.
Материал поступил в редколлегию 20.04.2017
УДК 004.522
Е.А. Макарова
Научный руководитель: старший преподаватель кафедры «Информатика и программное обеспечение», Д.Н. Панус