Результаты экспериментов
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ
Кафедра математического моделирования и анализа данных
ЦЕПЬ МАРКОВА С ЧАСТИЧНЫМИ СВЯЗЯМИ И ПЕРЕМЕННЫМ ШАБЛОНОМ
Курсовая работа
Батуры Олега Владимировича
студента 3 курса,
специальность
«Компьютерная безопасность»
Научный руководитель:
доктор физ.-мат. наук,
заведующий кафедрой ММАД
Ю. С. Харин
Минск, 2015
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ПРИКЛАДНОЙ математики и информатики
Кафедра математического моделирования и анализа данных
ЗАДАНИЕ НА КУРСОВУЮ РАБОТУ
Студент Батура Олег Владимирович, 3 курс, 9 группа
1. Тема работы Цепь Маркова с частичными связями и переменным шаблоном
2. Срок сдачи студентом законченной работы________ 2015 г.
3. Перечень вопросов, подлежащих разработке
· Исследовать вероятностные характеристики модели цепи Маркова с частичными связями и переменным шаблоном. Найти -мерное распределение вероятностей .
· Построить компьютерную модель ЦМ с переменным шаблоном.
· Построить статистические оценки параметров модели при известной функции шаблона , исследовать свойства оценок.
· Построить оценки параметров модели при периодически изменяющемся, но неизвестном шаблоне.
Руководитель курсовой работы______________ / Ю. С. Харин/ ______ 2015 г.
Задание принял к исполнению_______________ 2015 г.
ОГЛАВЛЕНИЕ
Введение. 4
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ. 5
1.1. Цепь Маркова порядка . 5
1.2.Цепь Маркова с частичными связями ЦМ . 7
1.3.Цепь Маркова с частичными связями и переменным шаблоном ЦМ 9
1.4.Статистическое оценивание параметров ЦМ , состоятельность оценок 11
1.5.Статистическое оценивание параметров ЦМ . 15
2.ПРАКТИЧЕСКАЯ ЧАСТЬ. 16
2.1.Описание программы.. 16
2.2.Моделирование временного ряда длительности . 17
2.3.Построение оценок максимального правдоподобия и . 18
2.4.Результаты экспериментов. 21
2.5.Вывод. 23
Заключение. 24
Список использованной литературы.. 25
Введение
При математическом моделировании сложных систем и процессов в различных научных сферах часто возникает необходимость построения вероятностно-статистических моделей дискретных временных рядов , где пространство состояний — конечное множество мощности с длинной памятью [1]. Известной моделью таких дискретных временных рядов является цепь Маркова достаточно высокого порядка , определяющего длину памяти; если , то цепь Маркова называется простой, если — сложной. Однако для такой модели число параметров растет экспоненциально при увеличении порядка : , и для статистического оценивания параметров требуется иметь реализацию не всегда доступной на практике длительности . В связи с этим актуальна проблема построения малопараметрических моделей цепей Маркова высокого порядка. В данной работе исследуется малопараметрическая модель цепи Маркова порядка с частичными связями ЦМ , рассмотренная в [2], для которой шаблон связей зависит от времени, исследуются ее вероятностные характеристики, строятся статистические оценки параметров при известной функции шаблона, а также при периодически изменяющемся, но неизвестном шаблоне.
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1. Цепь Маркова порядка
В криптологии для моделирования дискретных временных рядов с глубиной памяти используется цепь Маркова порядка (ЦМ ), обобщающая модель простой цепи Маркова [3].
Определение.Цепь Маркова , порядка с пространством состояний , определенная на вероятностном пространстве ( ) и временной области , характеризуется обобщенным марковским свойством:
Это означает, что условное распределение вероятностей будущих состояний при фиксированной предыстории зависит не от всей этой предыстории, а от ближайшей на глубину предыстории
Цепь Маркова ЦМ( ) характеризуется -мерным начальным распределением вероятностей
и -мерной матрицей вероятностей одношаговых переходов в момент времени :
=
Матрица при этом удовлетворяет условиям нормировки (если она не зависит от времени, то есть , ЦМ( ) в таком случае называется однородной):
В таком случае -мерное распределение вероятностей имеет вид:
Число независимых параметров, определяющих матрицу вероятностей одношаговых переходов для однородной ЦМ( ), равно .
При увеличении глубины памяти число параметров экспоненциально возрастает, и для идентификации такой модели требуется наблюдать реализацию не всегда доступной на практике длительности .
Возникает задача поиска малопараметрической модели цепи Маркова высокого порядка, для которой число параметров в матрице задается числом параметров . Одной из таких моделей является цепь Маркова порядка с частичными связями (ЦМ ) [2].
1.2. Цепь Маркова с частичными связями ЦМ
Пусть – однородная ЦМ( ), заданная на вероятностном пространстве ( ) с некоторой ( )-мерной матрицей вероятностных переходов
Рассмотрим – параметр, который называется числом связей; – произвольный целочисленный -вектор с упорядоченными компонентами:
Этот вектор называется шаблоном связей, – множество всевозможных таких векторов с компонентами, мощность – некоторая -мерная стохастическая матрица.
Определение.Цепь Маркова называется цепью Маркова -го порядка с -частичными связями и обозначается ЦМ( ), если ее вероятности одношаговых переходов имеют вид:
Это означает, что вероятность перехода процесса в состояние в момент времени зависит не от всех значений предыдущих состояний процесса, а лишь от некоторых избранных состояний .
В данном случае, вместо параметров ЦМ( ) данная модель полностью определяется параметрами , что играет существенную роль на практике.
Замечание.Если , , то и ЦМ( ) представляет из себя цепь Маркова порядка , то есть ЦМ( ЦМ .
В дальнейшем будем рассматривать однородную цепь Маркова с частичными связями.
Следует отметить, что -мерное распределение вероятностей для данной модели имеет следующий вид:
Возникает проблема исследования свойств такой модели цепи Маркова, в которой шаблон зависел бы от какой-либо функции. Данное свойство помогло бы сделать распознавание шаблона для злоумышленника более проблематичным, что сыграло бы важную роль в криптостойкости модели.
1.3. Цепь Маркова с частичными связями и переменным шаблоном ЦМ
Пусть – однородная ЦМ( ), заданная на вероятностном пространстве ( ), определенная ранее. Рассмотрим обобщение данной модели, когда шаблон зависит от времени :
причем:
В общем случае шаблон зависит от некоторой функции, определяющей его изменение. Простейшая модель такой зависимости – периодическая функция с некоторым периодом :
.
В частности, при имеются два различных шаблона и которые циклично повторяются:
Для данного частного случая -мерное распределение вероятностей имеет вид:
При произвольной модели зависимости шаблона от времени имеем общую формулу:
Использование такой модели цепи Маркова позволяет сделать выборку для злоумышленника как можно более случайной, что сильно влияет на криптостойкость модели, так как появляются сложности с распознаванием зависимости и поиском используемого шаблона. Полезно исследование такой модели ЦМ , в которой шаблон периодически изменяется, но неизвестен.
Далее рассмотрим задачу статистической оценки параметров модели ЦМ при известном шаблоне и поиска свойств оценок.
1.4. Статистическое оценивание параметров ЦМ , состоятельность оценок
Для статистического оценивания параметров ЦМ( ) будем пользоваться методом максимального правдоподобия.
Рассмотрим задачу построения оценок максимального правдоподобия (ОМП) для параметров шаблона и стохастической матрицы по наблюдаемой реализации длительности .
Введем обозначения, пусть – мультииндекс -го порядка; – функция, которую назовем селектором -го порядка с параметрами и – индикатор события ; – начальное -мерное распределение вероятностей ЦМ ;
– частота -граммы для шаблона , удовлетворяющая условию нормировки:
Для модели ЦМ логарифмическая функция правдоподобия имеет вид:
Для того, чтобы найти ОМП для матрицы , необходимо решить задачу на условный экстремум:
В результате получаем условную ОМП для матрицы ( ):
Далее рассматривается задачу поиска ОМП для шаблона .
Пусть – стационарное распределение вероятностей ЦМ . Пусть ЦМ – стационарна ( ), тогда распределение вероятностей -граммы для шаблона будет иметь следующий вид:
Соответствующая частотная оценка вероятностей:
.
Энтропия -мерного распределения вероятностей запишется в виде:
Количество информации по Шеннону, содержащейся в -грамме о будущем символе :
Логарифмическая функция правдоподобия для оценки имеет следующий вид:
где – подстановочная оценка энтропии, получающаяся при подстановке вместо истинных значений их оценок { }.
Учитывая, что не зависит от , добавляя также не зависящее от слагаемое , а также используя тот факт, что:
приходим к следующей ОМП шаблона :
где – подстановочная оценка количества информации по Шеннону, получающаяся при подстановке вместо истинных значений их оценок { }.
Теорема 1.Если ЦМ является стационарной, то при истинном шаблоне и оценка состоятельна:
Теорема 2.Если ЦМ является стационарной и шаблон идентифицируемый, то при оценка состоятельна:
1.5. Статистическое оценивание параметров ЦМ
Для ЦМ оценки параметров генератора с переменной обратной связью строятся аналогично модели с постоянной обратной связью с учетом периодически изменяющегося шаблона .
Логарифмическая функция правдоподобия имеет следующий вид:
Задача на условный экстремум
решается в общем виде, и это позволяет решить частную задачу оценки параметров генератора с переменной обратной связью.
Теорема 3.Если ЦМ является стационарной, то при истинном шаблоне и оценка состоятельна:
Теорема 4.Если ЦМ является стационарной и шаблон идентифицируемый, то при оценка состоятельна:
ПРАКТИЧЕСКАЯ ЧАСТЬ
Описание программы
Построена компьютерная модель цепи Маркова с частичными связями и переменным шаблоном со следующими входными параметрами:
· глубина предыстории однородной цепи Маркова ЦМ .
· длина временного ряда с пространством состояний .
· Шаблоны и , которые повторяются с периодом
· Стохастическая матрица вероятностей одношаговых переходов для шаблонов:
В частном случае, при данная матрица имеет следующий вид:
Реализовано моделирование цепи Маркова с частичными связями и переменным шаблоном, нахождение оценок максимального правдоподобия матрицы вероятностей одношаговых переходов и переменного шаблона смоделированного временного ряда. Далее более подробно рассматривается алгоритм работы программы.
2.2. Моделирование временного ряда длительности
Случайным образом выбираются первые элементов последовательности. Для моделирования элементов с нечетными номерами выбирается шаблон . Рассматривается -предыстория элемента. Распределениями вероятностей исхода для данных элементов являются строки матрицы , соответствующие состояниям предыдущих элементов
В частности, если предыстория элемента имеет вид
,
то при
Элементы с четными номерами моделируются аналогичным образом с использованием шаблона
На каждом шаге моделирование происходит с помощью генератора псевдослучайных чисел, работающего по следующему алгоритму:
1. Генерируется число в диапазоне .
2.
В результате имеется временной ряд , где пространство состояний – конечное множество мощности .
2.3. Построение оценок максимального правдоподобия и
Логарифмическая функция правдоподобия имеет вид:
Задача на условный экстремум:
Поиск условной оценки максимального правдоподобия матрицы одношаговых переходов ищется путем приравнивания к нулю компонент градиента логарифмической функции правдоподобия:
Используя тот факт, что матрица стохастическая,
, условная оценка полностью определяется шаблоном
Для вычисления оценки шаблона при известном истинном значении числа связей можно воспользоваться алгоритмом полного перебора значений логарифмической функции правдоподобия.
В частности, при имеется следующая система уравнений:
где частота выпадения при предыстории .
Условной оценкой максимального правдоподобия является решение данной системы:
.
Логарифмическая функция правдоподобия перепишется в следующей форме:
Оценка максимального правдоподобия ищется путем перебора вариантов шаблонов. Производится подсчет частот при всевозможных вариантах пар шаблонов и выбирается та пара, которая максимизирует логарифмическую функцию правдоподобия. Таким образом:
Оценка максимального правдоподобия матрицы имеет вид:
Результаты экспериментов
Экспериментальные оценки параметров построены при следующих входных данных:
Рис. 1.Зависимость числа ошибок распознавания истинного шаблона при 100 экспериментах от
При :
При :
При :
При :
Вывод
Результаты показывают состоятельность оценки при истинном шаблоне и . Также очевидна состоятельность оценки шаблона при .
Таким образом, для более точного распознавания матрицы одношаговых переходов и шаблона требуется наблюдать реализацию как можно большей длительности .
Заключение
В данной работе исследованы вероятностные характеристики модели цепи Маркова с частичными связями и переменным шаблоном, реализована компьютерная модель ЦМ с переменным шаблоном. Построены статистические оценки параметров модели при известной функции шаблона , периодически изменяющемся, но неизвестном шаблоне. Исследована состоятельность данных оценок.
Результаты экспериментов показали, что для более точного распознавания матрицы одношаговых переходов и шаблона требуется наблюдать реализацию как можно большей длительности .
Список использованной литературы
1. Алферов А. П. и др. Основы криптографии / Алферов А. П., Зубов А. Ю., Кузьмин А. С., Черемушкин А. В. – 2-е изд., испр. и доп. – М.: Гелиос АРВ, 2002. – 480 с.
2. Харин Ю. С., Петлицкий А. И. Цепь Маркова -го порядка с частичными связями и их статистическое оценивание – Дискретная математика, 2007. – Т. 12, вып. 2. С. 109-130.
3. Харин Ю. С. и др. Криптология / Харин Ю. С., Агиевич С. В., Васильев Д. В., Матвеев Г. В. – Мн.: БГУ, 2013. – 511 с.