Методы генерации псевдослучайных последовательностей чисел
При шифровании методом гаммирования в качестве ключа используется случайная строка битов, которая объединяется с открытым текстом, также представленным в двоичном виде (например, А = 00000, В = 00001, С = 00010 и т.д.), с помощью побитового сложения по модулю 2, и в результате получается шифрованный текст. Генерирование непредсказуемых двоичных последовательностей большой длины является одной из важных проблем классической криптографии. Для решения этой проблемы широко используются генераторы двоичных псевдослучайных последовательностей.
Генерируемые псевдослучайные ряды чисел часто называют гаммой шифра или просто гаммой (по названию буквы g греческого алфавита, часто используемой в математических формулах для обозначения случайных величин).
Обычно для генерации последовательности псевдослучайных чисел применяют компьютерные программы, которые, хотя и называются генераторами случайных чисел, на самом деле выдают детерминированные числовые последовательности, которые по своим свойствам очень похожи на случайные.
К криптографически стойкому генератору псевдослучайной последовательности чисел (гаммы шифра) предъявляются три основных требования:
1. период гаммы должен быть достаточно большим для шифрования сообщений различной длины;
2. гамма должна быть практически непредсказуемой, что означает невозможность предсказать следующий бит гаммы, даже если известны тип генератора и предшествующий кусок гаммы;
3. генерирование гаммы не должно вызывать больших технических сложностей.
Длина периода гаммы является самой важной характеристикой генератора псевдослучайных чисел. По окончании периода числа начнут повторяться, и их можно будет предсказать. Требуемая длина периода гаммы определяется степенью закрытости данных. Чем длиннее ключ, тем труднее его подобрать. Длина периода гаммы зависит от выбранного алгоритма получения псевдослучайных чисел.
Второе требование связано со следующей проблемой: как можно достоверно убедиться, что псевдослучайная гамма конкретного генератора является действительно непредсказуемой? Пока не существуют такие универсальные и практически проверяемые критерии и методики. Чтобы гамма считалась непредсказуемой, т.е. истинно случайной, необходимо, чтобы ее период был очень большим, а различные комбинации битов определенной длины были равномерно распределены по всей ее длине.
Третье требование обусловливает возможность практической реализации генератора программным или аппаратным путем с обеспечением необходимого быстродействия.
Один из первых способов генерации псевдослучайных чисел на ЭВМ предложил в 1946 г. Джон фон Нейман. Суть этого способа состоит в том, что каждое последующее случайное число образуется возведением в квадрат предыдущего числа с отбрасыванием цифр младших и старших разрядов. Однако этот способ оказался ненадежным и от него вскоре отказались.
Из известных процедур генерации последовательности псевдослучайных целых чисел наиболее часто применяется так называемый линейный конгруэнтный генератор. Этот генератор вырабатывает последовательность псевдослучайных чисел Y1, Y2, ..., Yi-1, Yi, ..., используя соотношение
Yi = (a*Yi-1 + b) mod m,
где Yi - i-e (текущее) число последовательности; Yi-1 - предыдущее число последовательности; а, Ь и m - константы; m - модуль;
а - множитель (коэффициент); b - приращение; Y0 - порождающее
число (исходное значение).
Текущее псевдослучайное число Yi получают из предыдущего числа Yi-1 умножением его на коэффициент а, сложением с приращением b и вычислением остатка от деления на модуль m. Данное уравнение генерирует псевдослучайные числа с периодом повторения, который зависит от выбираемых значений параметров а, Ь и m и может достигать значения m. Значение модуля m берется равным 2n либо равным простому числу, например m=231-1. Приращение b должно быть взаимно простым с m, коэффициент а должен быть нечетным числом.
Конгруэнтные генераторы, работающие по алгоритму, предложенному Национальным бюро стандартов США, используются, в частности, в системах программирования. Эти генераторы имеют длину периода 224 и обладают хорошими статистическими свойствами. Однако такая длина периода мала для криптографических применений. Кроме того, доказано, что последовательности, генерируемые конгруэнтными генераторами, не являются криптографически стойкими.
Существует способ генерации последовательностей псевдослучайных чисел на основе линейных рекуррентных соотношений.
Рассмотрим рекуррентные соотношения и их разностные уравнения:
k
S hj *ai+j=0
j=0
k-1
ai+k=-S hj *ai+j
j=0
где h0¹0, hk=1 и каждое hi принадлежит полю GF(q).
Решением этих уравнений является последовательность элементов а0,а1,а2,... поля GF(q). Соотношение определяет правило вычисления ak по известным значениям величин a0,a1,a2,...,ak-1. Затем по известным значениям a0,a1,a2,...,ak находят ak+1 и т.д. В результате по начальным значениям a0,a1,a2,...,ak-1можно построить бесконечную последовательность, причем каждый ее последующий член определяется из k предыдущих. Последовательности такого вида легко реализуются на компьютере, при этом реализация получается особенно простой, если все hi и аi, принимают значения 0 и 1 из поля GF(2).
На рис. показана линейная последовательная переключательная схема, которая может быть использована для вычисления суммы и, следовательно, для вычисления значения ak по значениям k предыдущих членов последовательности. Исходные величины a0,a1,a2,...,ak-1 помещаются в разряды сдвигового регистра, последовательные сдвиги содержимого которого соответствуют вычислению последовательных символов, при этом выход после i-ro сдвига равен аi. Данное устройство генератором последовательности чисел, построенным на базе сдвигового регистра с линейной обратной связью.
Решения линейных рекуррентных соотношений, реализуемые генератором с регистром сдвига, описываются следующей теоремой. Пусть многочлен
h(X)= S hjXj,
где X - формальная переменная; hj - коэффициент при Xj, принимающий значение 0 или 1; h0 ¹0, hk= 1, и пусть n - наименьшее целое положительное число, для которого многочлен Хn - 1 делится на h(X).
Кроме того, многочлен g(x)=(Xn-1)/h(X)
Тогда решения рекуррентных соотношений
k
S hj *ai+j=0
j=0
в виде последовательности элементов а0,а1,аi,...an-1 периодичны с периодом n и совокупность, составленная из первых периодов всех возможных решений, рассматриваемых как многочлены по модулю (Хn-1),т.е.
a(X)= а0*Xn-1+ а1*Xn-2 + ….+аn-2*X+ аn-1.
совпадает с идеалом, порожденным многочленом g (X) в алгебре многочленов по модулю (Хn - 1). Доказательство этой теоремы можно найти в книге Питерсон У, Уэлдон Э. «Коды, исправляющие ошибки».
Заметим, что если при таком определении многочлена а(Х) элементы а0,а1,а2,... вычисляются в порядке возрастания номеров, то коэффициенты многочлена а(Х) вычисляются, начиная с коэффициентов при степенях высших порядков. Следует также отметить, что вид многочлена
k
h(X)=S hj *xj=0
j=0
определяет конфигурацию обратных связей (отводов) hj в генераторе со сдвиговым регистром. Другими словами, если у многочлена h(X) коэффициент hj= 1, это означает, что отвод hj в схеме генератора присутствует, если же у многочлена h(X) коэффициент hj = 0, то отвод hj в схеме генератора отсутствует. В [Питерсон У, Уэлдон Э. «Коды, исправляющие ошибки»] показано, что в качестве h(Х) необходимо выбирать неприводимый примитивный многочлен. При таком выборе многочлена h(X) со старшей степенью m генератор обеспечивает выдачу псевдослучайной последовательности двоичных чисел с максимально возможным периодом 2m - 1 .
Рассмотрим в качестве примера трехразрядный сдвиговый регистр с линейной обратной связью, построенный в соответствии с неприводимым примитивным многочленом
h(Х) = X3 + X2 + 1,
где коэффициенты h3=1, h2 = 1, h1 = 0, h0=1.
Пусть ключом является 101. Регистр начинает работать с этого состояния; последовательность состояний регистра приведена на рис.
Регистр проходит через все семь ненулевых состояний и снова возвращается в свое исходное состояние 101. Это - наиболее длинный период данного регистра с линейной обратной связью. Такая последовательность называется последовательностью максимальной длины для сдвигового регистра (Maximal Lenght Shift Register Sequence - MLSRS). Питерсон и Уэлдон показали, что при любом целом m существует m-битовая последовательность MLSRS с периодом 2m - 1. В частности, при m =100 последовательность будет иметь период 2100 - 1 и не повторится 1016 лет при передаче ее по линии связи со скоростью 1 Мбит/с.
В данном примере выходной последовательностью (гаммой шифра) Гш сдвигового регистра с обратной связью является последовательность 1010011, которая циклически повторяется. В этой последовательности имеется четыре единицы и три нуля, и их распределение настолько близко к равномерному, насколько это возможно в последовательности, имеющей длину 7. Если рассмотреть пары последовательных битов, то пары 10 и 01 появляются по два раза, а пары 00 и 11 - один раз, что опять оказывается настолько близким к равномерному распределению, насколько это возможно. В случае последовательности максимальной длины для m-разрядного регистра это свойство равнораспределенности распространяется на тройки, четверки и т.д. битов, вплоть до m-битовых групп. Благодаря такой близости к равномерному распределению последовательности максимальной длины часто используются в качестве псевдослучайных последовательностей в криптографических системах, которые имитируют работу криптостойкой системы одноразового шифрования.
Хотя такая криптографическая система осуществляет имитацию заведомо криптостойкой системы одноразового шифрования, сама она не отличается стойкостью и может быть раскрыта за несколько секунд работы компьютера при условии наличия известного открытого текста [Диффи У. Хеллман М.Э. «Защищенность и имитостойкость. Введение в криптографию»].
Если отводы регистра с обратной связью зафиксированы, то для нахождения начального состояния регистра достаточно знать m битов открытого текста. Чтобы найти m битов ключевого потока, m битов известного открытого текста складывают по мо: дулю 2 с соответствующими m битами шифртекста. Полученные m битов дают состояние сдвигового регистра с обратной связью в обратном направлении на некоторый момент времени. Затем, моделируя работу регистра назад, можно определить его исходное состояние.
Если отводы регистра с обратной связью не фиксированы, а являются частью ключа, то достаточно 2m битов известного открытого текста, чтобы сравнительно быстро определить расположение отводов регистра и его начальное состояние. Пусть S(i) -вектор-столбец, состоящий из m символов 0 и 1, который определяет состояние регистра в i-й момент времени. Тогда
S(i + 1) = A*S(i) mod 2,
где А — матрица размером m x m, определяющая положение отводов регистра с обратной связью.
Для трехразрядного регистра
| 1 0 1 |
А = | 1 0 0 |
| 1 0 1 |
Матрица А всегда имеет следующую структуру: в ее первой строке отражена последовательность отводов в регистре, непосредственно под главной диагональю располагаются единицы, а в остальных позициях располагаются нули.
2m битов известного открытого текста позволяют вычислить 2т последовательных битов ключевого потока. Для упрощения обозначений предположим, что это - первые 2 m битов ключевого потока. Следовательно,
• S(1) - первая группа m известных битов ключевого, потока;
• S(2) - следующая группа (начиная с номера 2) из m известных битов ключевого потока;
• S(m+1) - последняя группа из m известных битов ключевой потока.
Далее можно образовать две матрицы размером m x m:
X(1) = [S(1), S(2), ... S(m)]
X(2) = [S(2), S(3), ..., S(m+1)]
которые связаны соотношением X(2) = A*X(1)mod2.
Можно показать, что для любой последовательности максимальной длины матрица Х(1) всегда несингулярна, поэтому матрицу А можно вычислить как
А = Х(2)[Х(1)]-1 mod 2.
Обращение матрицы Х(1) требует (самое большее) порядка m3 операций, поэтому легко выполняется при любом разумном значении m.
Для криптографии последовательности максимальной длины MLSRS можно сделать более криптостойкими, используя нелинейную логику. В частности, предложен вариант [Диффи У. Хеллман М.Э. «Защищенность и имитостойкость. Введение в криптографию»], в котором в качестве ключевого потока используется нелинейно "фильтрованное" содержимое сдвигового регистра, а для получения последовательности максимальной длины - линейная обратная связь (см. рис.).
Функция f должна выбираться так, чтобы обеспечить хороший баланс между нулями и единицами, а фильтрованная последовательность имела распределение, близкое к равномерному. Необходимо также, чтобы фильтрованная последовательность имела большой период. Если (2m - 1) является простым числом (как в примере: при m = 3 имеем 23 - 1 = 7), то фильтрованная последовательность может иметь период (2m - 1) (при выборе структуры сдвигового регистра в соответствии с неприводимым примитивным многочленом h(Х) степени m).
К таким значениям m относятся, в частности, следующие: 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607, 1279, 2203, 2281, а полученные таким образом простые числа называются простыми числами Мерсенна.
Несмотря на то, что фильтрованную выходную последовательность обычно нельзя получить с помощью m-разрядного сдвигового регистра с линейной обратной связью, ее всегда можно получить с помощью сдвигового регистра большей длины с линейной обратной связью [Месси Дж. П. «Введение в современную криптологию»]. Регистр длиной (2m - 1) всегда позволит это сделать, а иногда пригоден и более короткий регистр.
Еще более привлекательно использование в цепи обратной связи нелинейной логики, однако теория таких схем недостаточно хорошо освещена (в открытой литературе).