Лингвистическая стеганография
Введение
Стеганография – это методы сокрытия информации в такой форме, когда сам факт наличия информации не очевиден.
Открытый текст после стеганографических преобразований, как правило, называется стеганограммой (стегограммой).
Стеганография подразделяется на лингвистическую и технологическую.
Лингвистическая стеганография
Методы лингвистической стеганографии связаны непосредственно с сокрытием информации в текстовых документах. Обычно после применения лингвистических методов стеганограмма имеет вид документа, который может нести любую отвлекающую смысловую нагрузку для читающего и неочевидную полезную информацию для истинного получателя.
Лингвистические стеганограммы подразделяются на две основные категории: условное письмо и семаграммы. Существуют три вида условного письма: жаргонный код, пустышечный шифр и геометрическая система.
В жаргонном коде слова имеют двойное значение: одно общепринятое, а другое известно только посвященным. Стеганограмма имеет вид текста, который должен иметь как можно более неприметное и правдоподобное содержание.
Сначала он может содержать лишь упоминание об обоюдно известных событиях и лицах: “Я посетил человека, с которым Вы обедали на прошлой неделе”. А далее может идти отрезок текста, понятный только адресату, например, один преступник сообщает об аресте другого: “Этот человек попал в больницу”, вместо слова “тюрьма” используя слово “больница”.
Строгих математических методов обнаружения жаргонного кода не существует, как, впрочем, и для раскрытия других лингвистических стеганограмм. Поэтому акцент делается на профессионализм исследователя, который должен уделять повышенное внимание к искусственным оборотам и тяжелым фразам.
В книге Д. Кана “Coderbreakers” приведен следующий интересный случай со вскрытием жаргонного кода времен Первой мировой войны. У одного английского цензора вызвали подозрения слишком крупные ежедневные телеграфные заказы на сигары (главным образом из портовых городов Англии) от “двух голландских дельцов”. Однажды из Портсмута они заказали 10 тысяч сигар “Корона”. На следующий день из Плимута они потребовали крупную партию более дешевых сигар. Затем в течение одной ночи в заядлых курильщиков превратились все жители Ньюкасла. Казалось, всё население прибрежных районов Англии внезапно почувствовало непреодолимую тягу к курению, так чудовищно возрос спрос на сигары. По предложению цензора была предпринята проверка, в результате которой “двое голландских дельцов” оказались немецкими разведчиками, а их заказы условным письмом, в котором заказ на 5 тысяч сигар для Ньюкасла означал, что в этом порту находятся пять крейсеров. 30 июля 1915г. оба немецких разведчика были расстреляны.
На этом примере хорошо виден недостаток данного метода, который заключается в том, что жаргонный код почти всегда удается вскрыть сразу после обнаружения. Более того, прослеживается следующая закономерность: чем менее подозрительно внешнее содержание жаргонного кода, тем легче он поддается вскрытию. Ибо чем больше жаргонный код перегружен всякими правдоподобными подробностями, тем больше он содержит данных для раскрытия его подлинного смысла.
Другим видом условного письма является пустышечный шифр. При его применении в тексте имеют значение лишь некоторые определенные буквы или слова. Например, читаются каждое пятое слово или первая буква каждого слова, в то время как все остальные буквы или слова служат в качестве “контейнера” для сокрытия значимого текста. Стеганограммы, созданные на основе пустышечного шифра обычно выглядят еще более искусственно, чем жаргонный код.
Слабая стойкость пустышечного шифра к криптоанализу ограничивает область его применения, хотя простота метода привлекает обычных обывателей для его использования в частной переписке
Примером могут служить ряд писем американского солдата посланных во время Второй мировой войны, цель которых была попытка (правда неудачная) сообщить о своем месте службы семье.
Пользуясь заранее условленной системой переписки со своими родителями, молодой солдат пытался довести до их сведения, что находится в Тунисе. Для этого в пяти письмах домой он использовал в качестве второго инициала своего отца сначала “Т”, затем “У”, “Н”, “И” и “С”. К несчастью, эти письма были получены в другом порядке, а беспечный солдат забыл проставить на письмах даты. Обезумевшие родители написали ему, что они перерыли весь свой атлас, но нигде не смогли найти “Нутси”!
В 1943 г. подобные попытки настолько участились, что руководству ВМС США пришлось предупредить моряков о том, что пользование “семейными кодами” может привести к суровому наказанию.
Третьим видом условного письма является геометрическая система. При ее применении имеющие значение слова располагаются на странице в определенных местах или в точках пересечения геометрической фигуры заданного размера.
Известен случай, когда в период Второй мировой войны пленные немецкие офицеры-подводники в своих письмах домой посылали тайные сообщения, делая небольшие пробелы после каждой значимой буквы. Один бдительный английский цензор заметил, что эти маленькие пробелы попадаются в самых неестественных местах, даже в середине слогов. Оказалось, что в своих скрытых посланиях немцы сообщали о тактике, применявшейся англо-американскими союзниками в борьбе с немецкими подводными лодками, а также об их технических недостатках.
Вторую категорию лингвистических стеганограмм составляют семаграммы – тайные сообщения, в которых шифрообозначениями являются любые символы, кроме букв и цифр. Эти сообщения могут быть переданы, например, в рисунке, содержащем точки и тире для чтения по коду Морзе.
Однажды в нью-йоркском цензурном отделении перевели все стрелки в партии часов предназначенной для отправки, опасаясь, что их положение может заключать в себе какое-то сообщение.
Исследование сообщений, скрытых лингвистическими средствами или, точнее, подозрительных в этом отношении, является весьма мучительным процессом.
Часто криптоаналитик не может даже сказать, скрывается ли некое содержательное сообщение за неуклюже составленным или просто безграмотным текстом. И даже если он совершенно уверен, что такое сообщение там спрятано, найти его зачастую просто невозможно. Обычно в распоряжении цензора имеется всего одно сообщение, а вероятные слова, на которые можно опереться при криптоанализе, отсутствуют начисто.
В начале Второй мировой войны американской цензуре даже рекомендовалось не работать над предполагаемой криптограммой свыше получаса, исходя из того, что если за это время криптоаналитик не вскрыл ее, он вообще никогда ее не прочтет. Эти непрочитанные сообщения представляли собой трудную проблему для цензоров. В них могла содержаться важная секретная информация, и тогда их не следовало отправлять дальше по адресу. Но пока подозрительное послание не было дешифровано, вина его отправителя оставалась недоказанной. Тем не менее, иногда письма специально задерживали или видоизменяли, чтобы предполагаемая тайная информация не дошла до адресата.