Применение теории вероятностей при анализе днк

Объект исследования: анализ ДНК.

Результаты, полученные лично автором: рассмотрены некоторые методы теории вероятностей при анализе ДНК.

С середины 1980-х годов анализ ДНК начал использоваться в судебных разбирательствах для установления отцовства, родства между людьми, а также для определения вины или невиновности подозреваемых.

Суть этого анализа заключается в сравнении ДНК детей и их предполагаемых отцов либо в сравнении ДНК, взятого из образцов, найденных на месте преступления, с ДНК подозреваемого или подозреваемых. Методы анализа ДНК постоянно улучшались, и сегодня он служит основным доказательством во многих судебных процессах ввиду значительного разнообразия ДНК разных людей, даже если они принадлежат к одной и той же этнической группе. Эти методы стали очень популярными после использования в некоторых судебных процессах, а также после выхода на экраны криминальных сериалов. Не все знают, что при анализе ДНК используются методы теории вероятностей, которые дали начало отдельной дисциплине – судебной статистике.

Мы не будем говорить о том, как именно анализируется ДНК, но расскажем, каким образом теория вероятностей помогает определить виновность подозреваемого. Рассмотрим упрощенный и не вполне реалистичный пример, который, однако, будет вполне показательным. Было совершено преступление, полиция собрала образцы ДНК и задержала подозреваемого, у которого также были взяты образцы ДНК на анализ. Допустим, что каждый образец ДНК представляет собой простой тип данных. Хотя в реальном суде чаще всего рассматривается несколько возможных исходов, мы ограничимся двумя вариантами: подозреваемый виновен (В) или невиновен (Н). Суд примет окончательное решение по результатам анализа ДНК. Следовательно, цель анализа – выбрать одну из двух следующих гипотез.

1. Оба образца принадлежат одному человеку (В).

2. Образцы принадлежат разным людям (Н).

Обозначим через Еv ситуацию, в которой образец ДНК, взятый на месте преступления, совпадает с образцом ДНК подозреваемого, через S – остальные ситуации.

Нужно использовать теорему Байеса, согласно которой для двух данных событий А и В и условной вероятности события А при условии наступления события В Р(А|В) и при условии, что Р(В) ≠ 0, справедливо равенство:

Р(А\В) = (Р(В\А)Р(А))/Р(В).

Использовав условные вероятности и теорему Байеса, получим отношение вероятностей того, что подсудимый виновен, и того, что он невиновен:

применение теории вероятностей при анализе днк - student2.ru

Из этого выражения следует, что нужно определить две основные вероятности: вероятность события Еv в случае, если подозреваемый виновен, и вероятность наступления этого события в случае, если он невиновен. Здесь недостаточно рассмотреть только вероятность наступления этого события в случае, когда подозреваемый невиновен, и на основании малого значения этой вероятности сделать вывод о виновности подозреваемого. Также следует принять во внимание вероятность наступления этого события в случае, если подозреваемый виновен. Следует отметить, что эти две вероятности не соответствуют противоположным событиям, и обе они могут быть очень малыми.

Подобные тонкости рассматривают адвокаты и прокуроры, и неверное толкование этих понятий теории вероятности может привести к тому, что невиновный окажется в тюрьме, а виновный – на свободе. Приемы, которые используют адвокаты, имеют мало общего с теорией вероятности и касаются трактовки вероятностей в пользу той или иной стороны. Выражение, приведенное выше, также показывает зависимость вероятности того, что подсудимый виновен, от результатов другой процедуры (S), которую не следует недооценивать.

Определение вероятностей наступления события Еv в случае, когда подозреваемый виновен или невиновен, является одним из источников противоречий в судебных процессах, в которых используется анализ ДНК. Методы анализа позволяют максимально точно установить вину подсудимого: так, используются референтные группы, разбитые по национальности и полу. Однако во многих случаях эту задачу решить не удается, так как вся информация о том, как именно были сформированы базы данных и проведены вычисления, обычно недоступна. Кроме того, при анализе ДНК, как правило, рассматривается множество маркеров, поэтому вероятность того, что все они присутствуют в образце, равна произведению отдельных вероятностей, если мы будем считать, что все эти маркеры присутствуют в ДНК независимо друг от друга (этот вопрос является предметом для дискуссий).

Материал поступил в редколлегию 25.04.17

УДК 511.36

И.В. Бондарева

Научный руководитель: профессор кафедры «Высшая математика»,

д.-ф.-м.н. В.Х. Салихов

[email protected]

Наши рекомендации