Компьютерное моделирование молекулярно-генетических и биохимических процессов
Компьютерное моделирование молекулярно-генетических и биохимических процессов является самым молодым и перспективным направлений в развитии биомедицинских наук. В данной области знаний продолжается дифференциация наук по предмету и объекту исследований. Компьютерным моделированием молекулярно-генетических и смежных процессов занимаются такие науки как биоинформатика, системная биология, геномика, эволюционная генетика, протеомика, транскриптомика, метаболомика и другие, еще более узкоспециализированные дисциплины, в каждой из которых работают тысячи и десятки тысяч исследователей. Такой высокий уровень дифференциации наук связан с колоссальной сложностью и огромным объемом молекулярно-генетических данных. Например, работа с последовательностью ДНК даже простейших эукариот - дрожжей S. cerevisiae – не была бы возможна без использования компьютерных методов, не говоря уже о геноме человека.
Для примера, в таблице представлены задачи, решаемые биоинформатикой.
Источник данных | Объем данных | Задачи |
Секвенированные последовательности ДНК | ~40 млн. последовательностей, 1012 пар оснований | Функциональная аннотация |
Белковые последовательности | ~5.5 106 последовательностей (~300 аминокислот каждая) | Сравнительный анализ. Выявление консервативных мотивов |
Структуры макромолекул | 50000 структур (~3000 атомных координат каждая) | Предсказание, выравнивание, измерение геометрии, докинг |
Геномы | Около 1200 геномов прокариот, более 160 геномов эукариот | Сборка полных геномов; Функциональная аннотация; Сравнительный анализ |
Экспрессия генов в различных тканях, стадиях развития, состояний организма и т.д. | Сотни тысяч образцов c тысячами вариантов измерений для десятков тысяч генов. ~1013 измерений. | Анализ механизмов регуляции коэкспрессирующихся генов. Связь с последовательностями, структурными и биохимическими данными. |
SNP (однонуклеотидные мутации в ДНК) | Только одна база данных dbSNP содержит информацию о 108 мутациях в 23 геномах. | Анализ связи с заболеваниями |
Молекулярные взаимодействия, метаболические пути и генные сети | Более 106 молекулярных взаимодействий описано в публикациях. Более ста тысяч метаболических путей и генных сетей представлено в базах данных. | Моделирование молекулярно-генетических процессов и систем |
Публикации | Десятки миллионов публикаций | Поиск и извлечение знаний |
Знание пространственной организации белковых молекул является ключом не только к пониманию их функций и механизма работы, но и основой для разработки эффективных и безопасных лекарственных средств. В то же время, определять структуру белков в прямом эксперименте не всегда возможно или целесообразно — из-за сложности, дороговизны и ограниченности возможностей экспериментальных методик. Однако иногда удаётся преодолеть эти сложности, подойдя к проблеме «с другого конца»: структуру биомакромолекул можно «предсказать», используя теоретические подходы — основанные на физических или эмпирических приближениях. В этой статье даётся теоретическое обоснование возможности «предсказывать» структуру белков и коротко рассматриваются основные подходы к этой задаче.
Фармацевты и врачи, например, заинтересованы в производстве и выпуске на рынок новых поколений лекарственных средств. Однако в наше время уже нельзя рассчитывать на случайный успех, и нужно хорошо разбираться в молекулярных механизмах действия проектируемого лекарства, — направленного, скорее всего, на взаимодействие с каким-нибудь белком (рецептором или ферментом) в человеческом организме. Проектирование нового лекарства с учётом атомарного строения молекул-«мишеней», на которые это лекарство будет действовать — наукоёмкий и сложный процесс, называемый драг-дизайном.
Молекулярно-генетические данные хранятся в специализированных банках данных (все на английском языке):
- крупнейшая база генетических данных – GeneBank;
- удобная в навигации база генетических последовательностей – Ensembl
- удобный доступ к полным геномам через сайт Европейского института биоинформатики - http://www.ebi.ac.uk/genomes/
- крупнейший банк белковых данных – UniProt.org
- крупнейший банк данных о структуре биологических макромолекул http://www.pdb.org/