Биоинформатика
БИОИНФОРМАТИКА, научное направление на стыке математики, биологии, физики полимеров и биохимии, изучающее структуру, функцию и эволюцию биологических макромолекул (белков, ДНК и РНК). Возникло в конце 20 века. Важнейшие задачи биоинформатики: исследование последовательности мономеров и пространственной структуры биологических макромолекул; идентификация генов и регуляторных сигналов в нуклеотидных последовательностях; предсказание структуры и функции белков; выявление и моделирование метаболических путей и регуляторных взаимодействий в живой клетке. Биоинформатика активно занимается также проблемами молекулярной эволюции. Среди используемых математических подходов - теория алгоритмов, в особенности методы анализа символьных цепей (например, нуклеотидных и аминокислотных последовательностей), теория графов, вычислительная геометрия, теория дифференциальных уравнений, теория вероятностей, математическая статистика и распознавание образов. В биоинформатике анализируются также данные об экспрессии генов, концентрации белков в клетке, взаимодействия между белками и между белками и нуклеиновыми кислотами, данные о точечных заменах в белках и нуклеиновых кислотах, частотах аллелей в популяциях и др.
Реклама
В биоинформатике можно выделить статистический, сравнительный и системный подходы. В основе первого лежит предположение о том, что наблюдаемые явления, которые не сводятся к простым вероятностным моделям, имеют функциональное значение. Например, при распознавании кодирующих белок областей генома используют характерные периодичности в ДНК, а при предсказании пространственной структуры белков - периодичности в аминокислотных последовательностях, характерные для основных типов их вторичной структуры. Сравнительный подход основан на сопоставлении однородных данных из разных организмов и выделении общих элементов. При этом предполагается, что необходимость сохранения структуры и функции таких элементов, как, например, каталитические центры ферментов и пространственная структура РНК, определяет их устойчивость (неизменяемость) в ходе эволюции. Системный подход состоит в привлечении разнородных данных при анализе одного объекта. Так, при предсказании функции белка в клетке используют сравнение его аминокислотной последовательности с последовательностями аминокислот в уже изученных белках, сведения о пространственной структуре белка и его взаимодействиях с другими белками, об экспрессии гена, кодирующего этот белок и тому подобное. Применение комплекса биоинформатических методов даёт возможность составить общее представление о физиологии организма путём компьютерного анализа его генома. В свою очередь это позволяет целенаправленно проводить его дальнейшее экспериментальное изучение при существенной экономии времени, труда и материальных затрат.
В более широком понимании к биоинформатике относят исследования математическими и компьютерными методами всех информационных процессов и взаимодействий в живых организмах: моделирование нервной системы, зрения, слуха, мышечной активности, метаболических процессов и информационных взаимодействий в иммунной системе; математическое исследование экологических систем; исследование сигнальных систем животных и растений; создание компьютерных систем поддержки биологических экспериментов, баз данных по биологии и медицине, алгоритмов автоматического реферирования биологических текстов.
Лит.: Математические методы для анализа последовательностей ДНК. М., 1999; Гельфанд М. С., Любецкий В. А. Биоинформатика: от эксперимента к компьютерному анализу и снова к эксперименту // Вестник РАН. 2003. Т. 73. №11 ; Гасфилд Д. Строки, деревья и последовательности в алгоритмах: Информатика и вычислительная биология. СПб., 2003; Koonin Е. V., Galperin М. Y. Sequence-evolution-function: computational approaches in comparative genomics. Boston, 2003.
М. С. Гельфанд.