Компьютерщики привыкли описывать и решать сложные арифметические задачи. Однако, если они имеют дело с вопросами биологии, проблемы вряд ли можно привести к гладким вычислениям. Поэтому компьютерные алгоритмы должны быть максимально адаптированы и найдены приближенные решения. Биоинформатик профессор Дэниел Хьюсон работает над программами, помогающими систематизировать и обрабатывать генетическую информацию.
Биоинформатика делает знания о генах систематически применимыми
В биологии производится куча данных - например, в генетике при анализе генома человека, животных или растений. Во многих организмах генетический материал распределен по множеству хромосом, которые могут содержать тысячи генов, каждый из которых состоит из миллионов строительных блоков, в используемых генетиками символах из четырех букв А, Т, С и G. Если вы хотите отдельные гены или сравнить даже большие части генома двух живых существ в деталях, трудно уследить за длинными строками алфавита беспорядок. Биоинформатика может помочь. В этой области исследований разрабатываются базы данных и программы, которые делают поток данных управляемым и позволяют ученым делать содержательные сравнения и выводы. Профессор Даниэль Хьюсон из Института компьютерных наук им. Вильгельма Шикарда при Тюбингенском университете работает над проблемами биоинформатики, исследуя генетическую историю эволюции и семейные отношения живых существ - сравнительно «старую» область биоинформатики, по словам исследователя. с улыбкой. Потому что даже самые старые исследования в области биоинформатики восходят к 1960-м годам.
Отнесение организмов к родственникам на основании молекулярных данных
В то время биоматематика начала приписывать организмам семейные отношения на основе молекулярных данных. Когда Дэниел Хьюсон, который первоначально занимался исследованиями в качестве математика, прежде чем заняться биоинформатикой, говорит сегодня о деревьях, он обычно имеет в виду не растения, а ветвящиеся деревья. Они создаются на бумаге или на экране компьютера при записи семейных отношений живых существ. «Идея, стоящая за этим, заключается в том, что в ходе эволюции разные живые существа отделились от общего предка, но больше не сошлись», - объясняет Хьюсон. Для многих контекстов это почти правильно. Были также предприняты попытки классифицировать бактерии с точки зрения истории эволюции таким образом. В молекулярной биологии для этой цели выбирают малую субъединицу так называемых рибосом, которые имеются во всех клетках. Эти клеточные органы участвуют в важной задаче чтения ДНК и преобразования ее в белки. Однако быстро достигались пределы метода.
Структура обычных ветвящихся деревьев неверна, когда бактерии родственны. Не все участки генома имеют одинаковую эволюционную историю», - говорит исследователь. Высшие организмы образуют половые клетки, т. е. яйцеклетки и сперматозоиды, которые постоянно собираются в потомстве. Одноклеточные бактерии не образуют половых клеток. Но они также могут обмениваться и изменять свой генетический материал: две бактериальные клетки прикрепляются друг к другу и обмениваются частями своего генетического материала через соединение. Таким образом, например, устойчивость к антибиотикам может передаваться от одной бактерии к другой. «Геном, то есть ДНК всего организма, складывается как некая мозаика. Бактериальный геном обычно не развивается от одного предка», - объясняет Дэниел Хьюсон. Если вы хотите показать отношения между бактериями, вы получите сложные сети, а не обычные ветвящиеся деревья. Хьюсон разработал программу «SplitsTree» для описания таких сетей. «Если вы используете классический метод ветвления дерева, вы всегда получаете древовидную структуру. Древовидная структура получается из сетей только в том случае, если данные также поддерживают эту структуру», - объясняет исследователь.
91 Бактериальные геномы под увеличительным стеклом
91 Дэниел Хьюсон и его коллега Стефан Шустер из Института биологии развития им. Макса Планка в Тюбингене сравнили бактериальные геномы, полная последовательность которых была определена другими рабочими группами, и сравнили их взаимоотношения исключительно на основе генетических данных с помощью программы "Splitstree". «В целом мы были очень удовлетворены тем, что этот метод поддерживает общую картину происхождения бактерий, такую как положение архей как отдельной, очень оригинальной группы, не принадлежащей к бактериям, которая также была получена из других свойств. ", - говорит Хьюсон. Археи - это одноклеточные существа, которые часто живут в экстремальных условиях, при температуре около точки кипения воды, с высокой концентрацией соли или в очень кислой среде. В сети Хьюсона есть не только линии, но также прямоугольники и трапеции, из чего видно, что они связаны друг с другом в двух направлениях. Метод, разработанный Хьюсоном, сравнивает геномы в парах, буква за буквой последовательностей ДНК. «Предполагается, что чем больше фрагментов последовательности совпадает, тем теснее родственны организмы. У бактерий порядок расположения генов не очень полезен, важнее содержание генов», - говорит Хьюсон.
За предыдущей общей систематической классификацией организмов стоят прежде всего сведения о внешних формах, морфологии живых существ, их анатомии, строении их тканей и их метаболизме. «Мы, с другой стороны, используем гены только как источник информации о семейных отношениях», - говорит Хьюсон. Кроме того, некоторые допущения в моделях эволюции также упрощаются: «Например, мы предполагали, что мутации происходят везде с одинаковой частотой, что на практике неверно».. Если бы разные методы давали разные результаты, нужно было бы исследовать прежде всего те места, где семейные задания отличаются друг от друга.
Биоинформатик Дэниел Хьюсон работал на известного молекулярного биолога Крейга Вентера, прежде чем он пришел в Тюбингенский университет. В то время Вентер был генеральным директором компании Celera Genomics в Роквилле, штат Мэриленд, которая впервые расшифровала геном человека. Дэниел Хьюсон видит в биоинформатике действительно новую область, отличную от информатики: «В чистой информатике задача состоит в том, чтобы четко описать проблему и разработать алгоритмы, т. е. расчетные инструкции, которые могут решить эту проблему. Однако в биологии проблемы не могут быть описаны так четко», - объясняет исследователь. Во-первых, они будут сформулированы очень упрощенно. «Но в важном втором раунде необходимо много поправочных факторов, чтобы достаточно хорошо решить биологическую проблему», - говорит Хьюсон. Детальные биологические знания играют здесь важную роль. Дэниел Хьюсон быстро переходит от фундаментальных исследований к практическому применению. Для своей программы «SplitsTree» он запрограммировал реализацию на Java, чтобы сделать сетевой метод расчета и визуализации генетических отношений живых существ доступным для биологов на веб-сервере. «В результате наших исследований мы имеем более-менее довольных биологов», - подмигивает исследователь.