Программное обеспечение, оптимизированное для Mira, способствует разработке мини-белков для лекарств и материалов

Программное обеспечение, оптимизированное для Mira, способствует разработке мини-белков для лекарств и материалов
Программное обеспечение, оптимизированное для Mira, способствует разработке мини-белков для лекарств и материалов

Когда такие болезни, как рак и СПИД, ежегодно поражают миллионы людей, а редкие, но смертельные инфекции, такие как лихорадка Эбола, развиваются быстрее, чем лечение, гонка за созданием эффективных лекарств превращается в спринт.

Вот почему исследователи из Вашингтонского университета (UW) используют один из самых мощных суперкомпьютеров страны, 10-петафлопсный Mira в Аргоннском вычислительном центре лидерства (ALCF), чтобы улучшить свое программное обеспечение для проектирования белковых структур для точно так же виртуально разрабатывайте и тестируйте мини-белки, называемые пептидами. ALCF - это пользовательский ресурс Управления науки Министерства энергетики США.

Пептиды состоят из цепочек аминокислот - 20 основных органических соединений, содержащихся в белках, - но они составляют примерно одну десятую размера белков. Пептиды могут связываться с мишенями на клетке (обычно с рецепторами или ферментами, которые сами являются белками) и таким образом регулировать клеточные функции, такие как поглощение питательных веществ или связь между клетками. Структура пептида, в том числе то, как его ветви аминокислот складываются в трехмерные конформации, определяет, с какими мишенями он может «подходить» или связываться.

С помощью вычислительного моделирования и тестирования пептидов в больших количествах лаборатория UW Baker под руководством главного исследователя Дэвида Бейкера предполагает создание пептидов с уникальными структурами, не встречающимися в природе. Эти «дизайнерские» пептиды могут однажды составить новый класс терапевтических препаратов, более эффективных и дающих меньше побочных эффектов. Они также могут найти широкое применение в технологиях и материалах, основанных на органических соединениях, таких как самосборные или сверхпрочные материалы.

Подходит

Многие лекарства сегодня представляют собой «маломолекулярные» препараты, в которых молекулы активных ингредиентов легко растворяются и диффундируют, потому что они достаточно малы, чтобы пересекать ключевые мембраны в организме.

«Большинство лекарств вводятся системно [через систему кровообращения], даже если они должны попасть только в одно место в организме, что означает, что их нужно вводить в более высоких дозах», - сказал Викрам Маллиган, старший преподаватель Университета Вашингтона. коллега и со-главный исследователь. «Когда вводят небольшие молекулы, они могут прикрепляться ко многим различным белкам в организме, потому что их размер позволяет им взаимодействовать со многими мишенями, а не только с намеченной целью, вызывая больше побочных эффектов».

Маллиган назвал химиотерапию хорошим примером такого эффекта. «Когда вы на химиотерапии, вы очень больны, потому что лекарство влияет на все ваше тело, а не только на рак».

В течение более 20 лет Baker Lab разрабатывала инструменты компьютерного моделирования для дизайна белков, которые необходимы для создания целевых белковых препаратов, уменьшающих побочные эффекты. Используя флагманское программное обеспечение Baker Lab для определения структуры белка и секвенирования, Rosetta, пользователи могут предсказывать структуру белка по аминокислотным последовательностям и создавать новые аминокислотные последовательности для получения желаемой функции.

Однако, в то время как низкомолекулярные препараты могут вызывать нежелательные побочные эффекты, потому что они легко усваиваются организмом, белковые препараты могут иметь противоположную проблему: они могут быть слишком большими. «Преимущество белка в том, что он очень эффективен и может дать желаемый результат, - сказал Маллиган. - Недостаток в том, что белки большие. Вдобавок ко всему, у нас есть иммунная система, которая хорошо распознает чужеродные белки и устраняет их».

Пептиды нашли многообещающий компромисс, но для того, чтобы превратить эти короткие, «гибкие» цепи аминокислот в четкие, жесткие формы, которые исследователи могут настроить для конкретных целей, они должны заново изобрести свои строительные блоки аминокислот.. Наряду с «вычислительной лабораторией» Rosetta ученые Baker Lab могут синтезировать пептиды из новых искусственных аминокислот в своей физической лаборатории, а также тестировать свои окончательные конструкции белков и пептидов.

При введении искусственных аминокислот в модели пептидов количество потенциальных пептидов уникальной формы резко возрастает. Использование искусственных аминокислот также обеспечивает некоторую защиту от иммунной системы, которая в противном случае могла бы распознать естественные аминокислотные последовательности как чужеродные белки и атаковать их.

Новая глава для Rosetta

За последние полвека объем данных о структуре белков, полученных с помощью таких методов визуализации, как рентгеновская дифракция и электронная микроскопия, увеличился, а в базах данных о структуре белков хранится готовая информация о секвенировании и структуре.

Однако исследователи все еще пытаются полностью понять, как последовательность влияет на структуру, в частности, на складку. Чтобы найти наилучшую последовательность белка или пептида для определенной функции, они должны моделировать тысячи дизайнов и искать наиболее эффективный вариант. Этот поиск оптимизации требует введения ряда геометрических ограничений на атомарном уровне, которые могут влиять на свертывание и связывание. Все пространство динамики структуры белка или пептида называется его конформационным пространством.

«Это исчерпывающий подход», - сказал Юрий Алексеев, помощник специалиста по вычислительной технике ALCF. «Для моделирования конформационного пространства пептидов требуются сотни миллионов симуляций». Чтобы смоделировать новый пептид, Rosetta начинает с дизайна с одним состоянием. Работая в обратном направлении от мишени к вирусу, злокачественной клетке или другому болезнетворному агенту, исследователи определяют, какой должна быть основная конформация пептида. Они используют этот пептидный «скелет» для создания тысяч (или даже сотен тысяч) возможных аминокислотных последовательностей, которые могут поддерживать стабильные взаимодействия для этой конформации. Эти первые шаги могут быть выполнены на небольших системах, поскольку потенциальные последовательности могут генерироваться изолированно.

Однако оценка и оптимизация этих тысяч проектов требует быстрой связи между процессорными ядрами, поэтому Mira - и ее более 780 000 ядер - необходимы. Чтобы устранить побочные эффекты, исследователям нужен не только пептид, который благоприятствует или стабилен в конформации, которая будет эффективно связываться с желаемой мишенью, они также хотят пептид, который неблагоприятен для любых других конформаций, поэтому маловероятно, что он изменит конформацию и взаимодействуют с другими белками в здоровых клетках, вызывая побочные эффекты.

С помощью алгоритма проектирования с несколькими состояниями Rosetta моделирует и оптимизирует каждое конформационное состояние на отдельном ядре и ищет состояние, которое только способствует желаемой конформации. Baker Lab первоначально разработала алгоритм проектирования белков с несколькими состояниями, но он нуждается в тонкой настройке для работы с более мелкими пептидами. Поскольку Розетта использует функции потенциальной энергии для расчета взаимодействий между атомами и молекулами в белке, команда улучшает функцию энергии, чтобы ее можно было лучше применять к системам, включающим новые аминокислоты, для которых экспериментальные данные могут быть недоступны. Этот этап, уникальный для пептидов, требует разработки энергетических функций, которые не только используют существующие данные о природных белках для аппроксимации взаимодействий, но также используют законы физики, что усложняет вычислительные задачи.

«Если мы разрабатываем большой белок, и у нас есть какая-то ошибка или неточность в нашей энергетической функции, есть большая вероятность, что он усреднится по большой структуре», - сказал Маллиган. «Однако с пептидом мы рассматриваем меньшее количество взаимодействий, и ошибка может сильно испортить наш дизайн, поэтому наша энергетическая функция должна быть более точной».

Давние пользователи ALCF, в 2012 году лаборатория Baker Lab хотела перевести Rosetta, которая в то время занималась дизайном белков, с предыдущей системы Blue Gene / P на Mira, систему Blue Gene / Q. Алексеев помог портировать и протестировать Rosetta для Blue Gene/Q и посоветовал, как увеличить распараллеливание. Вычислительное время для работы с пептидами было предоставлено в рамках награды Advanced Scientific Computing Research Leadership Computing Challenge в 2014-2015 годах и награды 2015 года «Инновационное и новое вычислительное воздействие на теорию и эксперимент» (INCITE). Финансирование исследований было предоставлено Национальным институтом здравоохранения, Национальным институтом старения и Национальным научным фондом.

С момента начала последнего проекта команды INCITE Алексеев также помогает им проверить силовое поле (наборы параметров, необходимые для точного расчета функций энергии) для дизайна пептидов в сравнении с квантово-механическим моделированием. Это силовое поле значительно улучшит предсказания конструкций с использованием искусственных аминокислот.

В поисках мишеней для дизайна пептидов команда начала предварительные исследования белков на поверхности капсида ВИЧ и вирусов Эбола и Марбург, а также гистонов (также белков), участвующих в некоторых типах рака.

В долгосрочной перспективе они надеются собрать базу данных дизайнов искусственных пептидов, которая предоставит пользователям Rosetta каркас или шаблон, чтобы сократить вычислительные усилия, необходимые для оптимизации пептида для применения в медицине или материале..

Такая база данных поможет будущим усилиям по проектированию, потому что, например, получив ее, мы сможем выбрать дизайн пептида, который будет служить каркасом для перепроектирования и оптимизации для нового заболевания, а не разработан с нуля», - сказал Маллиган.