Исследователи из Университета штата Джорджия создали молниеносное компьютерное программное обеспечение, которое может помочь странам отслеживать и анализировать пандемии, такие как вызванная COVID-19, до того, как они распространится по всему миру со скоростью лесного пожара.
Группа исследователей в области компьютерных наук и математики заявляет, что их новое программное обеспечение на несколько порядков быстрее существующих компьютерных программ и может обрабатывать более 200 000 новых геномов вирусов менее чем за два часа. Затем программа строит четкое визуальное дерево штаммов и мест их распространения. Это предоставляет информацию, которая может быть бесценной для стран, принимающих ранние решения о блокировках, карантине, социальном дистанцировании и тестировании во время вспышек инфекционных заболеваний.
«Будущее инфекционных вспышек, несомненно, будет в значительной степени зависеть от данных», - сказал Александр Зеликовский, профессор компьютерных наук из штата Джорджия, который работал над проектом.
Новое программное обеспечение было создано совместно с Павлом Скумсом, доцентом кафедры информатики, Марком Гриншпоном, старшим преподавателем кафедры математики и статистики, Даниилом Новиковым, кандидатом компьютерных наук. студент и два бывших доктора философии штата Джорджия. студенты - Сергей Князев (ныне постдокторант Калифорнийского университета в Лос-Анджелесе) и Пелин Айсер (ныне постдокторант Швейцарского федерального технологического института, ETH Zürich).
Их статья с описанием нового подхода «Масштабируемая реконструкция филогении SARS-CoV-2 с повторяющимися мутациями» была опубликована в Journal of Computational Biology.
«Пандемия COVID-19 стала беспрецедентной проблемой и возможностью для ученых», - сказал Скумс, отметив, что никогда прежде исследователи во всем мире не секвенировали так много полных геномов любого вируса. Штаммы SARS-CoV-2 загружены в бесплатную глобальную базу данных GISAID (https://www.gisaid.org/hcov19-variants/), где про них можно сказать Зеликовский. «Ученые по всему миру, вероятно, секвенируют новый вариант почти каждый час».
Зеликовский сказал, что этот поразительный объем данных позволяет ученым увидеть эволюцию вируса в действии в режиме реального времени - если у нас есть программное обеспечение, способное быстро его анализировать.
В первые дни пандемии, в марте 2020 года, ученые работали гораздо медленнее. Ученые думали, что вирус впервые прибыл на наши берега в штате Вашингтон в феврале. Однако более позднее секвенирование, представленное в статье Скумса и его коллег, показало дуги вирусных вариантов, путешествующих по странам и океанам. Благодаря новым исследованиям ученые узнали, что вирус, вероятно, также незаметно проник в Нью-Йорк в феврале из штаммов, происходящих из Европы.
В то время ученые секвенировали данные слишком медленно, чтобы зафиксировать истинную миграцию этого глобального вируса и его мутации в режиме реального времени.
«Программы были недостаточно быстрыми и недостаточно масштабируемыми, - сказал Скумс. «Алгоритмы не были приспособлены для обработки огромных объемов данных». По его словам, на обработку даже небольшого подмножества вирусных геномов могут уйти часы или дни.
Зеликовский, Скумс и их коллеги создали новый алгоритм секвенирования вируса под названием SPHERE (масштабируемая филогения с рекуррентными мутациями). SPHERE может быстро обрабатывать огромные объемы данных в реальном времени и создавать эволюционные деревья вируса и его мутаций. Эти визуализации можно легко понять с первого взгляда. Сама компьютерная программа находится в свободном доступе для скачивания любым исследователем в мире.
Когда исследователи применили свой алгоритм к геномам из базы данных GISAID, они обнаружили, что их подход SPHERE очень надежен в отслеживании путей распространения вируса. SPHERE может помочь ученым изучить эволюцию вируса в режиме реального времени.
«Мы видим, как мутации распространяются из страны в страну и из региона в регион», - сказал Зеликовский. «Мы можем определить, как блокировки и закрытия влияют на распространение. Это имеет последствия для государственной политики».
Алгоритм SPHERE может оказаться бесценным во время будущих пандемий.
«Вы можете очень быстро отследить цепочки передачи», - сказал Зеликовский. Наблюдение за этими цепочками поможет правительствам принимать обоснованные решения в отношении социальной политики, такой как дистанцирование или блокировка во время высокой передачи инфекции.
SPHERE также может показать влияние различных подходов к вспышкам. Например, сказал Скумс, Швеция заняла более мягкий подход к пандемии COVID-19, чем другие страны Северной Европы. Анализ данных секвенирования показывает, что у шведов более длинные «цепочки передачи». Это означает, что в Швеции один штамм способен заразить гораздо больше людей, одного за другим.
«Опасность длинных цепей в том, что может появиться новый штамм», - сказал Зеликовский. «И один из этих штаммов может быть вариантом, который очень хорошо заражает людей».
Такого рода идеи помогут нам, если мы столкнемся с новой глобальной пандемией.
«Инструменты, которые мы и другие разработали, можно использовать где угодно при любой вспышке», - сказал Зеликовский. «В этом вся прелесть информатики».