Аппаратная сторона биоинформатики: белок Sequenator для малины Pi
Вычислительная биология превратилась в рутинный лабораторный процесс, и сегодня компьютерная технология помогает анализировать широкий спектр информации о молекулярной биологии. Вот взгляд на некоторые аппаратные средства, которые помогли области биоинформатики расти с течением времени.
Биоинформатика может быть описана как область исследования, которая использует компьютерную науку, инженерию и математику для решения проблем в биологии.
Некоторая форма биоинформатики использовалась с самого начала компьютерной эры - еще в 1960-х годах вычислительные биологи использовали суперкомпьютеры и компьютерные сети для извлечения информации из наборов данных аминокислотных последовательностей для изучения белков. После окончания Второй мировой войны компьютеры стали более доступными для исследователей, а язык программирования FORTRAN, внедренный IBM, позволил неспециалистам писать программы для осуществления научных приложений.
Прежде чем это было возможно, секвенирование было трудоемким процессом, требующим экспертизы химиков. Вычислительная биология превратилась в рутинный лабораторный процесс, и сегодня компьютерная технология помогает анализировать широкий спектр информации о молекулярной биологии.
Вот посмотрите на некоторые из инструментов и аппаратных средств, используемых в биоинформатике.
Оригинальное оборудование для секвенирования
Впервые опубликованный в 1966 году, Sequenator протеина был разработан исследователем Пером Эдманом. Sequenator использовал деградацию белка для автоматизации синтеза аминокислот в пептидах и белках. Это был первый случай, когда последовательность была автоматизирована.
Блок программирования Sequenator состоял из 30-канального электронного таймера, которые были расположены последовательно, так что, когда один таймер истек через заданный промежуток времени, он запускает следующий через реле. Затем секвенсор перейдет к следующему этапу процесса секвенирования.

Блок-схема модуля программирования. Изображение предоставлено Школой медицинских исследований Сент-Винсента
Подсчет и синхронизация контролировались тремя счетчиками Десятилетия Филлипса, которые получали свои сигналы от генератора импульсов. Блок программирования может вручную сбросить счетчики импульсов и программные кадры, сбросить счетчик сцены, выбрать ступень, прервать генератор импульсов и прервать выходные команды.
Генератор импульсов времени управлялся миниатюрной лампочкой, которая светилась на светочувствительном диоде, при этом свет прерывался вращающимся диском с диаметральными отверстиями. Это привело к генерации импульсов в 20 импульсов в минуту.

Изображение предоставлено школой медицинских исследований Сент-Винсента
Это очень старая школа, но также интересно, как можно решить такие сложные проблемы с относительно простыми компьютерными технологиями.
Использование параллелизма с пользовательскими процессорами
Команда в Италии разработала специализированный процессор для решения проблемы сходства белков с похожими подстроками в белке после получения цели. Команда хотела изучить возможность использования аппаратного обеспечения с высоким параллелизмом для ускорения времени вычислений с использованием уже существующих решений, разработки процессора для поиска сходства PROtein (PROSIDIS).
Это было достигнуто с помощью инструмента под названием Parallel Hardware Generator (PHG), который может автоматически разрабатывать параллельное оборудование. Высокоуровневые спецификации проблемы сходства с белком передаются в PHG, которая затем выполняет всю необходимую работу, чтобы определить, как превратить эти спецификации в параллельные аппаратные решения, а затем выводит сценарий VHDL, который может быть синтезирован на FPGA. PHG может достичь этого, используя систолические массивы, которые проецируют вычислительную область на пространство временного процессора.

Изображение предоставлено IPITEC
Команда проверила выход VHDL на процессоре Pentium III с частотой 550 МГц, XPGA Xilinx XV1000 FPGA, соединенном с прототипом RC1000-PP. Проблема, на которую нацелился процессор, была протеом длиной n = 2, 096, 000 и пептидом длиной m = 24.
Результаты показали, что процессор PROSIDIS, разработанный с PHG, показал, что скорость улучшилась в диапазоне от 5, 6 до 55, 6 против решений COTS.
В этом документе показано совпадение высокопроизводительных вычислений и биоинформатики и подчеркивается, почему высокопроизводительные вычисления - такая важная область исследований для многих разных областей.
Обучение будущих биоинформатиков Исследователи
Операционная система 4273π Raspberry Pi была разработана Андреевским университетом в Шотландии для решения проблемы в программах бакалавриата по биологии: студенты, как правило, не были готовы к управлению компьютерными системами, которые им понадобятся для проведения исследований в области биоинформатики.
Несмотря на то, что существует множество возможностей предоставить студентам доступ к компьютерным системам через SSH на сервер или изображения виртуальной машины на своих персональных компьютерах, он все еще не научил их действительному аспекту системного администрирования этих систем, которые в основном базировались на Linux. И эти основные исследователи в исследованиях биоинформатики обычно не были самими экспертами.
Таким образом, родилось 4273 г., которое может работать на недорогой малине Pi и представляет собой индивидуальную версию Linux на основе операционной системы Raspbian. Каждому учащемуся на курсе биоинформатики старшего уровня была предоставлена малина Pi и некоторые основные аппаратные средства в кредит, чтобы они могли выполнять задания в школе или дома. Они смогли получить доступ к базам данных, управлять и устанавливать необходимые пакеты, а также управлять административным контролем своих систем, одновременно изучая понятия биоинформатики и системного администрирования.

Снимок экрана из 4273п. Изображение предоставлено 4273π
4273π доступен открыто в Интернете, поэтому его могут использовать другие учебные заведения или любители дома. Это перспективное решение, признающее неотъемлемое дисциплинарное перекрытие в биоинформатике и области, в которых будущие исследователи могли бы быть полезными для ознакомления.
Особенное изображение предоставлено исследовательским институтом Дэвида Х. Мердока.