Глубокая нейронная сеть, работающая на обычном настольном компьютере, интерпретирует высокотехнологичные данные, связанные с национальной безопасностью, так же, а иногда и лучше, чем лучшие современные автоматизированные методы или даже человеческие эксперты.
Прогресс в решении некоторых из самых сложных проблем окружающей среды, космоса и национальной безопасности был достигнут учеными из Тихоокеанской северо-западной национальной лаборатории Министерства энергетики, которые представили свою работу на 11-й конференции MARC - Methods and Applications of Radioanalytical Химия - в апреле на Гавайях. В их работе используется глубокое обучение, при котором машины могут учиться и принимать решения без явного программирования для любых условий.
Исследования исследуют невероятно сложные наборы данных из неглубокой подземной лаборатории лаборатории, где ученые обнаруживают слабейшие сигналы от жужжащей активности планеты. В лаборатории, погребенной на глубине 81 фута под бетоном, камнем и землей, толстая защита гасит сигналы от космических лучей, электроники и других источников. Это позволяет ученым PNNL изолировать и расшифровывать интересующие сигналы, собранные из любой точки планеты.
Эти сигналы означают события, называемые радиоактивным распадом, когда частица, такая как электрон, вылетает из атома. Процесс происходит постоянно, благодаря как природной, так и человеческой деятельности. Ученые могут отслеживать изменения уровня аргона-37, который может свидетельствовать о предшествующих ядерных испытаниях, и аргона-39, уровни которого помогают ученым определить возраст подземных вод и узнать больше о планете.
Лаборатория накопила данные о миллионах случаев радиоактивного распада с момента ее открытия в 2010 году. Но там шумный мир, особенно для ученых, слушающих очень редкие сигналы, которые легко спутать с сигналами другого и часто рутинного происхождение - например, человек, щелкающий выключателем света или получающий звонок по мобильному телефону.
Ученый из PNNL Эмили Мейс, выступавшая на MARC, является экспертом в интерпретации особенностей таких сигналов - когда событие может указывать, например, на подземные ядерные испытания или на быстро истощающийся водоносный горизонт. Подобно тому, как врачи просматривают рентгеновские снимки в поисках признаков болезни, Мейс и ее коллеги регулярно изучают данные о событиях радиоактивного распада, чтобы интерпретировать сигналы - их энергию, время, пики, наклоны, продолжительность и другие характеристики..
«Некоторые формы импульсов трудно интерпретировать, - сказал Мейс. «Бывает сложно отличить хорошие данные от плохих».
Недавно Мейс и его коллеги обратились за советом к своим коллегам, которые являются экспертами в области глубокого обучения, интересной и активной области искусственного интеллекта. Джесси Уорд - один из десятков экспертов по глубокому обучению в лаборатории, которые изучают несколько приложений в рамках проекта PNNL Deep Learning for Scientific Discovery Agile Investment. Мейс отправил Уорду информацию о почти 2 миллионах энергетических импульсов, обнаруженных в Подземной лаборатории на мелководье с 2010 года.
Уорд использовал чистую выборку из 32 000 импульсов для обучения сети, вводя множество характеристик каждого импульса и показывая сети, как интерпретировались данные. Затем он отправил сети еще тысячи сигналов, поскольку она научилась различать «хорошие» сигналы, показывающие что-то интересное, и «плохие» сигналы, представляющие собой нежелательный шум. Наконец, он протестировал сеть, передав ей все более сложные наборы данных, которые трудно интерпретировать даже экспертам.
Сеть, которую он создал, интерпретирует события формы импульса с точностью, которая равна, а иногда и превосходит ноу-хау таких экспертов, как Мейс. При использовании простых данных программа правильно отсортировала более 99,9% импульсов.
Результаты еще более впечатляющие, когда данные зашумлены и содержат лавину ложных сигналов:
- В анализе, включающем 50 000 импульсов, нейронная сеть согласовывалась с экспертом-человеком в 100% случаев, превзойдя лучшие традиционные компьютерные методы, которые согласовывались с экспертом в 99,8% случаев.
- В другом анализе 10 000 импульсов нейронная сеть правильно идентифицировала 99,9% импульсов по сравнению с 96,1% с помощью обычного метода. В этот анализ были включены наиболее сложные для интерпретации импульсы; с этим подмножеством нейронная сеть работала более чем в 25 раз лучше, правильно классифицировав 386 из 400 импульсов по сравнению с 14 из 400 для обычной техники.
«Это относительно простая нейронная сеть, но результаты впечатляют», - сказал Уорд. «Вы можете продуктивно работать над важными научными проблемами с помощью довольно примитивной машины. Интересно подумать, что еще возможно».
Однако проект столкнулся с неожиданной проблемой: неглубокая подземная лаборатория настолько безупречна, что большинство ложных шумовых сигналов подавляются до того, как они попадут в поток данных, что Уорд попросил у Мейса больше неверных данных.
"Сигналы могут вести себя хорошо или плохо", - сказал Уорд. «Чтобы сеть узнала о хороших сигналах, ей нужно приличное количество плохих сигналов для сравнения».
Проблема отбора огромных объемов данных в поисках значимых сигналов имеет множество последствий и распространяется на многие области науки. Одной из областей PNNL является поиск сигналов, которые могут быть результатом темной материи, огромной части материи в нашей Вселенной, происхождение и местонахождение которой неизвестны. Другой - автоматическое обнаружение рака молочной железы и других аномалий тканей.
«Глубокое обучение облегчает нам фильтрацию небольшого количества хороших событий, которые указывают на интересующую деятельность», - сказал Крейг Олсет, физик-ядерщик и сотрудник лаборатории PNNL.«Приятно видеть, что методы глубокого обучения действительно работают лучше, чем наши предыдущие лучшие методы обнаружения».