Прогнозирование выборов - проблема с высокими ставками. Политики и избиратели часто отчаянно хотят узнать исход близкой гонки, но предоставление им неполных или неточных прогнозов может ввести в заблуждение. А прогнозирование выборов уже само по себе является сложной задачей - процесс моделирования изобилует неопределенностью, неполной информацией и субъективным выбором, и со всем этим нужно умело обращаться. Политологи и исследователи внедрили ряд успешных подходов к прогнозированию результатов выборов с разной степенью прозрачности и сложности. Тем не менее, прогнозы выборов могут быть трудными для интерпретации и могут оставить многие вопросы без ответа после того, как развернутся близкие гонки.
Эти проблемы заставили исследователей задуматься о том, может ли применение модели болезни к выборам расширить сообщество, занимающееся политическим прогнозированием. В статье, опубликованной сегодня в SIAM Review, Александрия Волкенинг (Северо-Западный университет), Дэниел Ф. Линдер (Университет Августы), Мейсон А. Портер (Калифорнийский университет, Лос-Анджелес) и Гжегож А. Ремпала (Университет штата Огайо) позаимствовали идеи эпидемиологии для разработки нового метода прогнозирования выборов. Команда надеялась расширить сообщество, которое взаимодействует с данными опросов, и поднять исследовательские вопросы с новой точки зрения; многодисциплинарный характер их модели инфекционных заболеваний был в этом отношении достоинством. «Наша работа полностью открыта», - сказал Портер. «Надеюсь, это вдохновит других на дальнейшее развитие наших идей и разработку собственных методов прогнозирования выборов."
В своей новой статье авторы предлагают сказать Ремпала.
Это исследование в основном сосредоточено на влиянии, которое избиратели в разных штатах могут оказывать друг на друга, поскольку точный учет взаимодействия между штатами имеет решающее значение для производства надежных прогнозов. Результаты выборов в штатах с похожей демографией часто коррелируют, и штаты также могут асимметрично влиять друг на друга; например, избиратели в Огайо могут сильнее влиять на избирателей в Пенсильвании, чем наоборот. Сила влияния государства может зависеть от ряда факторов, в том числе от количества времени, которое кандидаты тратят на предвыборную кампанию, и освещения государства в новостях. Чтобы разработать свой подход к прогнозированию, команда перепрофилировала идеи из раздельного моделирования биологических заболеваний. Математики часто используют компартментальные модели, которые делят людей на несколько отдельных типов (т. е. компартментов), для изучения распространения инфекционных заболеваний, таких как грипп и COVID-19. Широко изученная компартментальная модель, называемая моделью восприимчивых-инфицированных-восприимчивых (SIS), разделяет население на две группы: те, кто подвержен заболеванию, и те, кто в настоящее время инфицирован. Затем модель SIS отслеживает доли восприимчивых и инфицированных лиц в сообществе с течением времени на основе факторов передачи и выздоровления. Когда инфицированный человек взаимодействует с восприимчивым человеком, восприимчивый человек может заразиться. Зараженный человек также имеет определенный шанс выздороветь и снова стать восприимчивым.
Поскольку в США есть две основные политические партии, авторы использовали модифицированную версию модели SIS с двумя типами инфекций. «Мы использовали методы математической эпидемиологии, потому что они дали нам средство для построения отношений между состояниями знакомым междисциплинарным способом», - сказал Волкенинг. Хотя динамика выборов и заболеваний, безусловно, различается, исследователи рассматривали склонность голосовать за демократов и республиканцев как два возможных вида «инфекций», которые могут распространяться между штатами. Неопределившиеся, независимые избиратели или избиратели, принадлежащие к меньшинству, подпадают под категорию уязвимых лиц. «Заражение» интерпретировалось как принятие взглядов демократов или республиканцев, а «выздоровление» представляло собой переход убежденных избирателей в неопределившиеся.
В модели заинтересованные избиратели могут передавать свое мнение неопределившимся избирателям, но обратное неверно. Исследователи придерживались широкого взгляда на передачу, интерпретируя убеждение мнения как происходящее посредством прямого общения между избирателями и более косвенными методами, такими как кампании, освещение новостей и дебаты. Люди могут взаимодействовать и приводить к тому, что другие люди меняют свое мнение как внутри государств, так и между ними.
Для определения значений математических параметров своих моделей авторы использовали данные опросов о сенаторских, губернаторских и президентских гонках от HuffPost Pollster за 2012 и 2016 годы и RealClearPolitics за 2018 год. отдельных рас и смоделировали эволюцию мнений в течение года, предшествующего каждым выборам, отслеживая доли избирателей, не определившихся с выбором, избирателей-демократов и республиканцев в каждом штате с января до дня выборов. Исследователи смоделировали свои окончательные прогнозы, как если бы они сделали их накануне дня выборов, включая все данные опросов, но опуская результаты выборов.
Несмотря на то, что она основана на нетрадиционной области прогнозирования выборов, а именно на эпидемиологии, получившаяся модель показала себя на удивление хорошо. Он прогнозирует гонки США на 2012 и 2016 годы на пост губернатора, Сената и президента с таким же уровнем успеха, как и популярные аналитические сайты FiveThirtyEight и Sabato's Crystal Ball. Например, вероятность успеха авторов в прогнозировании результатов партий на уровне штатов на президентских выборах 2012 и 2016 годов составила 94,1 процента, в то время как FiveThirtyEight имела вероятность успеха 95,1 процента, а Хрустальный шар Сабато - 93,1 процента. «Поначалу мы все были удивлены, что модель передачи болезней может давать значимые прогнозы выборов», - сказал Волкенинг.
Установив способность своей модели прогнозировать результаты накануне дня выборов, авторы попытались определить, насколько рано модель может создавать точные прогнозы. Прогнозы, сделанные за недели и месяцы до дня выборов, особенно значимы, но делать ранние прогнозы сложно, поскольку для обучения модели доступно меньше данных опросов. Используя данные опросов о сенаторских гонках 2018 года, модель команды смогла давать стабильные прогнозы с начала августа и далее с той же вероятностью успеха, что и окончательные прогнозы FiveThirtyEight для этих гонок.
Несмотря на явные различия между заражением и динамикой голосования, это исследование предлагает ценный подход к описанию того, как политические взгляды меняются в разных штатах. В настоящее время Волкенинг применяет эту модель - в сотрудничестве со студентами бакалавриата Северо-Западного университета Сэмюэлем Чианом, Уильямом Л. Хе и Кристофером М. Ли - для прогнозирования президентских, сенаторских и губернаторских выборов в США в 2020 году. «Этот проект заставил меня понять, что оценивать прогнозы сложно, особенно когда на некоторых выборах перевес голосов составляет менее одного процента», - сказал Волкенинг.«Тот факт, что наша модель работает хорошо, впечатляет, поскольку есть много способов сделать ее более реалистичной в будущем. Мы надеемся, что наша работа побуждает людей более критически относиться к тому, как они оценивают прогнозы, и сами участвуют в прогнозировании выборов».