Используя литературу, написанную Томасом Харди, Д. Х. Лоуренсом и Германом Мелвиллом, шведские физики разработали формулу для обнаружения литературных «отпечатков пальцев» разных авторов.
Новое исследование, опубликованное 10 декабря в New Journal of Physics, описывает новую концепцию группы шведских физиков с факультета физики Университета Умео под названием метакнига, в которой используется частота, с которой авторы используют новые слова. в своей литературе, чтобы найти четкие закономерности в стилях письма авторов.
На протяжении более 75 лет принцип Джорджа Кингсли Ципфа, основанный на тщательно отобранной компиляции американского английского языка под названием Brown Corpus, предлагал универсальную закономерность частоты новых слов, используемых авторами. Закон Ципфа предполагает, что рейтинг частоты слова обратно пропорционален его встречаемости.
Новое исследование показывает, однако, что истина, стоящая за частотностью слов, менее универсальна, чем утверждал Ципф, и больше связана с лингвистическими способностями автора, чем с любым всеобъемлющим лингвистическим правилом.
Исследователи впервые обнаружили, что появление новых слов в текстах Харди, Лоуренса и Мелвилла начало снижаться по мере того, как их книга становилась длиннее, несмотря на новые настройки и повороты сюжета.
Их данные также показывают, что скорость выпадения уникальных слов варьируется для разных авторов и, что наиболее важно, одинакова во всех работах любого из трех проанализированных авторов.
Статистический анализ применялся к целым романам, отрывкам из романов, полным собраниям произведений и объединениям из разных произведений одних и тех же авторов - все они имели уникальный частотный «отпечаток пальца».
Используя статистические закономерности, полученные в ходе их исследования, исследователи обдумали идею метакниги - кода для каждого автора, который мог бы представлять всю его работу, завершенную или находящуюся в процессе мысленного конвейера.
Как пишут исследователи: «Эти результаты приводят нас к концепции метакниги - написание текста может быть описано как процесс, в котором автор вытаскивает фрагмент текста из большой исходной книги (метакниги).) и записывает на бумаге. Эта метакнига представляет собой воображаемую бесконечную книгу, которая дает представление частотных характеристик слов всего, что определенный автор когда-либо мог придумать написать."