Российские математики обнаружили закономерности в манускрипте Войнича

Ученые из Института прикладной математики имени М.В. Келдыша РАН, проведя статистические исследования, убедились в том, что текст манускрипта Войнича написан на двух смешанных языках с исключением гласных букв. 

До этого все попытки расшифровать уникальный документ и даже просто понять, является ли он осмысленным текстом, проваливались. 600 лет бесполезных стараний! Согласно радиоуглеродному анализу, книга была написана между 1404-м и 1438 годом, однако до сих пор никто в мире не может сказать, о чем же она повествует. Криптографы ЦРУ и АНБ, суперкомпьютеры и даже доктора "оккультных наук" расписались в своем полном бессилии. А последнее сообщение криптолога Гордона Рагга (Gordon Rugg) из Килского университета в Великобритании таково: "Рукопись Войнича является фальшивкой. Такой "сложный текст" легко сконструировать каждому, кто знаком с простыми методами копирования". Получается, что расшифровать его невозможно вовсе. 

Российские математики поставили перед собой задачу — понять, представляет ли документ мистификацию, то есть бессмысленный набор знаков, или это все же зашифрованный текст?  Если документ является осмысленным текстом, то на каком языке он написан? Были предложены гипотезы о структуре текста манускрипта:

— он написан с перестановкой букв,

— двум символам некоторого известного алфавита соответствует один символ рукописи,

— существует рукопись-ключ, без которой невозможно прочитать текст,

— рукопись представляет собой двуязычный текст,

— текст содержит ложные пробелы между словами.

В случае ложных пробелов текст может быть легко прочитан, если знать, на каком языке читать. Например:

]]>]]>

Перенос пробелов

Однако даже после самой примитивной шифровки — допустим, удаления гласных — текст уже становится нечитаемым.

]]>]]>

Вынос гласных

Теперь используем второй язык, английский.

]]>]]>

Текст на английском языке

Удалим из этой фразы гласные буквы.

]]>]]>

Удаление гласных

Переведем на латиницу русскую фразу.

]]>]]>

Перевод кириллицы в латиницу

И добавим к ней остатки английской фразы.

]]>]]>

Добавление английской фразы

А теперь разобьем эту фразу пробелами и предложим расшифровать ее криптологам.

]]>]]>

Разбиение пробелами

Именно такой процесс, по мнению российских математиков, был использован для того, чтобы зашифровать некий текст, впоследствии купленный в 1912 году антикваром Вильфридом Войничем — мужем писательницы Этель Лилиан Войнич.

Российские математики доказали осмысленность манускрипта Войнича

Как они это поняли? Аналитики взяли языки индоевропейской группы — в нее входят славянская подгруппа, германская, романская, греческий язык, бакский и латинский. Сравнили славянскую группу с уральской семьей языков и финно-угорской ветвью: угорская подгруппа и прибалтийско-финская подгруппа. А также исследовали искусственные языки: эсперанто, интерлингва, волапюк, язык обитателей планеты Qo’noS — клингон и "эльфийский язык" — квенья. Сравнивались буквосочетания и расстояния между ними, показатель Хёрста* для разных языков, спектральный портрет матрицы двухбуквенных сочетаний.

]]>]]>

Формула коэффициента Хёрста

И правда, оказалось, что, сравнив статистику, можно определить близость датского и шведского языков, их отдаленность от французского и итальянского, найти другие родственные связи. Стало понятно, что рукопись написана на одном из европейских языков. Если бы это был один язык, то, скорее всего, датский. Но случайность расположения символов говорит о том, что буквы еще с чем-то смешали. Или все-таки текст написан на специально разработанном языке. Кстати, оказалось, что "эльфийский язык" Толкиена очень близок к языку интерлингва, а эсперанто и волапюк близки латыни. То есть статистические свойства искусственных языков ожидаемо близки естественным. 

Анализ структуры всего текста манускрипта выявил то, что части перемешаны между собой. Есть "Ботаническая часть", "Женские тела", "Астрология" и "Ступки". Они также отличаются между собой по структуре текста. В результате исследования было выяснено, что, вероятнее всего, манускрипт Войнича написан на смешанном языке без гласных, 60% текста написано на английском или немецком, а 40% — на итальянском или испанском, хотя это может быть и латынь. А вот какую именно информацию содержит этот текст, ученым еще предстоит выяснить.

"К сожалению, восстановить весь текст без огласовки не представляется возможным, так как вариантов осмысленных слов получается слишком много. Я вам приведу один вариант понимания текста, а другой специалист вытянет из этих слов абсолютно другой смысл. Однако я не знаю, насколько важным на сегодняшний день представляется понимание текста как такового, потому что, судя по рисункам, там объясняется, в какое время года нужно сажать мак, чтобы потом получить из него опий. Для нас же, математиков, самым важным моментом является проверка математических инструментов: можем ли мы распознать язык как таковой? Теперь мы знаем: это сделать можно. Следующий шаг — понимание того, на каких именно смешанных языках написан этот текст", — пояснил Юрий Орлов, доктор физико-математических наук, сотрудник Института прикладной математики имени М.В. Келдыша РАН.

Подписаться на секретный telegram-канал, чтобы не пропустить эксклюзивную информацию, не представленную больше нигде.