Империя – II - Фоменко Анатолий Тимофеевич. Страница 121

Таким образом эффективность методики подтвердилась на средневековых текстах с заранее известной датировкой.

1. 5. Как можно обнаружить дубликаты-повторы в хронике

Методика обнаружения дубликатов (А. Т. Фоменко, [6], [18]). Следуя работам [1]…[8], сформулируем следствие принципа дублирования частот для хроник, содержащих повторы (дубликаты).

Этот принцип позволяет предложить метод выявления «скрытых» дубликатов, которые из-за существенных различий в подаче материала не заметны при смысловом восприятии текста. Описанная ниже методика является с некотором смысле частным случаем предыдущей, но ввиду ее важности для датировки, мы выделим ее как самостоятельный прием обнаружения дубликатов.

Пусть интервал времени (А, В) – от года А до года В, – описан в хронике Х, разбитой на главы-поколения, которые мы обозначаем Х(Т), где Т – номер поколения. Предположим, что в целом главы-поколения Х(Т) в тексте Х занумерованы хронологически верно, за одним лишь исключением: среди них есть два дубликата, то есть две главы, помещенные в разных частях хроники Х, но говорящие об одном и том же поколении, по сути дела повторяющие друг друга.

Рассмотрим простейший случай, когда оба дубликата тождественны, то есть одна и та же глава-поколение встречается в тексте Х два раза – один раз с номером Т0, а второй раз с номером С0.

Ясно, что графики К(Т0, Т) и К(С0, Т), определение которых было дано выше, имеют в этом случае вид, качественно показанный на рис. 4.

В самом деле, все имена впервые появившиеся в главе с номером Т0 (первой в паре глав-дубликатов) повторяются затем еще раз в главе с номером С0 (второй главе этой пары). Поэтому частота употребления «имен главы Т0» в последующих главах хроники Х скачком возрастет, когда при движении слева направо по оси абсцисс мы дойдем до номера С0.

График К(Т0, Т) будет иметь в точке С0 характерный всплеск, говорящий о появлении в тексте дубликата главы с номером Т0.

Что же касается графика К(С0, Т), то ясно, что все значения К(С0, Т) просто равны нулю, так как глава Х(С0), являясь точным повтором уже бывшей главы Х(Т0), не содержит ни одного нового имени (все ее имена уже появились в Х(Т0)) – см. рис. 4.

Первый график на рис. 4 явно не удовлетворяет принципу затухания частот (так нет монотонного убывания справа от Т0).

Следовательно, для восстановления правильного хронологического порядка глав следует переставить главы-поколения в хронике Х так, чтобы добиться соответствия с теоретическим графиком (рис. 1). Ясно, что наилучшее совпадение с теоретическим графиком получится, если мы поместим главы-дубликаты Х(Т0) и Х(С0) рядом или просто отождествим их.

Итак, если среди глав-поколений некоторой хроники Х обнаружились две главы Х(Т0) и Х(С0), для которых их графики К(Т0, Т) и К(С0, Т) имеют вид приблизительно как на рис. 4, то эти главы являются дубликатами (в рамках рассматриваемой модели). Скорее всего, эти главы говорят об одних и тех же событиях и их следует отождествить.

Все сказанное переносится на случай, когда в хронике Х содержится три и более дубликатов.

1. 6. Пример из средневековой истории Италии

Метод был экспериментально проверен на реальных исторических данных. В качестве простого примера, в частности, была взята книга «Истории Флоренции» Н. Макьявелли (Л., 1973), снабженная развернутым комментарием. Ясно, что комментарии можно рассматривать как серию дополнительных глав-поколений, дублирующих основной текст (так как в них в основном говорится о тех же событиях, что и в основной хронике).

Текст «Истории» вместе с комментариями был разбит на главы-поколения. Для получившегося совокупного текста (охватывающего как саму «Историю», так и комментарии к ней) была построена матрица {K}, определенная выше.

Оказалось, что она имеет вид, качественно показанный на рис. 5, где жирным отмечены клетки матрицы, заполненные максимумами в ее строках (то есть максимумами, всплесками в графиках К(Т0, Т)). Комментарии к основной хронике ясно выделяются на рис. 5 в виде сплошного жирного отрезка, параллельного главной диагонали.

В данном случае методика успешно обнаружила заранее известные дубликаты – комментарии к тексту Макьявелли (при обработке этого текста принимал участие А. Макаров).

Описанные методы распознавания зависимостей («статистических дубликатов»), основанные на принципе затухания частот, были предложены А. Т. Фоменко в работах [5-8]. С их помощью, а также с помощью других, независимых методик, в 1980-1988 гг. А. Т. Фоменко и его коллегами была проделана исключительно объемная вычислительная работа по глобальному статистическому анализу совокупности текстов, описывающих древнюю и средневековую историю. Результаты этой работы суммированы в виде разложения ГХК (глобальной хронологической карты) [6, 7, 18].

2. Хронологические списки имен.

Примеры.

2. 1. Понятие списка имен.

Правильные, кратные, простые списки имен

В дальнейшем мы будем рассматривать не сами хроники (тексты), а списки имен, извлеченные из них. Это означает, что каждый фрагмент хроники, описывающий события некоторого выбранного периода времени (одного поколения, 10-ти, 20-ти летия и т.п.) заменяется на список собственных имен, упоминаемых в данном фрагменте. При этом, в каждом фрагмента любое имя учитывается столько раз, сколько оно упомянуто в нем – то есть учитывается «с кратностью».

Предположим, что общее число глав в рассматриваемой хронике равно N. Выстроив и занумеровав списки имен, извлеченных из каждого фрагмента этого текста, в том порядке, как они следовали в нем, получим список имен Х, являющийся объединением последовательности более коротких списков имен Х1, Х2,…, ХN:

Х = Х1 +Х2 +…+ХN.

Списки имен Хi (1 « i « N) мы в дальнейшем будем называть главами-поколениями или просто главами списка Х.

Список Х является упорядоченным списком имен и его можно рассматривать также и без разбиения на главы:

Х = a1, a2,…, aN.

Здесь через ai обозначено i-тое по порядку имя в списке Х.

Мы будем придерживаться следующих обозначений для характеристик списков имен:

n – общее число имен в списке Х (с учетом кратности их вхождения в список);

m – число различных имен списка Х;

N – число глав списка Х (если используется разбиение списка имен на главы).

Итак, основной объект нашего исследования – список имен Х,

разбитый на следующие одна за другой в хронологическом порядке

главы Х1, Х2,…, ХN. Такие списки мы будем называть хронологическими списками имен.

Хронологические списки имен, удовлетворяющие принципу затухания частот, являются (в рамках нашей модели) списками с правильной хронологией. В дальнейшем мы будем называть такие списки имен правильными списками.

Допустим, что в списке имен нарушен принцип затухания частот (или следствия этого принципа). Пусть это нарушение достаточно ярко выражено и позволяет выделить в списке имен систему «статистических дубликатов» (после отождествления которых справедливость принципа затухания частот восстанавливается). Тогда назовем такие хронологические списки имен – списками с дубликатами.

Хронологический список имен назовем простым, если имя (имена) каждого исторического деятеля входит в каждую главу списка не более, чем один раз. В тех случаях, когда в главах списка содержатся по нескольку раз имена одного и того же лица, мы будем называть его кратным списком.

Таким образом, простые списки – это просто перечисление имен (скажем, некоторой династии правителей) в хронологическом порядке.