Компютерные исследования в структуре славянского сборника

David J. Birnbaum, University of Pittsburgh (US)

Памятники славянской письменности типа «сборника смешанного содержания» или «эротапокрисейса» состоят из неопределенного количества текстологических частей («статей»), расположенных в неопределенном порядке. Предполагается, что для сочинения нового такого памятника, писец сначала списал ряд статей с одной рукописи (первый антиграф), а потом с другой, и т. д. Этот процесс отражается текстологически тем, что в двух памятниках типа сборника смешанного содержания или эротапокрисейса встречаются одни и те же составные статьи в одном и том же порядке (но не обязательно в одном и том же положении). Вероятность гипотеза о генетической текстологической связи между такими памятниками растет в мере длительности такого рода соответствия; соответствие одной или двух статей легко может быть случайным явлением, что это вряд ли возможно в случае соответствия пяти или десяти или больше статей, особенно когда последовательность статей не соответствует никакой логической последовательности их содержаий. Эта методика подробно выработана и доказана в текстологических исследованиях болгарского филолога Анисавы Милтеновой.

Исследование корпуса письменных памятников типа «сборника смешанного содержания» или «эротапокрисейса» с этой точки зрения сталкивается о два затруднения:

  1. Трудоемкость измерения соответствия содержаний памятников растет в мере количества памятников в корпусе и количества их статей. Сравнение любых двух памятников проводится без особого труда, но количества отдельных требуемых сравнений растет значительно быстрее, чем количества рукописей: n рукописей требуют (n x (n – 1)) / 2 сравнений (напр. 1225 сравнений для 50 рукописей, 4950 сравнений для 100 рукописей, и т. д.).
  2. Было бы желательно показывать графическим образом как и где соответствуют отдельные статьи в каждой паре памятников.

Докладчик предлагает компютерную систему, которая отвечает на эти филологеские потребности таким образом:

  1. Система сопоставляет содержание каждого памятника в корпусе со содержанием каждого другого памятника и предлагает филологу список пар памятников, которые требуют особое внимание. Таким образом, филолог не теряет время на сравнение памятников, содержания которых или совсем не соответствуют друг с другом или соответствуют лишь незначительно.
  2. Система предоставляет филологу графическое отражание соответстия (или его отсутствия) каждой статьи двух (или больше) исследуемых памятников.

Все компютерные операции проводятся на базисе одной и той же транскрипции текста, т. е., один и тот же компьютерный файл служит 1) для печатания и чтения текста (или на экране, или на бумаге), 2) для измерения соответствии (и предполагаемой генетической близости) текстов, и 3) для графического представления соответствия содержаний памятников на уровне отдельных статей. Система опирается исключительно на открытых стандартах W3C (XML, XSLT, и SVG) и TEI.