ПАНХРОНИЧЕСКИЙ КОРПУС: ИНТЕГРАЦИЯ ИСТОРИЧЕСКИХ И СОВРЕМЕННЫХ КОРПУСНЫХ РЕСУРСОВ*
Аннотация:
В статье идет речь о панхроническом корпусе в составе Национального корпуса русского языка, объединяющем поиск по нескольким уже существующим корпусам текстов — древнерусскому, старорусскому, корпусу берестяных грамот и основному, а также новому корпусу «Восточнославянская эпиграфика». Таким образом, создан единый поиск с одним запросом, охватывающий историю (древне) русского языка на протяжении тысячелетия. Основные препятствия на пути создания такого корпуса — расхождения между орфографией, фонетическим составом и морфологическим принципом выделения лемм в разных корпусах, а также не полностью совместимая разметка грамматических явлений. В статье описано, каким образом эти форматы удалось частично унифицировать, не утрачивая в то же время функционала отдельных корпусов. Приводятся также иллюстрации поиска по панхроническому корпусу, применимые не только для исследования грамматических процессов в синхронии и диахронии, но и для литературоведческих / текстологических и исторических задач.