КОРПУС И ЧАСТОТНЫЙ ГРАММАТИЧЕСКИЙ КОРПУСНЫЙ СЛОВАРЬ ЦЕРКОВНОСЛАВЯНСКОГО ЯЗЫКА В СОСТАВЕ НАЦИОНАЛЬНОГО КОРПУСА РУССКОГО ЯЗЫКА
Аннотация:
Статья посвящена описанию современного состояния работы над церковнославяянским подкорпусом Национального корпуса русского языка. Корпус отличается от собрания текстов наличием специальной разметки (грамматической, структурно, метатекстовой) и возможностью поиска по этой разметке. Рассмотрен состав, охарактеризованы основные жанровые рубрики, по которым распределяются включенные в корпус тексты, описаны принципы метаразметки, которые несколько отличаются от используемых в других корпусам, входящих в Национальный корпус русского языка. В необходимых случаях приводится историческая информация, на основе которой было принято то или иное решение. Поскольку для церковнославянских текстов ввод поисковых запросов с клавиатуры представляет определенные трудности, предлагается несколько вариантов упрощенной орфографической передачи, что позволяет ввести запрос, ограничиваясь возможностями стандартной клавиатуры. Наконец, в статье содержится описание созданного в рамках работы над проектом частотного грамматического словаря.