КОРПУС И ЧАСТОТНЫЙ ГРАММАТИЧЕСКИЙ КОРПУСНЫЙ СЛОВАРЬ ЦЕРКОВНОСЛАВЯНСКОГО ЯЗЫКА В СОСТАВЕ НАЦИОНАЛЬНОГО КОРПУСА РУССКОГО ЯЗЫКА


2015. № 3 (6), 116-141

Православный Свято-Тихоновский Гуманитарный Университет, Институт русского языка им. В.В. Виноградова РАН, Научная педагогическая библиотека К.Д. Ушинского

Аннотация:

Статья посвящена описанию современного состояния работы над церковнославяянским подкорпусом Национального корпуса русского языка. Корпус отличается от собрания текстов наличием специальной разметки (грамматической, структурно, метатекстовой) и возможностью поиска по этой разметке. Рассмотрен состав, охарактеризованы основные жанровые рубрики, по которым распределяются включенные в корпус тексты, описаны принципы метаразметки, которые несколько отличаются от используемых в других корпусам, входящих в Национальный корпус русского языка. В необходимых случаях приводится историческая информация, на основе которой было принято то или иное решение. Поскольку для церковнославянских текстов ввод поисковых запросов с клавиатуры представляет определенные трудности, предлагается несколько вариантов упрощенной орфографической передачи, что позволяет ввести запрос, ограничиваясь возможностями стандартной клавиатуры. Наконец, в статье содержится описание созданного в рамках работы над проектом частотного грамматического словаря.