ОРФОГРАФИЯ ОСТРОЖСКОЙ БИБЛИИ В КОНТЕКСТЕ ЦЕРКОВНОСЛАВЯНСКОГО КОРПУСА
Аннотация:
Современная церковнославянская орфография достаточно стандартизирована и четко фиксирует правила употребления букв и диакритических знаков, использование сокращений (титл и буквотитл), правила словоделения, правила написания конкретных словоформ и различения омонимов. Наличие такой нормы позволило нам создать грамматический словарь и морфологический анализатор для церковнославянского языка (http://dic.feb-web.ru/slavonic/dicgram/ index.htm), который используется в корпусе церковнославянских текстов (http:// ruscorpora.ru/search-orthlib.html). Острожская Библия 1581 года, как первое полное издание Библии на церковнославянском языке, также должна быть включена в корпус, но при этом возникла масса проблем. Орфография этого издания сильно отклоняется от современной нормы и отличается крайней нерегулярностью и нестабильностью. В данной статье анализируются орфографические особенности Острожской Библии и возможность ее автоматического морфологического анализа. Специально рассматриваются правила употребления дублетных букв и других графических средств, которые порождают массу вариантов написания для конкретного слова. В результате делается вывод о том, что морфологический анализатор должен быть существенно переделан, чтобы он мог обрабатывать тексты в старой орфографии, а также определяются направления дальнейшей работы.