СОВРЕМЕННОЕ СОСТОЯНИЕ ГЛУБОКО АННОТИРОВАННОГО КОРПУСА ТЕКСТОВ РУССКОГО ЯЗЫКА (СИНТАГРУС)


2015. № 3 (6), 272-299

Институт проблем передачи информации им. А.А. Харкевича РАН

Аннотация:

В статье излагаются основные особенности, принципы создания и параметры синтаксически аннотированного корпуса русских текстов «СинТагРус». Помимо синтаксической разметки каждого предложения в виде деревьев зависимостей, корпус содержит ин- формацию об аргументах и значениях лексических функций слов, входящих в предложение, а также сведения о лексических значениях слов. Рассматривается подкорпус предложений, содержащих различные виды эллипсиса. Обсуждаются возможности применения корпуса для решения научных и практических задач.