ОБУЧАЮЩИЙ КОРПУС В СОСТАВЕ НКРЯ КАК ИНСТРУМЕНТ УЧИТЕЛЯ-СЛОВЕСНИКА
Аннотация:
Обучающий корпус предназначен для преподавания русского языка и литературы в школе, для подготовки учителей-словесников в педагогических институтах, а также для преподавания русского языка иностранцам. Обучающий корпус построен на иных принципах, отличающих его от основного корпуса письменных текстов. Отличия касаются сбалансированности текстов в составе корпуса, соответствия их школьной программе и современным орфографическим нормам.
Объем корпуса превышает 13 млн словоупотреблений. В соответствии со школьным курсом русского языка в корпусе представлены тексты, относящиеся к различным сферам употребления языка: художественная литература, публицистика, деловая, научная, разговорная речь. Большую часть корпуса составляют произведения, входящие в программу по литературе для основной и старшей школы, в том числе рекомендованные для внеклассного чтения.
Морфологическая разметка в Обучающем корпусе адаптирована к школьной программе по русскому языку и обеспечивает именно традиционный, упрощенный грамматический разбор. В целях соответствия задачам школьного преподавания в разметку введены дополнительные морфологические признаки — словоизменительные типы имен и глаголов (склонения, спряжения) и лексико-грамматические разряды существительных, прилагательных, местоимений, наречий. В корпусе использована как морфологическая разметка с ручным снятием омонимии, так и морфологическая и синтаксическая разметка с автоматическим снятием неоднозначности на основе нейросетевых алгоритмов.
Новая разметка делает доступными все новейшие функциональные возможности: «Поиск коллокаций», «Частотный словарь», «Частотность выдачи», «Портрет слова», включающий «Скетчи» и «Похожие слова» и др., которые призваны повысить привлекательность корпуса для пользователя и превратить его в необходимый инструмент учителя-словесника.