НАИВНАЯ ПОЭЗИЯ В АКЦЕНТОЛОГИЧЕСКОМ КОРПУСЕ


2015. № 3 (6), 257-271

Институт русского языка им. В. В. Виноградова РАН, Яндекс, Национальный исследовательский университет, «Высшая школа экономики»

Аннотация:

В статье рассматривается особенный материал, способный пополнить акцентологический корпус, специфический подкорпус в составе НКРЯ, отражающий место постановки ударений. Наивная поэзия – непрофессиональные стихи, созданные поэтами-любителями, их текстовая продукция не прошла редакторских фильтров и не была опубликована в авторитетных периодических изданиях и издательствах. Так как большинство этих текстов написаны в правильной силлабо-тонике, оказывается возможным автоматически предсказывать ударения и делать разметку для корпуса. Наивная поэзия была извлечена с сайта stihi.ru, самого старого сайта в России, публикующего подобного рода произведения поэтов-любителей. Несмотря на появление альтернативных площадок для публикации, сайт всё ещё остаётся популярным и количество публикаций на нём растёт. Для разметки текстов была применена специальная программа, предсказывающая расстановку ударений на основе машинного обучения. В тексте статьи приводится таблица, показывающая, насколько пополнение корпуса увеличило количество вхождений некоторых конкурирующих форм.