ДИАЛЕКТНЫЙ ПОДКОРПУС СЕГОДНЯ


2015. № 3 (6), 142-162

Московский государственный университет им. М. В. Ломоносова, Институт русского языка им. В. В. Виноградова РАН

Аннотация:

В статье представлено современное состояние Корпуса диалектных текстов, являющегося подкорпусом НКРЯ. В 2005–2009 гг. проводилась работа по разметке пилотного диалектного корпуса. В последние годы проведена работа по усовершенствованию разметки диалектных текстов на различных уровнях (метатекстовая информация о времени и месте записи, жанре и других особенностях текста; фонетика, морфология, семантика, элементы синтаксиса), а также разработаны программные средства для разметки корпуса — прежде всего пользовательский интерфейс «Рабочее место диалектолога». Ведётся работа по сбору текстов в различных регионах России, а также по разметке ранее собранных текстов, как опубликованных, так и входящих в архивы исследователей. Разработана технология перевода транскрибированных текстов в орфографизированную форму; эта последняя версия затем подвергается полуавтоматической морфологической разметке. Предусмотрена возможность также включения в корпус текстов в орфографизированной записи. Морфологическая разметка сопровождается пометами о тех или иных нормативных особенностях на разных уровнях (основа, словообразование, словоизменение). Предусмотрена возможность включения также мультимедийной информации (видео- и аудиозапись). В статье приводятся сведения также о других существующих диалектных корпусах, разработчики многих из которых сотрудничают с командой диалектного корпуса НКРЯ.