Частотность частей речи в чешской поэзии


2017. № 4 (14), 113-126

Институт чешской литературы АН ЧР

Аннотация:

В статье представлены первые результаты статистической обработки Корпуса чешского стиха. Корпус чешского стиха является лемматизированным, фонетически, морфологически, метрически и строфически аннотированным корпусом чешской поэзии периода XIX — начала XX вв. и содержит 1700 сборников, около 15 миллионов слов, 2,5 миллиона стихов. В первой части статьи сравнивается частотность частей речи в Корпусе чешского стиха и в доступных корпусах чешского языка (включая подкорпусы художественной литературы, публицистических и специальных текстов, разговорного языка). Затем анализируется зависимость частотности частей речи от длины стиха (частотность личных форм глагола, именной и глагольной частей предложения), поэтической школы (чешская поэзия 50–60-х и 70–80-х гг. XIX в.), автора (на основе противопоставления творчества Сватоплука Чеха и Виктора Дыка) и рода литературы (на примере лирических и эпических произведений Адольфа Гейдука). По причине ограниченности проанализированного материала результаты исследования не являются окончательными, однако последующее изучение более обширного материала позволит использовать различия в значениях наблюдаемых параметров в качестве стилеметрических показателей как в истории литературы, так и при атрибуци в текстологии.