ВЫСОКОЧАСТОТНЫЕ ГЛАГОЛЬНЫЕ СЛОВАРНЫЕ КОЛЛОКАЦИИ С СУЩЕСТВИТЕЛЬНЫМИ В НАЦИОНАЛЬНОМ КОРПУСЕ РУССКОГО ЯЗЫКА


2024. № 4 (42), 78-88

Санкт-Петербургский государственный университет

Аннотация:

Корпусы текстов и ставший доступным в них статистический аппарат дали новый импульс дальнейшему изучению сочетаемости лексических единиц. При этом устойчивые словосочетания достаточно подробным образом представлены в толковых и специализированных словарях. Статья посвящена исследованию того, как, с одной стороны, словарные коллокации (единицы, зафиксированные в лексико- графических источниках) отражены в корпусе текстов (на материале Национального корпуса русского языка) и как, с другой стороны, частотные словосочетания, полученные на материале корпуса, соответствуют словарным данным. Материалом послужили коллокации, построенные по модели «глагол + существительное», которые были отобраны из словарей русского языка, со следующими существительными: жизнь, сила, дело, слово, работа, время, взгляд, вопрос, возможность,
право. Ранжирование словосочетаний в корпусе было произведено при помощи частоты совместной встречаемости, а также статистической метрики logDice. Резуль таты показывают, что высокочастотные единицы из корпуса довольно полно отражены среди коллокаций, представленных в словарях (около 67%). И наоборот, среди найденных частотных словосочетаний больше половины (55%) составляют словарные коллокации. Мера logDice демонстрирует результаты, схожие с ранжированием по частоте совместной встречаемости.