КОРПУС «СБАЛАНСИРОВАННАЯ АННОТИРОВАННАЯ ТЕКСТОТЕКА» (САТ): ИЗУЧЕНИЕ СПЕЦИФИКИ РУССКОЙ МОНОЛОГИЧЕСКОЙ РЕЧИ
Аннотация:
Статья представляет один из корпусов русской устной речи: коллекцию спонтанных монологических текстов, известную как «Сбалансированная аннотированная текстотека» (САТ). Данный корпус собирается в Санкт-Петербургском государственном университете в течение уже более чем 20 лет с использованием авторской (Н.В. Богдановой-Бегларян) методики сбора данных, предполагающей достаточно строгий набор экспериментальных процедур. САТ предназначендля изучения спонтанных монологов разного типа (чтение (сюжетного и несюжетного исходных текстов), пересказ прочитанных текстов, описание изображения (также сюжетного и несюжетного), рассказ на заданную тему) и содержит тексты, записанные от пяти профессионально-ориентированных групп носителей языка (медики; юристы; «компьютерщики»; филологи, преподаватели русского языка как иностранного; преподаватели-философы), несколько блоков речи студентов (филологов и нефилологов), а также четыре блока интерферированной русской речи носителей других языков: американского английского, китайского, французского и нидерландского. Всего в составе САТ сегодня около 700 текстов и около 50 часов звучания. В статье на фоне других русскоязычных и иноязычных устных корпусов дано описание данного лингвистического ресурса, отмечены основные темы, разрабатываемые на его материале, а также намечены перспективы продолжения работы.