Восприятие речи

ВОСПРИЯТИЕ РЕЧИ, один из основных функциональных типов речевой деятельности (наряду с порождением речи) - совокупность процессов, исходный пункт которых - обнаружение акустического речевого сигнала (или его графического эквивалента), а конечный - формирование структуры, поддающейся интерпретации с использованием средств конкретного языка. Например, если носитель русского язык интерпретировал порождённую кем-либо акустическую последовательность, состоящую из краткого отрезка высокочастотного шума и несколько более продолжительного отрезка тона с концентрацией энергии в центральном участке спектра (и некоторыми другими характеристиками), в качестве слога «-са-», то акт восприятия речи состоялся. Восприятие  речи не эквивалентно её пониманию, важен сам переход от акустической картины (акустических событий) к её интерпретации средствами того или иного языка.

Начальный этап восприятия речи заключается в том, что слуховой анализатор слушающего извлекает из акустического сигнала говорящего признаки, полезные для перехода от акустической картины к некоторому символьному представлению. К числу таких признаков принадлежат длительность отрезков звучания, характер формант (областей усиления частот в акустическом спектре), частота основного тона голоса, её изменения, скорость изменений и тому подобное. Исследуя соответствующие акустические параметры речевого сигнала, слушающий формирует его субъективное представление (образ).

Реклама

В памяти человека хранятся перцептивные эталоны - эталонные комплексные образы совокупностей этих полезных признаков. Слушающий сличает набор признаков, которые он обнаруживает в речи, с перцептивными эталонами.

В основе определения полезных признаков лежат врождённые способности человека, не зависящие существенно от его половой, этнической, языковой принадлежности, однако формирование перцептивных эталонов осуществляется в период раннего развития ребёнка под влиянием его языковой (речевой) среды. Поэтому физически (акустически) тождественные звуки речи носители разных языков воспринимают по-разному; например, так называемый открытые и закрытые э-образные гласные для носителя русского языка - один и тот же звук (одна и та же фонема), а для носителей французского или немецкого - разные (для носителей кхмерского языка различаются 3 разных э-образных гласных в зависимости от степени открытости/закрытости).

Относительно небольшая часть участков звучащей речи анализируется слушающим с использованием всех доступных полезных признаков акустического сигнала и интерпретируется в качестве тех или иных гласных или согласных; всё остальное - это результат встречной активности слушающего, который «достраивает» до целого (обычно до слова) тот фрагмент, который возникает в восприятии благодаря непосредственному анализу акустических признаков, обнаруживаемых в речи.

Класс слов, отобранных слушающим по сходству интерпретированных звуковых участков, обычно начальных, принято, вслед за английским лингвистом У. Марслен-Вильсоном, называть когортой. Слушающий осуществляет выбор в рамках когорты (сокращает когорту): отсеивает те её члены, которые плохо согласуются с контекстом, обладают низкой частотностью, не соответствуют ожиданиям слушающего и тому подобное. На раннем этапе (возможно, одновременно с определением начала слова) используются признаки слова как целого: акцентный контур (т.е. число слогов и место ударения), тип сингармонизма и тому подобное. В конечном результате объём когорты должен быть сокращён до единицы. Для слов, отсутствующих в словаре, восприятие методом когорты невозможно.

Все процессы восприятия речи обычно протекают на подсознательном уровне и характеризуются очень высокой скоростью реализации.

Существуют многочисленные работы по автоматическому распознаванию речи, но их результаты относительно скромны. Поскольку в процессах восприятия речи у человека большую роль играют разного рода эвристики - «догадки», основанные на знании темы воспринимаемого сообщения, личности говорящего и тому подобное, задача полного моделирования восприятия речи аппаратно-программными средствами смыкается с задачей моделирования искусственного интеллекта.

Лит.: Речь: Артикуляция и восприятие. М.; Л., 1965; Физиология речи. Восприятие речи человеком. Л., 1976; Perception and production of fluent speech / Ed. R. А. Cole. Hillsdale, 1980; Massaro D. Speech perception by ear and eye: а paradigm for psychological enquiry. Hillsdale, 1987; Галунов В. И., Родионов В. Д. Моделирование процессов передачи информации в звуковом диапазоне. Л., 1988; Cognitive models of speech processing: Psycholinguistic and computational perspectives / Ed. G. Т. Altmann. Camb., 1990; Штерн А. С. Перцептивный аспект речевой деятельности. Л., 1990; Мурзин Л. Н., Штерн А. С. Текст и его восприятие. Свердловск, 1991; Венцов А. В., Касевич В. Б. Проблемы восприятия речи. 2-е изд. СПб., 2003; The handbook of speech perception / Ed. D. В. Pisoni, R. Е. Remez. Oxf., 2005.

В. Б. Касевич.