Некоторые прикладные аспекты исследования звучащей речи

Тип работы:
Реферат
Предмет:
Языкознание


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Р. К. Потапова,
В. В. Потапов
НЕКОТОРЫЕ ПРИКЛАДНЫЕ АСПЕКТЫ ИССЛЕДОВАНИЯ ЗВУЧАЩЕЙ РЕЧИ
Решение задачи идентификации говорящего по голосу и речи усложняется вследствие применения широкого спектра используемых методов. В центре нашего внимания находятся способы, с помощью которых вскрывается информационное содержание речевого сигнала с учетом релевантных признаков перцептивной и акустической фонетики, физиологии, психологии и т. д. Цель данного исследования — показать важную роль прикладного речеведе-ния при решении задачи идентификации говорящего и его эмоционального состояния по голосу и речи.
Ключевые слова: прикладное речеведение- идентификация по голосу и речи- речевой сигнал- перцептивная и акустическая фонетика- эмоциональное состояние говорящего.
Продуктом говорения в собственном смысле этого слова является речевой сигнал (отдельное высказывание, фрагмент высказывания, дискурс, текст), который содержит информацию о деятельностных, индивидуально-личностных, а также интеллектуальных особенностях говорящего.
Современная модель социальной структуризации языка и речи включает взаимообусловленные и взаимозависимые аспекты, связанные с формированием речевых кодов говорящих под влиянием социальной структуры общества в целом (стратификации по общественным слоям, группам и т. д.), социальных отношений (например, социокультурных, ситуативных) между коммуникантами, а также физиологических, психологических и интеллектуальных особенностей коммуникантов [7].
Подобная модель предполагает учет системы языковых правил в лексике, грамматике (в частности, в синтаксисе) и в фонетике, соответственно лексических, синтаксических и фонетических стратегий планирования в речевом поведении индивида, способы выражения (говорения) в речевой коммуникации, что предопределяет дифференциацию функционирующего в определенной этнолингвистической общности языка по социальным группам говорящих и социальным слоям населения с учетом профессиональных, сословных и классовых
вариантов данного языка, т. е. с учетом его функциональных стилей (вариантов).
Среди всего многообразия факторов, обусловливающих специфику речевого кода, видное место занимает физиолого-психический фактор дифференциации говорящих (например, по принадлежности к биологическому полу, точнее сексолекту (по Р. К. Потаповой), возрастному цензу), что находит отражение в особенностях формирования и реализации звучащей речи, рассматриваемой как сложное скоординированное движение (по В. М. Бехтереву). Одной из наиболее убедительных концепций организации сложного осознаваемого движения является теория, согласно которой в сложном осознаваемом движении совмещено пять уровней (по Н. А. Бернштейну): уровень, А — уровень фона всех действий, движений, тонуса мышечного массива тела, скелета- уровень Б — уровень управления собственным телом- уровень В — уровень пространственного поля, которое полностью соотнесено с внешним миром- уровень Г — уровень предметных действий (схема, топология) — уровень Д — уровень, на котором сосредоточены ведущие в смысловом отношении координации речи и письма.
Все уровни тесно взаимодействуют друг с другом. «Выход» на конечный уровень — речь (а также письмо) — является результирующим, включающим в себя все особенности индивидуальности говорящего.
Речь — это форма поведения человека, манифестация его характера, привычек, жизненных и социальных позиций.
Совокупность различных сторон речевой деятельности составляет единый, целостный психологический объект, который включает следующие компоненты: механизм, образованный специализированными психофизиологическими структурами и динамическими процессами, протекающими в этих структурах- непосредственные функции, осуществляемые этим механизмом (психологические и лингвистические феномены) — функционирование этого механизма в условиях социального взаимодействия людей.
Лингвистика, использующая для своего анализа речевой продукт, отбирает для исследования различные речевые проявления, соотносит анализируемый материал с источником речевой деятельности (индивидуумом), констатирует наличие той или иной языковой системы в этом источнике. В проблематику входят также соотношения: речь — мысль, речь — эмоции, речь — патологии и т. д.
Проблема описания психических явлений через установление их зависимостей с явлениями другого рода (например, особенностями
речепроизводства, латентным периодом голосообразования и др.) приобретает особое значение для решения ряда прикладных задач: например, при профессиональном отборе, получении психологического и интеллектуального портрета говорящего, идентификации личности по речи и т. д. Вышеуказанные задачи могут решаться с привлечением дополнительной информации в области акустики речевого сигнала и тактики построения более сложного речевого продукта — звучащего текста. Опираясь на утверждение о «наложении психологического узора на физиологическую канву» (по И. П. Павлову), возможно соотнесение психического с физиологическим во времени как бы по внешнему формальному признаку.
В русле разрабатываемой нами проблемы стоит вопрос о соотнесении психического с физиологическим по такому внешнему наблюдаемому и регистрируемому признаку, как звучащая речь (как отдельные высказывания-реплики, так и связная речь-текст). Чтобы связь между внешним признаком и глубинными процессами психики, а также физиологии имели объяснительный характер, должна быть выявлена содержательная общность между изучаемыми явлениями, что возможно при условии использования понятия изоморфизма. Данный подход широко используется в современной психофизиологии. Так, например, известны исследования изоморфным способом сопоставить усиление пространственной синхронизации биопотенциалов мозга человека с напряженностью умственной деятельности человека. Или, например, предлагается определять «количество мотивации» с помощью учета массы активируемых нейронов.
Действительно, в ряде случаев с большой вероятностью могут быть выделены какие-то общие свойства физиологического процесса, которые изоморфным образом проявляются и в психическом процессе. Такими свойствами в первую очередь можно считать полярные отношения: усиление — ослабление, увеличение — уменьшение, соединение — разъединение.
Таким образом, если под изоморфизмом понимать наличие взаимооднозначного отображения двух совокупностей, сохраняющего их структурные свойства, то для решения стоящей перед нами задачи такими совокупностями будут являться, с одной стороны, продукт речевой деятельности (лингвистические единицы — звуки, слоги, слова, фразы, целые высказывания и тексты), а, с другой стороны, психофизиологическая основа индивидуума. В данном случае предлагается
идти от периферийного речевого механизма к механизму центрального внутреннего речевого блока, «отвечающего» за основные психологические и интеллектуальные характеристики речи.
По содержательным основаниям устанавливается связь физиологических свойств нервной системы и психических свойств человека через внешний формальный показатель (совокупность акустических и лексико-грамматических признаков).
Исходя из этого, можно предположить, что на основании детального анализа динамики изменения акустических и лексикограмматических параметров речи даже в рамках высказывания можно сделать адекватный вывод о преобладании процессов: возбуждения / торможения- уравновешенности / неуравновешенности- рассеянности / сосредоточенности- концентрации умственных усилий / отсутствии концентрации умственных усилий и т. д.
При этом достаточно индикативными для каждого говорящего являются такие акустические параметры, как: средняя частота основного тона Б0 и величина стандартного отклонения- дисперсия Б0- коэффициент вариативности Б0- максимальный и минимальный уровень Б0, диапазон Б0- характер огибающей Б0- треки формальных частот Б
^ ^ Бп и др.
Так, например, установлено, что при психофизиологической напряженности Б0 увеличивается со 100−132 Гц до 156−185 Гц- соответственно дисперсия возрастает с 9−17 Гц до 23−34 Гц, коэффициент вариативности возрастает с 8−16 отн. ед. до 15−20 отн. ед.
Для более полного понимания влияния психофизиологического механизма на параметры речи следует рассмотреть искажения, возникающие в акустических характеристиках речи при моделировании измененных состояний. В качестве примера такой модели может быть выбрано состояние вестибуловегетативных расстройств (СВВР), приводящих к выраженному возбуждению вегетативной нервной системы. При этом на начальных стадиях ВВР происходит преимущественно активация симпатических отделов, что применительно к голосовому аппарату человека может приводить к возникновению констрикторного эффекта, приводящего к увеличению инерционности голосовых мышц. Согласно ряду исследований влияния ВВР на речевую функцию имеют место определенные искажения, регистрируемые в параметрах речи, например увеличение Б0 и снижение амплитуды формант. Общая интенсивность речевого сигнала во всем
диапазоне речевых частот снижается в среднем на 5 дБ. Изменение частот первых четырех формант превышает пределы нормальной физиологический вариативности и имеет при этом нестабильный характер. Время произнесения ниже фонового значения.
Процесс формирования вокализованных (гласных, сонорных согласных) звуков включает два этапа. На первом этапе происходит формирование базового голосового сигнала, так называемого «голосового возбуждения».
На втором этапе — процесс фильтрации исходного базового сигнала в полостях речевого тракта, в результате чего реализуется характерная для того или иного звука спектральная картина.
Основной причиной специфики речевого сигнала могут служить нейрофизиологические и психические особенности процесса фонации (голосообразования), реализация через речь которых находится под контролем центральной и вегетативной нервных систем говорящего, причем крайне важным является разграничение двух видов вариативности речевого сигнала:
а) интериндивидуальной вариативности, обусловленной индивидуальными анатомо-физиологическими, психологическими и социальными особенностями говорящего и представляющей собой основу информационной области индивидуально-значимых признаков-
б) интраиндивидуальной вариативности, вызванной воздействием целого ряда не относящихся к семантическому содержанию высказывания факторов и выражающейся в самопроизвольном варьировании голоса и речи даже в рамках неизменного речевого отрезка в зависимости от различных неконтролируемых факторов функционирования многокомпонентного речевого аппарата.
Речь, являясь средством общения, становится одновременно и механизмом интеллектуальной деятельности, позволяющим выполнять операции отвлечения и обобщения и создающим основу категориального мышления.
Речь человека характеризуется исполнительной, или операционной стороной, первым звеном которой является физическая, или звуковая материя, анализ которой позволяет определить соотношение индивидуальной речевой реализации с инвариантом и вариантами звуковых и интонационных моделей на базе конкретного языка.
Следующим звеном исполнительной стороны речевого процесса является лексико-семантическая организация речевого материала,
состоящая в реализации лексико-морфологического кода языка, который обеспечивает превращение образов и понятий в их словесные обозначения.
Вышесказанное предопределяет концептуальную основу успешной разработки проблемы идентификации говорящего в специальных целях.
Исходя из основной предпосылки, согласно которой речь человека индивидуально организована на базе фонационных и артикуляторных жестов в непосредственной связи с социально отработанным фонологическим представлением высказывания и с его лексикосемантическими особенностями, целесообразно строить акустиколингвистический алгоритм идентификационного анализа говорящего с учетом следующих факторов: акустической (аппаратно-программной) обработки речевого сигнала- анатомо-физиологически сориентированного декодирования речевого сигнала- социо-психологически сориентированного декодирования речевого сигнала- интеллектуальносодержательного декодирования речевого сигнала- поуровневого глобального лингвистического декодирования.
В связи с этим все решаемые задачи могут быть условно охарактеризованы как задачи составления в конечном счете индивидуального «портрета» говорящего, куда следует отнести фонационные (голосовые), артикуляторные (сегментные), просодические (супрасегмент-ные) корреляты речи последнего. Основой акустико-лингвистического анализа служат итеративные процедуры обработки речевой волны. Целесообразно разбиение акустико-лингвистических признаков речевого сигнала на первичные и вторичные. К первичным следует отнести:
— фонационные признаки (признаки типологии голосовой мимики, например, форсированного или щадящего голосообразования) с соотнесением анализируемого речевого сигнала к одному из типов фонации-
— артикуляторные признаки (признаки артикуляторной типологии порождения речевого сигнала, например, напряженной или ненапряженной) с соотнесением речевого сигнала к одному из типов артикуляции.
Первичные признаки находятся в непосредственной зависимости от специфики анатомо-физиологического характера.
Вторичные (просодические) носят условно надстроечный характер относительно первичных и реализуются на их базе. Надсегментная
(супрасегментная) реализация вторичных признаков речевого сигнала ведет к образованию своего рода структурно-организованных речевых фигур и их конкатенации, носящих также строго индивидуальный характер.
Согласно современным данным речевые признаки, характеризующие говорящего, а также специфику его индивидуального склада (т. е. синкразию) содержат два типа информации: коммуникативную и индивидуальную.
В качестве лингвистического (языкового) сигнала речь включает коммуникативное содержание сообщения, а в качестве экстралинг-вистического сигнала соотносится с информацией о таких признаках говорящего, как пол, возраст, региональное происхождение и т. д.
В настоящее время предлагаются следующие виды классификации информации, содержащейся в речевом сигнале:
А
— биологическая информация (размеры, физические данные, пол, возраст и составляющие состояния здоровья) —
— психологическая информация (характеристика личности) —
— социальная информация (интегративная акустическая информация о происхождении, социальном статусе и т. д.).
Б
— групповая информация (региональная, профессиональная и т. д.) —
— идиосинкразическая информация (индивидуальная специфика) —
— аффективная информация (информация об изменениях в состоянии говорящего.
При описании речевого портрета говорящего различают три типа нормы: универсальную, групповую и синкразическую. При этом особая роль принадлежит голосовой информации, декодируемой на уровне слуховой перцепции по следующей схеме:
— описание, соотносящееся с портретом говорящего и его местом в жизни воспринимающего-
— соотнесение воспринимаемого речевого образа с определенным именем говорящего-
— репродукция по речевому образу физических данных говорящего (лица, общего телосложения, жестов, походки и т. д.) —
— спецификация дистинктивных акустических характеристик.
Речевые признаки говорящего подразделяются на контролируемые (внешние) и неконтролируемые (внутренние). Некоторые
специалисты выделяют потенциально контролируемые признаки. Степень контроля зависит от двух факторов:
— от способности говорящего использовать слуховые формы обратной связи в процессе реализации артикуляторной программы-
— от его перцептивной способности применять слуховые формы информации для обнаружения звуковых различий. Оба фактора входят в число таких понятий, как «мастерство контроля».
Факторы, не поддающиеся контролю, обусловлены органогенетическими признаками говорящего: структурой речевого аппарата, включающего длину голосового тракта, размеры языка, небной занавески, зева, челюсти и всей ротовой полости- формой (конфигурацией) гортанного тракта и объемом носовой полости. Сюда же могут быть отнесены так называемые структурные дефекты (например, наличие расщелины в твердом небе, отсутствие зубов и т. д.). Контролируемые факторы не связаны с органо-генетическими ограничениями и включают изменения в манипуляциях голосовой динамики всех потенциально контролируемых мышц артикуляции, которые характеризуют манипуляционные компоненты качества голоса.
Неконтролируемые факторы могут рассматриваться как постоянные (перманентные) и переменные (относительно постоянные). Они базируются на анатомии и физиологии говорящего и соотносятся с его инвариантом-нормой физического плана, свойственного для речевых характеристик говорящего.
Перманентность и неперманентность неконтролируемых признаков связаны с дифференциацией последних на долговременные и кратковременные (примером появления кратковременных неконтролируемых признаков является речепроизводство в период болезни горла, после бега, быстрого подъема по лестнице и т. д.). Однако к числу кратковременных неконтролируемых признаков не могут быть отнесены такие, например, признаки, как признаки возрастной ломки голоса в период пубертации.
Как контролируемые, так и неконтролируемые признаки могут быть сгруппированы по принципу внутридикторских (интрадиктор-ских) и междикторских (интердикторских) сходств и различий.
Следовательно, информация о говорящем скрыта в речевом сигнале, соотносится с его анатомическими признаками и хранящимися на нейронном уровне мышечными речевыми образцами, коррелирующими с телосложением говорящего.
При разработке методики отладки автоматизированных систем атрибуции говорящего по речи необходимо учесть следующие условия реализации речевого сигнала:
— речь должна быть естественной-
— речь должна быть варьируемой как можно шире относительно говорящих (интердикторские расхождения), но достаточно однородной относительно каждого говорящего (интрадикторские расхождения) —
— на первоначальной стадии разработки речь не должна находиться под влиянием шума, помех и т. д. или не должна включать специальные характеристики передачи по техническому тракту-
— не допускать искажений голоса.
Особо информативным для атрибуции говорящего по речи является диапазон частоты основного тона, куда входят прежде всего такие параметры, как ширина диапазона частоты основного тона и его регистр, что соотносится со следующими индивидуальными характеристиками говорящего:
1. Биологической дифференциацией по полу, возрасту и физическим данным (средняя длина голосовых связок у мужчин приблизительно на 1/3 больше, чем у женщин, что составляет приблизительно 23 мм по сравнению с 17 мм- данное распределение ведет к более низкой средней частоте основного тона для мужских голосов- вместе с тем для частоты основного тона женщин характерен более узкий диапазон по сравнению с диапазоном частоты основного тона у мужчин).
Уплотнение и затвердевание гортанных хрящей начинается с 25 лет. К 65 годам хрящи полностью костенеют и окружающие мышцы полностью утрачивают свою эластичность, что ведет к уменьшению таких параметров, как ширина диапазона частоты основного тона и его регистр относительно обычного, привычного для того или иного говорящего диапазона частоты основного тона.
2. Перманентными или временными биологическими различиями относительно состояния здоровья говорящего в данный момент времени (например, зауженный диапазон частоты основного тона характерен для больных эпилепсией, заикающихся и т. д.).
3. Психологическими различиями в поведении говорящего. Для состояния воодушевления характерна речь с более широким диапазоном частоты основного тона по сравнению с речью в состоянии
безразличия или усталости. Расширение частоты основного тона фиксируется в том случае, когда речь говорящего характеризуется наличием взволнованности. Отсутствие настроения индицируется уменьшением диапазона частоты основного тона.
4. Наличием иностранного акцента (например, при речеобразо-вании на иностранном языке фиксируется смещение диапазона частоты основного тона говорящего в более низкий регистр по сравнению с его речью на родном языке).
5. Идиосинкразическими (индивидуальными) признаками на биологическом, психологическом и регионально-социальном уровнях.
Индивидуальные признаки говорящего традиционно делят на две группы: приобретенные и неприобретенные.
К приобретенным признакам относятся такие речевые специфические признаки, которые образуются под влиянием внешних условий жизни говорящего. К числу последних относится прежде всего процесс овладения языком, а затем его применения в устной и письменной коммуникации. При этом особую роль играет диалект, на котором говорит непосредственное окружение индивидуума, в особенности в период фазы овладения речью, которая соотносится приблизительно со временем обучения в школе (приблизительно до 18 лет). Сюда же относятся общественные условия, которые определяют так называемый «социолект».
Неприобретенные признаки соотносятся с органогенетическими данными, базирующимися на анатомических и нейрофизиологических составляющих речевого аппарата. К последним относятся размер и пространственная конфигурация (так называемая «полостная конфигурация») шейно-гортанного, носового и глоточного трактов, мобильность и величина языка, и в особенности число зависящих от голосообразова-ния краевых условий (термин математики), а также возраст и пол.
При разработке акустико-фонетического модуля систем идентификации говорящего нами предлагается использовать фреймовый подход. При этом возможны две разновидности использования фреймов, содержащих структуру фонетических знаний. Применение фреймов базируется либо на сравнении фреймов-эталонов и фреймов-текущих реализаций акустических событий при наличии специальной фреймовой грамматики, либо на классификации фреймов и их последующего объединения в группу, которой приписывается определенный маркер.
Фреймовый подход представляется особенно перспективным, так как позволяет использовать знания экспертов: универсального и конкретно индивидуального плана. В основе формирования фреймов лежит информация следующих семантических зон: антропометрической (слоты: масса тела, рост, строение речевого аппарата, форма головы, ширина скул, форма и ширина грудной клетки- физиологической (слоты: пол, возраст, норма / патология) — психологической (слоты: типы нервной деятельности, типы эмоционально-волевой регуляции) — интеллектуальной (слоты: высокий интеллект, низкий интеллект, коммуникабельность и пр.).
Таким образом, каждый фрейм будет представлен своим вероятностным набором слотов, а каждый слот, в свою очередь, вероятностным набором акустических параметров (спектральных, временных, просодических).
На следующем этапе будет осуществляться сличение и сопоставление фрейма-эталона и фрейма-текущей реализации по всем акустическим параметрам применительно к каждой фреймовой зоне.
Фреймы формируются для всех возможных вариантов типов произнесения. Слоты фреймов заполняются с учетом как абсолютных, так и относительных (структурно-соотнесенных) параметров и их значений речевого сигнала.
На следующем этапе вычисляются меры соответствия между параметрами фрейма-эталона и фрейма-текущей реализации. Наличие события маркируется меткой, характеризующей фрейм-эталон, давший наилучший результат сравнения. Если меры соответствия ниже фиксированного порога, система может пересчитать один или несколько параметров фрейма-реализации.
Управляющие структуры формализуются фреймовой грамматикой, содержащей правила и метазнания, необходимые для получения результата.
База знаний эксперта содержит данные об используемых в ходе анализа объектах (акустических параметрах, акустических признаках), а также строго неформализуемые знания (силлогизмы, эвристики и т. д.), включая информацию о единицах всех языковых уровней.
База знаний может быть разделена на суббазы, каждая из которых должна функционировать параллельно с другими суббазами.
Введенные экспертом правила означают, что для данных ситуаций (определенного объема памяти, конкретной проблемы и т. д.), которые
могут быть описаны как «эксперт», «проблема», «контекст» и «условие», основополагающим является заключение по типу:
ЕСЛИ… ТО…
В автоматизированной системе, предназначенной для получения обликовых характеристик говорящего по речи, предусматривается, таким образом, новый в данном отношении экспертный подход с учетом фреймов. Впервые в экспертной системе подобного рода реализуется новая методология, основанная на алгоритмизации знаний экспертов-специалистов в области речеведения и прикладной лингвистики. Первоочередное значение при этом приобретает база акустико-фонетических и лингвистических знаний, а также база лингвистических данных, включающая информацию о ряде универсальных структурных признаках и параметрах речевого сигнала, соотносящихся с обликовыми характеристиками говорящего, не ограниченными перечнем характеристик традиционного плана.
Речь в ее звучащей форме полифункциональна по своей природе. Ввиду полифункциональности речевой сигнал содержит информацию лингвистического и экстралингвистического характера. При идентификации говорящего важны оба типа характеристик. Лингвистические характеристики содержат информацию о родном/неродном языке говорящего, о диалекте, идиолекте, жаргоне, арго, просторечии, литературной норме и т. д., о характере индивидуального структурирования сообщения.
Все вышеперечисленные аспекты соотносятся с определенными признаками, присутствующими в речи говорящего, что позволяет определить его происхождение, социальный статус, образовательный ценз, принадлежность к определенной социальной группе и т. д. Экс-тралингвистические характеристики содержат информацию о: физиологических, антропометрических, психологических, интеллектуальных данных.
Акустический и перцептивный анализы речевого сигнала (слова, фразы, текста) позволяют установить: антропометрические признаки (рост, вес, форму головы / черепа) — физиологические признаки (пол, возраст, состояние нормы / патологии) — психологические признаки (тип нервной системы, эмоционально-волевую регуляцию) — интеллектуальные признаки (специфику мышления). Особо выделяемы характеристики неконтролируемого плана. К ним относится
противопоставление: естественный речевой сигнал / имитируемый речевой сигнал. К экстралингвистическим типам информации, содержащимся в речевом сигнале информация о статике / динамике тела говорящего в момент говорения, пространственно-предметная информация (местность, наличие ветра и т. д.).
Вышеперечисленные типы информации могут быть извлечены из речевого сигнала с помощью специальных знаний в данной области, проведения акустического анализа и многоярусного лингвистического анализа по специальной программе формализации и алгоритмизации экспертных знаний, создания программного обеспечения.
Эмоциям в речи посвящено огромное количество исследований в области психологии, социологии, лингвистики, психолингвистики. Эмоции и разум в речи неразрывно связаны между собой. Эмоции не сопровождают деятельность человека, а являются неотъемлемой составляющей сложной организации его психических процессов и состояний. Речь следует рассматривать как единство интеллектуального и эмоционального, так как она является способом формирования и формулирования мысли посредством языка [1].
Являясь формой человеческого поведения, речь подвержена влиянию широкого ряда еще не полностью изученных факторов [8]. Измерения речевых характеристик говорящего показывают, что на качество голоса могут влиять различные факторы, например: смысл произносимого текста- язык, на котором произносится текст- физическое и психологическое состояние говорящего- анатомические изменения органов речи в результате операции и др. Такие внутренние факторы, как усталость, болезнь, наличие алкоголя или наркотиков в крови, могут воздействовать на речевой сигнал как на сегментном, так и на супрасегмент-ном (просодическом) уровнях. На качество голоса также может оказать влияние переход с одного языка на другой (у многоязычных говорящих) и эмоциональное состояние. Так, например, установлено, что различным эмоциональным состояниям свойственны свои просодические характеристики, лексические единицы, словообразовательные способы (например, суффиксы), междометия, частицы и т. д. [4- 13].
Многочисленные исследования позволяют утверждать, что эмоциональные составляющие влияют и на темп речи. Так, например, в состоянии грусти, злорадства и страха длительность высказывания по сравнению с нейтральным произнесением увеличивается, а при радости, гневе и раздражении — уменьшается [2].
Проводились исследования влияния эмоционального состояния и на интонацию. В частности, В. С. Соколова исследовала влияние эмоций на вопросительные интонации во французском языке [9]. По ее мнению, эмоции оказывают настолько сильное влияние на вопросительные интонации, что способны даже разрушать категорию во-просительности. Интонационный контур фразы способен изменяться вплоть до своей противоположности (там, где в эмоционально относительно нейтральной речи наблюдается повышение тона, в эмоционально окрашенной может появиться падение тона и наоборот).
Кроме интонационных характеристик эмоциональная окраска способна оказывать влияние и на артикуляцию. Например, при выражении грусти имеется тенденция к закрытому варианту гласных и к увеличению степени их лабиализации, тогда как открытый вариант и уменьшение лабиализации могут быть характерны для реализации эмоций радости и злорадства, а просто открытый вариант — гнева [8].
В исследованиях эмоционального состояния говорящего применительно к криминалистике большое внимание уделяется, прежде всего, анализу таких эмоциональных состояний, как «страх» и «тревожность» [6].
Ранее нами были выявлены следующие перцептивные индикаторы эмоционального состояния «страх» / «тревожность»:
— увеличение числа хезитационных пауз-
— увеличение длительности хезитационных пауз-
— увеличение скорости артикуляции (для гласных) —
— темпоральное слоговое скандирование-
— ограниченная громкость высказываний-
— «неуверенный» тембр произнесения гласных-
— наличие компонентов шума в артикуляции гласных-
— нарушение плавности в реализации частоты основного тона-
— появление элементов шепотной речи и др. [8].
Как показали исследования речевой симптоматики психофизиологического состояния индивидуума, эмоциональное состояние «страх» обладает такими характеристиками, как:
— тихий голос-
— сниженная голосовая насыщенность (часто реализация так называемого «тонкого» голоса) —
— в большинстве случаев высота тона выше среднего уровня-
— в ряде случаев хрипотца голоса (следствие «зажатого» голосо-образования) —
— напряженная речевая ритмика-
— наличие «скованных» ритмов, а также «рваного» (неравномерного) речевого ритма-
— слабая акцентуация ударных слогов (как бы «неуверенность в себе») —
— затрудненная артикуляция [8- 10].
Итак, как правило, основное внимание исследователей было направлено ранее на изучение особенностей паузации, темпа речи, интонационных характеристик и акустических параметров речи под влиянием эмоционального состояния «страх».
В данном случае на первом этапе исследования анализировались такие воспринимаемые при перцептивно-слуховом анализе характеристики речи, как речевое дыхание и манера говорения. Были рассмотрены также высота, сила и окраска голоса.
Следует упомянуть, что многие предыдущие исследования проводились на материале аудиозаписей речи актеров, имитирующих различные эмоциональные состояния. Однако такие эмоциональные состояния, как «страх» и «тревожность», наименее адекватно передаются в речи актеров и при различного рода имитации. А именно эти эмоциональные состояния наиболее важны при идентификации личности по голосу в судебных целях. Впервые наиболее подробно на неимити-руемом естественном материале речь в этих состояниях была проанализирована в работах Н. И. Корнилова [3], Р. К. Потаповой и В. В. Потапова [11].
Поставленная проблема решалась благодаря использованию в ходе эксперимента записей, сделанных в ситуациях реального речевого общения (описание картинки, ответ на экзамене и семинаре) с участием дикторов — студентов отделения прикладной лингвистики МГЛУ. Целью исследования была проверка гипотезы о влиянии эмоционального состояния «страх» / «тревожность» на модификацию речевого сигнала.
Результатом данной работы стало выявление релевантных характеристик на перцептивно-слуховом уровне, соотносящихся с усилением психического напряжения с последующим влиянием на речевую деятельность.
Подготовка экспериментальных данных включала аудиозапись речевых высказываний дикторов (в возрасте от 17 до 20 лет) в трех ситуациях общения:
— спонтанная речь (описание картинки без предварительной подготовки) —
— реализация высказываний на семинаре (квазиспонтанная речь) —
— реализация высказываний в условиях экзамена (квазиспонтанная речь).
Для получения фонограмм спонтанной речи информантам предлагалось описать картинку из каталога Н. И. Корнилова [3]. На описание картинки каждый испытуемый затрачивал не более одной минуты. Записи квазиспонтанной речи студентов были получены в ходе семинарских занятий и экзаменов. Запись производилась на магнитную ленту с использованием магнитофона «OLYMPUS Pearlcorder S711», диктофона «SANYO TRC-960C» и сотового телефона «Sony Ericson». После накопления экспериментального материала была проведена его оцифровка с использованием программ «Adobe Audition 1. 0» («Adobe System Inc. «) и «Zhenilo Signal Workshop». Данные были переведены в формат WAV. Записи, сделанные на сотовый телефон с помощью программы «WAV& lt->-AMR», были переведены в формат WAV. Затем из большого количества полученного материала были отобраны фонограммы девяти дикторов (трех дикторов мужского пола и шести дикторов женского пола) в трех ситуациях общения. Таким образом, общее число фонограмм, которые были представлены экспертам-фонетистам для определения специфических параметров голоса и речи, составило 27 при общей длительности звучания, равной 24 мин.
В ходе эксперимента по перцептивно-слуховому анализу аудиторам необходимо было определить специфические характеристики голоса и речи каждого из дикторов в трех ситуациях общения:
а) высоту голоса — голос очень низкий, голос низкий, высота ниже среднего, высота средняя, высота выше среднего, голос высокий, голос очень высокий-
б) речевое дыхание — норма, прерывистое, дискомфортное-
в) силу голоса — голос слабый, сила ниже среднего, сила средняя, сила выше среднего, голос сильный-
г) тембр (окраска) голоса — голос звонкий, голос глухой, голос бархатный, голос хриплый, голос взволнованный, голос мягкий, голос назализованный, голос сиплый, голос певучий, голос резкий-
д) манеру речи — официальная, сдержанная, спокойная, непринужденная, развязная.
В процессе проведения эксперимента каждый испытуемый работал индивидуально. Фактор обсуждения признаков с другими испытуемыми исключался.
Согласно оценкам аудиторов, полученным в ходе перцептивнослухового анализа, прослеживается тенденция, согласно которой высота голоса дикторов в ситуации описания картинки — средняя / ниже среднего- в ситуации ответа на семинаре — выше среднего- в ситуации ответа на экзамене — выше среднего (рис. 1).
Рис. 1. Изменение высоты голоса
Сила голоса у разных дикторов в ситуации описания картинки -средняя- в ситуации ответа на семинаре — средняя / выше среднего- в ситуации ответа на экзамене — средняя / ниже среднего (рис. 2).
Речевое дыхание у различных дикторов в ситуации описания картинки — норма- в ситуации ответа на семинаре — прерывистое- в ситуации ответа на экзамене — прерывистое (рис. 3).
Манера речи у разных дикторов в ситуации описания картинки (спонтанная речь) — варьируется между значениями «непринужденная — спокойная — сдержанная" — в ситуации ответа на семинаре (ква-зиспонтанная речь) — «официальная" — в ситуации ответа на экзамене (квазиспонтанная речь) — «официальная» (рис. 4).
Рис. 4. Изменение манеры речи
По оценкам аудиторов окраска голоса дикторов в различных ситуациях общения имеет следующие характеристики: в нейтральной ситуации общения (описание картинки) тембры голоса у дикторов друг от друга отличаются- в ситуации ответа на семинаре — у всех тембр звонкий, взволнованный- в ситуации ответа на экзамене — взволнованный, глухой.
В заключение следует сказать, что при интерпретации данных исключались такие факторы, как тип высшей нервной деятельности
испытуемых, уровень воспитания, уровень подготовки при ответах на семинаре и на экзамене. Учитывались только речевые характеристики поведения в различных ситуациях общения. В итоге на первом этапе применительно к исследованию были сделаны следующие выводы:
— под влиянием эмоциональных состояний «страх» / «тревожность», которые являются типичными для ситуаций ответа на семинаре и на экзамене, высота голоса повышается-
— прослеживается тенденция увеличения силы голоса в ситуации «Семинар» и уменьшения силы голоса в ситуации «экзамен" —
— речевое дыхание также меняется от нормального до прерывистого и дискомфортного под влиянием эмоциональных состояний «страх» / «тревожность» в ситуациях семинара и экзамена-
— манера речи становится официальной по сравнению с нейтральной ситуацией общения, и голос многих дикторов становится звонким и взволнованным в ситуации семинара- глухим и взволнованным в ситуации экзамена.
Полученные данные могут быть использованы в судебной фонетике при идентификации говорящего по голосу и речи, при идентификации эмоционального состояния говорящего, для дальнейшего сравнения с другими результатами, которые учитывают вербальную реализацию данных эмоций на примере других языков.
Главной задачей исследования на втором этапе был анализ характеристик речи, релевантных для речевой реализации таких эмоций, как «страх» / «тревожность» в русской речи. В ходе работы был проведен перцептивно-слуховой эксперимент, в котором приняли участие те же испытуемые.
На данном этапе аудиторы должны были отмечать особенности речи испытуемых по следующим параметрам:
1. темп речи (очень медленный, медленный, средний, быстрый, очень быстрый) —
2. паузы (очень длинные, длинные, средние, короткие, очень короткие) —
3. заполнение пауз (паузы незаполненные, сонант, слог, неопределенный звук, гласный) —
4. акцентуация (ритм):
— сильная (ярко выраженный ритмический рисунок) —
— слабая (слабо выраженный ритмический рисунок).
Для каждой фонограммы испытуемых (реализации высказываний на экзамене, на семинаре и реализации высказываний без коннотативного эмотивного значения — описание предложенной картинки) в программе «Боипё^о^е» было выделено по 1 мин. Из этих фонограмм для каждого диктора были сформированы файлы, представляющие собой три фонограммы трех речевых ситуаций, следовавших в определенной последовательности: описание картинки — ответ на семинаре — ответ на экзамене, общей продолжительностью 24 мин.
Каждому аудитору был предъявлен специальный «протокол», где аудиторы отмечали те или иные характеристики дикторов, которых они прослушивали. Следует отметить, что запись можно было прослушивать желаемое количество раз. В процессе проведения эксперимента каждый аудитор работал также индивидуально. Фактор обсуждения признаков с другими аудиторами исключался.
В ходе перцептивно-слухового эксперимента было установлено следующее:
Темп речи. В большинстве случаев в ситуации «нейтральная речь» (описание предложенной картинки) аудиторы отмечали темп речи как средний. В ситуации «семинар» темп речи был обычно быстрый. Темп речи высказываний на экзамене обычно отмечался также как быстрый (см. рис. 5). Общая картина временных изменений речи подтвердила результаты в полученных нами более ранних работах [5- 11- 12].
Темп речи:
1-очень быстрый
2-быстрый
3-средний
4-медленный
123 456 789
Дикторы
описание
картинки
высказывани я на семинаре
высказывани я на экзамене
Рис. 5. Изменение темпа речи
Среднее значение темпа речи в трех речевых ситуациях отмечено большинством аудиторов. Как видно из рисунка 5, наблюдается тенденция к увеличению темпа в ситуациях «семинар» и «экзамен» по сравнению с нейтральной ситуацией (описание картинки). Темп речи в ситуациях «семинар» и «экзамен» может быть одинаковым, а может и различаться. В этом случае темп речи в ситуации «семинар» чаще быстрее, чем в ситуации «экзамен».
Паузы в речи. Данные протоколов позволили определить, что паузы в «нейтральной речи» (описание картинки) в большинстве случаях средние. В ситуации «семинар» паузы короткие или очень короткие. В ситуации «экзамен» паузы обычно короткие (см. рис. 6).
Рис. 6. Изменение паузации
Можно выявить тенденцию к уменьшению длительности пауз в ситуациях «семинар» и «экзамен» по сравнению с «нейтральной речью», причем паузы в ситуации «семинар» чаще короче, чем паузы в ситуации «экзамен». Иногда паузы при реализации высказывания на экзамене совпадают по длительности с паузами при описании картинки.
Заполнение пауз. В ситуации «нейтральная речь» (описание картинки), как отмечали аудиторы, паузы часто не заполнены. В ситуации «семинар» и «экзамен» паузы заполняются гласными довольно часто. Заполнение пауз сонантами, слогами или неопределенным звуком отмечались аудиторами во всех ситуациях очень редко.
Ритмический рисунок. В «нейтральной речи» (описание картинки) аудиторы отмечали как ярко выраженный, так и слабо выраженный
ритмический рисунок. В ситуации «семинар» все аудиторы отметили ярко выраженный ритмический рисунок (усиленная акцентуация). В ситуации «экзамен» отмечали как ярко выраженный ритмический рисунок, так и слабо выраженный ритмический рисунок.
Результаты исследования позволяют констатировать наличие определенных тенденций, но существуют также и отклонения от общего вектора воспринимаемых признаков, что может быть связано:
— с типом высшей нервной деятельности дикторов-
— с уровнем воспитания дикторов-
— с уровнем подготовки дикторов.
Проведенный эксперимент представляет собой поиск релевантных признаков на перцептивно-слуховом уровне, соотносящихся с усилением психического напряжения в связи с изменением ситуации с последующим влиянием на речевую деятельность.
Полученные результаты могут быть использованы:
— для определения по лингвопросодическим параметрам психического состояния личности в различных ситуациях-
— для использования лингвопросодических параметров при слуховой идентификации говорящего-
— для определения роли каждой из лингвопросодических характеристик-
— для выявления возможностей по определению лингвопросодических признаков, связанных с изменением эмоционального состояния в направлении дихотомии «страх / тревожность» (своего рода слуховой детектор) —
— для распознавания эмоционального состояния говорящего в целях проведения криминалистической экспертизы-
— для составления «портрета говорящего» (по Р. К. Потаповой), определения его паравербальных характеристик как носителя конкретного языка в конкретной ситуации общения-
— для диагностирования психического и физического состояния говорящего, например в медицинских целях.
СПИСОК ЛИТЕРАТУРЫ
1. Витт Н. В. Речь и эмоции: учебное пособие к спецкурсу по психологии. -
М.: МГПИИЯ им. М. Тореза, 1984. — 74 с.
2. Геладзе Н. В. Модификация интонационной структуры повествовательной фразы под влиянием эмоциональной окраски во французском
языке (экспериментально-фонетическое исследование) // Вопросы романогерманской филологии. — М.: МГПИИЯ им. М. Тореза, 1975. — С. 237−249. (Тр. / МГПИИЯ- вып. 84.)
3. Корнилов Н. И. Моя Каракалпакия. — М.: Международная Ассоциация «Искусство Народов Мира» — Галерея «Никор», 2007. — 150 с.
4. Потапова Р. К. Коннотативная паралингвистика. — М.: Триада, 1997. -100 с.
5. Потапова Р. К., Потапов В. В. Временные корреляты эмоций как специфические индивидуальные параметры идентификации говорящего в судебной фонетике // Ежегодник Рос. Акуст. Общества «Акустика речи и прикладная лингвистика». — М., 2002. — С. 3−13.
6. Потапова Р. К., Потапов В. В. Модификация речевого сигнала как следствие наличия эмоциональных состояний «страх» / «тревожность» // XVIII Межд. науч. конф. «Информатизация и информационная безопасность правоохранительных органов»: сб. тр. — М., 2009. — С. 321−326.
7. Потапова Р. К., Потапов В. В. О соотношении обликовых характеристик говорящего и речевого сигнала // XVI Межд. науч. конф. «Информатизация и информационная безопасность правоохранительных органов»: сб. тр. — М., 2007. — С. 330−336.
8. Потапова Р. К., Потапов В. В. Язык, речь, личность. — М.: Языки славянской культуры, 2006. — 496 с.
9. Соколова В. С. Методические указания и задания по теоретическому курсу фонетики французского языка. — М.: МГПИИЯ им. М. Тореза, 1983. — 20 с.
10. Fahrmann R. Die Deutung des Sprachausdrucks. Studien zur Einfuhrung in die Praxis der Charakterologischen Stimm- und Sprachanalyse. — Bonn: H. Bouvier und Co. Verlag, 1960. — 361 S.
11. Potapova R. K., Potapov V V Speech Temporal Correlates of Fear-Anxiety (for Russian native speakers) // Proc. of IAFP Conference. — Paris, 2001. -P. 3−5.
12. Potapova R. K., Potapov V V Temporal Correlates of Emotions as a Speaker-state Specific Parameters for Forensic Speaker Identification (speech temporal correlates of fear-anxiety for russian native speakers) // Intern. Workshop «Speech and Computer» (SPECOM'2003). — Moscow, 2003. — P. 291−301.
13. Scherer K. R. Profiles of Emotion-Antecedent Appraisal: Testing Theoretical Predictions across Cultures // Cognition and Emotion. — 1997. — P. 23−37.

ПоказатьСвернуть
Заполнить форму текущей работой