Исследование фонетического строя языка в системах распознавания речи по методу фонетического декодирования слов

Тип работы:
Реферат
Предмет:
Культура и искусство


Узнать стоимость

Детальная информация о работе

Выдержка из работы

3. МЕХАНИЗМЫ РАЗВИ ТИЯ ИННОВАЦИО ННЫХ ПРОЦЕССОВ В ЭПОХУ ИНФОРМАЦИОННОГО ОБЩЕСТВА
3.1. ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ
УДК 519. 688
ИССЛЕДОВАНИЕ ФОНЕТИЧЕСКОГО СТРОЯ ЯЗЫКА В СИСТЕМАХ РАСПОЗНАВАНИЯ РЕЧИ ПО МЕТОДУ ФОНЕТИЧЕСКОГО ДЕКОДИРОВАНИЯ СЛОВ*
Д. Ю. Акатьев, К. А. Граевский
В работе поставлена и решена задача определения наиболее информативных минимальных речевых единиц типа фонем в метрике Кульбака-Лейблера для использования в системах распознавания речи основанных на методе фонетического декодирования слов.
Ключевые слова: распознавание речи, фонетический строй языка, минимальная речевая единица, декодирование слов.
Актуальной задачей прикладной информатики является построение систем распознавание изолированных слов. Процесс распознавания осуществляется путем сравнения его с существующими в базе данных эталонами по тому или иному критерию. Чаще всего для распознавания слов система делит их на минимальные речевые единицы (МРЕ) типа фонем и распознает как определенную их последовательность.
В существующих системах автоматического распознавания речи (АРР) наиболее распространены два подхода: скрытые марковские модели (СММ) и искусственные нейронные сети (ИНС). Они хорошо известны и описаны в работах [1, 2], но ни один из них не может считаться универсальным, полностью решающим задачу распознавания речи.
Поэтому для исследователей в этой области несомненный интерес представляет информационная теория восприятия речи (ИТВР), являющаяся альтернативой уже существующим подходам к задаче АРР. ИТВР основывается на критерии минимума информационного рассогласования (МИР) и методе обеляющего фильтра (МОФ) и подробно описана в работе [3]. Основным элементом ИТВР является понятие минималь-
* Работа выполнена при поддержке госконтракта № 07. 514. 11. 4137 на выполнение НИР в рамках мероприятия 1.4 ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007−2013 годы».
ной речевой единицы (МРЕ) типа фонемы. Под фонемой в данном контексте обычно понимают минимальную единицу звукового (фонетического) строя национального языка. Каждый человек имеет свой собственный фонетический строй. Это обусловлено особенностью и уникальностью речевого тракта. Сколько носителей, столько и разных реализаций фонетического списка национального языка. В этом проявляется краеугольная проблема вариативности устной речи [3]. Поэтому встает задача классификации МРЕ русского языка. Для ее решения применяется статистический подход на основе критерия МИР. Каждый парциальный сигнал рассматривается в пределах конечного списка МРЕ {Хг} и отождествляется с той X* из них,
которая отвечает принципу минимума ИР р х / х* ^ = тт х / х* ^ между вектором х (1) и соответствующим ИЦ-эталоном
х*, *& lt- Я. Это известная формулировка критерия МИР в задачах АРР [4].
Одной из наиболее эффективных реализаций критерия МИР служит МОФ [3]. При этом решающая статистика принимает следующий вид:
р (х /хг 0,5а2г (х)/2 -1] г = ,
где:
2
& amp-г (х) — выборочная дисперсия отклика г-го обеляющего фильтра (ОФ), работа которого опи-
Психолого-педагогический журнал Гаудеамус, № 2 (20), 2012
сывается с использованием авторегрессионной модели (АР-модели) МРЕ общего вида:
уг (1) = х (1) — агіх (1 — і), I = 1, 2, …, Ь І=1 ?
где:
аг = аг і} - вектор авторегрессионных коэффициентов.
Преимуществом приведенной формулировки принципа МИР является адаптивный вариант реализации МОФ, основанный на быстрых вычислительных процедурах, таких как метод Берга. Не все МРЕ присутствующие в речевом сигнале равносодержательны. Обычно малосодержательные фонемы носят служебный характер и неудовлетворительно распознаются. Напротив, информативные (содержательные) фонемы являются надежным материалом для распознавания РЕ, например, слов.
Алгоритм обработки сигналов речи. В проведенном эксперименте использовался следующий список звуков: [а в в' ж ж' з з' и л л' м м' н н' о р р' с с' у ф ф' х х' ч ш щ ы э], полученный от двух дикторов. Всего 29, из которых 6 гласных. В результате для Диктора 1 было выделено 120 МРЕ, а для Дикто-ра2 — 137. Каждая МРЕ из списка, представленного выше, была сформирована в ФБД в виде нескольких реализаций. В список наи-
Таким образом, можно утверждать, что к множеству информативных фонем русского языка относятся фонемы с минимальными вариациями своих контролируемых признаков в пределах соответствующего кластера с минимальными значениями ошибки перепу-тывания. Данный результат позволяет определить состав фонем для систем распознава-
более перепутываемых звуков не попал ни один гласный звук. Это дает нам право предположить, что именно они могут являться базой для систем распознавания речи, основанных на поэлементном сравнении РЕ.
Для подтверждения этого высказывания был проведен еще один эксперимент. Диктором! было записано от 10 до 15 реализаций каждого из 29 звуков. Далее все они были обработаны в информационной системе фонетического анализа речи (ИС ФАР), с использованием разных фонетических баз данных (ФБД) дикторов. При этом использовались кластеризованные ФБД Дикторов 1 и 2 и ФБД информационных центров (ИЦ). Для ФБД ИЦ информативных МРЕ выделяется больше (11 МРЕ), чем при использовании ФБД кластеризованных (9 МРЕ). Поэтому можно сделать вывод, что предпочтительнее использование ФБД ИЦ. В обоих случаях подавляющее большинство гласных МРЕ было отнесено к информативным, это дает право утверждать, что они являются надежным материалом для распознавания РЕ, таких как слова.
Для подтверждения полученных результатов ниже, на рисунке, представлены графики спектральных плотностей мощности двух фонем по итогам 10 реализаций, полученных от двух дикторов.
ния речи по методу фонетического декодирования слов.
Литература
1. Рабинер Л. Р. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи // ТИИЕР. 1989. Т. 77. № 2. С. 86.
3. Механизмы развития инновационных процессов в эпоху информационного общества
2. Головко В. А. Нейронные сети: обучение, организация и применение. М.: ИПРЖР, 2001.
3. Савченко В. В. Информационная теория восприятия речи // Известия вузов России. Радиоэлектроника. 2007. Вып. 6. С. 3−9.
4. Савченко В. В. Автоматическое распознавание речи на основе кластерной модели минимальных речевых единиц в информационной метрике Кульбака-Лейблера // Известия вузов России. Радиоэлектроника. 2012. № 2.
УДК 004. 9:069
МУЛЬТИМЕДИЙНОЕ ИЗДАНИЕ «ПУТЕВОДИТЕЛЬ ПО МУЗЕЯМ ОБРАЗОВАТЕЛЬНЫХ УЧРЕЖДЕНИЙ ТАМБОВСКОЙ ОБЛАСТИ»
Н. Н. Будюкина, С. Э. Ермаков, Е.В. Клыгина
В данном материале рассматривается вопрос популяризации музейной деятельности с использованием мультимедийного издания.
Ключевые слова: мультимедийное издание, музеи образовательных учреждений.
Музеи образовательных учреждений специалисты относят к одному из замечательных феноменов отечественной культуры и образования. Первые такие музеи возникли в Х1Х в. как межпредметные кабинеты для хранения учебно-наглядных пособий по истории и природе края, собранные и оформленные учащимися (гербарии, образцы почв и минералов, таблицы и диаграммы, документы и изобразительные материалы и т. п.). В течение сравнительно короткого времени они получили широкое распространение в педагогической практике как эффективное средство обучения и воспитания.
Участвуя в создании и деятельности школьного музея, педагоги и учащиеся, помимо решения задач совершенствования содержания и методов обучения и воспитания, вносят неоценимый вклад в дело выявления, собирания, сохранения и использования объектов культурного и природного наследия.
В начале ХХ1 в. в условиях модернизации школы, развития системы дополнительного образования школьные музеи востребованы и вновь уверенно заявляют о себе, показывая способность эффективно включаться в образовательный процесс и используя свои особенности «пограничного» положения в культуре. Вместе с тем, в последние годы идет процесс осмысления места школьного музея в диалоге всех заинтересованных участников образовательного процесса: родителей, педагогов, музейных сотрудников, ветеранов, общественности. Школьный музей превращается в полигон музейно-педагогических инноваций. Поэтому можно с уверен-
ностью утверждать, что сегодня музейнопедагогическое пространство является интегративной развивающейся средой нового типа и становится полноправной культурологической составляющей современного образования.
Сеть музеев образовательных учреждений Тамбовского края формировалась на протяжении ХХ в. За это время сложились определенные традиции, накоплен значительный опыт работы, сформирована система научно-методического руководства. Информация о деятельности паспортизированных музеев публикуется в виде периодически обновляющихся каталогов, в которых содержатся сведения общего характера. Вместе с тем, многочисленные материалы, довольно подробно рассказывающие о школьных музеях населенных пунктов, районов и городов региона, сконцентрированные в научном архиве методического центра, представляют собой ценную научно-исследовательскую базу по истории народного образования и музейного дела Тамбовщины. В настоящее время существует потребность в обобщении накопленного опыта и создания условий для популяризации школьного музейного дела. Например, в современной мире развития информационных технологий музеям очень важно занять активную позицию в области внедрения цифровых ресурсов предоставления информации посетителям.
Поэтому на кафедре информатики и информационных технологий совместно с музейно-выставочным комплексом ТГУ имени Г. Р. Державина и ТОГБОУ ДОД «Центр раз-

ПоказатьСвернуть
Заполнить форму текущей работой