Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений

Тип работы:
Диссертация
Предмет:
Теоретические основы информатики
Страниц:
223


Узнать стоимость

Детальная информация о работе

Выдержка из работы

В последнее десятилетие наблюдается возрастание требований общества к уровню автоматизации решения новых классов задач, увеличивающегося уровня сложности. К их числу, в первую очередь, относятся так называемые слабо формализованные или информационно сложные задачи, связанные с анализом, контролем и диагностированием сложных технических объектов, явлений и процессов. Такие задачи возникают при разработке автоматизированных управляющих или контролирующих систем, а также прикладных интеллектуальных систем, способных обеспечить эффективную экспертную поддержку принятия решений в сложных технических и информационно-технологических ситуациях.

Особый класс информационно сложных задач представляют собой задачи, связанные с качественным анализом и обработкой экспериментальных данных, характеризующих течение процессов различной природы и, в частности, задачи анализа и идентификации слабо формализованных временных процессов (СВП) — процессов, законы поведения которых неизвестны или недостаточно изучены. Характерными примерами таких задач являются задачи, связанные с визуальным анализом электрореограмм и динамограмм изменения контролируемых параметров в системах технической диагностики, задачи визуального анализа электрофизиологических процессов в системах медицинской диагностики, задачи идентификации и распознавания сложных акустических процессов в системах автоматического распознавания и синтеза речи и др.

Математическая модель СВП в общем случае должна описывать последовательность нескольких случайных или нечетких внутренне скрытых событий, явлений и подпроцессов, которые в результате взаимодействия приводят к достаточно сложной картине пересекающихся во времени внешне наблюдаемых признаков. Большое число практически важных задач, связанных с анализом и идентификацией СВП, сводятся к построению таких моделей, на основании которых можно было бы правильно восстановить последовательность внутренних состояний и подпроцессов СВП, обуславливающих его внешнее проявление, с целью идентификации самого СВП либо его отдельных фрагментов и принятия на этой основе управляющих либо контролирующих решений.

Характерными примерами СВП являются сложные акустические процессы и, в частности, речевые сигналы. Ключевой проблемой, возникающей при разработке моделей речевых сигналов в системах речевого распознавания является вариабельность речевых сигналов и, как следствие, отсутствие четкого соответствия между фонетическими единицами речи и реализации СВП, характеризующими эти единицы. Наличие множества & quot-НЕ"- - факторов, обусловленных неполнотой, неточностью и нечеткостью исходной информации об исследуемом процессе является отличительной особенностью слабо формализованных задач, которую необходимо учитывать при разработке математических моделей СВП.

Исследования специалистов показали, что практический успех, а решении слабо формализованных задач и, в частности, задач анализа СВП может быть достигнут при использовании новых информационных технологий, основанных на взаимодействии точных аналитических методов теории принятия решений с нечетко-логическими моделями, основанными на представлении и обработки знаний. В частности, общепризнано, что совершенствование существующих систем автоматического распознавания речи (АРР) и создание новых систем АРР, удовлетворяющих повышенным требованиям по надежности распознавания, требует использования подходов, основанных на моделях представления и обработки всесторонних знаний о речевом сигнале, включая нечеткие экспертные знания о речевом сигнале и процессах речевосприятия. При этом нечетко-логические модели

СВП могут быть использованы для поддержки решений, выработанных на основе аналитических, нейро-сетевых либо скрытых марковских моделях.

Для решения слабо формализованных задач, связанных с качественным анализом и моделированием сложных процессов и систем в настоящее время разрабатываются методы, основанные на алгебраических, логико-лингвистических и нечетко-логических моделях принятия решения. Большой вклад в становление и развитие теории построения алгебраических и логико-лингвистических моделей принятия решений внесли российские ученые Вагин В. Н., Горбатов В. А., Журавлев Ю. И., Кузнецов О. П., Нариньяни А. С., Осипов Г. С., Поспелов Д. А., Попов Э. В., Стефанюк В. Л., Финн В. К. и др. Большой вклад в развитие теории и практики построения интеллектуальных моделей анализа динамических систем и процессов, включая нечетко-логические модели, внесли ученые Аверкин А. Н., Берштейн JI.C., Вагин В. Н., Емельянов В. В, Еремеев А. П., Ковалев С. М., Мелихов А. Н., Потапова Р. К., Цемель Г. И., Ярушкина Н. Г. и др.

Однако, применение алгебраических и нечетко-логических методов для решения задач, связанных с качественным анализом и моделированием СВП, требует их определенного развития с учетом конкретных особенностей приложений. В частности, разработка интеллектуальных моделей СВП для класса речевых сигналов требует выбора семейства релевантных признаков, наиболее устойчивых к различного рода искажениям и одновременно допускающих возможность интеграции в них нечеткой экспертной информации о структуре речевого сигнала и особенностях речевосприятия. Также требуется разработка специального класса нечетко-логических моделей, способных оперировать данными прзнаками при выработке решений и допускающих возможность интеграции с существующими моделями анализа речевых сигналов, например, моделями, основанными на искусственных нейронных сетях. И наконец, поскольку модели нечетко-логического анализа являются качественными моделями, опирающимися на достаточно грубую исходную информацию об исследуемом & quot-СВП, требуется разработка методов оптимизации параметров нечетких моделей с целью повышения их эффективности и адаптируемости в соответствии с вновь поступающими данными.

В рамках поставленных задач в первой главе диссертации проодится анализ известных методов моделирования речевых сигналов, на основании которого формируется вывод о том, что наиболее учстойчивой к различного рода искажениям является информация, характеризующая временные и нечетко-временные свойства речевого сигнала. Следовательно, при разработке системы АРР перспективным представляется подход, в основе которого лежит предположение о том, что речевой сигнал реализует процесс передачи нечетких временных зависимостей, в структуре которых содержится необходимая, которую можно использовать для поддержки процессов распознавания.

Исходя из сказанного, и с учетом выше перечисленных общих задач, возникающих при разработке методов анализа и идентификации СВП, в качестве объекта исследования диссертации выбран новый класс интеллектуальных моделей, основанный на структурах временных и нечетко-временных отношений. В соответствии с выбранным направлением исследования сформулирована основная цель работы.

Цель исследования. Целью исследования является развитие методов моделирования слабо формализованных временных процессов на основе использования структур нечетко-временных отношений и их применение в системах поддержки принятия решений на примере систем речевого распознавания.

В соответствии с поставленной целью в диссертации решаются следующие задачи.

1. Разработка методов представления и формализации обобщенных временных признаков слабо формализованных процессов в классе нечетковременных отношений с целью использования их в качестве вторичных признаков речевых сигналов в интеллектуальных поддерживающих системах речевого распознавания.

2. Разработка методов оценки информативности нечетко-временных признаков СВП и на их основе методов формирования оптимальных наборов вторичных спектрально-временнных параметров речевых сигналов для интеллектуальных поддерживающих систем речевого распознавания.

3. Разработка интеллектуальных моделей анализа слабо формализованных временных процессов с использованием нечетко-временных отношений в качестве единиц структурных знаний о моделируемом объекте.

4. Для предложенного класса моделей — разработка методов нечетко-логического вывода в качестве основного механизма принятия решений.

5. Для предложенного класса нечетко-логических моделей — разработка методов оптимизации и адаптации их параметров на основе механизмов обучения.

7. На основе предложенного класса нечетко-логических моделей разработка и программная реализация подсистем поддержки процессов речевого распознавания с целью экспериментальной проверки эффективности их использования в системах АРР.

Методы исследования. Для решения поставленных задач использовались методы теории распознавания образов, методы теории нечетких множеств и нечеткой логики, аппарат дискретной математики и теории графов, а также методы анализа и обработки дискретных сигналов.

Практическая проверка разработанных моделей осуществлялась путем программной эмуляции и проведения имитационных экспериментов на модельных и реальных задачах в области речевого распознавания.

Научная новизна работы заключается в решении важной научной задачи качественного анализа слабо формализованных временных процессов, имеющее существенное значение для развития методов математического моделирования сложных динамических объектов и систем.

К наиболее существенным научным результатам работы относятся следующие:

1. На примере речевых сигналов проведено исследование характеристик СВП с целью выявления новых классов релевантных вторичных признаков для систем принятия решений. Обоснована возможность использования нечетко-временных отношений в качестве релевантных и наиболее устойчивых к различного рода искажениям вторичных признаков СВП.

2. Предложена система и методы формализации вторичных признаков СВП на основе структур нечетко-временных отношений, допускающих возможность их использования в системах принятия решений как самостоятельно, так и в объединении с другими моделями представления информации о СВП, в частности с нейро-сетевыми моделями.

3. Разработан новый способ оценки информативности и формирования наборов вторичных нечетко-временных признаков СВП по критерию их дискриминативной способности, основанный на использовании линейных нейро-сетевых классификаторов во взаимодействии с генетическими оптимизационными алгоритмами.

4. На примере моделирования речевых сигналов предложена новая нечетко-временная модель СВП, предназначенная для использования в поддерживающих системах речевого распознавания.

5. Разработан комплекс программного обеспечения (ПО), для анализа акустических СВП. Программные модули, входящие в состав ПО, могут быть использованы при решении инженерной задачи построения системы АРР, предназначенной для интеграции в существующие системы управления технологическими процессами.

Практическая ценность. Практическая ценность работы определяется возможностью использования предложенных моделей в качестве поддерживающих модулей для интегрированных систем речевого распознавания. В частности разработаны:

1. ПО автоматизированного рабочего места, позволяющее проводить детальное исследование временной структуры акустических СВП, накопление, хранение и статистический анализ полученной информации.

2. Программная оболочка, позволяющая моделировать работу нейросетевых модулей систем АРР, на различных фонемных базах.

3. Подсистема поддержки распознавания на основе укрупненных спектрально-временных образов PC для системы АРР, позволяющая, повысить надежность распознавания на 5−7%

Достоверность и обоснованность научных положений, выводов и результатов, сформулированных в диссертации, подтверждается доказательством утверждений и теорем, результатами вычислительных экспериментов на практических и модельных задачах, публикациями и апробацией работы на региональных, отраслевых и внутревузовских научно-технических конференциях, а также актами внедрения результатов работы.

Реализация результатов работы. Работа выполнялась в рамках хозяйственного договора при НИС РГУПС по разработке АРМа оператора технологических процессов на железнодорожном транспорте. Результаты работы прошли успешную апробацию в качестве модуля поддержки принятия решений в системе АРР, на примере АРМа ДСПГ и, также, применяются в учебном процессе.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на межвузовской конференции студентов, аспирантов и молодых специалистов.

Публикации. Полученные в диссертации теоретические и практические результаты нашли свое отражение в 8 печатных работах.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения общим объемом 190 страницы, а также списка литературы и приложений.

4.4 Выводы.

1. В процессе работы над диссертацией был реализован объемный комплекс полнофункционального ПО, предназначенный для всестороннего анализа PC.

2. Программные модули задействованные в исследовательском ПО являются самодостаточными и могут быть использованы при постороении систем анлиза слабоформализованных временных процессов.

Заключение

1. На сегодняшний день сложилась благоприятная ситуация для начала широкого внедрения речевых технологий на ж.д. транспорте. Необходимо проводить дальнейшие исследования в области моделей речевосприятия и усовершенствования существующей технологи распознавания речи, как фактора способного оказать влияние на многие аспекты функционирования ж.д. транспорта, в том числе и на один из ключевых аспектов — повышение безопасности перевозок.

2. В результате проведенного исследования моделей представления PC сделан вывод, что наиболее перспективным в системах АРР является применение ИНС при объединение с другими моделями, несущими в себе априорную лингвистическую и фонетическую информацию.

3. На основе анализа экспериментальных исследований в области психоакустики, экспериментальной фонетики и физиологии установлена большая роль временных и спектро-временных модуляций в PC для слухового восприятия речи и обоснована необходимость использования в системах АРР специальных классов вторичных временных признаков. Рассмотрены известные способы представления спектрально-временной информации о PC и показано, что они имеют существенные ограничения на их использования в современных системах АРР, связанные с невозможностью интерпретации данных параметров в качестве единиц структурно-временного знания.

4. Предложен новый класс вторичных спектрально-временных признаков, основанный на нечетких временных отношениях, которые, с одной стороны, допускают возможность естественной интерпретации в качестве единиц структурно-временного знания, а с другой стороны, допускают возможность обработки с использованием искусственных нейронных сетей.

5. Предложен новый способ оценки информативности вторичных нечетко-временных признаков речевых сигналов по критерию их дискриминативной способности, основанный на аналитическом методе оптимизации параметров линейных нейро-сетевых классификаторов, обеспечивающий возможность разработки эффективных в вычислительном плане процедур оптимизации наборов вторичных параметров для систем АРР.

6. Предложена новая нечетко-динамическая модель представления качественной временной информации в БЗ интеллектуальных систем, основанная на использовании нечетких временных отношений в качестве элементарных единиц знаний.

7. Разработана формальная модель БЗ интеллектуальной системы АРР, основанная на системе нечетко-динамических продукционных правил. Благодаря тому, что в предложенной структуре БЗ процедуры пополнения знаний совмещены с правилами нечетко-логического вывода обеспечивается возможность автономной реализации механизма поддержки принятия решений непосредственно в БЗ, что упрощает основной механизм распознавания, реализованный в подсистемах верхнего уровня АРР.

8. На основе предложенной 1рафовой модели задачи обучения разработан генетический алгоритм формирования оптимальных подмножеств нечетко-динамических описаний, основанный на процедуре случайного поиска во взаимодействии с градиентным методом оптимизации формируемых описаний и правилами вывода темпоральной логики, обеспечивающими выполнение условий семантической корректности формируемых описаний.

9. В процессе работы над диссертацией был реализован объемный комплекс полнофункционального ПО, предназначенный для всестороннего анализа PC.

ПоказатьСвернуть

Содержание

Глава

1. Методы моделирования слабо формализованных процессов в системах речевой коммуникации и их применение на ж.д. транспорте.

1.1 Предпосылки использования речевых технологий на ж.д. транспорте.

1.2 Использование композиционно динамического программирования в системах анализа СВП.

1.3 Использование искусственных нейронных сетей в системах анализа СВП.

1.4 Использование Скрытых Марковских моделей при анализе СВП.

1.5 Структурно-логические методы в системах анализа СВП.

1.6 Выводы.

Глава

2. Методы формирования вторичных временных признаков на основе нечетких временных отношений.

2.1. Значение временной информации и способы ее извлечения из необработанных данных.

2.2. Представление спектрально-временной информации в речевых сигналах на основе структур нечетких временных отношений.

2.3. Формирование оптимальных наборов нечетких временных признаков для баз знаний интеллектуальных систем анализа СВП.

2.4. Выводы.

Глава

3. Методы представления и обработки нечеткой динамической щ информации в базах знаний интеллектуальных систем.

3.1 Организация базы знаний интеллектуальной системы на основе структур нечетких временных отношений.

3.2. Методы обработки информации в моделях интеллектуальных систем на основе алгоритмов нечетко-логического вывода.

3.3 Методы формирования и оптимизации баз знаний ИС на основе алгоритмов обучения.

3.4. Выводы.

Глава

4. Структурно — программные аспекты реализации интеллектуальных моделей анализа СВП в системах речевого распознавания.

4.1 Состав и специфика речевого корпуса оператора технологического процесса сортировочной горки.

4.2 Структура и принципы построения интегрированной системы автоматической классификации СВП.

4.3 Программная реализация автоматизированного рабочего места для исследования СВП.

4.4 Выводы.

Список литературы

1. 12−1, Ookayama, Meguro-ku, Tokyo, 152−8552 Japan 1. RAILROADS & TECHNOLOGY: TRANSPORTING THE FUTURE

2. Transportation Technology Center, Inc. 2002

3. J. Jedruszek. Speech recognition. Alcatel Telecommunications Review -2nd Quarter 2000

4. Ronald R. Knipling Walter W. Wierwille Vehicle-Based Drowsy Driver Detection: Current Status and Future Prospects IVHS America Fourth Annual

5. Meeting, Atlanta, GA, April 17−20, 1994

6. Christopher Cieri. Resources for Robust Analyses of Natural Language

7. Conference ROMAND 2000, Lausanne, 19−20 octobre 2000

8. Shuangyu Chang, Miijam Wester and Steven Greenberg.

9. An Elitist Approach to Automatic Articulatory-Acoustic Feature Classification for

10. Phonetic Characterization of Spoken Language International Computer Science Institute 1947 Center Street, Berkeley, CA 94 704, USA

11. L. Lamel, S. Rosset, J. L. Gauvairi and S. Bennacef: «The LIMSI ARISE system for train travel information», Proc. IEEE Int. Conf. Acoust., Speech, Signal Process., Phoenix, pp. 501 -504 (1999)

12. AUTOMATIC SPEECH RECOGNITION AND ITS APPLICATION TO INFORMATION EXTRACTION Sadaoki Furu Department of Computer

13. Science Tokyo institute of Technology

14. Зозуля B.A. Речевая коммуникация в системах ввода сообщений для. автоматизации рабочих мест оперативно-диспетчерского персонала. Диссертация на соискание ученой степени кандидата технических наук. Ростов-на-Дону, 2000.

15. Винцюк Т. К. Анализ, распознавание и интерпретация речевых сигналов.

16. Киев: Наук, думка, 1987! 264с.

17. Вагин В. Н. Дедукция и обобщение в системах принятия решений. -М.: Наука. Гл. ред. физ. -мат. лит., 1988. — 384с.

18. S. Amari, N.K. Kasabov (Eds.), Brain-like Computing and Intelligent Information Systems, Springer, Berlin, 1997.

19. Попов Э. В., Фоминых И. Б. Кисель Е.Б. Шапот М. Д. Статические и динамические экспертные системы: Учеб. пособие. — М.: Финансы и статистика, 1996. 320с

20. D.P. Morgan and C.L. Scotfield, Neural Networks and Speech Recognition (Kluwer Academic Publishers, Dordrecht, 1991).

21. Захаров B.B., Кантор П. С., Ткаченко Д. Г. Синтез логических контроллеров с использованием механизма обработки нечеткой информации. // Известия РАН. Теория и системы управления, М.: & quot-Наука"-, 2000, № 4.

22. N.K. Kasabov, R.I. Kilgour, S.I. Sinclair. From hybrid adjustable neuro-fuzzy systems to adaptive cjnnectionist-based systems for phoneme and word recognition. Fuzzy Sets and Systems, 103 (1999) 349−367.

23. Mu-Chun Su, Ching-Tang Hsieh, Chieh-Ching Chin. A neure-fuzzy approach to speech recognition without time alignment. Fuzzy Sets and Systems. 98 (1998), 33−41.

24. Круглов B.B., Борисов B.B. Искусственные нейронные сети. Теория и практика. М.: Горячая линия. — Телеком 2001. — 382с. "-'

25. Заде JI.A. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. — 165с.

26. Потапова Р. К. Речь: Коммуникация, информация, кибернетика: Учеб. посбие для вузов. М.: Радио и связь. — 1997. — 528с.

27. Танака X., Цукиямо Т. Асаи К. Модель нечеткой системы, основанная на логической структуре. // Нечеткие множества и теория возможностей. Последние достижения: Пер. с англ. -М.: Радио и связь. 1986, с. 186−199.

28. Карелин В. П., Ковалев С. М. Метод построения модели, имитирующей алгоритм поиска управляющих решений оператором. // Известия Академии наук СССР. Техническая кибернетика, № 5. 1983. с. 181 188.

29. J.S.R. Jang, ANFIS: adaptive-network-based fuzzy inference system, IEEE Trans. Systems Man Cybernet. 23 (3) (1993)665- 684.

30. T. Yamakawa, H. Kusanagi, E. Uchino, T. Miki, A new effective algorithm for neo fuzzy neuron model, in: Proc. 5th IFSA World Congress, 1993, pp. 1017−1020.

31. N.K. Kasabov, J.S. Kim, М. Watts, A. Gray, FuNN/2 a fuzzy neural network architecture for adaptive learning and knowledge acquisition, Inform. Sci. 101 (3 {4) (1997) 155−175.

32. N.K. Kasabov, R. Kozma, M. Watts, Optimization and adaption of fuzzy neural networks through genetic algorithms and learning-with-forgetting methods and applications for phoneme based speech recognition, Inform. Sci. 110 (1998)61−79.

33. Курейчик B.M. Генетические алгоритмы. Обзор и состояние // Новости искусственного интеллекта. 1998. № 3.

34. Breiman L., Friedman J.H., Olshen R. A, Stone C.J. Classification and regression frees. Belmont, CA: Wadswort. 1984.

35. Мелихов A.H., Ковалев C.M., Карелин В. П. Моделирование процессов принятия решений на основе нечетких классификационных схем. // Известия А Н УССР. Электронное моделирование. № 3, т. 6, 1984 с. 3−6.

36. Мелихов А. Н., Берштейн JI.C., Коровин С. Я. Ситуационные советующие системы с нечеткой логикой. М.: Наука, 1990. — 272с.

37. Fletcher, Н. (1953). Speech and Hearing in Communication. Krieger. (There is a 1994 reprint ASA1. Edition.).

38. Allen, J. B. (1994). How do humans process and recognize speech. IEEE Trans. Speech Audio Processing, 2(4): 567−576.

39. Sharma, S. (1999). Multi-Stream Approach To Robust Speech Recognition. Dissertation, OGI, Portland, USA.

40. Hermansky, H. and Sharma, S. (1998). TRAPS Classifiers of temporal patterns. In Proc. ICSLP'98,Vol! 3, pp. 1003−1006.

41. Bourlard, H., Dupont, S., Hermansky, H. and Morgan, N. (1996a). Towards sub-band-based speech recognition. In European Signal Proc. Conf., Trieste, pp. 1579−1582.

42. Greenberg, S., Arai, T. and Silipo, R. (1998). Speech intelligibility derived from exceedingly sparse spectral information. In Proc. Int. Conf. on Spoken Language Processing (ICSLP).

43. Warren, R. and Bashford, J. J. (1999). Intelligibility of 1/3-octave speech: Greater contribution of frequencies outside than inside the nominal. J. Acoust. Soc. Am., 106(5)

44. Schreiner, C. and Calhoun, B. (1994). Spectral envelope coding in cat primary auditory cortex: properties of ripple transfer functions. Auditory Neuroscience, 1: 39−61

45. Kowalski, N., Depireux, D. and Shamma, S. (1996). Analysis of dynamic spectra in ferret primary auditory cortex. I. Prediction of unit responses to moving ripple spectra. J. Neurophysiol., 76: 3503−3523.

46. Schreiner, C., Read, H. and Sutter, M. (2000). Modular organization of frequency integration in primary auditory cortex. Annual Review Neuroscience, 23: 501−529

47. Depireux, D., Simon, J., Klein, D. and Shamma, S. (2001). Spectro-temporal response field characterization with dynamic ripples in ferret primary auditory cortex. Journal of Neurophysiology, 85: 1220−1234.

48. Kaernbach, C. (2000). Early auditory feature coding. In Contributions to psychological acoustics: Results of the 8th Oldenburg Symposium on Psychological Acoustics., pp. 295−307. BIS, Universitat Oldenburg

49. Касевич В. Б. Фонологические проблемы общего и восточного языкознания. М.: Наука, 1983. 295 с.

50. Gramss, Т. and Strube, Н. W. (1990). Recognition of isolated words based on psychoacoustics and neurobiology. Speech Communication, 9: 35−40.

51. Hermansky, H., Ellis, D. and Sharma, S. (2000). Tandem connectionist feature extraction for conventional HMM systems. In Proc. ICASSP, Istanbul.

52. Трунин Донской В. Н. Экспертные системы и фонетическая маркировка сегментов слитной речи. — В кн. Анализ, распознавание и синтез речи. М., ВЦ АН СССР, 1987.

53. Allen J.F. Towards a General Theory of Action and Time / Artificial Intelligence, 1984, 23(2).

54. Gramss, T. (1992). Worterkennung mit einem kunstlichen neuronalen Netzwerk. Dissertation, Universitat Gottingen.

55. Муравский A.B., Ковалев С. М. Определение информативности нечетко-темпоральных признаков в интеллектуальных моделях анализа слабо формализованных временных процессов. В кн. Обозрение прикладной промышленной математики. Т. 10, Вып. 1, 2003, с, 173.

56. Mazim Rahim, Giuseppe Ricardi, Lawrence Saul, Jerry Wright, Bruce Buntschun, Allen Gorin, Robust numeric recognition in spoken language dialogue, Speech Communication 34 (2001) 195−212.

57. Joseph Picone. Методы моделирования сигнала в распознавании речи. 1993. 57. www, troll tech. com58. OSS Programming Guide. 59. Numerics in C. Oxford

58. Robust Speech Recognition Based on Spectro-temporal Processing

59. Dem Fachbereich Physik der Universitat Oldenburg zur Erlangung des

60. Speech recognition by machines and humans

61. Richard P. Lippmann) Lincoln Laboratory MIT, Room S4−121, 244 Wood Street, Lexington, MA 2 173−9108, USA. Speech Communication 22 1997 1−15

62. Schreiner, С., Read, H. and Sutter, M. (2000). Modular organization of frequency integration in primary auditory cortex. Annual Review Neuroscience, 23: 501−529.

63. Brian E.D. Kingsbury a, b,*, Nelson Morgan a, b, Steven Greenberg a, b.

64. Robust speech recognition using the modulation spectrogram.

65. Speech Communication 25 (1998) 117−132

66. Melvyn J. Hunt. Practical large-vocabulary speech recognition in a multilingual environment. Dragon Systems UK, Stoke Road, Bishops Clee, Cheltenham GL52 4RW, UK. Speech Communication 23 1997 297−305

67. Аверкин А. Н. Костерев В.В. Триангулярные нормы в системах искусственного интеллекта. II Известия Академии наук. ТиСУ, 2000. № 5.с. 107−119.

68. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор 1989 http: //www. es. berkeley. edu/~iTiurphyk/Baves/rabiner. pdf

69. Скрытые Марковские модели 2000 http: //leader. cs. msu. su/~liik/HMM rus. html74. http: //www. statsoft. ru/home/portal/glossaiT/GlossaryTwo/M/Mahalano bisdistance. htm

70. Савченко В. В. Теоретико-информационное обоснование оценок минимакса энтропии // Изв. Вузов радиофизика, 1993, т. 36 u.i. с. 1002−1011.

71. Цемель Г. И. Опознавание речевых сигналов. М: Наука, 1971. -145 с.

72. Высоцкий Г. Я., Рудный Б. Н., Трунин-Донской В.П., Цемель Г. И. Алгоритм опознавания 40 слов на ЦВМ БЭСМ -3/ Работы по техн. кибернетике/ ВЦ АН СССР, М., 1968. -Вып.2. -с, 3−33.

73. Винцюк Т. К., Лобанов Б. М., Шинкаж А. Г. Система рспознавания речи и система устного диалога СРД & quot-Речь 1″ на основе микро-ЭВМ// Автоматическое распознавание слуховых образов., Киев: ИК АН УССР, 1982. -C. 516−521.

74. Еремеев А. П., Троицкий В. В. Основные способы формализации временных зависимостей при построении интеллектуальных систем. // Седьмая национальная конференция по искусственному интеллекту с международным участием. М. 2000.

75. Мелихов А. Н., Берштейн Л. С. Конечные четкие и расплывчатые множества: 4. 11. Расплывчатые множества. Таганрог: ТРТИ, 1981

76. Кандрашина Е. Ю. и др. Представление знаний о времени и пространстве. / Под ред. Д. А. Поспелова М.: Наука, 1987 г. — 328с

77. Schank, R. Dynamic Memory: A theory of learning in computers and people. New York, NY: Cambridge University Press. 1982.

78. Финн В. К. Правдоподобные выводы и правдоподобные рассуждения // Итоги науки и техники. Сер. теория вероятностей, математическая статистика и теоретическая кибернетика. Т. 28. М.: ВИНИТИ, 1988. с. 3−84.

79. Поспелов Д. А. Логико-лингвистические модели в системах управления. -М.: Энергоиздат. 1981. -231с

80. Вагин В. Н., Викторова Н. П. Вопросы структурного обобщения и классификации в системах принятия решений. Изв. АН СССР: Техническая кибернетика, 1982, № 5 с. 64−73

81. Минский М.: 1979. Фреймы для представления знаний М.: Энергия.

82. S. Gitton, J.N. Temem, Specification and evaluation of French automatic telephone information systems in the Arise project, WCRR 97. 91. www. ldc. upenn. edu/Catalog/CatalogEntry. isp? catalogId=LDC93Sl92. www. linux. org

83. Поспелов Д. А. Ситуационное управление: Теория и практика. М.: Наука. 1986.

84. Ковалев С. М. Интеллектуальные модели анализа акустических процессов на основе нечетких динамических систем // Новости искусственного интеллекта. М.: ВЦ РАН, 2000, 3, с. 146−159.

85. Ковалев С. М. Нечеткие темпоральные системы в моделях анализа акустических процессов // Труды конгресса & quot-Искусственный интеллект в

86. XXI веке& quot-. Научное издание. М.: Издательство Физ. -мат. литературы, 2001. -847с.

87. Методы автоматического распознавания речи: В 2кн. Пер. с англ./ Под ред. У. Ли. -М.: Мир. 1983

88. Ковалев С. М. Модели анализа слабо формализованных динамических процессов на основе нечетко-темпоральных систем. // Изв. гвузов. Сев. -Кавк. регион. Естеств. науки. 2002. № 2. с. 10−13.

89. Shoham Y. Time for action // In Proceedings 11 IJCAI, 1989.

90. Еремеев А. П., Троицкий B.B. Представление временных ограничений в интеллектуальных системах (обзор)// Труды конгресса & laquo-Искусственный интеллект в XXI веке& raquo-.- М.:. изд-во Физико-математической литературы. 2001.Т.1. -С. 61−74.

91. Berge С. Graphes et hypergraphes. Paris: Dunon, 1970.

92. Rabiner L.R., Schafev R.W. Digital processing of Speech Signals. -NJ: Prentice-Hall- Englewood Cliffs. 1978

93. Ковалев С. М. Нечеткие модели идентификации речевых сигналов на основе визуальной информации. Изв. ТРТУ. Тем. вып.: Интеллектуальные САПР / материалы международной НТК & quot-ИСАПР"- Таганрог: ТРТУ, 2000 -№ 2 с. 78−81.

94. Joseph Picone (перевод Ruslan Popov) Методы моделирования сигнала в распознавание речи.

95. Ковалев С. М., Муравский А. В! Нейро-нечеткие модели извлечения знаний для интеллектуальных систем автоматическогораспознавания речи. Научно-технический журнал Вестник РГУПС г. Ростов-на-Дону: РГУПС, 2003 № 2 с 79−81.

96. Муравский А. В. Разработка гибридных классификаторов в интеллектуальных системах анализа слабо формализованных временных процессов. Научно-технический журнал Вестник РГУПС г. Ростов-на-Дону: РГУПС, 2003 № 2 с 81−83.

97. И. Л. Мазуренко. Компьютерные системы распознавания речи. 2002.

98. Sadaoki Furui From Read Speech Recognitionto Spontaneous Speech Understanding Tokyo Institute of Technology, Department of Computer Science 2−12−1 Ookayama, Meguro-ku, Tokyo, 152−8552 Japan 2002.

99. Chao Wang Prosodic Modeling for Improved Speech Recognition and Understanding by M.S., Massachusetts Institute of Technology (1997) B.S., Tsinghua University, Beijing, China (1994)

100. И. В. Заенцев, Нейронные Сети: основные модели. Воронеж 1999 г.

101. A. Batliner, R. Kompe, A. Kieling, М. Mast, Н. Niemann ,

102. Е. Noth, М = Syntax + Prosody: A syntactic±prosodic labelling scheme for large spontaneous speech databases Speech Communication 25 (1998) p. 193−222

103. Keller, E. (1998). Neurological bases of the temporal organisation of speech. In P. Bhatt & R. Davis (eds.), The Linguistic Brain (pp. 215−229). Toronto: Canadian Scholars' Press.

104. Zellner Keller, В., & Keller, E. (forthcoming). The chaotic nature of speech rhythm. In Ph. Delcloque and V. M. Holland (Eds). Integrating Speech Technology in Language Learning. Swets & Zeitlinger 2000. x

105. Jacques Duchateau, Kris Demuynck, Dirk Van Compernolle Fast and accurate acoustic modelling with semi-continuous HMMs. Speech Communication 24 1998 5−17.

106. Huang, X., Jack, M., 1989. Semi-continuous hidden Markov models for speech signals. Computer Speech Language 3, p. 239−252.

107. Lee, C. -H., Rabiner, L., Pieraccini, R., Wilpon, J., 1990. Acoustic modeling for large vocabulary speech recognition. Computer Speech Language 4, 127−166.

108. Victor Sorokin, Vladimir Olshansky, Leonid Kozhanov. Internal model in articulatory control: Evidence from speaking without larynx

109. Speech Communication 25 (1998) 249−268.

110. Timothy J. Hazen. A comparison of novel techniques for rapid speaker adaptation Speech Communication 31 (2000) 15−33.

111. Hartigan, J., 1975. Clustering Algorithms. Wiley, New York.

112. Rabiner, L.R., 1989. A tutorial on hidden Markov models and selected applications in speech recognition. In: Proceedings IEEE 77,257−286.

113. Randolph, M., 1994. Speech analysis based on articulatory behavior. J. Acoust. Soc. Amer. 95, laSP15.

114. Moore, B.C.J., An Introduction to the Psychology of Hearing, Academic Press, New York. 1982.

115. Antoniol, G., Carli, G., Cettolo, M., Fiutem, R., 1992. Tools for development, test and analysis of ASRs. In: Proceedings ICSPAT, Cambridge, MA, pp. 1005−1010.

116. Фоминых И. Б. Принципы построения гибридных интеллектуальных систем реального времени// Труды международного конгресса ICAP2001 & laquo-Искусственный интеллект в XXI веке& raquo- М.: Физматлит. 2001. Т.2. -С. 570−583.

Заполнить форму текущей работой