автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений

кандидата технических наук
Муравский, Александр Викторович
город
Ростов-на-Дону
год
2003
специальность ВАК РФ
05.13.18
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений»

Автореферат диссертации по теме "Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений"

На правах рукописи

МУРАВСКИЙ АЛЕКСАНДР ВИКТОРОВИЧ

ИНТЕЛЛЕКТУАЛЬНЫЕ МОДЕЛИ КАЧЕСТВЕННОГО АНАЛИЗА СЛАБО ФОРМАЛИЗОВАННЫХ ВРЕМЕННЫХ ПРОЦЕССОВ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Специальности: 05.13.18 - "Математическое моделирование,

численные методы, комплексы программ"

05.13.17 - "Теоретические основы информатики"

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Ростов-на-Дону 2003

Работа выполнена на кафедре "Автоматика и телемеханика на железнодорожном транспорте" Государственного образовательного учреждения высшего профессионального образования "Ростовский государственный университет путей сообщения Министерства путей сообщения Российской федерации" (РГУПС).

Научный руководитель: доктор технических наук, профессор

Ковалев Сергей Михайлович

Официальные оппоненты: доктор технических наук, профессор

Белявский Григорий Исаакович

кандидат технических наук, доцент Чефранов Сергей Георгиевич

Ведущая организация: Таганрогский государственный радиотехнический университет (ТРТУ)

Защита состоится 2003 г. в/3 час, в конференц-зале

РГУПС на заседании диссертационного совета К218.010.01 при Ростовском государственном университете путей сообщения (344038, г. Ростов-на-Дону, пл. Народного ополчения, 2).

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан 2003 г. Отзывы на

автореферат, в двух экземплярах, заверенные печатью, просим направлять по адресу: 344038, г. Ростов-на-Дону, пл. Народного ополчения, 2, РГУПС, диссертационный совет.

Ученый секретарь диссертационного совета, кандидат технических наук, доцент

М.А. Бутакова

188о{~

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. В последнее десятилетие наблюдается возрастание требований общества к уровню автоматизации решения новых классов задач, увеличивающегося уровня сложности. К их числу, в первую очередь, относятся так называемые слабо формализованные или информационно сложные задачи, связанные с анализом, контролем и диагностированием сложных технических объектов, явлений и процессов. Такие задачи возникают при разработке автоматизированных управляющих или контролирующих систем, а также прикладных интеллектуальных систем, способных обеспечить эффективную экспертную поддержку принятия решений в сложных технических и информационно-технологических ситуациях.

Особый класс информационно сложных задач представляют собой задачи, связанные с качественным анализом и обработкой экспериментальных данных, характеризующих течение процессов различной природы и, в частности, задачи анализа и идентификации слабо формализованных временных процессов (СВП) - процессов, законы поведения которых неизвестны или недостаточно изучены. Характерными примерами таких задач являются задачи, связанные с визуальным анализом электрореограмм и динамограмм изменения контролируемых параметров в системах технической диагностики, задачи визуального анализа электрофизиологических процессов в системах медицинской диагностики, задачи идентификации и распознавания сложных акустических процессов в системах автоматического распознавания и синтеза речи и др.

Математическая модель СВП в общем случае должна описывать последовательность нескольких случайных или нечетких, внутренне скрытых событий, явлений и подпроцессов, которые в результате взаимодействия приводят к достаточно сложной картине пересекающихся во времени внешне наблюдаемых признаков. Большое число практически важных задач, сводятся к построению таких моделей, на основании которых можно было бы правильно восстановить последовательность внутренних состояний и подпроцессов СВП с целью идентификации самого СВП либо его отдельных фрагментов и принятия на этой основе соответствующих решений.

Характерными примерами СВП являются сложные акустические' процессы и, в частности, речевые сигналы. Ключевой проблемой, возникающей при разработке моделей речевых сигналов в системах речевого распознавания, является вариабельность речевых сигналов и, как следствие, отсутствие четкого соответствия между фонетическими единицами речи и реализации СВП, характеризующими эти единицы. Наличие множества "НЕ" - факторов, обусловленных неполнотой, неточностью и нечеткостью исходной информации об исследуемом процессе является отличительной особенностью слабо формализованных задач, которую необходимо учитывать при разработке математических моделей СВП.

Исследования специалистов показали, что практический успех а решении слабо формализованных задач и, в частносп , быть

библиотека |

С. Петербург у. „ I 9Э НИ? шк-ХУЗ !

достигнут при использовании новых информационных технологий, основанных на взаимодействии точных аналитических методов теории принятия решений с нечетко-логическими моделями, основанными на представлении и обработки знаний. В частности, общепризнано, что совершенствование существующих систем автоматического распознавания речи (АРР) и создание новых систем АРР, удовлетворяющих повышенным требованиям по надежности распознавания, требует использования подходов, основанных на моделях представления и обработки всесторонних знаний о речевом сигнале, включая нечеткие экспертные знания о речевом сигнале и процессах речевосприятия. При этом нечетко-логические модели СВП могут быть использованы для поддержки решений, выработанных на основе аналитических, нейро-сетевых либо скрытых марковских моделях.

Для решения слабо формализованных задач, связанных с качественным анализом и моделированием сложных процессов и систем в настоящее время разрабатываются методы, основанные на алгебраических, логико-лингвистических и нечетко-логических моделях принятия решения. Большой вклад в становление и развитие теории построения алгебраических и логико-лингвистических моделей принятия решений внесли российские ученые Вагин В.Н., Горбатов В.А., Журавлев Ю.И., Кузнецов О.П., Нариньяни A.C., Осипов Г.С., Поспелов Д.А., Попов Э.В., Стефанюк В.Л., Финн В.К. и др. Большой вклад в развитие теории и практики построения интеллектуальных моделей анализа динамических систем и процессов, включая нечетко-логические модели, внесли ученые Аверкин А.Н., Берштейн JI.C., Вагин В.Н., Емельянов В.В, Еремеев А.П., Ковалев С.М., Мелихов А.Н., Потапова Р.К., Цемель Г.И., Ярушкина Н.Г. и др.

Однако, применение алгебраических и нечетко-логических методов для решения задач, связанных с качественным анализом и моделированием СВП, требует их определенного развития с учетом конкретных особенностей приложений. В частности, разработка интеллектуальных моделей СВП для класса речевых сигналов требует выбора семейства релевантных признаков, наиболее устойчивых к различного рода искажениям и одновременно допускающих возможность интеграции в них нечеткой экспертной информации о структуре речевого сигнала и особенностях речевосприятия. Также требуется разработка специального класса нечетко-логических моделей, способных оперировать данными признаками при выработке решений и допускающих возможность интеграции с существующими моделями анализа речевых сигналов, например, моделями, основанными на искусственных нейронных сетях. И наконец, поскольку модели нечетко-логического анализа являются качественными моделями, опирающимися на достаточно грубую исходную информацию об исследуемом СВП, требуется разработка методов оптимизации параметров нечетких моделей с целью повышения их эффективности и адаптируемости в соответствии с вновь поступающими данными.

В рамках поставленных задач в первой главе диссертации проводится анализ известных методов моделирования речевых сигналов, на основании которого делается вывод о том, что наиболее устойчивыми к различного рода

искажениям является информация, характеризующая временные и нечетко-временные свойства речевого сигнала. Следовательно, при разработке системы АРР перспективным представляется подход, в основе которого лежит предположение о том, что речевой сигнал реализует процесс передачи нечетких временных зависимостей, в структуре которых содержится необходимая информация, которую можно использовать для поддержки процессов распознавания.

Исходя из сказанного, в качестве объекта исследования диссертации выбран новый класс интеллектуальных моделей, основанный на структурах временных и нечетко-временных отношений, предназначенных для решения широкого круга задач, связанных с качественным анализом СВП. В соответствии с выбранным объектом исследования сформулирована основная цель исследования.

Цель исследования. Целью исследования является развитие методов моделирования слабо формализованных временных процессов на основе использования структур нечетко-временных отношений и их применение в системах речевого распознавания.

В соответствии с поставленной целью в диссертации решаются следующие задачи.

1. Разработка методов представления и формализации обобщенных временных признаков слабо формализованных процессов в классе нечетко-временных отношений с целью использования их в качестве вторичных признаков речевых сигналов в интеллектуальных поддерживающих системах речевого распознавания.

2. Разработка методов оценки информативности нечетко-временных признаков СВП и на их основе методов формирования оптимальных наборов вторичных спектрально-временнных параметров речевых сигналов для интеллектуальных поддерживающих систем речевого распознавания.

3. Разработка интеллектуальных моделей анализа слабо формализованных временных процессов с использованием нечетко-временных отношении в качестве единиц структурных знании о моделируемом объекте.

4. Для предложенного класса моделей разработка методов нечетко-логического вывода в качестве основного механизма принятия решений.

5. Для предложенного класса моделей разработка методов оптимизации и адаптации их параметров на основе механизмов обучения.

7. На основе предложенного класса нечетко-логических моделей разработка и программная реализация подсистем поддержки процессов речевого распознавания с целью экспериментальной проверки эффективности их использования в системах АРР.

Методы исследования. Для решения поставленных задач использовались методы теории распознавания образов, методы теории нечетких множеств и нечеткой логики, аппарат дискретной математики и теории графов, а также методы анализа и обработки дискретных сигналов.

Практическая проверка разработанных моделей осуществлялась путем программной эмуляции и проведения имитационных экспериментов на модельных и реальных задачах в области речевого распознавания.

Научная новизна работы заключается в решении важной научной задачи качественного анализа слабо формализованных временных процессов, имеющее существенное значение для развития методов математического моделирования сложных динамических объектов и систем.

К наиболее существенным научным результатам работы относятся следующие:

1. На примере речевых сигналов проведено исследование характеристик СВП с целью выявления новых классов релевантных вторичных признаков для систем принятия решений. Обоснована возможность использования нечетко-временных отношений в качестве релевантных и наиболее устойчивых к различного рода искажениям вторичных признаков СВП.

2. Предложена система и методы формализации вторичных признаков СВП на основе структур нечетко-временных отношений, допускающих возможность их использования в системах принятия решений как самостоятельно, так и в объединении с другими моделями представления информации о СВП, в частности, с нейро-сетевыми моделями.

3. Разработан новый способ оценки информативности и формирования наборов вторичных нечетко-временных признаков СВП по критерию их дискриминативной способности, основанный на использовании линейных нейро-сетевых классификаторов во взаимодействии с генетическими оптимизационными алгоритмами.

4. На примере моделирования речевых сигналов предложена новая нечетко-временная модель СВП, предназначенная для использования в поддерживающих системах речевого распознавания.

Практическая ценность. Практическая ценность работы определяется возможностью использования предложенных .моделей в качестве поддерживающих модулей для интегрированных систем речевого распознавания. В частности разработаны:

1. ПО автоматизированного рабочего места, позволяющее проводить детальное исследование временной структуры акустических СВП, накопление, хранение и статистический анализ полученной информации.

2. Программная оболочка, позволяющая моделировать работу нейросетевых модулей систем АРР, на различных фонемных базах.

3. Подсистема поддержки распознавания на основе укрупненных спектрально-временных образов РС для системы АРР, позволяющая повысить надежность распознавания на 5-7 %

Достоверность и обоснованность научных положений, выводов и результатов, сформулированных в диссертации, подтверждается доказательством утверждений и теорем, результатами вычислительных экспериментов на практических и модельных задачах, публикациями и апробацией работы на региональных, отраслевых и внутривузовских научно-технических конференциях, а также актами внедрения результатов работы.

Реализация результатов работы. Работа выполнялась в рамках хозяйственного договора при НИС РГУПС по разработке АРМа оператора технологических процессов на железнодорожном транспорте. Результаты работы прошли успешную апробацию в качестве модуля поддержки принятия решений в системе АРР, на примере АРМа ДСПГ и, также, применяются в учебном процессе.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на межвузовской конференции студентов, аспирантов и молодых специалистов .

Публикации. Полученные в диссертации теоретические и практические результаты нашли свое отражение в 8 печатных работах.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения общим объемом 190 страниц, а также списка литературы и приложений.

Во введении обоснованы актуальность темы диссертационной работы, описана научная новизна и практическая ценность ее результатов. Сформулированы цель работы и решаемые в ней задачи. Содержится информация о реализации и апробации работы.

В первой главе рассматривается сложившаяся на сегодняшний день ситуация касательно применения интеллектуальных технологий в различных сферах промышленности:

- вопросы о перспективах и месте современных интеллектуальных технологий в железнодорожной транспортной системе;

- возможность применения новых технологий для повышения безопасности;

- повышение качества обслуживания клиентов;

- эргономическая составляющая.

Проводится исследование существующих методов и подходов к анализу СВП. К ним относятся искусственные нейронные сети (ИНС), скрытые Марковские модели (СММ), модели композиционно - динамического программирование (КДП) и структурно логические методы.

Вторая глава посвящена обоснованию применения нечетко-временных отношений в качестве вторичных признаков СВП и методам их формализации.

На примере PC проводится анализ временной структуры СВП и обосновывается необходимость введения нового класса вторичных признаков. Исследуются известные методы выделения спектро-временных признаков, основанные на использовании фильтрующих функций Габора и моделях "сигма-пи" ячеек. Показывается, что данные модели не позволяют в полной мере раскрыть весь потенциал, заложенный в классе временных признаков, в частности, потому, что сформированные на их основе признаки не имеют осмысленной интерпретации, а следовательно не могут использоваться в качестве единиц знаний в ИС АРР.

Исследуется возможность использования нечетких спектрально-временных признаков в интеллектуальных системах. Вводится понятие нечетко-временного отношения и предлагается метод его формализации.

В качестве области определения нечетких временных отношений используется пространство спектральных параметров. При этом исходным представлением РС являются спектрограммы.

Под реализацией РС понимается многопараметрический временной процесс 5 = ^(О = (^(О» )>•••> г отдельные состояния которого,

задаются векторами спектральных параметров РС, вычисленных на

промежутках времени ^ ~ ~ С целью учета изменчивости и нечеткости, свойственной РС, в рассмотрение вводится 6 экспериментально подобранных

укрупненных частотных диапазонов - \25Гц-3&6Гц^

Рг=Ъ%6Гц-ШГц Ру=1Ъ0Гц-\тГц =1160Гц-2\05Гц

Р. = 2105 Гц-3652Гц р = 3652Гц-бЗООГи

. 5 ^ ^ и * ч с каждым из которых

связывается понятие наблюдаемого на временном интервале нечетко-

временного события ^ — >6).

Нечеткий функционал " ^ ^ с , сопоставляет каждому

из фрагментов & РС ^ нечеткое значение признака ^^. Значение вычисляется путем нормирования суммарной энергии звукового сигнала в

частотном диапазоне 1 и имеет смысл интенсивности признака П1, наблюдаемого на временном сегменте &. Таким образом, функционалы F£l (5) являются, фактически, нечеткими предикатами, преобразующими различные комбинации значений числовых векторов первичных параметров 8 с: 5 РС 51 в значения нечетких переменных, характеризующих интегральные свойства соответствующих фрагментов РС. То есть для любых конкретных й и величина Ра (£) характеризует меру возможности считать, что на временном фрагменте 5 РС 5" наблюдается признак Е1.

•да ¿.ю

Рис. 1. Фрагмент двухуровневой структуры формирования нечетких значений признаков для нечетко временного модуля.

Способ представления события через аналитические функционалы (б) применим лишь к спектральным признакам РС. Более универсальным способом задания события, подходящим для трудно формализуемых признаков, являются искусственные нейронные сети (ИНС) (рис. 1) Нижний уровень образуют трехслойные ИНС, предназначенные для скрытого детектирования фонетической информации в каждом из элементарных речевых кадров (РК) РС, а верхний - модуль вычисления интегральной оценки на основе информации, полученной с выходов ИНС нижнего уровня.

Приведенная на рис. 1 структура реализует отображение 5 -> Jq{5) на временном интервале путем агрегирования нечетких значений признаков

Jt(sJ), выявленных нейросетями для всех РК е <5, с использованием *

формулы Jq{5) = У£iJl|{s¡)•w¡. Вторичные признаки £7 индуцируют на

у-'

временной шкале Т нечеткие подмножества интервалов АЕг = {< б/> /5 с 8,//й(£) = Га(£)}, являющиеся

формализованными представлениями нечетко временных событий.

В качестве базовой системы временных отношений выступает семейство временных отношений ЯТ интервально-временной логики Аплена, включающее 4 временных отношения в качестве базисных.

г, г, О (Л <г), г, гШ Т. О (Д = )

,и , ^ - начальные и конечные границы интервалов времени г, и т.. Пусть а = £7, [} — Е] - некоторые события, находящиеся в некоторой временной зависимости, например, Пё§ - "Следование с пересечением". Тогда в основу формализации нечетко-временного отношения положены следующие

соображения. Должен существовать временной интервал Т. на котором

наблюдается признак ОС и отсутствует признак /?, затем следует интервал Т. с

выраженными признаками а и ¡5 и, наконец, за ним следует интервал Тк, на котором выражено свойство р и отсутствует признак ОС. Соответствующую ситуацию иллюстрирует рис. 2.

. 1

-—м-а&р.

Рис. 2. Семантика нечеткого отношения "Следование с пересечением".

Формализованное описание рассматриваемой ситуации имеет вид: Зт, с T,3tj с Т,3тк с Т (vlrtsnTjrtsnTk &F(rtésJ), (1)

где F{rtés) = ¡ia(г,)&/2Дг,) &Я(г))

(T,TjTt) - цепочка, следующих друг за другом темпоров; Т - окно анализа PC.

На основании выражения (1) определяется понятие нечетко-временного отношения ríes с использованием принципа обобщения.

Пусть а и Р - нечетко-временные события с ФП ца и Цр

соответственно. Тогда возможность J(CCTtes /?) нахождения событий а и /? в нечетко-временном отношении ríes определяется как наибольшее значение F(rtes ) по всем возможным цепочкам (т(туг4), то есть

J(artesр) = sup F(rtés ) (X = z.rtsn xrtsn rt). (2)

z

Для вычисления значений истинности нечетко-вре!менных отношений используется нечетко-композиционный метод, основанный на том, что все описания, характеризуемые выражениями F(rí^) (rt* е RT), представляют собой цепочки из трех, строго следующих друг за другом нечетко-временных событий ArtsnBrtsnС. Следовательно, для максимизации F(rt*) необходимо нахождение цепочки сегментов (г , T¡, тк), доставляющей максимум выражению /Лл(г()&jUs(t¡)&¡.1с(тк). Для решения этой задачи предлагается графовая модель.

Для событий А, В к С, входящих в выражение F(rt*), формируются вспомогательные нечеткие графы GA =(С,ЯЛ), GB =(C,RB), Gc = (C,Rc), заданные на множестве вершин С = {i, = s(tt) / s(t.) е 5}. Нечеткие веса дуг вспомогательных графов RD (D — А, В, С) задаются:

К (s, > ■sj) = Mo Ф, > sj ]). при j ^ i O)

Rd(s,>sj) = °> приу'</.

Для выражения F(rt *) формируется вспомогательный нечеткий граф Gf = (C,Rabc) путем последовательной композиции вспомогательных нечетких графов GD согласно вхождению соответствующих нечетко-временных событий в F(rt*), то есть

Gf=GaoGbOGc, (4)

■ GaoGb=(C,Ráb), (5)

RAB(S„Sj) = y R^sJ&R.is^S;). (6)

Теорема. Максимальное значение F(rt *) по всем возможным цепочкам (г., т^, т,) равно наибольшему значению из всех нечетких весов дуг (st,s )eRAac результирующего графа Gr — (C,Rabc), определенного на основании выражений (4)-(6).

Условия теоремы положены в основу метода вычисления нечетко-истинностных значений временных отношений, имеющего полиномиальную сложность. Первый этап сводится к означиванию всех нечетких переменных А,

В и С входящих в выражение F(rt*), на множестве фрагментов PC 3 = {SIS с £} путем вычисления для каждого из фрагментов 8 = ] е 3 нечетких оценок ¡-1Л(8), jUB(S) и flc(S). Второй этап сводится к реализации композиционной схемы путем последовательного перемножения треугольных матриц для соответствующих вспомогательных графов и выбору в

результирующей матрице M(RFмаксимального значения R'= sup {RF(s.,s.)}.

(Ji.tf>eC*C

Описывается метод формирования оптимальных наборов нечетких временных признаков по критерию их дискриминативной способности. Предлагается подход, основанный на использовании линейной ИНС в качестве детектора информативности признаков.

3 = {Ei rt* Ej / rt* e RT) (i, j = 1,2,...,6) - множество всевозможных типов временных отношений между всевозможными парами нечетких событий (Ei,Ejг), 3* - некоторое подмножество 3, состоящее из m нечетко-временных признаков (пар отношений) Eirt * Ej.

Для выяснения дискриминативной способности совокупности нечетко-временных отношений 3*, используется двухслойная линейная ИНС, содержащей m входных' нейронов, соответствующих нечетко-временным отношениям из 3*, и п выходных нейронов, соответствующих распознаваемым классам речевых единиц из R — {г.}.

Синаптические веса линейной ИНС представлены матрицей весовых коэффициентов W = // W.. II размером (пхт). Оптимальные значения

весовых коэффициентов для линейных ИНС находятся аналитическим путем с использованием "псевдообратного" метода

W = Yx(XTx(XxXT)'1), (7)

где Хт - транспонированная матрица X, (X х Хт)~' - обратная матрица, У = 11 у II - целевая матрица.

Оценка информативности совокупности вторичных признаков //(3*) осуществляется также с использованием линейной ИНС в качестве детектора информативности. Оценка информативности совокупности признаков определяется выражением

Иф) = ±Р'-рп (8)

. Ел

где р' = —-— - вероятность появления примера из J -го класса; р = _-

±п, ' nJ

4-1

средняя вероятность правильной классификации примеров j -го класса; р ———°LlL- - вероятность правильной классификации к -го примера j -го

j' 1

класса; /Лк ~J (Ei rt* Ej) - значение истинности нечетко-временного

отношения Ei rt*Ej, вычисленное для к -го примера; C0tJ - оптимизированные

значения весовых коэффициентов линейной ИНС.

В основу формирования оптимального набора признаков положен генетический алгоритм. В качестве ЦФ выступает функция информативности,

н

заданная выражениями U(Ert.) = YjP' 'Pj (8)> а ограничение на число

м

признаков, входящих в искомый оптимальный набор, задано в виде фиксированного значения к, выступающего в качестве параметра алгоритма.

В главе 3 рассматриваются модели принятия решений и методы оптимизации параметров нечетко-временных моделей на основе алгоритмов обучения.

Основными блоками, входящими в состав интеллектуальных систем поддержки принятия решений являются блок модели знаний, которому соответствует база знаний (БЗ) ИС, и блок принятия решений, которому соответствует блок логического вывода.

Объектами БЗ являются нечеткие правила, устанавливающие связь между спектрально-временными свойствами PC и их фонетическими либо лексическими признаками. БЗ интеллектуальной АРР включает нечеткие правила вида Т —> г либо г —> Т, основанные на нечетко-динамических высказываниях (описаниях) Т:

Т = &(Elrt*Ej) (9)

где Е = {Е^ - множество нечетких временных событий; ЯТ — {г?*} -множество временных отношений.

Нечетко-временная модель представляется в виде тройки:

М= <Х,ДТ, П>, (10)

где - множество базовых элементов; ИТ - система нечетко-динамических правил, описывающих процессы принятия решений; П - правила нечетко-логического вывода, включая правила интерпретации нечетко-временных описаний.

Реализация нечеткого вывода осуществляется в два этапа. Вначале осуществляется этап фаззификации (интерпретации). Он сводится к определению степеней истинности предпосылок нечетких правил, входящих в БЗ ИС, с использованием специальных интерпретирующих процедур. Второй этап сводится к распространению ограничений с посылок 1} нечетких правил на заключения г, с использованием одного из способов формализации условных нечетких высказываний. Полученные нечетко-истинностные значения консеквентов продукционных правил агрегируются на шкалах выходных переменных и в результате формируется нечеткое множество заключений ШО,), используемое в процедурах поддержки процессов распознавания.

Для интерпретации нечетко-динамических описаний строятся согласующие сценарии, однозначным образом задающие координацию размещения интервальных признаков на временной шкале Т. По заданному сценарию строится интерпретирующее разбиение, которое максимизирует степень выраженности всех нечетко-временных признаков на интервалах разбиения. Степень выраженности нечетко-временных признаков полученного разбиения является значением истинности нечетко-динамического описания. Для вычисления истинностных значений нечетко-динамических описаний предлагается модифицированный нечетко-композиционный метод.

Второй этап, осуществляемый в рамках общей процедуры вывода сводится к вычислению нечетких значений истинности консеквентов продукционных правил на основании нечетко-истинностных значений антецедентов, полученных в результате интерпретации входных данных. Нечеткая импликация реализуется путем отсечения ФП выходной переменной по высоте, соответствующей нечетко-истинностному значению антецедента. В случае простых правил, заключениями которых являются конкретные названия речевых единиц, характеризующих входной РС или его отдельный фрагмент, нечеткий вывод сводится к присвоению полученных в результате интерпретации нечетко-истинностных значений антецедентов заключениям нечетких правил.

В результате нечетко-логического вывода для каждого из правил БЗ Т, —> г. формируются нечеткие подмножества выходных переменных г,. Последние объединяются на соответствующих шкалах выходных переменных,

в результате чего образуются нечеткие подмножества решений используемые в процедурах поддержки процессов распознавания ИС.

Поддерживающие процедуры реализованы в ИС АРР в виде гибридных классификаторов. Структура одного из них, обеспечивающего поддержку распознавания фонем в морфемах с опорой на нечетко-временную информацию об их окружении, приведена ниже. Для БЗ интеллектуальных моделей разрабатывается метод автоматической генерации нечетко-динамических правил БЗ на основе механизмов обучения.

Для конечного множества классов решений (подлежащих распознаванию гипотез) Я = {г1}гг,...,г4} задано семейство обучающих примеров Требуется на основании множества Л и обучающей выборки реконструировать семейство нечетко-динамических описаний В = Т1 иТ2 и...иТ' так, чтобы для как можно большего числа примеров из 9? система нечетких правил П = П' иП! и...иП' обеспечивала верный вывод решений при минимальном числе правил в П.

Охоинтеяьям решение

рс |пнс| |инс) О О

О О рки.)рка,) рка,1... рхи„).. рк(*_т)

|гшс|

О Р1г (О

Распознаваемый РК

Рис. 3. Струкутра гибридного нейро-нечеткого классификатора фонем.

Для БЗ интеллектуальных моделей разрабатывается метод автоматической генерации нечетко-динамических правил БЗ на основе механизмов обучения.

Для конечного множества классов решений (подлежащих распознаванию гипотез) Я = {гх,г2,...,гк} задано семейство обучающих примеров 9? = 5" ^д?2 Требуется на основании множества Я и обучающей

выборки 5Я реконструировать семейство нечетко-динамических описаний В = Т1 ^ Т2 и... О Т* так, чтобы для как можно большего числа примеров из

система нечетких правил П = П' иП! обеспечивала верный

вывод решений при минимальном числе правил в П.

Для решения задачи вводится моделирующий гиперграф Н = (3,£* и5").

Множество вершин гиперграфа отождествлено с множеством элементарных пар отношений 3 = {т. = Еп Нк Е) (г, j = \,2,...п,к = 1,2,...,7). Для описания Т определяется понятие интерпретирующего подмножества 3(Т), образованного теми элементами Т1, которые входят в исходное описание Т. Множество ребер гиперграфа Н отождествляется с множеством реализаций обучающей выборки ^ 5". Ребра гиперграфа Н подразделяются на два сорта. Каждой из реализаций принадлежащей подмножеству положительных примеров 5*, в Н сопоставлено ребро положительного сорта , состоящее из тех вершин г, еЗ, степень принадлежности которых

нечеткому интерпретирующему множеству 3(5*) не ниже £, где £ £ [0,1] имеет смысл некоторого заранее выбранного порога достоверности. Каждой из реализаций 5,", принадлежащей подмножеству отрицательных примеров 15", в Н сопоставлено ребро отрицательного сорта 5(", включающее те вершины т1 е 3, степень принадлежности которых нечеткому интерпретирующему множеству 3(5,") не ниже е.

Множество вершин 3' называется £-покрытием подмножества положительных ребер Б'*, если каждое из ребер я* е содержит подмножество 3*. Множество положительных ребер, покрываемое вершинами 3*, обозначается через 5+(3'). Подмножество вершин 3* называется £ -покрытием подмножества отрицательных ребер 1$"", если ни одно из ребер б 5"" не содержит в себе полностью подмножество 3". Множество отрицательных ребер, для которых множество вершин 3' является £-покрытием обозначается через 5" (3*).

Оптимизационно-графовая модель задачи обучения имеет вид

3

где /£*(3)/ и /5" (9?)/) - мощности множеств (91) и 5" "(91) соответственно.

В основу алгоритма обучения положен итерационный метод последовательного случайного поиска покрывающих множеств вершин во взаимодействии с локально-градиентным методом оптимизации формируемых наборов вершин и правилами вывода временной логики, используемыми с целью получения семантически корректных описаний.

В главе 4 описываются результаты практической реализации идей, методов и алгоритмов, лежащих в основе диссертационной работы.

Рассматривается случай практического применения системы АРР, оснащенной модулем интеллектуальной поддержки принятия решений при ее интеграции в автоматизированное рабочее место дежурного по сортировочной горке.

Исследован словарь дежурного по горке, в результате чего выделены три группы речевых сообщений - "справочные", "командные" и "системные". Выявленные классы речевых сообщений легли в основу построения предметно-ориентированного языка оператора (ПОЯО), на котором осуществляется общение оператора с системой. Разработана стратегия ведения устного диалога, положенная в основу интеллектуальной АРР.

Разработан комплекс программ и АРМ (см. рис. 4), предназначенный для всестороннего анализа PC, включая модели качественного анализа временных и просодических свойств речевых сообщений. Программно реализованы следующие методы извлечения и анализа параметров PC: вычисление и анализ формантных траекторий, построение спектрограмм по частотам Ме1 шкалы, построение кепстрально-временных образов PC, построение спектрально-

Рис. 4. Пользовательский интерфейс АРМа для анализа PC.

АРМ предоставляет пользователю возможность менять параметры моделирования сигнала, получать исчерпывающую информацию о любом

отрезке РС, а также сохранять полученные результаты для дальнейшего исследования. С помощью разработанного ПО были собраны экспериментальные данные для моделирования нечетко-временных свойств ряда конкретных РС из словаря ПОЯО и дальнейшего их использования в под держивающих системах АРР

24 • 22 20 it к

14

12 10

E<Vo)

АРР без модуля нечетко -временной модели АРР с модулем нечетко-временной модели

Речевые сообщения

Отпустить Зпормозжп Огцеп номер Конец роспуск» Напраюпь га трн путь пять

Рис 5. Сравнительные показатели функционирования систем анализа СФП.

Комплект, разработанного ПО объединен в единый программный комплекс для анализа акустичеких процессов Разработка всего ПО выполнена в ОС Linux, язык программирования С++, для построения графического интерфейса использована кроссплатформенная графическая библиотека QT. . Реализован нечетко-временной модуль поддержки принятия решений. На рис. 5 приведены сравнительные показатели его применения в системах АРР.

Основные положения диссертации опубликованы в работах:

1. Ковалев С.М., Муравский A.B., Определение информативности нечетко-темпоральных признаков в интеллектуальных моделях анализа слабо формализованных временных процессов. В кн. Обозрение прикладной промышленной математики. Т. 10, Вып. 1,2003, с, 173.

2. Ковалев С.М. , Муравский A.B. Разработка автоматизированного рабочего места для экспертного анализа сложных акустических процессов. Перспективные технологии и технические средства управления движением поездов на железнодорожном транспорте. Международный межвузовский сборник научных трудов, под. ред. проф. Л.В. Пальчика. Ростов н/Д, 2000, с 149-152.

3. Ковалев С.М. , Муравский A.B. Интеллектуальные модели обработки динамических данных в речевых терминала на железнодорожном транспорте.

Телекоммуникационные технологии на транспорте России: Аннотация докладов первой межведомственной научно-практической конференции "ТелекомТранс-2003", - Ростов н/Д, стр 91.

4. Муравский A.B. Организация речевого интерфейса автоматизированного рабочего места в интегрированной системе горочной автоматики. Актуальные проблемы развития технических средств железнодорожной автоматики и телемеханики. Междунар. Межвуз. Сб. науч. Тр. / Под ред. И.Д. Долгого. Ростов н/Д: Рост. Гос. Ун-т путей сообщения, 2002. с 138-142.

5. Ковалев С.М., Муравский A.B. Нейро-нечеткие модели извлечения знаний для интеллектуальных систем автоматического распознавания речи. Научно-технический журнал Вестник РГУПС г. Ростов-на-Дону:РГУПС, 2003 №2 с 79-81.

6. Муравский A.B. Разработка гибридных классификаторов в интеллектуальных системах анализа слабо формализованных временных процессов. Научно-технический журнал Вестник РГУПС г. Ростов-на-Дону:РГУПС, 2003 №2 с 81-83.

7. Муравский A.B. Формирование нечетких темпоральных правил в базах знаний интеллектуальных систем динамического типа. Отечественный теоретический и научно-методический журнал. Перспективные информационные технологии и интеллектуальные системы г. Таганрог ТРТУ. №3/2003 (15). с 114-117.

8. Ковалев С.М., Муравский A.B. Организация баз знаний интеллектуальных систем речевого распознавания. Отечественный теоретический и научно-методический журнал Перспективные информационные технологии и интеллектуальные системы г. Таганрог ТРТУ. №3/2003 (15). с 118-119.

Муравский Александр Викторович

ИНТЕЛЛЕКТУАЛЬНЫЕ МОДЕЛИ КАЧЕСТВЕННОГО АНАЛИЗА СЛАБО ФОРМАЛИЗОВАННЫХ ВРЕМЕННЫХ ПРОЦЕССОВ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Автореферат диссертации на соискание ученой степени кандидата технических наук

Формат 60x84/1. Бумага офсетная. Печать офсетная. Усл. Печ. Л 1: Уч. изд.л. 1 Тираж 100. Заказ №|782.

Ростовский государственный университет путей сообщения.

Лицензия ЛР № 65-64 от 10.12.1999 г.

Ризография РГУПС. Лицензия ПЛД № 65-10 от 10.08.1999 г.

Адрес университета: 344038, Ростов н/Д, пл. им. Ростовского стрелкового полка народного ополчения, 2.

= 1 я* 04

Iggoj

Оглавление автор диссертации — кандидата технических наук Муравский, Александр Викторович

Введение.

Глава

1. Методы моделирования слабо формализованных процессов в системах речевой коммуникации и их применение на ж.д. транспорте.

1.1 Предпосылки использования речевых технологий на ж.д. транспорте.

1.2 Использование композиционно динамического программирования в системах анализа СВП.

1.3 Использование искусственных нейронных сетей в системах анализа СВП.

1.4 Использование Скрытых Марковских моделей при анализе СВП.

1.5 Структурно-логические методы в системах анализа СВП.

1.6 Выводы.

Глава

2. Методы формирования вторичных временных признаков на основе нечетких временных отношений.

2.1. Значение временной информации и способы ее извлечения из необработанных данных.

2.2. Представление спектрально-временной информации в речевых сигналах на основе структур нечетких временных отношений.

2.3. Формирование оптимальных наборов нечетких временных признаков для баз знаний интеллектуальных систем анализа СВП.

2.4. Выводы.

Глава

3. Методы представления и обработки нечеткой динамической щ информации в базах знаний интеллектуальных систем.

3.1 Организация базы знаний интеллектуальной системы на основе структур нечетких временных отношений.

3.2. Методы обработки информации в моделях интеллектуальных систем на основе алгоритмов нечетко-логического вывода.

3.3 Методы формирования и оптимизации баз знаний ИС на основе алгоритмов обучения.

3.4. Выводы.

Глава

4. Структурно - программные аспекты реализации интеллектуальных моделей анализа СВП в системах речевого распознавания.

4.1 Состав и специфика речевого корпуса оператора технологического процесса сортировочной горки.

4.2 Структура и принципы построения интегрированной системы автоматической классификации СВП.

4.3 Программная реализация автоматизированного рабочего места для исследования СВП.

4.4 Выводы.

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Муравский, Александр Викторович

В последнее десятилетие наблюдается возрастание требований общества к уровню автоматизации решения новых классов задач, увеличивающегося уровня сложности. К их числу, в первую очередь, относятся так называемые слабо формализованные или информационно сложные задачи, связанные с анализом, контролем и диагностированием сложных технических объектов, явлений и процессов. Такие задачи возникают при разработке автоматизированных управляющих или контролирующих систем, а также прикладных интеллектуальных систем, способных обеспечить эффективную экспертную поддержку принятия решений в сложных технических и информационно-технологических ситуациях.

Особый класс информационно сложных задач представляют собой задачи, связанные с качественным анализом и обработкой экспериментальных данных, характеризующих течение процессов различной природы и, в частности, задачи анализа и идентификации слабо формализованных временных процессов (СВП) - процессов, законы поведения которых неизвестны или недостаточно изучены. Характерными примерами таких задач являются задачи, связанные с визуальным анализом электрореограмм и динамограмм изменения контролируемых параметров в системах технической диагностики, задачи визуального анализа электрофизиологических процессов в системах медицинской диагностики, задачи идентификации и распознавания сложных акустических процессов в системах автоматического распознавания и синтеза речи и др.

Математическая модель СВП в общем случае должна описывать последовательность нескольких случайных или нечетких внутренне скрытых событий, явлений и подпроцессов, которые в результате взаимодействия приводят к достаточно сложной картине пересекающихся во времени внешне наблюдаемых признаков. Большое число практически важных задач, связанных с анализом и идентификацией СВП, сводятся к построению таких моделей, на основании которых можно было бы правильно восстановить последовательность внутренних состояний и подпроцессов СВП, обуславливающих его внешнее проявление, с целью идентификации самого СВП либо его отдельных фрагментов и принятия на этой основе управляющих либо контролирующих решений.

Характерными примерами СВП являются сложные акустические процессы и, в частности, речевые сигналы. Ключевой проблемой, возникающей при разработке моделей речевых сигналов в системах речевого распознавания является вариабельность речевых сигналов и, как следствие, отсутствие четкого соответствия между фонетическими единицами речи и реализации СВП, характеризующими эти единицы. Наличие множества "НЕ" - факторов, обусловленных неполнотой, неточностью и нечеткостью исходной информации об исследуемом процессе является отличительной особенностью слабо формализованных задач, которую необходимо учитывать при разработке математических моделей СВП.

Исследования специалистов показали, что практический успех а решении слабо формализованных задач и, в частности, задач анализа СВП может быть достигнут при использовании новых информационных технологий, основанных на взаимодействии точных аналитических методов теории принятия решений с нечетко-логическими моделями, основанными на представлении и обработки знаний. В частности, общепризнано, что совершенствование существующих систем автоматического распознавания речи (АРР) и создание новых систем АРР, удовлетворяющих повышенным требованиям по надежности распознавания, требует использования подходов, основанных на моделях представления и обработки всесторонних знаний о речевом сигнале, включая нечеткие экспертные знания о речевом сигнале и процессах речевосприятия. При этом нечетко-логические модели

СВП могут быть использованы для поддержки решений, выработанных на основе аналитических, нейро-сетевых либо скрытых марковских моделях.

Для решения слабо формализованных задач, связанных с качественным анализом и моделированием сложных процессов и систем в настоящее время разрабатываются методы, основанные на алгебраических, логико-лингвистических и нечетко-логических моделях принятия решения. Большой вклад в становление и развитие теории построения алгебраических и логико-лингвистических моделей принятия решений внесли российские ученые Вагин В.Н., Горбатов В.А., Журавлев Ю.И., Кузнецов О.П., Нариньяни А.С., Осипов Г.С., Поспелов Д.А., Попов Э.В., Стефанюк В.Л., Финн В.К. и др. Большой вклад в развитие теории и практики построения интеллектуальных моделей анализа динамических систем и процессов, включая нечетко-логические модели, внесли ученые Аверкин А.Н., Берштейн JI.C., Вагин В.Н., Емельянов В.В, Еремеев А.П., Ковалев С.М., Мелихов А.Н., Потапова Р.К., Цемель Г.И., Ярушкина Н.Г. и др.

Однако, применение алгебраических и нечетко-логических методов для решения задач, связанных с качественным анализом и моделированием СВП, требует их определенного развития с учетом конкретных особенностей приложений. В частности, разработка интеллектуальных моделей СВП для класса речевых сигналов требует выбора семейства релевантных признаков, наиболее устойчивых к различного рода искажениям и одновременно допускающих возможность интеграции в них нечеткой экспертной информации о структуре речевого сигнала и особенностях речевосприятия. Также требуется разработка специального класса нечетко-логических моделей, способных оперировать данными прзнаками при выработке решений и допускающих возможность интеграции с существующими моделями анализа речевых сигналов, например, моделями, основанными на искусственных нейронных сетях. И наконец, поскольку модели нечетко-логического анализа являются качественными моделями, опирающимися на достаточно грубую исходную информацию об исследуемом "СВП, требуется разработка методов оптимизации параметров нечетких моделей с целью повышения их эффективности и адаптируемости в соответствии с вновь поступающими данными.

В рамках поставленных задач в первой главе диссертации проодится анализ известных методов моделирования речевых сигналов, на основании которого формируется вывод о том, что наиболее учстойчивой к различного рода искажениям является информация, характеризующая временные и нечетко-временные свойства речевого сигнала. Следовательно, при разработке системы АРР перспективным представляется подход, в основе которого лежит предположение о том, что речевой сигнал реализует процесс передачи нечетких временных зависимостей, в структуре которых содержится необходимая, которую можно использовать для поддержки процессов распознавания.

Исходя из сказанного, и с учетом выше перечисленных общих задач, возникающих при разработке методов анализа и идентификации СВП, в качестве объекта исследования диссертации выбран новый класс интеллектуальных моделей, основанный на структурах временных и нечетко-временных отношений. В соответствии с выбранным направлением исследования сформулирована основная цель работы.

Цель исследования. Целью исследования является развитие методов моделирования слабо формализованных временных процессов на основе использования структур нечетко-временных отношений и их применение в системах поддержки принятия решений на примере систем речевого распознавания.

В соответствии с поставленной целью в диссертации решаются следующие задачи.

1. Разработка методов представления и формализации обобщенных временных признаков слабо формализованных процессов в классе нечетковременных отношений с целью использования их в качестве вторичных признаков речевых сигналов в интеллектуальных поддерживающих системах речевого распознавания.

2. Разработка методов оценки информативности нечетко-временных признаков СВП и на их основе методов формирования оптимальных наборов вторичных спектрально-временнных параметров речевых сигналов для интеллектуальных поддерживающих систем речевого распознавания.

3. Разработка интеллектуальных моделей анализа слабо формализованных временных процессов с использованием нечетко-временных отношений в качестве единиц структурных знаний о моделируемом объекте.

4. Для предложенного класса моделей - разработка методов нечетко-логического вывода в качестве основного механизма принятия решений.

5. Для предложенного класса нечетко-логических моделей - разработка методов оптимизации и адаптации их параметров на основе механизмов обучения.

7. На основе предложенного класса нечетко-логических моделей разработка и программная реализация подсистем поддержки процессов речевого распознавания с целью экспериментальной проверки эффективности их использования в системах АРР.

Методы исследования. Для решения поставленных задач использовались методы теории распознавания образов, методы теории нечетких множеств и нечеткой логики, аппарат дискретной математики и теории графов, а также методы анализа и обработки дискретных сигналов.

Практическая проверка разработанных моделей осуществлялась путем программной эмуляции и проведения имитационных экспериментов на модельных и реальных задачах в области речевого распознавания.

Научная новизна работы заключается в решении важной научной задачи качественного анализа слабо формализованных временных процессов, имеющее существенное значение для развития методов математического моделирования сложных динамических объектов и систем.

К наиболее существенным научным результатам работы относятся следующие:

1. На примере речевых сигналов проведено исследование характеристик СВП с целью выявления новых классов релевантных вторичных признаков для систем принятия решений. Обоснована возможность использования нечетко-временных отношений в качестве релевантных и наиболее устойчивых к различного рода искажениям вторичных признаков СВП.

2. Предложена система и методы формализации вторичных признаков СВП на основе структур нечетко-временных отношений, допускающих возможность их использования в системах принятия решений как самостоятельно, так и в объединении с другими моделями представления информации о СВП, в частности с нейро-сетевыми моделями.

3. Разработан новый способ оценки информативности и формирования наборов вторичных нечетко-временных признаков СВП по критерию их дискриминативной способности, основанный на использовании линейных нейро-сетевых классификаторов во взаимодействии с генетическими оптимизационными алгоритмами.

4. На примере моделирования речевых сигналов предложена новая нечетко-временная модель СВП, предназначенная для использования в поддерживающих системах речевого распознавания.

5. Разработан комплекс программного обеспечения (ПО), для анализа акустических СВП. Программные модули, входящие в состав ПО, могут быть использованы при решении инженерной задачи построения системы АРР, предназначенной для интеграции в существующие системы управления технологическими процессами.

Практическая ценность. Практическая ценность работы определяется возможностью использования предложенных моделей в качестве поддерживающих модулей для интегрированных систем речевого распознавания. В частности разработаны:

1. ПО автоматизированного рабочего места, позволяющее проводить детальное исследование временной структуры акустических СВП, накопление, хранение и статистический анализ полученной информации.

2. Программная оболочка, позволяющая моделировать работу нейросетевых модулей систем АРР, на различных фонемных базах.

3. Подсистема поддержки распознавания на основе укрупненных спектрально-временных образов PC для системы АРР, позволяющая , повысить надежность распознавания на 5-7 %

Достоверность и обоснованность научных положений, выводов и результатов, сформулированных в диссертации, подтверждается доказательством утверждений и теорем, результатами вычислительных экспериментов на практических и модельных задачах, публикациями и апробацией работы на региональных, отраслевых и внутревузовских научно-технических конференциях, а также актами внедрения результатов работы.

Реализация результатов работы. Работа выполнялась в рамках хозяйственного договора при НИС РГУПС по разработке АРМа оператора технологических процессов на железнодорожном транспорте. Результаты работы прошли успешную апробацию в качестве модуля поддержки принятия решений в системе АРР, на примере АРМа ДСПГ и, также, применяются в учебном процессе.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на межвузовской конференции студентов, аспирантов и молодых специалистов .

Публикации. Полученные в диссертации теоретические и практические результаты нашли свое отражение в 8 печатных работах.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения общим объемом 190 страницы, а также списка литературы и приложений.

Заключение диссертация на тему "Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений"

4.4 Выводы.

1. В процессе работы над диссертацией был реализован объемный комплекс полнофункционального ПО, предназначенный для всестороннего анализа PC.

2. Программные модули задействованные в исследовательском ПО являются самодостаточными и могут быть использованы при постороении систем анлиза слабоформализованных временных процессов.

Заключение

1. На сегодняшний день сложилась благоприятная ситуация для начала широкого внедрения речевых технологий на ж.д. транспорте. Необходимо проводить дальнейшие исследования в области моделей речевосприятия и усовершенствования существующей технологи распознавания речи, как фактора способного оказать влияние на многие аспекты функционирования ж.д. транспорта, в том числе и на один из ключевых аспектов — повышение безопасности перевозок.

2. В результате проведенного исследования моделей представления PC сделан вывод, что наиболее перспективным в системах АРР является применение ИНС при объединение с другими моделями, несущими в себе априорную лингвистическую и фонетическую информацию.

3. На основе анализа экспериментальных исследований в области психоакустики, экспериментальной фонетики и физиологии установлена большая роль временных и спектро-временных модуляций в PC для слухового восприятия речи и обоснована необходимость использования в системах АРР специальных классов вторичных временных признаков. Рассмотрены известные способы представления спектрально-временной информации о PC и показано, что они имеют существенные ограничения на их использования в современных системах АРР, связанные с невозможностью интерпретации данных параметров в качестве единиц структурно-временного знания.

4. Предложен новый класс вторичных спектрально-временных признаков, основанный на нечетких временных отношениях, которые, с одной стороны, допускают возможность естественной интерпретации в качестве единиц структурно-временного знания, а с другой стороны, допускают возможность обработки с использованием искусственных нейронных сетей.

5. Предложен новый способ оценки информативности вторичных нечетко-временных признаков речевых сигналов по критерию их дискриминативной способности, основанный на аналитическом методе оптимизации параметров линейных нейро-сетевых классификаторов, обеспечивающий возможность разработки эффективных в вычислительном плане процедур оптимизации наборов вторичных параметров для систем АРР.

6. Предложена новая нечетко-динамическая модель представления качественной временной информации в БЗ интеллектуальных систем, основанная на использовании нечетких временных отношений в качестве элементарных единиц знаний.

7. Разработана формальная модель БЗ интеллектуальной системы АРР, основанная на системе нечетко-динамических продукционных правил. Благодаря тому, что в предложенной структуре БЗ процедуры пополнения знаний совмещены с правилами нечетко-логического вывода обеспечивается возможность автономной реализации механизма поддержки принятия решений непосредственно в БЗ, что упрощает основной механизм распознавания, реализованный в подсистемах верхнего уровня АРР.

8. На основе предложенной 1рафовой модели задачи обучения разработан генетический алгоритм формирования оптимальных подмножеств нечетко-динамических описаний, основанный на процедуре случайного поиска во взаимодействии с градиентным методом оптимизации формируемых описаний и правилами вывода темпоральной логики, обеспечивающими выполнение условий семантической корректности формируемых описаний.

9. В процессе работы над диссертацией был реализован объемный комплекс полнофункционального ПО, предназначенный для всестороннего анализа PC.

Библиография Муравский, Александр Викторович, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1.12-1, Ookayama, Meguro-ku, Tokyo, 152-8552 Japan 1. RAILROADS & TECHNOLOGY: TRANSPORTING THE FUTURE

2. Transportation Technology Center, Inc. 2002

3. J. Jedruszek. Speech recognition. Alcatel Telecommunications Review -2nd Quarter 2000

4. Ronald R. Knipling Walter W. Wierwille Vehicle-Based Drowsy Driver Detection: Current Status and Future Prospects IVHS America Fourth Annual

5. Meeting, Atlanta, GA, April 17-20, 1994

6. Christopher Cieri. Resources for Robust Analyses of Natural Language

7. Conference ROMAND 2000, Lausanne, 19-20 octobre 2000

8. Shuangyu Chang, Miijam Wester and Steven Greenberg.

9. An Elitist Approach to Automatic Articulatory-Acoustic Feature Classification for

10. Phonetic Characterization of Spoken Language International Computer Science Institute 1947 Center Street, Berkeley, CA 94704, USA

11. L. Lamel, S. Rosset, J. L. Gauvairi and S. Bennacef: "The LIMSI ARISE system for train travel information", Proc. IEEE Int. Conf. Acoust., Speech, Signal Process., Phoenix, pp. 501 -504 (1999)

12. AUTOMATIC SPEECH RECOGNITION AND ITS APPLICATION TO INFORMATION EXTRACTION Sadaoki Furu Department of Computer

13. Science Tokyo institute of Technology

14. Зозуля B.A. Речевая коммуникация в системах ввода сообщений для . автоматизации рабочих мест оперативно-диспетчерского персонала. Диссертация на соискание ученой степени кандидата технических наук. Ростов-на-Дону, 2000.

15. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов.

16. Киев: Наук, думка, 1987! 264с.

17. Вагин В.Н. Дедукция и обобщение в системах принятия решений. -М.: Наука. Гл. ред. физ.-мат. лит., 1988. - 384с.

18. S. Amari, N.K. Kasabov (Eds.), Brain-like Computing and Intelligent Information Systems, Springer, Berlin, 1997.

19. Попов Э.В., Фоминых И.Б. Кисель Е.Б. Шапот М.Д. Статические и динамические экспертные системы: Учеб. пособие. — М.: Финансы и статистика, 1996. 320с

20. D.P. Morgan and C.L. Scotfield, Neural Networks and Speech Recognition (Kluwer Academic Publishers, Dordrecht, 1991).

21. Захаров B.B., Кантор П.С., Ткаченко Д.Г. Синтез логических контроллеров с использованием механизма обработки нечеткой информации. // Известия РАН. Теория и системы управления, М.: "Наука", 2000, №4.

22. N.K.Kasabov, R.I.Kilgour, S.I.Sinclair. From hybrid adjustable neuro-fuzzy systems to adaptive cjnnectionist-based systems for phoneme and word recognition. Fuzzy Sets and Systems, 103 (1999) 349-367.

23. Mu-Chun Su, Ching-Tang Hsieh, Chieh-Ching Chin. A neure-fuzzy approach to speech recognition without time alignment. Fuzzy Sets and Systems. 98 (1998), 33-41.

24. Круглов B.B., Борисов B.B. Искусственные нейронные сети. Теория и практика. М.: Горячая линия. - Телеком 2001. — 382с."'

25. Заде JI.A. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. - 165с.

26. Потапова Р.К. Речь: Коммуникация, информация, кибернетика: Учеб.посбие для вузов. М.: Радио и связь. — 1997. - 528с.

27. Танака X., Цукиямо Т. Асаи К. Модель нечеткой системы, основанная на логической структуре.// Нечеткие множества и теория возможностей. Последние достижения: Пер. с англ. -М.: Радио и связь. 1986, с. 186-199.

28. Карелин В.П., Ковалев С.М. Метод построения модели, имитирующей алгоритм поиска управляющих решений оператором. // Известия Академии наук СССР. Техническая кибернетика, №5. 1983. с. 181188.

29. J.S.R. Jang, ANFIS: adaptive-network-based fuzzy inference system, IEEE Trans. Systems Man Cybernet. 23 (3) (1993)665- 684.

30. T. Yamakawa, H. Kusanagi, E. Uchino, T. Miki, A new effective algorithm for neo fuzzy neuron model, in: Proc. 5th IFSA World Congress, 1993, pp. 1017-1020.

31. N.K. Kasabov, J.S. Kim, М. Watts, A. Gray, FuNN/2 a fuzzy neural network architecture for adaptive learning and knowledge acquisition, Inform. Sci. 101 (3 {4) (1997) 155-175.

32. N.K. Kasabov, R. Kozma, M. Watts, Optimization and adaption of fuzzy neural networks through genetic algorithms and learning-with-forgetting methods and applications for phoneme based speech recognition, Inform. Sci. 110 (1998)61-79.

33. Курейчик B.M. Генетические алгоритмы. Обзор и состояние // Новости искусственного интеллекта. 1998. №3.

34. Breiman L., Friedman J.H., Olshen R.A, Stone C.J. Classification and regression frees. Belmont, CA: Wadswort. 1984.

35. Мелихов A.H., Ковалев C.M., Карелин В.П. Моделирование процессов принятия решений на основе нечетких классификационных схем.// Известия АН УССР. Электронное моделирование. №3, т.6, 1984 с.3-6.

36. Мелихов А.Н., Берштейн JI.C., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой. М.: Наука, 1990. - 272с.

37. Fletcher, Н. (1953). Speech and Hearing in Communication. Krieger. (There is a 1994 reprint ASA1. Edition.).

38. Allen, J. B. (1994). How do humans process and recognize speech. IEEE Trans. Speech Audio Processing, 2(4):567-576.

39. Sharma, S. (1999). Multi-Stream Approach To Robust Speech Recognition. Dissertation, OGI, Portland, USA.

40. Hermansky, H. and Sharma, S. (1998). TRAPS Classifiers of temporal patterns. In Proc. ICSLP'98,Vol! 3, pp. 1003-1006.

41. Bourlard, H., Dupont, S., Hermansky, H. and Morgan, N. (1996a). Towards sub-band-based speech recognition. In European Signal Proc. Conf., Trieste, pp. 1579-1582.

42. Greenberg, S., Arai, T. and Silipo, R. (1998). Speech intelligibility derived from exceedingly sparse spectral information. In Proc. Int. Conf. on Spoken Language Processing (ICSLP).

43. Warren, R. and Bashford, J. J. (1999). Intelligibility of 1/3-octave speech: Greater contribution of frequencies outside than inside the nominal. J. Acoust. Soc. Am., 106(5)

44. Schreiner, C. and Calhoun, B. (1994). Spectral envelope coding in cat primary auditory cortex: properties of ripple transfer functions. Auditory Neuroscience, 1:39-61

45. Kowalski, N., Depireux, D. and Shamma, S. (1996). Analysis of dynamic spectra in ferret primary auditory cortex. I. Prediction of unit responses to moving ripple spectra. J. Neurophysiol., 76:3503-3523.

46. Schreiner, C., Read, H. and Sutter, M. (2000). Modular organization of frequency integration in primary auditory cortex. Annual Review Neuroscience, 23:501-529

47. Depireux, D., Simon, J., Klein, D. and Shamma, S. (2001). Spectro-temporal response field characterization with dynamic ripples in ferret primary auditory cortex. Journal of Neurophysiology, 85:1220-1234.

48. Kaernbach, C. (2000). Early auditory feature coding. In Contributions to psychological acoustics: Results of the 8th Oldenburg Symposium on Psychological Acoustics., pp. 295-307. BIS, Universitat Oldenburg

49. Касевич В.Б. Фонологические проблемы общего и восточного языкознания. М.: Наука, 1983. 295 с.

50. Gramss, Т. and Strube, Н. W. (1990). Recognition of isolated words based on psychoacoustics and neurobiology. Speech Communication, 9:35-40.

51. Hermansky, H., Ellis, D. and Sharma, S. (2000). Tandem connectionist feature extraction for conventional HMM systems. In Proc. ICASSP, Istanbul.

52. Трунин Донской В.Н. Экспертные системы и фонетическая маркировка сегментов слитной речи. - В кн. Анализ, распознавание и синтез речи. М., ВЦ АН СССР, 1987.

53. Allen J.F. Towards a General Theory of Action and Time / Artificial Intelligence, 1984, 23(2).

54. Gramss, T. (1992). Worterkennung mit einem kunstlichen neuronalen Netzwerk. Dissertation, Universitat Gottingen.

55. Муравский A.B., Ковалев С.М. Определение информативности нечетко-темпоральных признаков в интеллектуальных моделях анализа слабо формализованных временных процессов. В кн. Обозрение прикладной промышленной математики. Т. 10, Вып. 1, 2003, с, 173.

56. Mazim Rahim, Giuseppe Ricardi, Lawrence Saul, Jerry Wright, Bruce Buntschun, Allen Gorin, Robust numeric recognition in spoken language dialogue, Speech Communication 34 (2001) 195-212.

57. Joseph Picone. Методы моделирования сигнала в распознавании речи. 1993.57. www, troll tech. com58. OSS Programming Guide.59. Numerics in C. Oxford

58. Robust Speech Recognition Based on Spectro-temporal Processing

59. Dem Fachbereich Physik der Universitat Oldenburg zur Erlangung des

60. Speech recognition by machines and humans

61. Richard P. Lippmann ) Lincoln Laboratory MIT, Room S4-121, 244 Wood Street, Lexington, MA 02173-9108, USA. Speech Communication 22 1997 1-15

62. Schreiner, С., Read, H. and Sutter, M. (2000). Modular organization of frequency integration in primary auditory cortex. Annual Review Neuroscience, 23:501-529.

63. Brian E.D. Kingsbury a,b,*, Nelson Morgan a,b, Steven Greenberg a,b.

64. Robust speech recognition using the modulation spectrogram.

65. Speech Communication 25 (1998) 117-132

66. Melvyn J. Hunt. Practical large-vocabulary speech recognition in a multilingual environment. Dragon Systems UK, Stoke Road, Bishops Clee, Cheltenham GL52 4RW, UK. . Speech Communication 23 1997 297-305

67. Аверкин А.Н. Костерев В.В. Триангулярные нормы в системах искусственного интеллекта. II Известия Академии наук. ТиСУ, 2000. №5.с.107-119.

68. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор 1989 http://www.es. berkeley.edu/~iTiurphyk/Baves/rabiner.pdf

69. Скрытые Марковские модели 2000 http://leader.cs.msu. su/~liik/HMM rus.html74. http://www.statsoft.ru/home/portal/glossaiT/GlossaryTwo/M/Mahalano bisdistance.htm

70. Савченко В.В. Теоретико-информационное обоснование оценок минимакса энтропии // Изв. Вузов радиофизика, 1993, т.36 u.i. с. 1002-1011.

71. Цемель Г.И. Опознавание речевых сигналов. М,: Наука, 1971. —145 с.

72. Высоцкий Г.Я., Рудный Б.Н., Трунин-Донской В.П., Цемель Г.И. Алгоритм опознавания 40 слов на ЦВМ БЭСМ -3/ Работы по техн. кибернетике/ ВЦ АН СССР, М., 1968.-Вып.2.-с,3-33.

73. Винцюк Т.К., Лобанов Б.М., Шинкаж А.Г. Система рспознавания речи и система устного диалога СРД "Речь 1" на основе микро-ЭВМ// Автоматическое распознавание слуховых образов., Киев: ИК АН УССР, 1982.-C.516-521.

74. Еремеев А.П., Троицкий В.В. Основные способы формализации временных зависимостей при построении интеллектуальных систем.// Седьмая национальная конференция по искусственному интеллекту с международным участием. М. 2000.

75. Мелихов А.Н., Берштейн Л.С. Конечные четкие и расплывчатые множества: 4.11. Расплывчатые множества. Таганрог: ТРТИ, 1981

76. Кандрашина Е.Ю. и др. Представление знаний о времени и пространстве. / Под ред. Д.А. Поспелова М.: Наука, 1987г. - 328с

77. Schank, R. Dynamic Memory: A theory of learning in computers and people. New York, NY: Cambridge University Press. 1982.

78. Финн В.К. Правдоподобные выводы и правдоподобные рассуждения // Итоги науки и техники. Сер. теория вероятностей, математическая статистика и теоретическая кибернетика. Т. 28. М. : ВИНИТИ, 1988. с. 3-84.

79. Поспелов Д.А. Логико-лингвистические модели в системах управления. -М.: Энергоиздат. 1981. -231с

80. Вагин В.Н., Викторова Н.П. Вопросы структурного обобщения и классификации в системах принятия решений. Изв. АН СССР: Техническая кибернетика, 1982, №5 с. 64-73

81. Минский М.: 1979. Фреймы для представления знаний М.: Энергия.

82. S.Gitton, J.N. Temem, Specification and evaluation of French automatic telephone information systems in the Arise project, WCRR 97.91.http://www.ldc.upenn.edu/Catalog/CatalogEntry.isp?catalogId=LDC93Sl92.www.linux.org

83. Поспелов Д.А. Ситуационное управление: Теория и практика. М.: Наука. 1986.

84. Ковалев С.М. Интеллектуальные модели анализа акустических процессов на основе нечетких динамических систем // Новости искусственного интеллекта. М.: ВЦ РАН , 2000, 3, с. 146-159.

85. Ковалев С.М. Нечеткие темпоральные системы в моделях анализа акустических процессов // Труды конгресса "Искусственный интеллект в

86. XXI веке". Научное издание. М.: Издательство Физ.-мат. литературы, 2001.-847с.

87. Методы автоматического распознавания речи: В 2кн. Пер. с англ./ Под ред. У. Ли. -М.: Мир. 1983

88. Ковалев С.М. Модели анализа слабо формализованных динамических процессов на основе нечетко-темпоральных систем. // Изв.гвузов. Сев.-Кавк. регион. Естеств. науки. 2002. №2. с.10-13.

89. Shoham Y. Time for action // In Proceedings 11 IJCAI, 1989.

90. Еремеев А.П., Троицкий B.B. Представление временных ограничений в интеллектуальных системах (обзор)// Труды конгресса «Искусственный интеллект в XXI веке».- М.:.изд-во Физико-математической литературы. 2001.Т.1. -С.61-74.

91. Berge С. Graphes et hypergraphes. Paris: Dunon, 1970.

92. Rabiner L.R., Schafev R.W. Digital processing of Speech Signals. —NJ: Prentice-Hall- Englewood Cliffs. 1978

93. Ковалев С.М. Нечеткие модели идентификации речевых сигналов на основе визуальной информации. Изв. ТРТУ. Тем. вып.: Интеллектуальные САПР / материалы международной НТК "ИСАПР" Таганрог: ТРТУ, 2000 -№2 с.78-81.

94. Joseph Picone (перевод Ruslan Popov) Методы моделирования сигнала в распознавание речи.

95. Ковалев С.М., Муравский А.В! Нейро-нечеткие модели извлечения знаний для интеллектуальных систем автоматическогораспознавания речи. Научно-технический журнал Вестник РГУПС г. Ростов-на-Дону :РГУПС, 2003 №2 с 79-81.

96. Муравский А.В. Разработка гибридных классификаторов в интеллектуальных системах анализа слабо формализованных временных процессов. Научно-технический журнал Вестник РГУПС г. Ростов-на-Дону:РГУПС, 2003 №2 с 81-83.

97. И.Л. Мазуренко. Компьютерные системы распознавания речи.2002.

98. Sadaoki Furui From Read Speech Recognitionto Spontaneous Speech Understanding Tokyo Institute of Technology, Department of Computer Science 2-12-1 Ookayama, Meguro-ku, Tokyo, 152-8552 Japan 2002.

99. Chao Wang Prosodic Modeling for Improved Speech Recognition and Understanding by M.S., Massachusetts Institute of Technology (1997 ) B.S., Tsinghua University, Beijing, China (1994)

100. И.В. Заенцев, Нейронные Сети: основные модели. Воронеж 1999 г.

101. A. Batliner, R. Kompe, A. Kieling, М. Mast, Н. Niemann ,

102. Е. Noth , М = Syntax + Prosody: A syntactic±prosodic labelling scheme for large spontaneous speech databases Speech Communication 25 (1998) p. 193-222

103. Keller, E. (1998). Neurological bases of the temporal organisation of speech. In P. Bhatt & R. Davis (eds.), The Linguistic Brain (pp. 215-229). Toronto: Canadian Scholars' Press.

104. Zellner Keller, В., & Keller, E. (forthcoming). The chaotic nature of speech rhythm. In Ph. Delcloque and V. M. Holland (Eds). Integrating Speech Technology in Language Learning. Swets & Zeitlinger 2000. x

105. Jacques Duchateau, Kris Demuynck, Dirk Van Compernolle Fast and accurate acoustic modelling with semi-continuous HMMs. Speech Communication 24 1998 5-17.

106. Huang, X., Jack, M., 1989. Semi-continuous hidden Markov models for speech signals. Computer Speech Language 3, p. 239-252.

107. Lee, C.-H., Rabiner, L., Pieraccini, R., Wilpon, J., 1990. Acoustic modeling for large vocabulary speech recognition. Computer Speech Language 4, 127-166.

108. Victor Sorokin, Vladimir Olshansky, Leonid Kozhanov. Internal model in articulatory control: Evidence from speaking without larynx

109. Speech Communication 25 (1998) 249-268.

110. Timothy J. Hazen. A comparison of novel techniques for rapid speaker adaptation Speech Communication 31 (2000) 15-33.

111. Hartigan, J., 1975. Clustering Algorithms. Wiley, New York.

112. Rabiner, L.R., 1989. A tutorial on hidden Markov models and selected applications in speech recognition. In: Proceedings IEEE 77,257-286.

113. Randolph, M., 1994. Speech analysis based on articulatory behavior. J. Acoust. Soc. Amer. 95, laSP15.

114. Moore, B.C.J., An Introduction to the Psychology of Hearing, Academic Press, New York. 1982.

115. Antoniol, G., Carli, G., Cettolo, M., Fiutem, R., 1992. Tools for development, test and analysis of ASRs. In: Proceedings ICSPAT, Cambridge, MA, pp. 1005-1010.

116. Фоминых И.Б. Принципы построения гибридных интеллектуальных систем реального времени// Труды международного конгресса ICAP2001 «Искусственный интеллект в XXI веке» М.: Физматлит. 2001. Т.2.-С.570-583.