Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости

Шаталова, Ольга Владимировна

Системный анализ, управление и обработка информации (по отраслям)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости

кандидата технических наук: Шаталова, Ольга Владимировна
город: Курск
год: 2006
специальность ВАК РФ: 05.13.01

Диссертация по информатике, вычислительной технике и управлению на тему «Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости»

Автореферат диссертации по теме "Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости"

На правах рукописи

Шаталова Ольга Владимиров на

НЕЧЕТКИЕ СЕТЕВЫЕ МОДЕЛИ И АЛГОРИТМЫ ДЛЯ ДИАГНОСТИКИ СОСТОЯНИЯ ГОЛОСОВОГО АППАРАТА НА ОСНОВЕ АНАЛИЗА ФОНЕМ НА ВЕЙВЛЕТ-ПЛОСКОСТИ

Специальность 05.13,01 - Системный анализ, управление и обработка

информации

Автореферат диссертации на соискание ученой степени кандидата технических наук

КУРСК 2006

Работа выполнена 8 ГОУ ВПО «Курский государственный технический университет».

Научный руководитель: „ локтор технических наук, профессор

Кореневский Николай Алексеевич

Официальные оппоненты: доктор технических наук, профессор

Маслак Анатолий Андреевич,

кандидат технических наук, доцент Руленко Вероника Викторовна

Ведущая организация: Воронежский государственный

технический университет

Зашита диссертации состоится 17 ноября 2006 года в 14 часов в конферени-зале на заседании диссертационного совета Д 212.105.03 при ГОУ ВПО «Курский государственный технический университет» по адресу: 303040, г. Курск, ул. 50 лет Октября, 94.

С диссертацией можно ознакомиться в библиотеке ГОУ ВПО «Курский государственный технический университегг».

Автореферат разослан 16 октября 2006 г.

1 "" ^ч ^

Ученый секретарь

днссерташюнного совета V г Старков Ф.А.

ОК1ЦЛЯ ХЛРЛКТКПКТМКЛ 1'Л1>ОТЫ

Актуальность работы. Расстройство голосового аппарата является наиболее распространенным заболеванием среди школьников, студентов и преподавателей. Многие хронические заболевания органов и систем, не входящих в состав голосового аппарата, могут обуславливать неполноценность его функции даже в случае отрутстш 1я каких-либо изменений в гортани. Сюда относятся заболевания легких, сердечнососудистой, нервной и эндокринной систем. Установлена тесная связь между голосовыми расстройствами и нарушениями функции щитовидной железы.

Проведенные исследования показали, что 8 большинстве случаев оценка голоса пациента осуществляется . оториноларингологом или фоинатром субъективно, т.е. на слух, и присутствие человеческого фактора при этом неизбежно. Поэтому в практике фоииатрон пспользуются компьютерные технологии, которые позволяют определить некоторые акустические параметры голоса, на основе которых может быть объективно определено состояние голосового тракта, например, путем балльных оценок. При этом используются различные методы компьютерного анализа сигнала голоса, орнеш ироваиные как на пространство сигналов, так - и на пространство частот. Однако в. настоящий момент они не могуг удовлетворить специалистов, как по достоверности, так и по оперативности диагностики, так как в результате размытости границ классов обладают низкой специфичностью и требуют высокой квалификации эксперта для принятия решения о наличии пли отсутствии патологии голосового аппарата.

Многочисленные исследования показали, что основой существования любой сложной биологической системы являются ритмические процессы (['лас Л., Скляров О., Чижевский Л), Каждой биологической системе, находящейся в состоянии гам еостати чсского равновесия, соответствует рнтм определенной сложности. Причем отклонение ог этого состоянии может сопровождаться как усложнением ритма (до хаотического ритма), так и упрощением его (мстрономныП режим) {Еаевскин р.). Поэтому для исследования функционального состояния голосового аппарата и распознавания речи широко используют спектральные методы (Гоулд В., Рабнпер Л.).

Однако на спектральный состав сигнала голоса влияет множество системных факторов, не связанных с функциональным состоянием голосового аппарата (Василенко Ю.С., Васильев Ю.М.), поэтому использование классических спектральных методов анализа в этом случае затруднительно н для его анализа предпочтительно использовать часто гно-врсмеиные преобразования (Макс Ж.).

решений в условиях нечетко выраженных границ классов, является актуальной задачей.

Работа выполнена в соответствие с научно-технической программ oil «Научные исследования высшей школы по приоритетным направлениям науки н техники», подпрограмма 204 «Технология живых систем» 2002-2004 гг. н в соответствии с научным направлением Курского государственного технического университета «Разработка медико-экологических информационных технологий».

Цель работы. Целью данной работы является повышение диагностической эффективности классификации функционального состояния голосового аппарата посредством частотно-временного анализа тестовых сигналов голоса и нечеткой логики принятия решений.

Для лостнжсния поставленной пели необходимо решить следующие основные задачи:

- разработать метол синтеза пространства информативных признаков, выделяемых hj кода тестовог о сигнала;

- разработать модель модуля нечеткого вывода, предназначенного для использования в системах поддержки принятия решений при диагностике функционального состояния голосового аппарата;

- предложит;, структуру системы поддержки принятия решений для ирача-фон натра;

- разработать способ формирования функций принадлежности для классификации функциональных состояний голосовых складок;

• провести апробацию предложенных методов и средств im

репрезентативных контрольных выборках.

Методы исследований. Для решения поставленных задач использовались методы системного анализа, спектрального анализа, пен влет-а нал и за. математической статистики, теории нечетких нейронных сетей и распознавания образов, экспертного оценивания и принятия решен и ft. При разработке модуля нечеткого вывода в качестве инструментария использовался Mat lab ¿.0 с графическим интерфейсом пользователя для NN — NNTool и со встроенным пакетом Fuzzy Logic Toolbox,

Научнаи ntmmiia. В диссертации получены следующие результаты, характеризующиеся научной новизной:

- метод синтеза признакового пространства по псивлст-плоскости тестовой фонемы, отличающийся способами выделения тестовой фонемы из тестового сигнала, сегментации вей влет-плоскости тестовой фонемы и процедурами определения статистических характеристик выделенных сегментов неПвлет-плоскости тестовой фонемы;

- способ выделения тестовой фонемы из тестового сигнала, основанный на анализе числа пересечений нулевого уровня тестовым сигналом в скользящем частот но-в ре мен ном окне;

• способ сегментации в ç îi вл ет- п лос кости тестовой фонемы, отличающиЛся анализом частотных компонент модуле Л вс Л влет-коэффициентов и их нисходящих разностей в окнах, ширина которых равна длине строки неГшлет-плоскости; :

- модель модуля нечеткого вывода, предназначенная для использования в системах поддержки принятия решений при диагностике функционального состояния голосовых складок, отличающаяся правилами вывода в агрегаторе и дефуззифн кагоре и алгоритмом уточнения настраиваемых параметров, основанном на итерационной процедуре минимизации числа объектов обучающей выборки, для которых, не могут быть приняты ни нулевая, ни альтернативная гипотезы; '

способ формирования функций принадлежности для классификации функциональных состояний голосовых складок, заключающийся в сортировке полигонов обучающих выборок двух разделяемых классов, с последующим применением к полученным полигонам процедур обработки гистограмм, определяемым относительной дислокацией полигонов выбранных классов;

• алгоритмы классификации функциональных состояний голосовых складок, отличающиеся наличием детектора ошибок, позволяющие контролировать достоверности полученных результатов при выделении подклассов функциональных состояний голосовых складок и при ситуациях, когда нечеткий решающий модуль не выдает конкретного диагностического заключения.

Практическая значимости н результаты внедрения. Разработанные метод i,t, способы л алгоритмы составили основу построения автоматизированной системы поддержки принятия решения по управлению процессами диагностики и коррекции функционального состояния голосовых складок, практическое испытания которой показали се высокую диагностическую эффективность и приемлемое качество рекомендаций по реабилитации голосового аппарата. •

Программные средства 1 ориентированы на практическое здравоохранение и реализуют алгоритмы диагностики, способствующие ускорению процессов реабилитации больных с функциональными нарушениями голосовых складок.

Результаты работ используются при проведении научно-исследовательских работ в ГУЛ НИИ Новых Медицинских Технологий и используются в учебном процессе Курского государственного технического университета при подготовке специалистов по направлению 200300.68 -«Биомедицинская инженерия».

Апробация цаботы. Основные положения диссертационной, работы докладывались н обсуждались на следующих научно-тсхннческп^ конференциях: Всероссийской научно-технической конференции студентов, молодых ученых и специалистов «Биотехнические, медицинские н экологические системы» (Бномедснстемы-2001) (Рязань, 2001); VI, Vil, VIIK

о IX Международных научпо-тсхннчсскнх конференциях «Медико-экологические информационные технологии» (Курск, 2003, 2004, 2005, 2006); б-й Международной конференции «Оптико-Электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации» (Рас познавание-2003) (Курск, 2003); X Юбилейном и XI Российских научно-технических конференциях с международным участием «Материалы и упрочняющие технологии» (Курск, 2003, 2004); XXXI вузовской научно-технической конференции студентов и аспирантов п области научных исследований «Молодежь и XXI век» (Курск, 2003); Всероссийской научно-технической конференции «Биотехнические системы в XXI веке» (С.-Петербург, 2004); научной конференции «Интеграция медицины и образования» (Курск, 2006).

Публикации. Самостоятельно и в соавторстве по теме диссертации опубликовано 9 печатных работ.

Личный вклад Автора. 11 работах, опубликованных в соавторстве и приведенных в конце автореферата, в [I] автором предложена модификация нечеткой нейронной сети В.-тга-Мсплсля, и [2] автором предложена структура модуля нечеткого вывода с трехе габ ильным выходом; в [4| соискателем предложен способ получении «картины» голоса, в [5] соискатель предложил способ сегментации сигнала голоса, в [6) аптор исследовал структуру пятисложного нечеткого решаюшего модуля, в [8] н |9} соискателем предложены способы сегментации всйвлст-шюскостей тестовых сигналов к выделения информативных пртпакоп из полученных сегментов.

Структура II объем о;)Поты. Диссертация состоит из введения, четырех глав, заключения и библиографического списка, включающего 116 отечественных и 22 .зарубежных наименования. Габота изложена па 152 страницах машинописного текста, содержит 49 рисунков и 6 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

По ипеленнн к диссертации обосновывается актуальность темы, определяются цели и задачи исследования, научная новизна и практическая значимость работы. Кратко излагается содержание глав диссертации.

В нерпой главе исследуются методы и средства диагностики функциональных состояний голосового аппарата н компьютерные методы анализа тестовых фонем. Покачано, что расстройство голосового аппарата относится к наиболее распространенным заболеваниям. Анализ интенсивности этих заболевании показал, что основными расстройствами голоса при заболевании гортаНн являются дисфонии, причинами которых могут быть функциональные, органические или воспалительные заболевания гортани.

Анализ существующих методов обработки сигнала голоса показал, что для выделения информативных признаков удобно использовать методы

вей влет-анализа сегментов тестовой фразы, а решение о том, к какому классу относится функциональное нарушение голосового аппарата, в связи с отсутствием четких границ между этими состояниями, целесообразно принимать на основе нечеткой логики принятия решений.

11 заключении первой главы определяются цель и задачи исследования.

Пюран глава посвящена вопросам выбора и вычисления показателей, выделяемых из сигнала голоса, характеризующих функциональное состояние голосового аппарата обследуемого. В результате теоретического и экспериментального анализа голосовых сигналов было предложено исследовать вен влет-плоскость фонемы «Ей, записанной в процессе фонации слов, в которых фонема «£» расположена между двумя согласными (использовалось слово «СПЕКТР») с последующим выделением сегмента записи, соо тветствующего фонеме «Е»,

' 11 ходе исследований был разработан мсгод выделения информативных признаков, включающий следующие технологические операции: запись кода фонпрусмого тестового слова, выделение из него тестовой фонемы, веП влет-преобразован не кода тестовой фонемы, сегментацию ве Л влет-ил ос кости тестовой фонемы и выделение информативных признаков из сегментов вейвлет-шюскостн.

В процессе разработки способа выделения тестовой фонемы ич тссгкшого сигнала были исследованы ряд известных способов распознавании гласных звуков. Однако применение способа сегментации речевого сигнала на основе формаитнон структуры спектра и мака (-минного метода не дало положительного результата «виду большой вариации периода основного тона (до 100%), дрейфа изолинии и высокочастотных помех.

11а рис. I приведены фрагменты записей слов «СПЕКТР», полученные на различных пациентах.

1'ие. I, Записи последовательности слов «СПЕКТР» у пациентов е различными видами патологий (в цент!« пациент без функциональных нарушений гортани)

Анализ многочисленных записей тестовых сигналов показал, что выделение кода фонемы «К» из слова «СПЕКТР» представляет трудности не юлько в автоматическом, но и в ручном режиме, что потребовало разработки нового способа сегментации, основанного на выводах из теоремы I). Логина.

Сущность способа заключается' в подсчете числа пересечений тестовым сигналом нулевого уровня в окне, занимающем частотный диапазон 100.,.400 Гц и временной - 0...40 мс. Статистический анализ кодов -

слова «СПЕКТР» пациентов с различными патологиями голосового аппарата показал, что такое окно для сегмента фонемы «Е» содержит 20±2 нсрссечсннИ нулевого уровня, а для других сегментов тестового слова содержит не более 12±4 пересечении.

Правильность распознавания фрагмента ссгмсита фонемы «Е» составила 98,5%.

В соответствии с предложенным методом синтеза пространства информативных признаков, на в ей влет-плоскости тестового сигнала необходимо выделить информативные области, характеризующие функциональное состояние голосового аппарата путем сегментации этой плоскости.

Механизм сегментации может быть иллюстрирован путем построчной развертки вейвлет-плоскости тестового сигнала {фонема «Е»), Пример такой построчной развертки показан на рис. 2,

.....^^н+^тгт«^.

Рис. 2. Развертка вен влет-плоскости тестовой фонемы по строкам: зона обертонов (I), зона высокочастотной форманты (2). зона первой форманты (.1) и зона второй форманты (4)

Статистический анализ множества разверток позволил предложить двухэтапный поиск информативных областей.

Па первом этапе сегментации определяются зоны дислокации формант. ')тн зоны могут перекрываться. На вгором -тшс в этих зонах выделяются информативные области, верхние и нижние границы которых могут аппроксимироваться полиномами нулевого или более высокого порядка.

Верхнюю границу формантной зоны (абсцисса) обозначаем <?;,, где I -номер формантной зоны. Нижнюю Гранину формантной зоны или зоны обертонов обозначаем + Т,, где Т - ширина зоны обертонов или формантной зоны. Слева формаптная юна на вей влет-плоскости ограничена ординатой т (в отсчетах) или т/Г, (в секундах), где (, - частота дискретизации сигнала. Ширина формантной зоны по оси абсцисс определяется параметром М. Параметры т и М определяются способами реализации вейвлст-лрсобразоеания.

Рассмотрим первый этап сегментации, в ходе которого определяются ппплмеггпм Я II Т.

141

Для юны обертонов параметр £ не определяется, так как ее верхняя граница соответствует нулевой ординате (частоте, несколько меньшей половины частоты дискретизации), а величина Т определяется наименьшим значением параметра 0, для которого

Т4-М Т ♦ М

о)

Экспериментальные исследования показали, что границам формантнмх зон (рис. 2) соответствует выполнение следующего условия

им, >■■>

(2)

г > )■'

iH'l

где - отсчеты высокочастотной составляющей модулей вейвлет-

ко »ффицнентов £,1 строки вей влет-плоскости; |^„|114- - отсчеты низкочастотной составляющей модулей вей влет-коэффициентов 4)-он строки ве и влет-плоскости.

Статистический анализ фрагментов вейвлет-плоскости тестовых сигналов, примеры которых приведены на рис. 3, показал, что для того, чтобы отличить верхнюю границу первой форманты от верхней границы высокочастотной форманты необходимо воспользоваться следующими решаюшимиправнламн:

1-СЛИ

X'iKr'W и 42кг],о]

V V J"T } ) )

ТО "верхняя граница высокочастотной форманты" ИНАЧЕ

БСЛИЦ£КН>0 И 4 skr К О" ) V J** ) j

.(3>

ТО "верхняя tpaiiiina первой форманты" ИНЛЧП "нет решения'' где Д - оператор нисходящей разности по параметру £,•

|W,|

строка (^мраница формаптиой зоны

1 | I п^^ I гГ^О 1 nTl 1,1 .

Рис. 3. Верхняя граница первой форманты {шссть строк пей влет-плоскости) ■

Для определения нижней границы высокочастотной форматы и нижней границы первой форманты используются решающие правила аналогичные (2), (3).

На втором этапе сегментации в выделенных формантных зонах определяются информативные области, структура которых показана на рис. 4. Алгоритм поиска этих областей заключается в определении траектории следа форманты, как траектории, образованной координатами вейвлет-коэффицненгов с максимальными модулями на отрезках Л>[4| Д при Зе|т,т+ М]. Границы V], определяются минимальным значением вертикальных координат {к-х параметров масштаба) этих максимумов, границы V;, — максимальным значением к-х координат этих максимумов.

Л,,(Н>|> Н,, "Дч"»""» На

форнвиты

аторой форманты . ; — С ЛСМ

Рис. 4. Сегментная структура вейвлет-плоскости фонемы «Ев-

При анализе сигнала в частотно-временной области использовались пять информативных признаков.

Первый информативный признак XI сформирован на основе анализа корреляционной матрицы информативной области зоны обертонов..

Анализ полигонов корреляционных матриц, примеры которых приведены на рис. 5, показал, что для гортани без патологии частости выпадения коэффициентов корреляции с более высокими значениями выше, чем для гортани с патологиями.

часюсть

чистое11

а)

б)

Рис, 5. Полигоны корреляционных мафии зоны обертонов вейвлст-плоскостей тестовых сигналов: а - гортань с патологиями, б - гортань без патологий

Исходя из этого установленного факт, информативный признак предлагается рассчитывать в соответствии с выражением

• N-(N-1

(6)

г* 1-11 ,.0

где N — число строк в информативной облает зоны обертонов, Гу * коэффициент корреляции между ¡-ой и]-оЛ строками вейвлет-ллоскостн.

Статистический анализ модулей вей влет-коэффициентов первой формантной зоны (300 Гц) показал, что по мере увеличения степени тяжести патологического состояния гортани происходит рост математического ожидания и дисперсии модулей вей влет-коэффициентов в этой форматной зоне. Затем, по мере «перекачки энергии» в более низкочасто гну ю формантную зону, математическое ожидание модулей иеГишет-коэффициентов начинает падать с продолжающимся ростом дисперсии.

Таким образом, для определения второго и третьего информтиыных признаков можем записать следующие формулы

Х2 =-!-— (7)

Х3= ' £ £(Х2-|\^,|Г. (8)

01г: - П и К Ун - Уц ци (

Статистический анализ модулей вейвлет-коэффициентов второй формантой зоны вен влет-плоскости тестового сигнала (150 Гц) показал, что но мере увеличения степени тяжести патологии гортани происходит «накачка энергией» второй формантной зоны за счет более высокочастотных сегментов вей влет-плоскости. Дисперсия же модулей нейвлет-коэффицнентов агорой форматной зоны в пом случае ведет себя неоднозначно: в зависимости ог натолошн она может, как увеличиваться, так н уменьшаться.

Для определения четвертого и пятого информативных признаков не пол ыу ем формулы, аналогичные (7) и (К), записанные для вейвлст-коэффнннентов второй форма(тгы.

И главе 3 рассматривается модель модуля нечеткого вывода, предназначенною дли системы поддержки принятия решений врача* фон натра.

В качестве прототипа структуры модуля взята структура Ван га-Менделя. В процессе экспериментального анализа функций принадлежности дня пяти признаков синтезированного признакового пространства было установлено, что как при выявлении патологического состояния, так и нрн его классификации в агрсгаторс модуля (рис. 6) может быть использовано следующее правило вывода

где м« (*i) - фупшии принадлежности объекта с признаком х( к классу tOj; Ч|.Ч;>Ч) ' настраиваемые параметры.

В данном правиле функции принадлежности, носители которых относятся к одной форманте, объединяются по правилу Ларсспа, а функции принадлежности, полученные в разных формантах, определяются как функции принадлежности суммы нечетких множеств.

Чтобы трансформировать структуру В a lira-M et шел я из аппроксиматора в классификатор и реализовать процесс управления соотношением между числом ошибок первого н второго рода, целесообразно иа выходах второго слоя (агрегатора) осуществить функциональное преобразован не посредством униполярной спгмонлальной функции (третий слон)

g, =-¡¿ПГТ- il(>)

* 1 + с" ^

где - значение выхода агрегатора в канале соответствующего класса, £ -индекс элемента обучающей или контрольной выборки. (Î - коэффициент, подбираемый в процессе обучения.

Для того, чтобы реализовать итерационным иронссс пошаговой коррекции настраиваемых коэффициентов в агрегаторе и дефуззификаторе (параметры i] в (9) и Р в (10)), выход дефуззнфикагора (четвертый слой) из двухстабилыюго преобразуем в трех стабильный посредством добавления пятого слоя, который на рис. 6 показан справа or штриховой линии модифицируемой структуры lîanra-Мснлсля.

Пятый слой, предназначенный для выделения третьего состояния, соответствующей) ситуации, когда не могут быть приняты пи нулевая, ни конкурирующая гипотезы, реализует следующее правило вывода: вСЛИ jg^-g^^O, ТО «нетрешения», ИНАЧЕ, ГСЛИ > g„ir5, ТО «болен», ИНАЧЕ «здоров». (11)

где гистерезис О лежит в пределах 10...20% от максимальной верхней граинцы множества { K„t}, принимая значения 0,1 ...0.2,

I (астройка этого молуля ведется в два этапа. На первом этапе, используя функцию LEARNP пакета Matlab, настраиваются коэффициенты третьего слоя модели рис. б. При этом при классификации объектов обучающей выборки в качестве правила вывода используется нижняя часть выражения (II). На втором хане посредством компаратора пятого слоя из обучающей выборки выделяется третий класс - «пег решения». При этом в качестве правила вывода используется верхняя часть выражения (I П.

Рис. 6. Структурная схема нечеткого решающего модуля с трс\стабнльным выходом

После выделения третьего класса осуществляется пошаговая коррекция параметров 1], начиная с параметра, обладающего наибольшей чувствительностью по отношению к третьему классу. Процесс коррекции по ¡-му параметру продолжается до тех пир, пока уменьшение объектов третьего класса идет за счет ошибок нерпою н/нли второго рола. Для настраиваемых коэффициентов в первом агрегаторс это условие имеет следующий вид:

ПСЛИ Дгц; сО.ТОГКДД > ЛВ) И ((С - О) >0)) ИЛИ [{ДА > ДО) И ((С - О) > 0)]] = «ИСТИ11Л», (12)

где ДЛ - уменьшение ошибок первого рода за счет снижения К^; АВ -увеличение ошибок второго рола за счет снижения К. С - уменьшение числа объектов, отнесенных решающим модулем к третьему классу, за счет класса «болен»; О - увеличение числа объектов, отнесенных решающим модулем к треплму классу, за счет класса «здоров».

Условие, аналогичное (12), может быть получено и при настройке модуля по каналу нулевой гипотезы (класс «болен»).

Если проверка условий (12) даст отрицательный результат для всех л из множества {т]}, то осуществляется переход к первому этапу настройки и т.д., пока не получаются удовлетворительные показатели точности или условия (12) не выполнятся пи для одного параметра ц после первого этапа настройки.

Исходя из задач, решаемых разрабатываемой системой, в се состав входят: П. подсистема управления базой данных (ПУВД); 2) подсистема тестирования; 3) решающий модуль.

Структурная схема автоматизированной системы диагностики функционального состояния гортани показана на рис. 7.

ПУБД эхо ¡1 системы включает три функциональных модуля: 1 )глобальную базу данных; 2) локальную базу данных (БД) первого уровня; 3) интерфейс.

Рнс. 7. Структурная схема автоматизированной системы для поддержки принятия решений при диагностике функционального состояния гортани

О локальной БД первого уровня хранятся протоколы гестов пациентов. Глобальная база данных хранит вей влет-плоскости тестовых фонем различных классов, а также выделенные информативные признаки и включает программные модули для определения вей влет-коэффициент» в и коэффициентов Фурье тестовых фонем и информативных признаков.

Блок формирования информативных признаков (БФИП) функционирует согласно алгоритмам, рассмотренным в главе 2 диссертации.

При настройке модуля нечеткого вывода- БФИГ] формируют множество векторов информативных признаков, а при тестировании - один вектор.

Решающий модуль включает два блока: модуль нечеткого вывода и ПУВД третьего уровня. Локальная база данных третьего уровня предназначена для хранения моделей трсхстабпльных нечетких решающих модулей (настраиваемых параметров) и функций принадлежности для фуззнфнкаторов трех стабильного нечеткого решающего модуля.

Процесс получения функций принадлежности сводится к определению и преобразованию гистограмм информативных признаков, хранящихся в глобальной базе данных. -

Для получения функций принадлежи ости в локальной базе данных третьего уровня имеется блок формирования функций принадлежности, работа которого основана на интерактивном режиме. Этот подход обусловлен тем, что определенные виды органических поражений гортани достаточно редки и обучающие выборки необходимого объема собрать довольно трудно.

Способ формирования функций принадлежности включает сортировку полигонов обучающих выборок двух разделяемых классов, осуществляемую в интерактивном режиме, и применение к ним последовательности процедур обработки гистограмм с учетом относительной дислокации полигона класса «болен» относительно полигона класса «здоров» и их эволюции в процессе применения процедур видоизменения гистограмм. В качестве процедур видоизменения гистограмм использовались процедуры выравнивания гистограмм, пороговой обработки и аппроксимации.

В результате проведенного нами статистического анализа при заболеваниях гортани было выделено три характерных типа полигонов двух разделяемых классов. В зависимости от характерного типа к каждому из этих двух полигонов последовательно применяются процедуры выравнивания гистограмм и пороговой обработки. Последовательность применения этих стандартных процедур, а также их очередность по кдассам определяется типом полигонов. Пользователь в интерактивном режиме сопоставляет полученные полигоны классов «боле и »/«здоров» для исследуемого признака с одним из выделенных типов, и относит его к наиболее подходящему. После этого подключается программный модуль (база данных третьего уровня), который реализует соответствующие данному типу полигонов процедуры выравнивания гистограмм и пороговой обработки. При этом отдельным видам обработки подвергаются только определенные части полигонов, дислокации которых определяются тем, к какому типу конфигурации полигонов они относятся. Затем полученные модифицированные полигоны преобразуются экспертами в графики функций принадлежности, на основании которых составляют соответствующие аналитические выражения.

- В м четвертой главе обсуждаются методика и результаты экспериментальных исследований, па основе которых определяются функини принадлежности по заданным информативным признакам.

Функции принадлежности по признаку XI для трех выделенных заболеваний показаны на рис. 8.

Второй информативный признак Х2 получаем в первой формантой зоне фонемы «Е».

Рис. 8. Функции принадлежности по классам заболевании гортани по носителю XI (показатель регулярности в зоне обертонов ве налетал оскости): <в0 - здоров; (0) - функциональная дисфоння; м; - органическая днефоння; о»] - воспалительное заболевание горганн

В качестве нормирующего коэффициента используем среднее значение модуля вейвлет-плоскости, которое определяется согласно выражению

1 МЫН2~1

где N1 — число строк вей влет-плоскости, N2 - число столбцов вей влет-плоскости.

Таким образом, функции принадлежности цЩ|{Х2) п ци1(Х2) ищем для носителя

Х2 = Х2/е. (14)

Третий информативный признак ХЗ характеризует- вариабельность коэффициентов в первой формантной зоне. Как и второй признак, он должен быть нормирован, чтобы ослабить на него влияние неконтролируемых параметров. Поэтому функции принадлежности цЫ1(ХЗ) н (ХЗ) получаем по носителю

Четвертым н пятый информативные признак» характеризуют тс же энергетические соотношения, но только для второй форманты, поэтому они могут быть определены по формулам, аналогичным (14) и (15).

Полученные функции принадлежности хранятся в локальной базе данных третьего уровня (рис. 7) и используются в фуззнфнкаторе модуля нечеткого вывода (рис. 6).

Система поддержки принятия решений предоставляет пользователю провести предварительный диагноз (скрининг-диагноз), а также провести более тщательную диагностику той патологии, которая выявлена в процессе скрининг-диагностики, путем выбора подходящей модели нечеткого решающего модуля.

Если выбранная модель находится в третьем состоянии, то реализуется алгоритм классификации функционального состояния голосовых складок, негюльзуюшнй интерактивный режим.

11а первом этапе алгоритма согласно частному решающему правилу по первому информативному признаку проводится . скринннг-диагностика, которая позволяет получить коэффициент уверенности в предполагаемом диагнозе до 0,75 (рис. 8). Если коэффициент уверенности низок к скрининг-диагноз л о первому' частному решающему правилу поставить не представляется возможным, то алгоритм подключает следующее частное решающее правило и таким образом анализ данных идет по следующей ветви. В результате в каждой ветви алгоритма происходит объединение по логическому И частных решающих правил с выбором той ветви, которая наиболее адаптиропшщ к входным данным, Па втором этапе реализации алгоритма пользователь может нарушить естественный ход выполнения алгоритма путем игнорирования определенных результатов функции И, в результате чего алгоритм выйдет на другую ветвь. Это делается либо па основе собственного опыта, либо на основе информации, полученной при обследовании конкретного пациента. При этом в алгоритм введен «детектор ошибок», который контролирует количество игнорирований и при выходе за предельно допустимые значения пользователь получаст сообщение о целесообразности направления пациента на и негру ментальные исследования. , .

Для проверки качества диагностики функционального состояния гортани из обследуемых пациентов были сформированы контрольные выборки. Контрольная выборка класса Шр (здоров) формировалась в количестве 100 человек путем случайного выбора из базы данных класса «здоров». Результаты качества диагностики, характеризуемые показателями диагностическая чувствительность (ДЧ), диагностическая специфичность (ДС), прогностическая значимость положительных результатов (П3+), прогностическая значимость отрицательных результатов (ПЗ"), диагностическая эффективность решающего правила (ДЭ), приведены в табл. I.

. Таблица I

Таблица контрольных испытаний классов со0, ь>|, о>2 и Ш]

1 Разделяемые классы Показатели качества классификации

ДЧ ДС ПЗ* П3~ ДО

Ш|/мо 0,90 0,89 0,89 0,96 0,95

012 / 0>0 0,938 0.92 0,882 0,979 0,945

о>з/тоо 0,95 0,90 0,916 0,978 0,949

(!)}/<»! 0,833 0,888 0,870 0,947 0,917

Анализ полученных результатов показал, что статистические - испытания на контрольных выборках позволяют рекомендовать полученные решающие правила и алгоритмы для практического использования.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

\ -

Предлагаемая работа посвящена решению научных и практических задач, связанных с повышением дна гностической эффективности классификации функционального состояния голосовых складок путем разработки способов, алгоритмов и программно-технических средств, обеспечивающих управление процессами диагностики функционального состояния голосовых складок в условиях нечеткого представления исходных : данных и диагностируемых классов.

В результате выполнения работы получены следующие основные результаты.

1. Разработан метод синтеза пространства информативных признаков, выделяемых из кода тестового сигнала, позволяющий класспфицировать функциональные состояния голосового аппарата, включающий:

• способ выделения тестовой фонемы из тестового сигнала, основанный на анализе числа пересечений нулевого уровня тестовым сигналом в скользящем частот) ю-в ременном окне;

- способ сегментации вей влет-ил ос кости тестовой фонемы, отличающийся анализом высокочастотной и низкочастотной составляющих модулей вен влет-коэффициентов и их нисходящих разностей во временных окнах, ширина которых равна длине строки в е налет-плоскости;

- алгоритмы вычисления компонент признакового пространства, ■ основанные на вычисления статистических характеристик модулей кеивлет-

коэффициентов в выделенных сегментах вей влет-плоскости тесто ной фонемы.

модуля и алгоритмом коррекции их параметров, реализующим

итерационный процесс повышения точности классификации за счет контролируемого снижения области не классифицируемых объектов.

3. Предложена структура системы поддержки принятия решений для диагностики н реабилитации функционального состояния гортани, включающая три функциональных уровня и обеспечивающая диагностическую эффективность решающих правил по классам «болен »/«здоров» не ниже 0,945 и диагност ческу ю эффективность по классам «болен»/«болен>> не ниже 0,917.:

4. Разработан способ формирования функции принадлежности для классификации функциональных состояний голосовых складок, заключающийся в формировании полигонов обучающей выборки двух классов и, путем использования интерактивного режима, отнесения этих полигонов к одному из трех типов, в рамках которого:'

- получены три алгоритма синтеза функций принадлежности, соответствующие трем типам полигонов выборок двух классов, предусматривающие учет относительной дислокации полигонов класса «болен» относительно полигона класса «здоров» и его эволюции в процессе применения способов видоизменения гистограмм;

- получены функции принадлежности по пяти информативным признакам по классам «болен»/«здоров» и по классам, соответствующим функциональным нарушениям голосового аппарата;

• разработаны алгоритмы классификации функциональных состояний голосовых складок, отличающиеся | наличием детектора ошибок, позволяющие контролировать степень достоверности полученных результатов при классификации функционального состояния голосовых складок и при ситуациях, когда нечеткий решающий модуль не выдает конкретного диагностического заключения.

5. Разработанные модели, методы и алгоритмы и соответствующее программное обеспечение прошли экспериментальную проверку в ГУП НИИ Новых Медицинских Технологий и используются в учебном процессе кафедры Б ном ели ин не кой инженерии Курского государственного технического университета. В результате проведенных статистических исследований получены количественные результаты качества диагностики различных функциональных состояний голосовых складок, которые показали, что разработанные способы,1 методы и алгоритмы могут быть рекомендованы для практического использования.

СПИСОК НАУЧНЫХ РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ 1. Шаталова, О.В. Система поддержки принятия решений для диагностики шизофрении на основе модифицированной нечеткой нейронной сети Ванга-Менделя [Текст] / О.В. Шаталова, С.А. Филист, А.Г. Уварова // Биотехнические системы в XXI веке: сб. материал. Всерос. научн.-техн, кокф. СПб, 2004. С. 70*72.

2. Шаталова, O.B. Обучение нечеткой сети с трехстабильным выходом н нечетким выходным вектором [Текст] / О.В. Шаталова, А.Г. Уварова, Халед Абдул Рахим Сапем // Медико-экологические информационные технологии - 2004: сб. материал. VII Между нар. научн,-техн. конф. / Курск, гос. техн. ун-т. Курск, 2004. С. 34-88.

3. Шаталова, О.В. Способ выбора параметров модулей нечеткого управления в многоуровневых системах классификации [Текст] / О.В. Шаталова // Медико-экологические информационные технологии - 2005: сб. материал. VIII Междунар. научн.-техн. конф. / Курск, гос. техн. ун-т. Курск, 2005, С. 96-101.

4. Шаталова, О.В. Использование частотно-временных преобразований для диагностик» нарушений голосового аппарата [Текст] / О.В. Шаталова, Н.В. Краснова // Интеграция медицины и образования: сб. материал, научн. конф. Курск: Изд-во КГУ, 2006. С. 118-121.

5. Шаталова, О.В. Автоматизированная сегментация тестовых фраз н фонем [Текст] / О.В. Шаталова, В.А. Алексенко И Медико-экологические информационные технологи» - 2006: сб. материал. IX Междунар. научн.-техн. конф. / Курск, гос. техн. ун-т, Курск, 2006. С. 19-22.

6. Шаталова, О.В. Нейронные сети на основе нечеткой адаптирующейся иерархической структуры при наличии данных с пробелами [Текст] / О.В. Шаталова, С.А, Филист, М.А. Ефремов // Медико-экологические информационные технологии - 2006: сб. материал. IX Междунар. научн.-техн. конф. / Курск, гос. техн. ун-т. Курск, 2006. С. 87-93.

7. Шаталова, О.В. Синтез нечетких решающих правил для диагностики заболеваний гортани на основе информативных признаков, полученных по в ей влет-плоскости тестовых фонем [Текст]/ О.В. Шаталова // Медико-экологические информационные технологии - 2006: сб. материал. IX Междунар. научн.-техн. конф. / Курск, гос. техн. ун-т, Курск, 2006. С. 107-112.

8. Шаталова, О.В. Синтез информативных признаков на вейвлет-плоскостн фонемы «И» для диагностики голосовых расстройств [Текст] / О.В. Шаталова, С.А. Филист, Н.В. Краснова // Вестник новых медицинских технологий. Тула, 2006. Т. XIII, №2. С. 20-21.

9. Шаталова, О.В. Методика вейвлет-л и агностик и дисфонни по фонеме И [Текст] / О.В. Шаталова, С.А. Филист, Н.В. Краснова // Вестник новых медицинских технологий, Тула, 2006. Т. XIII, №2. С. 21-22.

ИД №06430 от 10.l2.0lr Подписано в печать П. ТО2006- Формат 60xS4 1/16. Печатных листов 1.0. Тираж ЮОэкэ. 3aicai>g . •

Курский государственный технический университет. Издатели: ко-поли графи чес кий центр Курского государственного технического университета. 305040, г. Курск, ул. 50 лет Октября, 94 .

Оглавление автор диссертации — кандидата технических наук Шаталова, Ольга Владимировна

ВВЕДЕНИЕ

СОДЕРЖАНИЕ

ГЛАВА 1. МЕТОДЫ ФОРМИРОВАНИЯ И КЛАССИФИКАЦИИ ИНФОРМАТИВНЫХ ПРИЗНАКОВ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ, ОСНОВАННЫХ НА АНАЛИЗЕ СИГНАЛА

ГОЛОСА.

1.1. Основные принципы классификации заболеваний гортани и их диагностики.

1.1.1. Воспалительные 'заболевания гортани.

112 Двигательные расстройства гортани.

1 1.3. Новообразования гортани.

1.1.4. Функциональные дисфонии.

1.2. Частотно-временные представления сигнала голоса.

1.3. Модели систем обработки и классификации данных при диагностике, прогнозировании и дифференцировании заболеваний.

1.4. Цель и задачи исследования.

ГЛАВА 2. СИНТЕЗ ПРИЗНАКОВОГО ПРОСТРАНСТВА ДЛЯ ДИАГНОСТИКИ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ГОЛОСОВОГО АППАРАТА.

2.1. Выбор тестовых голосовых сигналов и их метода анализа для дифференциальной диагностики функционального состояния голосового аппарата.

2.2. Разработка способа сегментации тестовых сигналов.

2.3. Сегментация вейвлет-плоскости тестового сигнала.

2.4. Выбор информативных признаков на вейвлет-плоскости тестового сигнала./.

2 4.1 Выбор первого информативного признака.

2.4 2 Выбор и вычисление второго и третьего информативных признаков.

2.4 3. Выбор четвертого и пятого информативных признаков

2.5. Выводы второй главы.

ГЛАВА 3. РАЗРАБОТКА МЕТОДОВ И СРЕДСТВ ДЛЯ АВТОМАТИЗИРОВАННОЙ ДИАГНОСТИКИ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ГОРТАНИ.

3.1. Нечеткий решающий модуль с трехстабильным выходом в инструментарии для исследований функционального состояния гортани.

3.2. Выбор целевой функции и разработка алгоритмов обучения для нечеткого решающего модуля с трехстабильным выходом.

3.3. Разработка и исследование автоматизированной системы для поддержки принятия решений по диагностике функциональных состояний гортани.

3.4. Разработка способа формирования функций принадлежности для фуззификатора решающего модуля.

3.5. Выводы третьей главы.

ГЛАВА 4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ РЕШАЮЩЕГО МОДУЛЯ С ТРЕХСТАБИЛЬНЫМ ВЫХОДОМ В ЗАДАЧАХ ДИАГНОСТИКИ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ГОЛОСОВЫХ СКЛАДОК.

4.1. Объект, методы и средства исследования.

4.2. Синтез нечетких решающих правил для диагностики заболеваний гортани на основе информативных признаков, полученных по вейвлет-плоскости тестовых фонем.

4.3. Разработка алгоритмов для дифференциальной диагностики функционального состояния гортани.

4.4. Экспериментальные исследования качества диагностики функционального состояния гортани по вейвлет-плоскостям сигнала голоса.

4.5. Выводы четвертой главы.

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Шаталова, Ольга Владимировна

Расстройство голосового аппарата является наиболее распространенным заболеванием среди школьников, студентов и преподавателей. Многие хронические заболевания органов и систем, не входящих в состав голосового аппарата, могут обуславливать неполноценность его функции даже в случае отсутствия каких-либо изменений в гортани. Сюда относятся заболевания легких, сердечнососудистой, нервной и эндокринной систем. Установлена тесная связь между голосовыми расстройствами и нарушениями функции щитовидной железы.

Проведенные исследования показали, что в большинстве случаев оценка голоса пациента осуществляется оториноларингологом или фониатром субъективно, т.е. на слух, и присутствие человеческого фактора при этом неизбежно. Поэтому в практике фониатров используются компьютерные технологии, которые позволяют определить некоторые акустические параметры голоса, на основе которых может быть объективно определено состояние голосового тракта, например, путем балльных оценок. При этом используются различные методы компьютерного анализа сигнала голоса, ориентированные как на пространство сигналов, так и на пространство частот. Однако в настоящий момент они не могут удовлетворить специалистов, как по достоверности, так и по оперативности диагностики, так как в результате размытости границ классов обладают низкой специфичностью и требуют высокой квалификации эксперта для принятия решения о наличии или отсутствии патологии голосового аппарата.

Многочисленные исследования показали, что основой существования любой сложной биологической системы являются ритмические процессы (Глас JL, Скляров О., Чижевский А). Каждой биологической системе, находящейся в состоянии гомеостатического равновесия, соответствует ритм определенной сложности. Причем отклонение от этого состояния может сопровождаться как усложнением ритма (до хаотического ритма), так и упрощением его (метрономный режим) (Баевский Р.). Поэтому для исследования функционального состояния голосового аппарата и распознавания речи широко используют спектральные методы (Гоулд Б., Рабинер Л.).

Однако на спектральный состав сигнала голоса влияет множество системных факторов, не связанных с функциональным состоянием голосового аппарата (Василенко Ю.С., Васильев Ю.М.), поэтому использование классических спектральных методов анализа в этом случае затруднительно и для его анализа предпочтительно использовать частотно-временные преобразования (Макс Ж.).

Таким образом, разработка методов и средств диагностики функционального состояния голосового аппарата, позволяющих вести анализ нестационарных сигналов и обеспечивающих поддержку принятия решений в условиях нечетко выраженных границ классов, является ак1уальной задачей.

Работа выполнена в соответствие с научно-технической программой «Научные исследования высшейг школы по приоритетным направлениям науки и техники», подпрограмма 204 «Технология живых систем» 20022004 гг. и в соответствии с научным направлением Курского государственного технического университета «Разработка медико-экологических информационных технологий».

Для достижения поставленной цели необходимо решить следующие $ основные задачи: разработать метод синтеза пространства информативных признаков, выделяемых из кода тестового сигнала;

- предложить структуру системы поддержки принятия решений для врача-фониатра;

- провести апробацию предложенных методов и средств на репрезентативных контрольных выборках.

Методы исследований. , Для решения поставленных задач использовались методы системного анализа, спектрального анализа, вейвлет-анализа, математической статистики, теории нечетких нейронных сетей и распознавания образов, экспертного оценивания и принятия решений. При разработке модуля нечеткого вывода в качестве инструментария использовался Matlab 6.0 с графическим интерфейсом пользователя для NN - NNTool и со встроенным пакетом Fuzzy Logic Toolbox.

Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной: метод синтеза признакового пространства по вейвлет-плоскости тестовой фонемы, отличающийся способами выделения тестовой фонемы из тестового сигнала, сегментации вейвлет-плоскости тестовой фонемы и процедурами определения статистических характеристик выделенных сегментов вейвлет-плоскости тестовой фонемы; способ выделения тестовой фонемы из тестового сигнала, основанный на анализе числа пересечений нулевого уровня тестовым сигналом в скользящем частотно-временном окне;

- способ сегментации вейвлет-плоскости тестовой фонемы, отличающийся анализом частотных компонент модулей вейвлет-коэффициентов и их нисходящих разностей в окнах, ширина которых равна длине строки вейвлет-плоскости; модель модуля нечеткого вывода, предназначенная для использования в системах поддержки принятия решений при диагностике функционального состояния голосовых складок, отличающаяся правилами вывода в агрегаторе и дефуззификаторе и алгоритмом уточнения настраиваемых параметров, основанном на итерационной процедуре минимизации числа объектов обучающей выборки, для которых не могут быть приняты ни нулевая, ни альтернативная гипотезы; способ формирования функций принадлежности для классификации функциональных состояний голосовых складок, заключающийся в сортировке .полигонов обучающих выборок двух разделяемых классов, с последующим применением к полученным полигонам процедур обработки гистограмм, определяемым относительной дислокацией полигонов выбранных классов;

- алгоритмы классификации функциональных состояний голосовых складок, отличающиеся наличием детектора ошибок, позволяющие контролировать достоверность полученных результатов при выделении подклассов функциональных состояний голосовых складок и при ситуациях, когда нечеткий решающий модуль не выдает конкретного диагностического заключения. г

Практическая значимость и результаты внедрения.

Разработанные методы, способы и алгоритмы составили основу построения автоматизированной системы поддержки принятия решения по управлению процессами диагностики и коррекции функционального состояния голосовых складок, практические испытания которой показали ее высокую диагностическую эффективность и приемлемое качество рекомендаций по реабилитации голосового аппарата.

Программные средства ориентированы на практическое здравоохранение и реализуют алгоритмы диагностики, способствующие ускорению процессов реабилитации больных с функциональными нарушениями голосовых складок.

Результаты работ используются при проведении научно-исследовательских работ в ГУП НИИ Новых Медицинских Технологий и используются в учебном процессе Курского государственного технического университета при подготовке специалистов по направлению 200300.68 - «Биомедицинская инженерия».

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих .научно-технических конференциях: Всероссийской научно-технической конференции студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы» (Биомедсистемы-2001) (Рязань, 2001); VI, VII, VIII и IX Международных научно-технических конференциях «Медико-экологические информационные технологии» г

Курск, 2003, 2004, 2005, 2006); 6-й Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации» (Распознавание-2003) (Курск, 2003); X Юбилейной и XI Российских научно-технических конференциях с международным участием «Материалы и упрочняющие технологии» (Курск, 2003, 2004); XXXI вузовской научно-технической конференции студентов и аспирантов в области научных исследований «Молодежь и XXI век» (Курск, 2003);

Всероссийской научно-технической конференции «Биотехнические системы в XXI веке» (С.-Петербург, 2004); научной конференции «Интеграция медицины и образования» (Курск, 2006).

Публикации. Самостоятельно и в соавторстве по теме диссертации опубликовано 9 печатных работ.

Личный вклад автора. В работах, опубликованных в соавторстве и приведенных в конце автореферата, в [1] автором предложена модификация нечеткой нейронной сети Ванга-Менделя, в [2] автором предложена структура модуля нечеткого вывода с трехстабильным t выходом; в [4] соискателем предложен способ получения «картины» голоса, в [5] соискатель предложил способ сегментации сигнала голоса, в [6] автор исследовал структуру пятислойного нечеткого решающего модуля, в [8] и [9] соискателем предложены способы сегментации вейвлетплоскостей тестовых сигналов и выделения информативных признаков из полученных сегментов.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и библиографического списка, включающего

Заключение диссертация на тему "Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости"

4.5. Выводы четвертой главы г

1. На основе предложенного программно-аппаратного обеспечения оцифровки сигнала голоса и способа синтеза функций принадлежности по информативным параметрам вейвлет-плоскости сигнала голоса получены функции принадлежности по пяти информативным признакам по классам р болен»/«здоров» и по классам, дифференцирующим функциональные нарушения голосового аппарата, позволяющие построить фуззификатор нечеткого решающего модуля с трехстабильным выходом, а также алгоритмы скрининг-диагностики функционального состояния гортани.

2. Предложен алгоритм скрининг- и дифференциальной диагностики функциональных состояний голосовых складок, отличающийся тем, что на первом этапе, на основе решающих правил, полученных путем анализа функций принадлежности, осуществляется скрининг-диагноз, а затем, на основе полученного скрининг-диагноза, выбирается подходящая модель нечеткого решающего модуля для постановки окончательного диагноза.

3. Разработаны алгоритмы классификации функциональных состояний голосовых складок, предназначенные для использования в случае, когда модель нечеткого решающего модуля находится в третьем состоянии, отличающиеся наличием детектора ошибок, позволяющего качественно контролировать степень достоверности полученных результатов при дифференцировании функционального состояния голосовых складок и при ситуациях, когда нечеткий решающий модуль не выдает конкретного диагностического результата. I

4. Получена база данных для формирования обучающих и контрольных выборок, позволяющая определить качественные показатели диагностики и дифференцирования функционального состояния голосовых складок.

5. В результате статистических исследований получены количественные результаты качества диагностики различных функциональных состояний голосовых складок, которые показали, что разработанные способы, методы и алгоритмы могут быть рекомендованы для практического использования.

ЗАКЛЮЧЕНИЕ

Предлагаемая работа посвящена решению научных и практических задач,' связанных с повышением диагностической эффективности классификации функционального состояния голосовых складок путем разработки способов, алгоритмов и программно-технических средств, обеспечивающих управление процессами диагностики функционального состояния голосовых складок в условиях нечеткого представления исходных данных и диагностируемых классов.

В результате выполнения работы получены следующие основные ре зультаты.

1. Разработан метод синтеза пространства информативных

• признаков, выделяемых из кода тестового сигнала, позволяющий классифицировать функциональные состояния голосового аппарата, включающий:

- способ выделения тестовой фонемы из тестового сигнала, основанный на анализе числа пересечений нулевого уровня тестовым сигналом в скользящем частотно-еременном окне;

- способ сегментации вейвлет-плоскости тестовой фонедоц, отличающийся анализом высокочастотной и низкочастотной составляющих модулей вейвлет-коэффициентов и их нисходящих разностей во временных окнах, ширина которых равна длине строки вей влет-плоскости;

- алгоритмы вычисления компонент признакового пространства, основанные на вычислении статистических характеристик модулей вейвлет-коэффициентов в выделенных сегментах вейвлет-плоскости тестовой фонемы.

2. Предложена модель нечеткого решающего модуля с тремя выходами, предназначенная для использования в системах поддержки принятия решений при диагностике и реабилитации функционального состояния голосового аппарата, позволяющая выделить в выборке объекты, для которых не мргут быть приняты ни нулевая, ни альтернативная гипотезы, отличающаяся правилами вывода в агрегаторе и дефуззификаторе модуля и алгоритмом коррекции их параметров, реализующим итерационный процесс повышения точности классификации за сч,ет контролируемого снижения области неклассифицируемых объектов.

3. Предложена структура системы поддержки принятия решений для диагностики и реабилитации функционального состояния гортани, включающая три функциональных уровня и обеспечивающая диагностическую эффективность решающих правил по классам «болен»/«здоров» не ниже 0,945 и диагностическую эффективность по классам «болен»/«болен» не ниже 0,917.

4. Разработан способ формирования функций принадлежности для классификации функциональных состояний голосовых складок, заключающийся в формировании полигонов обучающей выборки двух классов и, путем использования интерактивного режима, отнесения этих полигонов к одному из трех типов, в рамках которого:

- получены функции принадлежности по пяти информативным ф признакам по классам «болен»/«здоров» и по классам, соответствующим функциональным нарушениям голосового аппарата;

- разработаны алгоритмы классификации функциональных состояний голосовых складок, отличающиеся наличием детектора ошибок, позволяющие контролировать степень достоверности полученных 9 результатов при классификации функционального состояния голосовых складок и при ситуациях, когда нечеткий решающий модуль не выдает конкретного диагностического заключения.

5. Разработанные модели, методы и алгоритмы и соответствующее программное обеспечение прошли экспериментальную проверку в ГУП НИИ Новых Медицинских Технологий и используются в учебном процессе кафедры Биомедицинской инженерии Курского государственного технического университета. В результате проведенных статистических исследований получены количественные результаты качества диагностики различных функциональных состояний голосовых складок, которые показали, что разработанные способы, методы и алгоритмы могут быть рекомендованы для практического использования. г

Библиография Шаталова, Ольга Владимировна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Аверкин, А.Н. Нечеткие множества в моделях управления и • искусственного интеллекта Текст. / А.Н. Аверкин и др. М.: Наука, 1987.430 с.

2. Автоматизированные медико-технологические системы Текст. : монография / А.Г. Устинов, В.А. Ситарчук, Н.А. Кореневский; под ред. А.Г. Устинова; Курск, гос. техн. ун-т. Курск, 1995. Ч.З. 105 с.

3. Автоматизированные медико-технологические системы Текст. : монография / А.Г. Устинов, В.А. Ситарчук, Н.А. Кореневский; под ред. А.Г. Устинова; Курск, гос. техн. ун-т. Курск, 1995. 4.2. 157 с.

4. Автоматизированные медико-технологические системы Текст. : монография / А.Г. Устинов, В.А. Ситарчук, Н.А. Кореневский; под ред. А.Г. Устинова; Курск, гос. техн. ун-т. Курск, 1995. 4.1. 128 с.

5. Айвазян, С.А. Прикладная статистика. Основы эконометрики Текст. : учебник для вузов. В 2 т. Т. 1. Теория вероятностей и прикладная статистика / С.А. Айвазян, B.C. Мхитрян. 2-е изд., испр. М.: ЮНИТИ-ДАНА, 2001.656 с.г

6. Ахутин, В.М. Биотехнические системы Текст. / В.М. Ахутин. Л.: ЛГУ, 1979. 257 с.

7. Барсуков, А.П. Электронные версии зрения и слуха Текст. / А.П. Барсуков // Техника кино и feлeвидeния. 2003. № 2.

8. Бегун, П,И. Биомеханика Текст. : учебник для вузов / П.И. Бегун, Ю.А. Шукейло. СПб.: Политехника, 2000. 483 с.

9. Боровиков, В. STISTICA. Искусство анализа данных на компьютере: Для профессионалов Текст. / В. Боровиков. 2-е изд. (+CD). СПб.: Питер, 2003. 688 с.

10. Брежнев, А.В. Модуль нечеткого вывода для разнотипных признаковых пространств Текст. / А.В. Брежнев, А.А. Бурмака // Научно-технический сборник. М.: ВУ РХБЗ, 2005. №2 (37). С. 64-67.

11. Брежнев, А.В. Способ выделения сигнала тремора голосовых связок посредством анализа вейвлет-плоскости цифровых отсчетов сигнала голоса Текст. / А.В. Брежнев // Научно-технический сборник. М.: ВУ РХБЗ, 2005. №2 (37). С. 30-36.г

12. Васильев, В.Н. Компьютерная обработка сигналов в приложении к интерферометрическим системам Текст. / В.Н. Васильев, И.П. Гуров. СПб.: БХВ — Санкт-Петербург, 1998. 240 с.

13. Воробьев, В.И. Теория й практика вейвлет-преобразования Текст. / В.И. Воробьев, В.Г. Грибунин. СПб.: ВУС, 1999. 204 с.

14. Галушкин, А.И. Синтез многослойных систем распознавания образов Текст. / А.И. Галушкин. М.: Энергия, 1974. 386 с.

15. Галягин, Д.К. Адаптивные вейвлеты (Алгоритм спектрального анализа сигналов) Текст. / Д.К. Галягин, П.Г. Фрик / ММСП. Пермь: ПГТУ, 1996. №4. С. 20-28.

16. Генкин, А.А. Новая информационная технология обработки данных (программный комплекс ОМИС) Текст. / Генкин А.А. СПб.: Политехника, 1999. 191 с.

17. Гимаров, В.А. Нейро-нечеткий метод классификации объектов с разнотипными признаками Текст. / В.А. Гимаров, М.И. Дли, С.Я. Битюцкий // Системы управления и информационные технологии. 2004. №4 (16). С. 13-18.

18. Голд, Б. Цифровая обработка сигналов Текст. : [пер. с англ.] / Б. Голд, Ч. Рэйдер. М.: Сов. радио, 1973. 368 с.

19. Гоноровский, И.С. Радиотехнические цепи и сигналы Текст. / И.С. Гоноровский. М.: Радио и связь, 1986. 512 с.

20. Горелик, A.J1. Методы распознавания Текст. / A.J1. Горелик, В.А. Скрипкин. М.: Высшая школа. 1989.

21. Даджион, Д. Цифровая'обработка многомерных сигналов Текст.: [пер. с англ.] / Д. Даджион, Р. Мерсеро. М.: Мир, 1988.488 с.

22. Дмитриева, Н.В. Индивидуальное здоровье и полипараметрическая диагностика функциональных состояний организма (системно информационный подход) Текст. '/ Н.В. Дмитриева, О.С. Глазачев. М., 2000. 214 с.

23. Дремин, И.М. Вейвлеты и их использование Текст. / И.М. Дремин, О.В. Иванов, В.А. Нечитайло // Успехи физических наук. 2002. Т. 171, №5. С. 465-500.

24. Дубров, A.M. Многомерные статистические методы Текст.: учебник / A.M. Дубров, B.C. Мхитрян, Л.И. Трошин. М.: Финансы и статистика, 2000. 352 с

25. Дуда, Р. Распознавание образов и анализ сцен Текст. / Р. Дуда, Р. Харт. М.: Мир, 1976.

26. Дьяконов, В. Обработка сигналов и изображений Текст. : специальный справочник / В. Дьяконов, И. Абраменкова. СПб.: Питер, 2002. 608 с.

27. Дюк, В. Обработка данных на ПК в примерах Текст. / В. Дюк. СПб: Питер, 1997. 240 с.

28. Елисеева, И.И. Логика прикладного статистического анализа Текст. / И.И. Елисеева, В.О. Рукавишников. М.: Финансы и статистика, 1982. 192 с.р

29. Заде, А. Основы нового подхода к анализу сложных систем,и процессов принятия решений Текст. / А. Заде // Математика сегодня. М., 1974.

30. Заде, J1.A. Понятие лингвистической переменной и ее применение к принятию приближенных решений Текст. / J1.A. Заде. М.: Мир, 1976. 312 с.

31. Заенцев, И.В. Нейронные сети: основные модели Текст. : учебное пособие по курсу «Нейронные сети» для студентов 5 курса магистратуры физического ф-та Воронежского государственного университета /И.В. Заенцев. Воронеж, 1999. 76 с.• ч • |д

32. Искусственный интеллект Текст. В 3-х кн. Кн. 2. Модели и методы: справочник / под общ. ред. Д.А. Поспелова. М.: Радио и связь, 1990.304 с.' • р

33. Использование видеоларингостробоскопии в фониатрической практике Текст. : пособие для врача / Московский научно-исследовательский институт уха, горла и носа. Москва. 1997. 22 с.

34. Казначеев, В.П. Донозологическая диагностика в практике массовых заболеваний населения Текст. / В.П. Казначеев, P.M. Баевский,г

35. А.П. Беренев. JL: Медицина, 1986.'216 с.

36. Калинцев, Ю.К. Разборчивость речи в цифровых вокодерах Текст. /Ю.К. Калинцев. М: Радио и связь, 1991. 218 с.

37. Кириллов, С.Н. Алгоритмы сегментации речевых сигналов в естественно-языковых интерфейсах Текст. / С.Н. Кириллов, А.С. Шелудяков, 0.3. Шустиков // ЭВМ и информационные технологии: сб. научн. статей. Рязань: РГРА, 1998. С. 4-8.

38. Кодзасов, С.В. Общая фонетика Текст. / С.В. Кодзасов, О.Ф. Кривнова. М.: Рос. гос. гуманит. ун-т, 2001. 592 с.

39. Колоколов, А.С. Предварительная обработка и сегментация речевого сигнала в частотной области для распознавания речи Текст. / А.С. Колоколов // Автоматика и телемеханика. 2003. №6. С. 152-162.

40. Кореневский, Н.А. Полифункциональная система интеллектуальной поддержки принятия решений по рационализациилечебно-диагностических процессов Текст. / Н.А. Кореневский // Вестник4 1 *новых медицинских технологий / АМНТ. 1996. Т. 3, № 2. С. 43-46.

41. Коротких, В.Ф. Система поддержки принятия решений поликлинического врача общей практики Текст. / В.Ф. Коротких, Ю.Н. Горобец, М.А. Желудева // Биомедицинская радиоэлектроника. 2001. №3. С. 28-34.

42. Кофман, А. Введение в теорию нечетких множеств Текст. / А. Кофман. М.: Радио и связь, 1982. 432 с.

43. Крашенинников, И.В. Методы определения периода речевых сигналов Текст. / И.В. Крашенинников // Ноосферные знания и технологии: труды Ульяновского научного цейтра / РАЕН. Ульяновск, 1999. Т. 2, Вып. 1. С. 111-116.

44. Круглов, В.В. Искусственные нейронные сети. Теория и практика Текст. / В.В. Круглов, В.В. Борисов. 2-е изд., стереотип. М.: Горячая линия1. Телеком, 2002. 382 с.

45. Кэнал, Л. Обзор систем для анализа структуры образов и разработки алгоритмов классификации в режиме диалога Текст. / Л. Кэнал

46. Распознавание образов при помощи цифровых вычислительных машин. М.: Мир, 1974. 157 с.

47. Леоненков, А.В. Нечеткое моделирование в среде Matlab и fuzzyTECH Текст. / А.В. Леоненков. СПб.: БХВ Петербург, 2005. 736 с.

48. Леонов, А.С. Артикуляторный ресинтез гласных Текст.11

49. АС. Леонов, И.С. Макаров, В.Н. Сорокин, А.И. Цыплихин // Информационные процессы. 2003. Т. 3, № 2. С. 73-92.

50. Леонов, А.С. Обратная задача для управления артикуляцией1.'

51. Текст. : доклады Академии наук / А.С. Леонов, В.Н. Сорокин. 2000. Т. 374, № 6. С. 749-753.

52. Ливенцев, Н.М. Курс физики Текст. / Н.М. Ливенцев. М.: Высшая школа, 1974. С. 114-115.

53. Макаров, И.С. 3-мерная модель речевого тракта и алгоритмгвычисления площадей поперечного сечения Текст. / И.С. Макаров, П. Баден, В.Н. Сорокин // Диалог: тр. Междунар. семинара. 2002. С. 352-359.

54. Макс, Ж. Методы и техника обработки сигналов при физических измерениях Текст. : в 2-х т. [пер. с франц.] / Ж. Макс. М.: Мир, 1983. Т. 2.4 256 с.'

55. Малышев, Н.Г. Нечеткие модели для экспертных систем в САПР Текст. / Н.Г. Малышев, Л.С. Бернштейн, А.В. Боженюк. М.: Энергоатомиздат, 1991.

56. Марпл.-мл., С.Л. Цифровой спектральный анализ и его приложения Текст.: [пер. с англ.}/ С.Л. Марпл.-мл. М.: Мир, 1990. 584 с.

57. Марр, Д. Зрение. Информационный подход к изучецщо представления и обработки зрительных образов Текст. : [Пер. с англ.] / Д. Марр. М.: Радио и связь, 1987. 400 с.t

58. Математическая обработка результатов исследований в медицине, * 0биологии и экологии Текст. : монография / С.А. Воробьев, А.А. Яшин; под общ. ред. А.А. Яшина. Тула: ТулГУ, 1999. 120 с.

59. Мелихов, А.Н. Расплывчатые ситуационные модели принятия решений Текст. : учеб. пособие / А.Н. Мелихов, J1.C. Берштейн, С .Я. Коровин. Таганрог: ТРТИ, 1986. 211 с.

60. Методика применения экспертных методов для оценки качества продукции Текст. М.: Стандарт, 1975. 31 с. 1

61. Нечеткие множества и теория возможностей. Последние достижения Текст. : [пер. с англ.] / под общ. ред. Р.П. Ягеря. М.: Радио исвязь, 1986. 408 с.

62. Нечеткие модели для экспертных систем САПР Текст. /Н.Г. Боженюк, Н.Г. Малышев и др. М.: Энегроатомиздат, 1991. 136 с.

63. Омельченко, В.П. Практикум по медицинской информатике Текст. : серия «Учебники, учебные пособия» / В.П. Омельченко, A.J1. Демидова. Ростов-на-Дону: феникс, 2001. 304 с.

64. Оппенгейм, А.В. Цифровая обработка сигналов Текст. : [пер.( с англ.] / А.В. Оппенгейм, Р.В. Шафер. М.: Связь, 1979. 416 с.

65. Орловский, С.А. Проблемы принятия решений при нечеткой исходной информации Текст. / С.А. Орловский. М.: Наука, 1981. 208 с.

66. Основы проектирования автоматизированных систем анализа медико-биологических сигналов Текст. / В.В. Губанов, J1.B. Ракитская, С.А. Филист / ГУИПП «Курск». Курск, 1997. 134 с.

67. Осовский, С. Нейронные сети для обработки информации Текст. / С. Осовский; пер. с польского И.Д. Рудинского. М.: Финансы и статистика, 2002. 344 с.

68. Плис, А.И. Mathcad 2000. Математический практикум для экономистов и инженеров Текст. : учеб. пособие / А.И. Плис, Н.А. Сливина. М.: Финансы и статистика, 2000. 656 с.

69. Подвальный, Е.С. Модели индивидуального прогнозирования и классификации состояний в системах компьютерного мониторинга Текст. /Е.С. Подвальный. Воронеж: Изд-во ВГТУ, 1998. 127 с.

70. Половко, A.M. Matlab для студента Текст. / A.M. Половко. СПб.: БХВ Петербург, 2005. 320 с.

71. Прикладная статистика* классификация и снижение размерности Текст. / под общ. ред. С.А. Айвазяна. М.: Финансы и статистика, 1989. 315

72. Прэтт, У. Цифровая обработка изображений Текст. : в 2-х кн. /У. Прэтт. М.: Мир, 1982. Кн. 1. 312 е.; Кн. 2. 480 с.

73. Рабинер, JI. Теория и применение цифровой обработки сигналов Текст.: [пер. с англ.] / JL Рабинер, Б. Гоулд. М.: Мир, 1978. 848 с.

74. Растригин, JI.A. Метод коллективного распознавания Текст. / JLA. Растригин, Р.Х. Эренштейн. М.: Энергоиздат, 1981. 80 с.

75. Рутковская, Д. Нейронные сети, генетические алгоритмы инечеткие системы Текст. / Д. Рутковская, М. Пилиньский, JI. Рутковский;пер. с польск. И.Д. Рудинского. М.: Горячая линия Телеком, 2004. 452 е.:1.1

76. Скоромец, А.А., Скоромец Т.А. Топическая диагностика заболеваний нервной системы Текст. / АЛ. Скоромец, Т.А. Скоромец. СПб.: Политехника, 2000. 141 с.

77. Сорокин, В.Н. Модель многослойного первичного анализагречевых сигналов Текст. / В.Н. Сорокин // Труды 13-й сессии Российскогоакустического общества. 2003. С. 11-16.

78. Сорокин, В.Н. Сегментация и распознование гласных Текст. / В.Н. Сорокин, А.И. Цыплихин // Информационные процессы. М., 2004. Т. 4, № 2. С. 202-220.

79. Сорокин, В.Н. Синтез речи Текст. / В.Н. Сорокин. М.: Наука, . 1992. ,

80. Сорокин, В.Н. Теория речеобразования Текст. / В.Н. Сорокин. М.: Радио и связь, 1985.

81. Справочник по функциональной диагностике в педиатрии Текст. / под общ. ред. Ю.Е. Вельтищева, Н.С. Кисляк. М.: Медицина, 1979. 624 с.

82. Статические и динамические экспертные системы Текст. :учебное пособие / Э.В. Попов и др. М.: Финансы и статистика, 1996. 320 с.I

83. Толстов, Г.П. Ряды Фурье Текст. / Г.П. Толстов. М.: Наука, 1980.384 с.

84. Тьюки, Дж. Анализ результатов наблюдений. Разведочный анализ Текст. / Дж. Тьюки. М.: Мир, 1981.

85. Тюрин, Ю.Н. Статистический анализ данных на компьютере Текст. / Ю.Н. Тюрин, А.А. Макаров; под общ. ред. В.Э. Фигурнова. М.: ИНФА, 1998.528 с.

86. Уотерман, Р.Д. Построение экспертных систем Текст. : [пер. с ' айгл.] 1 Р.Д. Уотерман, Д. Ленат, Ф. Хойсе-Рот. М.: Мир. 1987.

87. Фант, Г. Акустическая теория речеобразования Текст. : [пер. с англ.] / Г. Фант. М.: Наука, 1964.284 с.г

88. Филист, С.А. Метод спектрального анализа биомедицинскихIсигналов Текст. / С.А. Филист, С.Ю. Багликов, Е.А. Юдина // Распознавание-95: сб. материал. 2-й Междунар. конф. Курск, 1995. С. 93.

89. Фомин, А.А. Статистическая теория распознавания образов Текст. / А.А. Фомин, Г.Р. ТарловСкий. М.: Радио и связь, 1986.

90. Фролов, М.В. Диагностика функциональных и депрессивных состояний по характеристикам интонации и временного потока речи Текст. / М.В. Фролов и др. // Биомедицинские технологии и радиоэлектроника.2004. № 12. С. 8-16.

91. Хансен, Г. Базы данных: разработка и управление Текст. : [пер. с англ.] / Г. Хансен, Д. Хансен. М.: БИНОМ, 1999. 704 с.

92. Хартли, О.Г. Многомерный дискриминационный анализ Текст. : [пер. с англ.] / О.Г. Хартли; под. общ. ред. И.С. Енюкова // Факторный, дискримйнантный и кластерный анализ. М.: Финансы и статистика, 1989. С. 98-122.

93. М.: Радио и связь, 1981. 496 с.

94. Чистович, Л.А. Физиология речи. Восприятие речи человеком

95. Текст. / JI.А. Чистович, А.И. Венцов, М.П. Гранстрем и др. М.: Наука, 1976. 388 с.'

96. Чэн, Ш.-К. Принципы проектирования систем визуальной информации Текст.: [пер. с англ.] / Ш.-К. Чэн. М.: Мир, 1994. 480 с.

97. Шаталова, О.В. Использование частотно-временных преобразований для диагностики нарушений голосового аппарата Текст. / О.В. "Шаталова, Н.В. Краснова // Интеграция медицины и образования: сб. материал, научн. конф. Курск: Изд-во КГУ, 2006. С. 118-121.

98. Шаталова, О.В. Методика вейвлет-диагностики дисфонии по фонеме И Текст. / О.В. Шаталова, С.А. Филист, Н.В. Краснова // Вестник новых медицинских технологий. Тула, 2006. Т. XIII, №2. С. 20.

99. Шаталова, О.В. Нейронные сети на основе нечеткойадаптирующейся иерархической структуры при наличии данных с пробелами*

100. Текст. / О.В. Шаталова, С.А. Филист, М.А. Ефремов // Медико-экологические информационные технологии 2006: сб. материал. IX . Междунар. научн.-техн. конф. / Курск, гос. техн. ун-т. Курск, 2006. С. 87-93.

101. Шаталова, О.В. Синтез информативных признаков на вейвлет-плоскости фонемы «И» для диагностики голосовых расстройств Текст.

102. О.В. Шаталова, С.А. Филист, Н.В. Краснова // Вестник новых медицинских технологий. Тула, 2006. Т. XIII, №2. С. 21.

103. Экспертные системы. Принципы работы и примеры Текст. : [пер. с англ.] / А. Брукинг, Д. Джонс, Ф. Кокс и др; под общ. ред. Р. Фройсата. М.: Радио и связь, 1987. 352 с.

104. Элти Кумбс, Дж. Экспертные системы: концепции и примеры Текст. : [пер. с англ.] / Дж. Элтй Кумбс. М.: Финансы и статистика, 1987. 251 с. ,I

105. Яковлев А.Н. Основы вейвлет-преобразования сигналов Текст. : учеб. пособие / А.Н. Яковлев. М.: САЙНС-ПРЕСС, 2003. 80 с.

106. Agranovsky, A.V. Variation of the Fundamental Tone Characteristics with the Emotional Changes in Man Text. / A.V. Agranovsky, D.A. Lednov // Proc / SPECOM-96. St Petersburg, Russia, Oct. 21-23, 1996. Pp. 186-187.

107. Dempster, A.P. Maximum-likelihood from incomplete data via the EM algorithm Text. / A.P. Dempster, N.M. Laird, D.B. Rubin // J. Royal Statist. Soc. Ser. B. 1977. Vol. 39.

108. Ganapathiraju, A. Syllable-Based Large Vocabulary Continuous

109. Speech Recognition Text. / A. Ganapathiraju, J. Hamaker, J. Picone, G.R. Doddington, M. Ordowski. // IEEE Transactions on Speech and Audio Processing. 2001, Vol. 9, No. 4. Pp. 358-366.

110. Kamakshi, Prasad. Automatic segmentation of continuous speech using minimum phase group delay functions Text. / Prasad Kamakshi, Nagarajan, Murthy Hema. // Speech Communication. 2004. Vol. 42. Pp. 429-446.

111. Matlab Manual, http://www.mathworks.com/access/helpdesk/help/ toolbox/optim/optim.shtml.

112. Pastel, L. Turbulent voice sources in vocal tract models Text. / L. Pastel // M.S. Thesis, MIT Cambridge. 1987.

113. Rabiner, L.R. A bootstrapping training technique for obtaining demisyllable reference patterns Text. / L.R. Rabiner, A.E. Rosenberg, J.G. Wilpon, T.M. Zampini //JASA. 1982. Vol. 71, No. 6. Pp. 1588-1595.

114. Seifritz, E. Spatiotempor^l pattern of neural processing in the human auditory cortex Text. / E. Seifritz, F. Esposito, F. Hennel, H. Mustofic,i l a

115. J.G. Neuhoff, D. Bilecen, G. Tedeschi, K. Scheffler, F. Di Salle // Science. 2002. Vol. 297, No. 5587. Pp. 1706-1708.

116. Sorokin V.N. Inverse problem for fricatives Text. / V.N. Sorokin // Speech Communication. 1994. Vol. 14, No. 2. Pp. 249-262.

117. Sorokin, V.N. Articulatory-to-acoustic mapping for inverse problem Text. / V.N. Sorokin, A.V. Trushkin // Speech Communication. 1996. Vol. 19. Pp. 105-118.

118. Sorokin, V.N. Determination of vocal tract shape for vowels Text.r

119. V.N. Sorokin// Speech Communication. 1992. Vol. 11, No 1. Pp. 71-85.

120. Sorokin, V.N. Estimation of stability and accuracy of inverse problem solution for the vocal tract Text. / V.N. Sorokin, A.S. Leonov, A.V. Trushkin // Speech Communication. 2000. Vol. 30, No. 1. Pp. 55-74.

121. Stevens, K.N. Acoustic Phonetics Text. / K.N. Stevens // MIT Press.2000.

122. Van Hemert, J.P. Automatic segmentation of speech Text. / J.P. Van Hemert // IEEE Transactions on Signal Processing. 1991. Vol. 39. Pp. 1008-1012.

123. Vernaz, Y. Mixture Modelling Software MIXMOD User's Guide Text. / Y. Vernaz, F. Langrognet, C. Biernacki et al. 1999. http.V/www-math.umvr-fcomte.fr/MIXMOD/usermdde/.

124. Walker, J. Fourier Analysis and Wavelet Analysis Text. / J. Walker < // Notiees of the AMS. 1997. Vol. 44, № 6. Pp. 658-670. '

125. Westbury J. X-ray Microbeam Speech Production Database. User's Handbook Text. / J. Westbury. Version 1. 1994.

126. Wilpon, J.G. An investigation on the use of acoustic sub-word units for automatic speech recognition Text. / J.G. Wilpon, B-H. Juang, L.R. Rabiner // Proc. Int. Conf. Acous., Speech, and Sig. Processing. Dallas, TX, 1987. Pp. 821824.r

127. Wu, C.F.J. On the convergence properties of the EM algorithm Text. /C.F.J. Wu//The Annals of Statistics. 1983. Vol. 11, No. 1. Pp. 95-103. f" № '

128. Xu, L. On the convergence properties of the EM algorithm for Gaussian mixtures Text. / L. Xu, M.I, Jordan // Neural Computation 1996. Vol. 8. Pp.] 2^-151.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00