автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Разработка и исследование речедиалоговых систем в мультимедийных технологиях (на примере экспертной системы диагностики патологии речи)
Автореферат диссертации по теме "Разработка и исследование речедиалоговых систем в мультимедийных технологиях (на примере экспертной системы диагностики патологии речи)"
Національна академія наук України .
Інститут кібернетики ім. В. М. Глушкова
5 оа
ФЕВ 1395
На правах рукопису
БОРДЯ Тетяна Дмитрівна
УДК 681.3.06
РОЗРОБКА ТА ДОСЛІДЖЕННЯ МОВНОДІАЛОГОВИХ СИСТЕМ У МУЛЬТИМЕДІЙНИХ ТЕХНОЛОГІЯХ
(на прикладі експертної системи діагностики патології мови)
05.25.05 — інформаційні системи та процеси
Автореферат дисертації на здобуття наукового ступеня кандидата технічних наук ^
Київ 1995
Дкссртсцісю е рукопис.
Робота виконана в Інституті кібернетики імені В. М. Глуш-кова НАН України.
Науковий керівник: доктор технічних наук, професор ' ПАНЫПИН Б. М. "
Офіційні опоненти: доктор технічних наук, професор ДОВГЯЛЛО О. М„
кандидат технічних наук КРАМАРЕНКО Р. П.
Провідна організація: Інститут системних досліджень Міністерства освіти України.
о • , Ж ^ ^
Захист відбудеться «- » ------------- 199 ^ р. о----------
год. на засіданні спеціалізованої вченої ради К 016.45.05 при Інституті кібернетики імені В. М. Глушкова НАН України за адресою:
252022 Київ 22, проспект Академіка Глушкова, 40.
З дисертацією можна ознайомитися в науково-технічному архіві інституту.
д і . „ <?/ '¿’/¿'¿Ґ ■<
Автореферат розісланий «---------»-------------- 199-^ р.
Учений секретар спеціалізованої вченої ради
РЕВЕНКО В. Л.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА ПРОБЛЕМИ
Актуальність проблеми. Кардинальні зміни, які сталися за( останні декілька років у розвитку програмних та технічних засобів’ обробки інформації, призвели до появи нових напрямків у розвитку комп'ютерних систем і інформаційних технологій. Це .- прогрес у росвитк, ПЕОМ, досягнення у галузі відео та аудютехніки, лазерних дисків (аналогових і CD-ROM), розробка різних універсальних та спеціальних Програмних засобів. Усе це зробило можливим інтеграцію за допомога® комп’ютера практично всіх використовуваних сьгодні людиною інформаційних технологій, середовищ, засобів і методів обміну інформацією, а також збагачення їх властивими комп’ютеру можливостями зберігання великих масивів ’інформації та інтерактивного доступу до окремих елементів цієї інформації, тобто створення багатосередовищних інформаційних систем Сmultimedia systems) ado систем мультимедіа.
Системи мультимедіа нині широко розповсюджені і являють собою суму технологій, які дозволяють вводити, обробляти, зберігати, передавати і відображати такі типи даних як текст, графіка, анімація, оцифровувати нерухомі зображення, відео, звук. мову. Огфім того, .методи автоматичного розпізнавання мови, які досяглії високого технічного рівня, дозволяють вирішувати конкретні прикладні задачі, зокрема створення мовного інтерфейсу, що є ¡складовою частиною технології мультимедіа.
Ця робота присвячена вивченню Та розробці у рамках технології мультимедіа моделі медичної діагностичної експертної системи СМДЕС), яка використовує природно-мовний інтерактивний інтерфейс, і розрахована для діагностики патології голосу та мови спеціалістами у галузі фоніатрії і отоларингології. Діагностика патології мови пов'язана з обробкою великого обсягу мовної інформації,, аналіз якої представляє собою складну багатоаспектну проблему, яка вимагає ретельного обліку найрізноманітніших індивідуальних особливостей і середовища мешкання пацієнта Сумови життєдіяльності, виду занять і т. ін. ). а також вікових та багатьох інших характеристик. Важливість практичних кроків у вирішенні цієї проблеми на теперішній !;ас зумовлена значним збільшенням кількості різних захворсвань мовкоголосоього апарату у жителів ряду районів України, Білорусі, Росії Енаслідск авари на Чсрнсйильскій АЕС та необхідності своєчасного і ретельного обстеження великої кількості осіб. ■ ' ' . ■ ’
- г -
У зв'язку з цим дуже актуальною є розробка спеціальних медичних експертних систем СЕС), які призначені - для діагностики патології мови і орієнтовані на використання найсучаснішіх
технологій запровадження, збереження та представлення інформації. При цьому необхідність обліку специфіки предметної області використання ЕС та висока вартість мовнодіалогсг систем СМДС) обумовлює актуальність проведення досліджень питань створення і використання конкретних МДС та методів аналізу і обробки мови як на програмному, так і на технічному рівні.
Мета і. задачі роботи. Метоп дисертаційної роботи є аналіз підходів, туор«іівдС‘ обгрунтування та розробка методики проектування медичних мовнодіалогових інформаційних систем СІС) на прикладі експертної системи з природно-мовним інтерфейсом з використанням елементів технології мультимедіа, розрахованої для діагностики патології мови.
Для досягнення поставленої мети Необхідно було вирішити такі задачі: .
проаналізувати вплив розвитку інформаційних технологій на формування інформаційних середовищ та використання різних інформаційних систем у медицині;
проаналізувати вплив особливостей предметної області на створення та використання мультимедійних систем;
вивчити можливості існуючих методів та підходів щодо створення медичних мультимедійних систем;
сформулювати нові принципові еимоги стосовно розробки методики створення медичних інформаційних систем з використанням мовнодіалогового інтерфейсу. 1 • •
Методи досліджень.. При виконанні роботи . були використані концепції інформатизації різних областей діяльності, результати аналізу створення сучасних інформаційних медичних систем, теорія ІС, теорія ЕС, теорія множин, математична логіка, теорія ймовірностей і математична статистика, теорія цифрової обробки сигналів, теорія інформації, сучасні методи проектування та реалізації програмного забезпечення баз даних і баз знань.
Наукова новизна роботи:
1) запропоновано підхід щодо створення медичної діагностичної ЕС для виявлення патології голосу і мови на базі сучасних методів гірооки та аналізу мовного сигналу;
2) розвинуті підходи щодо використання мовнодіалогових систем, експертних систем діагностики патології голосу і. мови щодо
■ - з -
обгрунтування вибору програмних та технічних засобів мовнодіалогових систем у рамках технології мультимедіа, можливостей МДС по виявленню необхідних Інформативних ознак мовного сигналу з урахуванням специфіки конкретної предметної області; - . ' ■
3) розроблена методика використання МДС для' медичної ЕС діагностики патології мови з метою використання в фоніатрії та отоларингології.
Об’єктом дослідження є медичні експертні системи для діагностики патології мови.
Практична цінність роботи. Основні результати дисертаційної роботи: ,
оцінка особливостей ІС медичного профілю та аналіз впливу цих особливостей "на ефективність процесу інформатизації медичної діяльності; .
оцінка, ефективності різних медичних діагностичних ЕС, їх достоїнств та недоліків; #
методика побудови експертних систем на базі мультимедійних технологій, а також,макет ЕС для діагностики патології, голосу і мови, на базі якого можуть бути побудовані практичні системи медичного профілю для використання спеціалістами з фоніатрії 1 отоларингології з метою виявлення захворювань на різних стадіях, а також для профілактики виникнення лор-захворювань, особливо в осіб мовноголосових професій, .
Дисертаційна робота виконувалась у рамках наукового співробітництва разом з Київським НДІ отоларінгояогіІ ім. Коломийчука, а також увійшла як складова частина до звіту за темою И. П. 265.01 "Дослідження і розробка принцип побудови систем автоматичного перетворення текстів в мовні повідомлення".
Апробація роботи. Отримані автором результати доповідались і обговорювались на семінарах секції "Кібернетика" Наукової ради НАИ України по проблемі "Кібернетика", С і 992-1994 рр ); науково-практичній конференції ПГКУ ім.Т.Г.Шевченко (Тирасполь, січень 1994 р.) ■ .
Публікації. За матеріалами дисертаційної роботи опубліковані чотири наукові роботи, підготовлена глава "Архітектура модуля автоматичного розпізнавання мови" у звіті. -
Структура та обсяг дисертації. Дисертація складається із вступу, трьох глав, висновків, списку літератури (168 найменувань) і додатків, загальним обсягом 148.сторінок. Дисертація містить 10
рисунків і 7 таблиць.
, КОРОТКИЙ ЗМІСТ РОБОТИ '
У вступі обгрунтовується актуальність теми дисертаційного дослідження, викладені мета і задачі роботи. її основні положення, наукова новизна і практична цінність, а також стислий зміст основних розділів дисертації.
У першій главі проведений аналіз ключових понять інформаційних систем, перспективних інформаційних технологій,
зокрема, таких як гіпертекст, гіпермедіа, мультимедіа.
Розглядаються сучасні методи та підходи щодо проектування
створення мультимедійних інформаційних середовищ, інтегрованих інформаційних систем, а також загальні поняття, концепції
принципів формування функціонально повних мультимедійних систем і особливості використання технології мультимедіа при створенні ЕС медичного профілю. Зазначається, ідо розвиток лазерної комп'ютерної інформаційної технології і насамперед лазерних компакт-дисків, а також швидкий розвиток відповідного програмного забезпечення призвело до появи нових напрямків в створенні носіїв інформації та комп'ютерних систем. Цифровий засіб запису, який використовується на компакт-дисках СО-ЕОМ, дозволяє записувати ' на них і відтворювати з одного і того самого носія зовсім різну інформацію
- літерно-цифрову, звукову (музика і мова), графічну, а також кс ■ьорові нерухомі та рухомі зображення. У свою чергу, розвиток інтерактивних комп’ютерних систем забезпечує роботу з усіма цими видами інформації у діалоговому режимі, ш.о призвело до створення якісно ноеого класу інформаційних систем, які називаються системами мультимедіа (тиИішесІїа зузієт), тобто системами з багатьма середовищами, з багатьма видами уводу, обробки та відображення інформації. .
Потенціальними користувачами мультимедійних систем є насамперед ті, які займаються прикладними дослідженнями складних структур з великим обсягом даних, представленії)! у різноманітній формі (графічна, текстова, звукова та ін.3. До цієї групи належать взагалі медичні працівники, географи, геологи, а також робітники кіно- і відеоіндустрії, промислової та будівельної індустрії, дизайнери. .
Слід зазначити, ао особливі переваги системи мультимедіа мають у і.їх випадках, коли необхідно вести, пошук інформації за дуже обмеженими строками серед еєліікого набору однотипних даних.
наприклад, у лікарській практиці С медичні діа'гностіпні довідники та енциклопедії на компакт-дисках, медичні експертні.системи).
У главі зазначено, що розробка мультисередовищ вимагає створення нових стандартів та методології спільної роботи спеціалістів різних профілів, так як передбачається,. що система мультимедіа являє собою систему з відкритої) архітектурою, що має ядро, зв'язане інтерфейсами з набором прикладних програм та зовнішніми середовищами (інші подібні системи). Ядро включає ОС, інтерфейс з користувачем, який оперує характерними для різних середовищ образами Стексти, образи, звуки, мультиплікації), базові засобе керування даними та телекомунікації. Прикладні програми можуть включати текстові редактори, СКБД, графічні пакети, ЕС, пошукові засоби і т. ін. .
Переваги таких систем - можливості прямого аудю- і відеоконтакту на великих відстанях, скорочення часу
обслуговування, непродуктивних затрат часу на чекання і т.ін., а також покращення параметрів інформаційного доступу.
Показується, що на цей момент розробка систем мультимедіа знаходиться у стадії переходу від комбінації різних засобів інформаційної техніки до їх інтеграції у рамках одніє системи.
Крім того, використання методології баз знань разом . із згаданими технологічним! новшествами дозволяє створити інформаційні системи нового покоління. Технологія мультимедіа дозволяє зв’язати описову інформацію з графічними та звуковими образами,-використати ппертекстову технологію, що в свою чергу, дозволяє 'ЗДІЙСНИТИ розробку якісно нових багатосередовишгах засобів, що особливо актуально в області навчаючих та медичних діагностичних систем.
У другій главі здійснюється аналіз підходів, методів реалізації та використання систем мовної обробки в мультимедійних системах. Розглядаються проблеми створення та перспективи розвитку мовнсдіалогових систем, технологія добудови мовнодіалогових систем в мультимедійні комплекси, створення систем з мовним інтерфейсом на базі методів обробки мовного сигналу.
Зазначається, що найважливішим напрямком технічного прогресу стала інтелектуалізація засобів інформатизації, яка припускає можливість інформаційних систем спілкуватися з людиною-оператором, на природній для нього моьі -засобом мови, у зв’язку з чим МДС стає невід'ємною частиною перспективних інформаційних систем.
У главі наведені результати аналізу сучасного світового рівня
- б -
розвитку техніки розпізнавання та синтезу мови. які можна характеризувати таким чином: 1) розпізнавання мови практично
обмежене розпізнаванням окремих слів та виразів, лімітованого словника і мови високої якості певного диктора;
2) можливо мати синтез мови задовільної якості з необмеженого за словарним обсягом тексту або еисокоі якості обмеженого словника.
Детальне розглядання відомих інформаційних технологій мовного уводу-виводу з точки зору їх використання показує, до для переважної більшості задач, які розв’язуються за допомогою цих технологій, фіксувати словник недоцільно, його слід вибирати виходячи із змісту конкретної задачі. При цьому для багатьох масових користувачів словник великих розмірів вимагаєтся рідко і в більшості випадків може бути обмеженим до 200 слів.
Порівняльний аналіз даних, які характеризують основні параметри найбільш ефективних західні . практично реалізованих МДС в Україні та інших країнах СНД. дозволяє зробити висновок про те, що західні розробки МДС по ряду параметрів переважають розробки, створені н Україні та інших країнах СНД. Досягнення у галузі розпізнавання та синтезу українскої і російської мов також скромніші у практичному плані, ніж зарубіжні, а роботи у галузі МДС для мов інших народів колишнього СРСР, окрім естонського і осе'і енського, практично не велися, але в теоретичному плані широко відомі досягнення української школи, очолюваної Т.К. Вінцюком С.абл. 1,?.). Досі неможливо Еважати, що центр проведення таких робіт повністю змістився а лаборатор . виробничу сферу. Однак навіть добре відпрацьовані західні рішення демонструють скоріше теоретичні можливості створення мовного інтерфейсу і зараз практично ще не в змозі забезпечити безпосередній контакт користувача з технікою у повному обсязі і складнощі людських міркувань.' Накладаються певні обмеження, такі, наприклад, як регламентований розмір і зміст словника, обмежені граматики, розпізнавання ізольованих слів, настройка на конкретного диктора. Крім того, навіть найбільш ефективним західним системам довелося б працювати з моеним сигналом (українским, російським), фонетична структура якого значно відрізняється від вихідного.
У зв'язку з цим можна зробити висновок, що вирішувати
проблему побудови ............ , . розпізнавання та синтезу
українскої мови, незважаючи на зарубіжні досягнення, мають вітчизняні спеціалісти, використовуєм;! досягнутий рівень розвитку
Параметри найбільш відомих-систем автоматичного розпізнавання моей
Назьа системи Кількість дикторів Обсяг словника. слів Можливість розпізнавання злитої мови Середніft-час розпізнавання, с Точність розпіз- навання, %
Західні розробки
Mark U Не обмеж. 300 Hi 0.3 99,50
VPJC 100-2 1 200 Hi 1.12 99,0
DP-200 1 600 Так 0.3 9у,0
Votan Voice Не обмеж. 150x8 Так Реальне 99,97
Розробки країн СНД
ИКАР 1 200 Hi 0.8 97
MAPC 1 200 Hi 1.0 95
Речь . 1 600 Так 0.3 99
Сириус 1 100 Hi 2.0 93
Россия 1 200 Hi 4,0 ' 93
Сибирь '1 300 Hi 5,0 93
Таблиця 2
Параметри синтезаторів мовних повідомлень
Марка Розробник Метод Звукова Полоса Полоса
синтезатору синтезу розбірли- вість,?'. частот сигналу, Гц частот ' основного тону, Гц
CALLTEXT Speach pías Str. Elect. Форманти LPC 96 200-3600 80-200
ECHO GP 98 200-5000 70-200
VSM-1 Votrax Форманти 93 200-4000 70-200
Votalker IB Votrax Форманти 95 200-3600 80-200
ФС-05 IK AH Естонії Форманти 93 200-4000 80-150
Фонемофон-5 Мін. від. ЦНІІС Форманти МДС 93 200-40СО 80-170
РЕТЕР-СПК IK HAH України 93 200-5000 70-350
методів автоматичного розпізнавання та синтезу моьи, який у ряді 'Еішадків дозволяє вирішувати конкретні практичні задачі.
’ V глаьі зазначається, що у зЕ'язку із зростаючим за останній час інтересом до розробки та використання експертних систем у невиробничій, сфері (зокрема, в медицині), все більш актуальної) стає проблема організації ефективної взаємодії з системою користувачів', які не мають спеціальної підготовки в галузі програмування та обчислювальної техніки. А один з важливих факторів, який може впливати на більш широке впровадження ЕС, є якість інтерфейсу, що полягає у зручності та легкості його використання. У зв'язку з цим інтерфейс для медичних ЕС пое::нєн довести до мінімуму незручності при уводі та отриманні інформації лікарем у процесі його звичної роботи, дати користувачу відчуття природного взаємозв’язку з системою. Розроблені до теперішнього часу інтерфейси користувача іде не настільки ефективні. Тому дослідники давне Еважають, що найбільш природний та в той хе час найбільш прийнятний засю спілкування з ЕС. можуть забезпечити системи МОВНОГО уЕОДу-ЕИВСДу. .
Розглядається потенціальна ефективність мовного уводу-виводу в машину, яка заснована на практично необмежених можливостях формулювання на природній мові всіляких задач у самих різноманітних галузях людської діяльності..Показані переваги, які дає користувачу спілкування з комп'ютером за допомогою МДС; якими не володіли інші діалогові засоби. Наводяться дані дослідів, які свідчать про те, що 90*/. важливої ділової інформації передається по мовному каналу, і тільки 10% залишається на решту каналів (машинопис, рукопис). Через те мовний канал у перспективі стане основним у системі зв’язку людина-ЕОМ.
Слід зазначити, ідо задача створення мовного інтерфейсу для медичної експертної діагностичної системи пов'язана з рішенням ряду питань. Зокрема, це розробка типових конструкція усних фраз-запитів та реакцій-відповідей ЕС (Залит-Відповідь(З-В)-мова). При цьому загальна схема організації діалога лікаря-користувача та ЕС може бути представлена в такому вигляді (ряс.і).
Ks)
ТсСр)
FH 1 Розпізна- Декомпозиція Усування
Аналіз •>— вання мовного •>- неоднознач-
мови мови запиту ності
—і У ч і V 1 •
Процедури Увод
обробки параметрів
інформації ~ 1 процедури
IlCs)
БСІ
v
і
3-В генератор
ipCs/h)
Рис.1. Загальна схема реалізації діалога
Алгоритм розпізнавання усного запиту до системи -полягає у наступному. Мовний запит f(s,t) визначеного семантичного змісту S підлягає поточному параметричному перетворенню FCL). на основі якого має місце виявлення ключових слів та словосполучень St , розуміння фрази TCs ), тоото поновлюється повний текст, а потім виконується його декомпозиція на атомарні змісти шляхом порівняння сукупності змістів фрази з еталонними шаблонами H=(h >, які зберігаються у банку службової інформації (БСІ), з метою вибору найбільш вірогідної типової фрази. Далі визначається розбіжність ip(s\h), на основі якого синтезується уточнюючи.: запит ТсСр). При відсутності розбіжності, чи після її усунення, тобто у разі повної "ясності" для системи запиту виконується санкціонована для користувача у банку користувача (БЮ.
Таким чином, у процесі діалогу з ЕС необхідно забезпечити вирішення таких задач, як знаходження ключових слів та словосполучень у потоці злитної моей, розуміння та декомпозиція запиту, синтез мови та" тексту для усунення неоднозначності у запитах лікаря-користувача на основі моеного та візуального зворотнього зв'язку з використанням терміналу. Підхід і методика вирішення цих задач стосовно МДЕС розглядаються у наступній главі.
процедура П (s),
У третій, заключній, главі дисертації досліджуються можливості ■використання мовних технології! у мультимедійних системах на прикладі EC діагностики патології мови. Аналізуються особливості побудови EC діагностики патології мови і сучасні тенденції розвитку медичних діагностичних засобів та систем. На основі аналізу обгрунтовуються умови формування банку мовної інформації, а саме: зміст мовних сегментів, умови та форма представлення мовного сигналу, зміст банку інформативних признаків мовного сигналу.
Обгрунтовується, що одним із класів сучасних прикладних інтелектуальних систем, в основі яких лежать різні засоби представлення та ооробки знань, є експертні системи, які в самому загальному випадку можна визначити як прикладні інтелектуальні системи, які реалізують різні режими роботи EC і вміщують засоби логічного виводу, базу знань СБЗ) та систему керування цією базою знань (СКБЗ), а також підсистеми формування пояснень та накопичення знань. . .
Проведений аналіз розробок у даній галузі показує, що більшість EC створюється у таких слабко формалізованих галузях, як медицина, біологія, хімія, що зумовлює високу актуальність та перспективність використання у цих галузях технологій мультимедіа. При цьому найбільший ефект досягається, коли для уБоду-виводу інформації використовуються сучасні засоби розпізнавання та синтезу мови.
Наводяться приклади найбільш вдалих із створених зарубіжних та вітчизняних систем, котрі використовуються у клінічній практиці (ONCOCIN, MYCIN, INTERNIST та ін.).
У главі обгрунтовується необхідність використання таких систем у медицині. По-перше, це вузька спеціалізація лікарів у своїй галузі та пов'язані з' нею труднощі постановки діагнозу з суміжних галузей. По-друге, різний рівень кваліфікації лікарів, необхідність для малокваліфікованих лікарів у тяжких випадках вдаватися за допомогою до спеціалістів більш високої кваліфікації. По-третє, можлива допомога, яку зможуть надати подібні системи при навчанні студентів медичних вузів. ■ . ...
Відмінність розроблюваної системи від відомих полягає у наступному. EC у галузі отоларингології ІПиврикас 1989, Hideo 1985) орієнтовані на діагностику приступів запаморочення і раптової глухоти, діагностику пошкоджень перікреріинсі вести-
зулярної системи. Годі як система, . яка розглядається е дисертації, передбачає діагностику захЕорсвань мрв’нсутворюючої системи на осноеі аналізу патологічних відхилень у мові хворого за допомогою апаратно-програмного комплексу аналізу мовного сигналу.
Макет EC діагностики мовної патології реалізований на базі персонального комп’ютеру типу ІБМ PC/AT з використанням оболонки INTER-EXPERT, яка являє собою інтегровану систему обробки знань. Передбачається три режими функціонування EC: навчання, інструктаж та безпосередньо робочий режим. Система повинна використовувати вже і^чупчі у неї моделі цієї галузі, а не навчатися "з нуля”. Наявність моделі забезпечує умови для того, щоб не шукати придатні правила на пустому міст. Люба стратегія пошуку буде давати більш точні результати, якщо пошук буде спиратися на вже існуючі моделі.
Архітектура EC діагностики мовної патології включає такі основні компоненти, як базу знань предметної галузі, базу даних, яка містить дані хворих ¿формалізована історія хвороби, дані результатів лабораторних та інструментальних досліджень та т. ін.), блок логічного виводу та дружній мовний інтерфейс людина-система. Однак специфічність прийнятих при її побудові рішень та функцій, які виконуються, привносить в цю архітектуру такі особливості:
в системі розділені бази знань експерта, інженера знань, критика та база оперативної роботи; •
процес навчання координується з процесом добування з мовного сигналу інформативних ознак; • .
оперативна база знань під час безпосередкьої роботи-проблемно орієнтується;
Правила логічного виводу коректуються у відповідності з ступенем підтвердження породжуваних гіпотез; '
вихідні дані, які експерт повідомляє інженеру знань під час навчання, а користувач - модулям при інструктажі, надаються у формі цільових установок, які необхідно досягти.
Архітектура EC, яка пропонується, зображена на рис. 2.
У роботі EC при діагностиці патології артикуляційного тракту використовуєтся акустичний мовний сигнал обстежуваного пацієнта, що вводяться в EC через мікрофон. За допомогою спеціальної програми здійснюється аналого-цифрове перетворення сигналу та його візу-алізація. Програма передбачає роботу з окремими фрагментами зображення мовного сигналу, їх виділення, зміну масштабу зображення.
Від
обстежуваного
Система
Від обстежуваного
Рис. 2. Архітектура експертної системи
відтворювання і збереження сигналу та його зображення в пам’яті системи, амплітудно-спектральне предотавленя мовного сигналу.
У ролі даних, якими оперує ЕС, використовуються як структурно-лінгвістичний опис отриманих результатів досліджень (наприклад, форма контура зображення мовного сигналу., визначення якості голосу при слуховій оцінці), так і параметри мовного' сигналу, які визначаються та обробляються самою експертною системою.
При виборі зразків мовної інформації, які пред’являються експертній системі у процесі її функціонування для діагностики можлиі. і патології голосового апарату, необхідно визначити: формальний зміст Еідрізків мовного сигналу, що аналізуються; умови та форму їх представлення; зміст банку інформативних ознак сигналу. При вирішенні задачі про зміст банку інформативних ознак мовного сигналу необхідно, щоб повідомлення не викликало утруднень при вимові любим диктором, було максимально, інформативним та займало мінімальний обсяг пам’яті. Крім того, повідомлення повинно бути однаковим для кожного з дикторів, якого аналізують.
З урахуванням цих вимог було прийнято рішення використовувати як вихідний мовний матеріал фонеми, що вимовляються окремо - "а", "о“, "у", "з", “и", “и”, ”л", "з”, "в", "м", тому що сумарний обсяг інформації, який переноситься цими звуками, складає більш ніж 70:'. усієї виборки, що розглядається, та дві короткі фонетико-сбалансовані фрази: "Саша кушал кашу" і "Мама мила
малину", які характеризуються різким переключенням мовного тракту на артикуляцію різновидих за своїми якостями, а, отже, і по місцю утворення у тракті відрізкам сигналу. Для перше» фрази. -"шумний-тональний", для. другої - “назальниа-тональний".
Необхідна довжина відрізку сигналу, що аналізується, прийнята півтори секунди, що є достатнім для певної ідентифікації голосу. Нормальним темпом .мови вважається значення 3,5 складу за секунду.
Б розроблюваній системі дається можливість аналізу мовного сигналу як у амплітудно-часовій, так і в частотно-часовій галузях. Найбільш цінним є аналіз саме спектру сигналу, тему що при цьому можливо виявити такі його властивості, які скриті або, принаймні, неочевидні. .
Важливе значення набуває виділення інформативних ознак мовного сигналу, У главі наведено обгрунтування параметрів мовного сигналу як інформативних ознак для медичної діагностики
патологічних станів голосу.
' За отриманими значеннями представляється можливим розробити типи тестів для аналізу голосів, виявити характерні відмінності нормальних голосів від патологічних, класифікувати голоси за групами в залежності від типу патології мовноутворюсчого тракту та статі пацієнта. . '
У висновках наведений короткий огляд результатів досліджень:
Основні результати роботи
1. Проведений' аналіз перспективних напрямків розвитку інформаційний технологій, а також сучісних методів та підходів у проектуванні інформаційних систем, вивченні можливості існуючих методів та підходів до створення інформаційних систем медичного профілю.
2. Уперше вивчені питання використання МДС у ЕС діагностики патології мови, сформульовані нові принципові вимоги до методики розробки та використання медичних мультимедійних систем.
3. Розвинута загальна концепція розвитку мовнодіалогових систем як складової частини систем мультимедіа. Проведений аналіз різних МДС вітчизняного та зарубіжного виробництва з метою виявлення можливості інформативних ознак наявності патології мовноголосового тракту.
4. Проаналізовані можливості трансформації традиційних
медичних діагностичних експертних систем у системі мультимедіа.
Розглянута загальна концепція архітектури та обгрунтовані принципи побудови медичної системи мультимедіа для діагностики патології мови. ’
■ 5. Розроблена методика проектування; створення макет медичної ЕС для діагностики патології моей та використання спеціалістами в галузі отоларингології та фоніатрії.
Осноені положення дисертаційної роботи опубліковані в таких роботах: . "
1. Особенности построения экспертной'• системы диагностики
патологии речи // Перспективные средства информационного и программного обеспечения в сложных системах. - - Киев: Ин-т
кибернетики им. В. М. Глушкова АН Украины, 1992. - С. 14 - 19.
2. Принципы построения интерфейса медицинской експертной
системы патологии речи // Исследование динамики социальных и экономических систем. - Киев: Ин-т. кибернетики им. В. М. Глушкова АН Украины, 1993, - С. 4-10. ■ •
3. Экспертные системы типа мультимедиа - пути развития и
сферы применения. - Кишинев, 1994. - 7 с. - Деп. в справочноинформационном фонде МолдНИИНТИ, N 1356-М94. . •
4. Создание речедиалоговых систем и задачи распознавания
речи. - Кишинев, 1994. - 7 с. - Деп. в справочно-информационном фонде МолдНИИНТИ, N 1357-М94. • '
Еордя Т.Д. Разработка и исследование речедиалоговых систем в мультимедийных технологиях Сна примере экспертной системы диагностики патологии речи)
Диссертация на соискание ученой степени кандидата технических наук по специальности 05.25.05 - информационные системы н процессы. Институт кибернетики им.В.М.ГлушкоЕа НАН Украины, Киев. 1994. ' ’
Работа посЕЛЕ£на вопросам разработки речедналотовых систем ь свете теории мультимедиа и их использования е перспеятиьных информационных : системах различного назначения. Рассматривается новые возможности и технологические преимущества, которые обеспечиваются при работе с системами данного типа. Приводится модель медицинской диагностической экспертной системы, предназначенной для диагностики патологии голоса и речи специалистами в области отоларингологии, фокиатрии, дефектологии и логопедии. Приводится ойоснование параметров речевого сигнала в качестве информативных признаков для диагностики патологических состяний голоса. •
Bcrdya Т.D. The Development and Investigation of the Speech-Interactiv Systems in Multimedia Technology Cat the example of diagnostic expert system of speech pathology),
. Doctor of technical sciences thesis, speciality 05.25.05 -information systems and processes, V.M.Glushcov Institute of Cybernetics, NAS of Ukraine, Kiev, 1994.
The thesis is devot-ea to the quastions of the working out of the Speech-Interactiv Systems in the multimedia theory and using these systems for the wide range of advanced informaiton systems. The new possibilities and technological advantages are considered which provide the work of such kind of systems. In particular, it. is examened the pattern of speech pathology diagnostic expert system. The choice of speech signal parameteres in the capacity of symptom information for doctor’s speech desorders diagnostics is based.
Ключові слова: технологія мультимедіа, мовнодіалогові
системи, експертні системи, мовний сигнал, патологія мови.
Підп. до друку 26.12.94. Формат 60X84/16. Папір друк. № 2. Офс. друк. Ум. друк. арк. 0,93. Ум. фарбо-відб. 1,05, Обл.-вид. арк. 1,0. Тираж 100 прим. Зам. 82.
Редакційно-видавничий відділ з поліграфічною дільницею Інституту кібернетики імені В. М. Глушкова НАН України 252022 Київ 22, проспект Академіка Глушкова, 40
-
Похожие работы
- Визуально-семантическое кодирование информации в электронных учебных изданиях
- Мультимедийные технологии в библиотечном образовании
- Методы и средства создания человеко-машинного интерфейса мультимедийных автоматизированных обучающих систем
- Модульный принцип организации электронного обучения по химико-технологическим и фармацевтическим специальностям
- Методы и программные средства аудиовизуальной обработки сигналов при сопровождении распределенных совещаний