автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Разработка метода и алгоритмов автоматического распознавания стадий сна и построения гипнограммы

кандидата технических наук
Захаров, Евгений Сергеевич
город
Таганрог
год
2008
специальность ВАК РФ
05.13.17
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка метода и алгоритмов автоматического распознавания стадий сна и построения гипнограммы»

Автореферат диссертации по теме "Разработка метода и алгоритмов автоматического распознавания стадий сна и построения гипнограммы"

На правах рукописи

Захаров Евгений Сергеевич

Разработка метода и алгоритмов автоматического распознавания стадий сна и построения гипнограммы

05 13 17 - Теоретическая информатика 05 11 17 - Приборы, системы и изделия медицинского назначения

Автореферат на соискание ученой степени кандидата технических наук

003445584

Таганрог-2008

003445584

Работа выполнена на кафедре «Математического обеспечения и применения ЭВМ» Технологического института Южного федерального университета в г Таганроге

Научный руководитель заведующий кафедрой МОП ЭВМ, доктор технических наук, профессор

Кравченко Павел Павлович

Официальные оппоненты

заведующий кафедрой информатики ТГПИ, доктор технических наук, профессор

Ромм Яков Евсеевич,

заведующий отделом ЗАО ОКБ "Ритм", кандидат технических наук

Черчаго Александр Яковлевич

Ведущая организация

Южный научный центр РАН, г Ростов-на-Дону

Защита диссертации состоится «_2_» 0 2008 г в 17 ? на заседании диссертационного совета Д21220821 при Южном федеральном университете по адресу 347928, Таганрог, пер Некрасовский, 44, ауд Д-406

С диссертацией можно ознакомиться в Зональной научной библиотеке Южного федерального университета по адресу 344000, Ростов-на-Дону, ул Пушкинская, 148

Автореферат разослан «1^>> 2008 г

Ученый секретарь

диссертационного совета Д212 208 21, доктор технических наук, профессор

Общая характеристика работы

Актуальность проблемы. Современное состояние вычислительной техники и микропроцессорных технологий позволяет применять диагностическое оборудование, способное регистрировать и обрабатывать широкий спектр физиологических показателей на протяженных промежутках времени Это, в свою очередь, предоставляет специалистам возможность детально исследовать жизнедеятельность организма человека в различных состояниях в процессе выполнения специфической деятельности, при воздействии на организм всевозможных нагрузок, в процессе сна Результатом таких исследований являются длительные записи физиологических сигналов, которые необходимо обрабатывать - выявлять специфические признаки и осуществлять с их помощью классификацию различных сегментов исходной записи сигналов по определенным критериям Одной из актуальных и интересных с научной и практической точки зрения задач в этой области является задача распознавания стадий сна и построения гипнограммы

В настоящее время данная задача в большинстве случаев решается специалистами вручную путем длительной визуальной обработки многочасовых записей динамики изменений физиологических показателей (исследований) Такой анализ является с одной стороны трудоемким и длительным, а с другой - субъективным Исследования показывают, что у различных экспертов совпадение гипнограмм может составлять от 67% до 91%, в частности, сравнение построенных вручную гипнограмм для двух здоровых взрослых испытуемых в десяти лабораториях в Японии выявило их совпадение между собой лишь на 67-75,3% Введение автоматизации процесса построения гипнограммы позволяет сэкономить большой объем рабочего времени, упростить работу специалистов в области исследования сна и сопутствующих ему процессов и явлений

Изучение и автоматизация процесса распознавания стадий сна и построения гипнограммы - одна из современных проблем, стоящих на пути внедрения вычислительной техники в процесс обработки полисомнологических исследований Данной теме был посвящен ряд работ Гийяр ЖМ, Тиссо Р 1973, Мартин В Б, Джонсон Л С 1972, Кувахара X 1988, Станус Е, Лакруа Б 1987, Каплан АЯ 1999, Хай-джонг П 2000, Агарвал Р, Готман Д 2001, Дорошенков Л Г 2007 Тем не менее, данная задача еще недостаточно проработна, и в рамках нее существует ряд ограничений и проблем, которые не позволяют говорить о полноценной применимости предложенных подходов.

Задача автоматизации процесса построения гипнограммы связана с рядом проблем Стандарты и рекомендации, которыми руководствуются врачи, ориентированы, в первую очередь, на визуальный анализ и интерпретацию исходных данных, что приводит к неоднозначности их представления в виде математической модели Длительность регистрации большого числа физиологических показателей приводит к получению больших объемов данных, что до недавнего времени являлось сдерживающим фактором на пути успешной автоматизации процесса обработки этих данных В настоящее время прогресс в области компьютерных технологий

г

позволяет манипулировать такими объемами данных, однако ограничения по применимости стандарта по-прежнему являются сдерживающим фактором на пути эффективного решения данной проблемы

В большинстве случаев для решения поставленной задачи использовались нейронные сети, что позволяло достичь практически значимой достоверности, однако процессы обучения и переобучения связаны с высокой вычислительной трудоемкостью, а дообучение на основе новых статистических данных приводит к существенному снижению чувствительности к данным предыстории В современной литературе присутствует информация об использовании скрытых сетей Маркова для построения гипнограммы, что также позволяет достичь сравнительно высокой достоверности в целом, однако не дает равномерного по достоверности распознавания всех стадий сна в отдельности при низких вероятностях проявления отдельных стадий сна и переходов между стадиями в гипнограмме

Необходимо отметить, что под достоверностью распознавания подразумевается процентное соотношение (или в пределах 0 + 1) суммарной длительности участков записи, для которых стадия сна, определённая экспертом, совпала со стадией сна, определенной автоматически, ко всей длительности записи

Обобщение современных научных и практических результатов в области автоматизации процесса распознавания стадий сна и построения гипнограммы позволяет выделить следующие основные требования к решению данной задачи

- высокая степень достоверности автоматического построения гипнограммы в целом, равномерность уровня достоверности по стадиям сна при сравнении с гипно-граммой, построенной экспертом,

- возможность адаптации алгоритма под различные классификации стадий сна и правила построения гипнограммы,

- применимость алгоритма к данным различных групп пациентов (например, физиологические паттерны сна у различных возрастных категорий испытуемых могут существенно отличаться, в частности, у грудных детей, как правило, выделяют не пять, а всего две стадии сна),

- возможность обучения на статистических данных с возможностью дообучения по мере получения новых данных,

- низкие требования к вычислительным ресурсам и, как следствие, возможность функционирования в реальном времени (в настоящее время рядом исследовательских организаций прорабатывается возможность создания автономного прибора мониторинга сна),

- информационное обеспечение автоматизации распознавания стадий сна и построения гипнограммы для эффективной работы врача,

- возможность использования широкого набора физиологических показателей, помимо тех, на которые ориентирован стандарт

Анализ достижений и обзор представленных в литературе методов решения данной задачи показал, что большинство методов не удовлетворяют всем перечисленным требованиям одновременно, а также, как правило, жёстко привязаны к какому-то одному стандарту В связи с этим решение комплексной задачи с обеспече-

нием указанных выше требований является актуальным и представляет практический интерес

Целью работы является разработка метода и алгоритмов, позволяющих расширить возможности автоматического распознавания стадий сна и построения гип-нограммы путем комплексной реализации требований к решению задачи распознавания, в том числе обеспечить высокий уровень достоверности результатов, применимость алгоритма для различных экспертов и групп пациентов с возможностью обучения и дообучения на основе накопления статистической информации, реализовать сочетание возможностей распознавания на единой теоретической основе, как с помощью типовых стандартов, так и с помощью экспертных оценок, снизить требования к вычислительным ресурсам, обеспечить возможность работы -врача в автоматизированном режиме

Объектом исследования являются методы и алгоритмы решения задачи автоматического распознавания стадий сна и построения гипнограммы

Методы исследования основаны на использовании таких разделов теоретической информатики, как распознавание образов, нечеткая логика, кластерный анализ, корреляционный анализ, сплайн-интерполяция, а также на использовании специальных алгоритмов формирования признаков при обработке физиологических сигналов

Научная новизна работы определяется следующими отличительными особенностями полученных существенных теоретических и практических результатов

1 Метод комплексного решения задачи распознавания стадий сна и построения гипнограммы, позволяющий обеспечить высокий уровень достоверности распознавания и улучшить равномерность значений достоверности по отдельным стадиям, отличающийся простотой адаптации к стандартам построения гипнограммы и настройки под индивидуальные особенности работы специалистов (экспертов), возможностью обучения и дообучения на статистических данных

2 Алгоритм обучения на основе статистических данных, отличающийся использованием принципов кластерного анализа для описания в многомерном пространстве распределений значений признаков с целью построения нечетких функций принадлежности, и алгоритм распознавания на основе элементов нечеткой логики, отличающийся возможностью обеспечения высокого уровня достоверности построения гипнограммы и равномерности значений достоверности распознавания отдельных стадий

3 Алгоритм дообучения на вновь полученных статистических данных, состоящий в коррекции вида функций принадлежности и отличающийся малыми вы-числительными.затратами

4 Методика и алгоритмизация аппроксимации функции принадлежности с помощью сплайна на основе дельта-преобразований второго порядка, отличающаяся возможностью обеспечения заданной точности аппроксимации и обеспечивающая

низкую вычислительную трудоёмкость и высокое быстродействие при решении задачи распознавания

Достоверность выводов и эффективность разработанного метода подтверждена проведением серий компьютерных экспериментов с применением базы клинических полисомнографических исследований, полученных с помощью сертифицированного оборудования, и построенных экспертами гипнограмм, апробацией на научных семинарах, публикацией результатов работ, внедрением полученных результатов Эффективность разработанного метода и алгоритмов обусловливается тем, что на основе экспериментов было получено подтверждение высокой достоверности результатов распознавания в диапазоне примерно 75-85%

Основные положения, выносимые на защиту:

метод распознавания стадий сна и построения гипнограммы,

• алгоритм построения нечетких функций принадлежности на основе кластерного анализа и статистических данных,

• алгоритм коррекции функции принадлежности с учетом новых статистических данных;

• алгоритмизация аппроксимации функции принадлежности с помощью сплайн-функции на основе дельта-преобразований второго порядка

Практическая ценность. Предложенные метод и алгоритмы имеют значимость для решения практической задачи распознавания стадий сна либо других психофизиологических состояний, которые могут быть описаны конечным числом вычисляемых показателей Особый интерес представляет использование полученных результатов в составе программно-методического обеспечения программно-аппаратного диагностического комплекса «Энцефалан» производства ООО НПКФ «Медиком МТД» Это обеспечивает расширение спектра возможностей по применению комплекса в области исследований сна и, как следствие, повышает научную и практическую ценность этого оборудования Кроме того, использование предлагаемого метода в арсенале возможностей по обработке физиологических данных значительно облегчает и ускоряет работу экспертов в автоматизированном режиме Низкая требовательность алгоритма к вычислительным ресурсам, а также гибкость и простота адаптации к различным требованиям обусловливают его широкие возможности с практической точки зрения Применения разработанных алгоритмов в сочетании с другими известными алгоритмами создают основу для эффективного комбинированного решения данной задачи

Реализация и внедрение результатов работы.

Результаты работы использованы

• в разработанном программно-методическом обеспечении «Электроэнцефалографические исследования» (подсистема «Сомнологические исследования») для прибора электроэнцефалографа-анализатора «Энцефалан», серийно выпускаемого ООО НПКФ «Медиком МТД»,

• в учебном процессе в Технологическом институте Южного федерального университета в г Таганроге (ТТИ ЮФУ) на кафедре Математического обеспечения и применения ЭВМ при подготовке студентов специальностей 230105 «Программное обеспечение вычислительной техники и автоматизированных систем» и 010503 «Математическое обеспечение и администрирование информационных систем», в дисциплинах «Системы искусственного интеллеета» и «Цифровое управление, сжатие и параллельная обработка информации на основе оптимизированных дельта-преобразований второго порядка»,

• в учебном процессе в Технологическом институте Южного федерального университета в г Таганроге (ТТИ ЮФУ) на кафедре Электрогидро-а^устической и медицинской техники при подготовке студентов по специальностям 200401 «Биотехнические и медицинские аппараты и системы» направления 200300 «Биомедицинская инженерия», в дисциплинах «Моделирование биологических процессов и систем» и «Управление в медицинских и биологических системах»

Использование результатов работы подтверждено актами об использовании

Апробация работы. Основные результаты работы докладывались и обсуждались на 5-ой международной конференции «Практикующий врач» (Италия, г Ри-мини, 9-16 сентября, 2006-й год), 4-ой ежегодной конференции студентов и аспирантов базовых кафедр Южного научного центра РАН (г Ростов-на-Дону, 9-18 апреля, 2008-й год), 50-ой студенческой конференции ТРТУ (г Таганрог, 20 марта, 2003-й год), 51-ой студенческой конференции ТРТУ (г Таганрог, 25 марта, 2004-й год), 55-ой студенческой научной конференции, посвященной 65-летию освобождения г Таганрога от немецко-фашистских захватчиков (г Таганрог, 27 марта, 2008-й год), всероссийской научно-технической конференции с международным участием «медицинские информационные системы» (г Таганрог, 11-14 сентября 2006-й год)

Публикации. Результаты работы были представлены в 11 публикациях, из них 4 статьи в ведущих реферируемых изданиях, рекомендованных ВАК, 2 статьи в прочих изданиях, 5 тезисов докладов

Структура и объем работы. Диссертация состоит из введения, 5-и глав, заключения, списка литературы и 4-х приложений Материалы работы изложены на 168 страницах машинописного текста, содержат 21 таблицу, 24 рисунка, 52 библиографических источника, 24 страниц приложений, 1 акт о внедрении и 2 акта об использовании в учебном процессе

Краткое содержание работы

Во введении дано обоснование актуальности темы диссертационной работы, описаны цель работы и основные научные положения, выносимые на защиту, определены круг задач, объект и предмет исследования, указаны методы исследования,

показаны научная новизна и практическая значимость, приведены сведения о внедрении результатов работы, дано общее описание выполненной работы

В первой главе описывается предметная область, даются базовые определения из области психофизиологии и сомнографии В частотности, определяется, что в процессе исследования сна (полисомнографического исследования) регистрируется широкий набор различных по своей природе физиологических показателей Обязательными сигналами для построения гипнограммы являются следующие типы сигналов- электроэнцефалограмма (ЭЭГ), электроокулограмма (ЭОГ) и электромио-грамма (ЭМГ). Другие физиологические показатели являются вспомогательными и в ряде случаев могут повысить надежность выявления стадий сна или достоверность диагностики тех или иных заболеваний Для исследования стадий сна вся запись сигналов разбивается на интервалы фиксированной длины, называемые эпохами Длина эпох может быть от 10 секунд до нескольких минут, наиболее распространенным стандартом считается длина эпохи, равная 30-ти секундам Для регистрации физиологических показателей в процессе сна используются сложные многопараметрические системы (в дальнейшем регистраторы), обеспечивающие регистрацию широкого спектра показателей В данной работе использовалось оборудование производства ООО НПКФ «Медиком МТД», в частности, мобильный автономный регистратор «Энцефалан-ЭЭГР-19/26»

Анализ полисомнограмм и определение стадий сна осуществляются в соответствии с критериями, предложенными группой экспертов под руководством А Rechtschaffen и А Kales (Manual of Standardized Termmology, Techniques, and Criteria for the Scoring of Stages of Sleep and Wakefiilness of Human Subjects - Washington, DC US Government Prmtmg Office, 1968 - NIH publication No 204) - R&K

Изложенное в первой главе позволяет сделать вывод, что задача автоматизации этого процесса представляется актуальной как с научной, так и с практической точки зрения по ряду причин

- Стандарт R&K, который используется для построения гипнограммы, ориентирован, в первую очередь, на визуальный анализ и интерпретацию исходных данных экспертами, из чего вытекает очевидная его неоднозначность при представлении в виде математической модели

- Большое число частично взаимосвязанных между собой признаков, описывающих процесс сна, и сложные правила, по которым строится гипнограмма, открывают простор для применения актуальных методов из таких областей теоретической информатики, как системы искусственного интеллекта, экспертные системы и интеллектуальные системы

- Длительность регистрации большого числа физиологических показателей приводит к получению больших объемов данных, что до недавнего времени являлось сдерживающим фактором на пути успешной автоматизации процесса обработки этих данных В настоящее время прогресс в области компьютерных технологий позволил с лёгкостью манипулировать такими объемами информации

Из вышесказанного следует, что ограничения компьютерного анализа полисо-многраммы, в частности, компьютеризированного построения гипнограмм, были

продиктованы, в основном, двумя причинами неоднозначностью стандарта Я&К и несовершенством компьютерных технологий В то время как ресурсы вычислительной техники не являются более ограничивающим фактором, несовершенство старого стандарта все еще представляет существенную проблему

Некоторые из подходов, которые будут рассмотрены далее, показывают приемлемую эффективность, однако они применимы только на ограниченной выборке пациентов, либо не обеспечивают достаточную точность, либо приводят к сложному процессу обучения, вследствие чего они не нашли признания в клинической среде Большая часть проблем обуславливается субъективностью того, как с помощью классификации Я&К обрабатываются переходные эпохи в разных лабораториях В дополнение к этому некоторые подходы требуют индивидуальную настройку порогов и коррекцию настроек алгоритмов для различных групп пациентов

Во второй главе формулируется постановка задачи и приводится обзор известных методов решения задачи распознавания стадий сна и построения гипно-граммы из открытых литературных источников По итогам обзора методов распознавания и классификации делается заключение, что в настоящее время не существует таких методов распознавания стадий сна, которые бы сочетали в себе высокую достоверность распознавания как всей гипнограммы в целом, так и каждой стадии в отдельности, гибкость настройки, обучение и дообучение на статистических данных, быстродействие и совместимость с любыми стандартами В частности, можно выделить следующие основные недостатки существующих методов распознавания и классификации

- вероятностные методы требуют априорного знания вида функции распределения вероятности, что не всегда возможно,

- использование нечеткой логики в чистом виде ведет к таким проблемам, как резкое возрастание сложности обучения и настройки системы (построения функций принадлежности классическими методами) с ростом числа параметров, описывающих ее состояние, отсутствие возможности математического анализа разработанной системы, отсутствие преимущества в достоверности по сравнению с вероятностными методами,

- нейросетевые модели, наиболее часто применяемые для решения задачи автоматизированного распознавания стадий сна, отличаются тем, что дообучение на основе новых статистических данных приводит к существенному снижению чувствительности к данным предыстории, а также отсутствием информативности и наглядности;

- алгоритмы кластерного анализа и корреляционный анализ зачастую сопряжены с перебором (часто неоднократным) всех статистических значений, что может быть весьма трудоемким процессом, эффективное автономное использование данных видов анализа не имеет подтверждения по литературным источникам,

- в современной литературе присутствует информация об использовании скрытых сетей Маркова для построения гипнограммы, что также позволяет достичь сравнительно высокой достоверности в целом, однако не дает равномерного по дос-

товерности распознавания всех стадий сна в отдельности при низких вероятностях проявления отдельных стадий сна и переходов между стадиями в гипнограмме.

Отмечается, что методы статистической обработки и расчета показателей, применяемые для анализа психофизиологических данных, не всегда адекватны решаемым задачам В частности, применение спектрального анализа для расчета индексов выраженности ритмов ЭЭГ нельзя считать полностью оправданным, т к результаты, которые могут быть получены с его помощью, существенно отличаются от тех, которые бы получил эксперт, проводящий визуальный анализ и руководствующийся физиологическими определениями ЭЭГ-ритмов. Связано это с тем, что эксперт оценивает непосредственно отношение времени, в течение которого наблюдались волны соответствующей частоты и амплитуды, к длительности всего анализируемого участка В отличие от этого, спектральный анализ позволяет оценить зависимость того или иного спектрального показателя (амплитуды, мощности, фазы и др) от частоты, и только в дальнейшем, косвенным образом, путем анализа определенных частотных диапазонов для каждой полученной спектральной характеристики могут быть получены обобщенные спектральные показатели, такие как индекс выраженности ЭЭГ-ритмов Учитывая это, и то, что помимо тех признаков, которыми оперирует стандарт Я&К (таких как индексы ритмов ЭЭГ), современное диагностическое оборудование позволяет регистрировать и рассчитывать широкий спектр других показателей, целесообразно разработать такой метод, который позволял бы оперировать любыми информативными показателями

Учитывая перечисленное выше, формируются требования к разрабатываемому методу распознавания стадий сна и построения гипнограмммы для решения поставленной задачи

В третьей главе осуществляется синтез метода и алгоритмов распознавания стадий сна и построения гипнограммы Сущность данного метода можно разделить на следующие составляющие

• обработка первичных данных, регистрируемых многофункциональной диагностической системой и расчет вторичных показателей,

• статистическая обработка данных и определение базовых свойств распределения каждого из вторичных показателей для каждой из стадий сна (обучение),

• для каждой эпохи исследования выполнение оценки того, насколько ее набор вторичных показателей близок к признакам каждой из известных стадий сна, и выбор наиболее близкой стадии сна (распознавание),

• верификация полученной гипнограммы, проверка ее на соответствие заданным правилам,

• коррекция выявленных на втором шаге закономерностей с учетом вновь полученных статистических данных с целью повышения точности работы алгоритма (дообучение)

В качестве признаков, по которым производится распознавание, используются индексы выраженности ритмов, рассчитанных на основе спектральных характеристик ЭЭГ сигналов, признаков наличия информативных графоэлементов Для выяв-

и

ления быстрых движений глаз используется расчет коэффициента корреляции между двумя отведениями ЭОГ Для выявления сонных веретен и К-комплексов используется периодометрический анализ Рассчитываются спектральные характеристики электроокулограммы и электромиограммы Численный расчет признаков алгоритмически осуществляется в соответствии с известными стандартами.

Для решения задачи распознавания разработан и реализован алгоритм построения функции принадлежности на основе эталонной объективной информации, базирующийся на принципах кластерного анализа Оценка степени принадлежности значения ]-го нормированного параметра одному из множества эталонных состояний (стадий сна) выполняется на основе вычисления нормированной величины, обратной квадрату евклидова расстояния от этого значения до каждого из статистических значений параметров для 5-ой стадии сна.

1 .Ifrv4.No.

Li'sj-'lJ

где - значение параметра, для которого оценивается степень принадлежности, эталонное значение параметра, полученное в результате 1-го статистического замера, 5 - номер стадии сна, j - номер параметра (у = 1 ,М), М- количество параметров, Ns - количество эпох, классифицированных как стадия сна S(S = 1,L), I-количество стадий сна, /j(tSj) - искомая функция принадлежности для /-го параметра и 5-ой стадии сна Нормированные значения tSj или /"„ соответствуют диапазону 0-1

Данную оценку можно считать соответствующей методу взвешенного попарного среднего (Weighted Pair Group using arithMetic Averages - WPGMA) для определения расстояния между кластерами, но с той особенностью, что один из кластеров состоит из всего лишь одного элемента Данный подход имеет существенное преимущество перед другими статистическими методами построения функций принадлежности в том, что в расчете каждой функции принадлежности учитывается абсолютно весь набор статистической информации В рамках алгоритма предусматривается также возможность уточнения функции принадлежности по мере поступления новых данных, что позволяет производить в процессе работы дообучение

Q ('*) = —-'-.

где <2 - уточнённое значение функции £>(г,,;), (Э(ц) - значение функции принадлежности для значения параметра до получения новых эталонных результатов измерений, Л^ - количество вновь полученных результатов замера значения у-г<? параметра для эпох стадии сна 4', - значение параметра, полученное в результате г'-го замера из новой серии замеров. \

Пример функций принадлежности, сформированных для гЛ). е [0,1], и используемых при их построении эталонных статистических значений параметров представлен на рисунке 1.

После накопления статистических данных для аппроксимации функций принадлежности строятся соответствующие сплайны. Алгоритм выбора узловых точек базируется на методе половинного деления и позволяет достичь гарантированной точности построения сплайна.

53 Ц Р С !!,?«. )) 53 « 1 401 г с 1 >г9, ?-' к -Г—. ... I

1 1 1 53 '1 II 11 1 111111111 р|| |||| 1

1 (100.001 ч Ю.001 1 110000)

Рис. 1. Примеры функций принадлежности

Процесс распознавания базируется на использовании полученных функций принадлежности для оценки близости показателей очередной эпохи к известным стадиям сна:

м

где М~ количество параметров; ¡и (л,.) - функция принадлежности, рассчитанная для параметра у и стадии сна - значение параметра, относительно которого производится распознавание. Максимальное результирующее значение функции принадлежности гшах^Р,) позволяет определить, к какой стадии сна 5 необходимо отнести текущую эпоху.

Помимо автоматического формирования нечётких функций принадлежности предусмотрена возможность задания их в ручном режиме.

Для повышения быстродействия алгоритмов распознавания и обучения функция (3 вычисляется однократно и в дальнейшем аппроксимируется с помощью сплайна на основе дельта-преобразований второго порядка, что избавляет от необ-

ходимости иметь доступ ко всей статистике и производить полный перерасчет значений функций принадлежности На первом этапе для построения сплайна выбираются три узловые точки, соответствующие минимальному и максимальному значениям признака, а также точка, соответствующая максимальному значению функции На втором этапе в центрах интервалов между этими точками осуществляется вычисление значения сплайна и, если оно отличается от значения функции принадлежности более, чем на заданное значение ошибки е, то в этих местах также добавляются узловые точки В дальнейшем этот процесс повторяется до тех пор, пока разность между сплайном и функцией на всем множестве значений признака не будет ниже заданного значения ошибки

При использовании режима дообучения сплайн строится по результирующей функции принадлежности (3 (1,у)

Основными достоинствами разработанного метода являются

• высокая точность описания стадий сна в многомерном параметрическом пространстве, достигаемая за счет применения методов кластерного анализа,

• достоверность вывода, в том числе и на переходных эпохах, обеспечиваемая за счет применения нечеткой логики,

• возможность дообучения по мере поступления новых данных, связанного с малыми вычислительными затратами,

• высокое быстродействие алгоритма распознавания, т к все операции, необходимые для определения стадии сна текущей эпохи по ее признакам, сравнительно просты и не требуют значительных вычислительных ресурсов,

• минимальные требования к объему данных для хранения результатов обучения и возможность получения повышенного быстродействия обработки функций принадлежности обеспечиваются за счет применения сплайн-интерполяции,

• низкая чувствительность к отклонениям некоторых параметров от характеристик обучающей выборки,

• обеспечение равномерной достоверности распознавания всех стадий сна вне зависимости от объема обучающей выборки

Сравнение с известными методами показало, что

• в отличие от Байесовского подхода к решению задачи классификации разработанный метод не требует априорного знания вида функции распределения вероятности,

• в отличие от систем, обучение которых происходит в диалоге с экспертом, и систем, основанных на нечеткой логике, разработанный метод позволяет получить более высокую достоверность построения функций принадлежности,

• в отличие от классических алгоритмов кластерного анализа не требуется сканирование всего множества значений при определении принадлежности нового элемента к кластеру, а также упрощен процесс обработки добавления новых экспериментальных данных,

• в отличие от нейросетевого подхода разработанный метод лишен таких недостатков, как высокая вычислительная трудоемкость обучения и переобучения Метод более информативен, т к имеется возможность визуализации функций принадлежности, которые сами по себе несут смысловую нагрузку В то же время, в процессе функционирования обученной системы, метод при распознавании обладает малой вычислительной трудоемкостью, как и нейросетевой метод

• в отличие от метода, базирующегося на использовании скрытых сетей Маркова, в основе разработанного метода не используются вероятности появления состояний и переходов из состояния в состояние, что создает предпосылки для обеспечения равномерности достоверности распознавания

В четвертой главе рассматривается программная реализация разработанного метода предназначенная для построения гипнограммы, и позволяющая эффективно и наглядно осуществлять обучение на статистических данных и распознавание стадий сна В архитектуру программы заложен принцип модульности, что позволяет с легкостью реализовывать альтернативные методы расчета и визуализации. Данная программная модель реализуется в составе программно-аппаратного комплекса «Энцефапан» Разработанная модель реализует следующие алгоритмы

• Импорт данных при взаимодействии с внешними программами, в частности, получение расчетных показателей из программного обеспечения «Энецефалан»

• Автоматическое построение функций принадлежности на основании экспертных данных

• Коррекция функций принадлежности с учетом вновь полученных данных

• Задание функций принадлежности вручную, согласно стандартам

• Статистическая обработка распределений значений расчетных показателей

• Представление функций принадлежности в виде сплайнов

• Распознавание стадий сна и построение гипнограммы

• Анализ достоверности построенной гипнограммы

• Анализ достоверности выявления каждой из стадий сна

• Вывод табличных данных результатов проводимых экспериментов Расчет признаков стадий сна по п 1 для каждой эпохи полисомнографическо-

го исследования выполняется программным обеспечением «Энецефалан 131-01» в соответствии с описанными выше методиками

В пятой главе описываются исследования и эксперименты, подтверждающие работоспособность разработанного метода

В ходе экспериментальных исследований была поставлена задача подтверждения работоспособности предлагаемого метода и оценки его возможностей с помощью базы данных клинических полисомнографических исследований в качестве экспериментальной Всего в базе находилось 7 исследований, построенных 3-мя экспертами для 7-ми различных пациентов Также использовалась международная

база физиологических данных www.PhysioNet.org, в которой имеются 8 исследований с построенными гипнограммами, выполненные 2-мя группами исследователей. В качестве основных задач экспериментальных исследований были выделены следующие:

• оценка влияния на достоверность распознавания маскирования признаков и различных способов определения расстояния в многомерном пространстве;

« определение предельных качественных возможностей метода при работе с данными, полученными от различных экспертов для различных пациентов;

• выработка рекомендаций по наиболее эффективному использованию разработанного метода.

Экспериментальное исследование достоверности распознавания, в ходе которого при формировании обучающей выборки использовались последовательно все исследования из базы www.PhysioNet.org, позволило получить среднюю достоверность распознавания 79,29%. Результаты исследования приведены в таблице 1.

Таблица 1. Сводные данные достоверности распознавания

№ Имя файла Достоверность(%)

1 зс4002е0 88,23

2 5с4012е0 88,00

3 5с4102е0 74,00

4 вс4112е0 87,16

5 73,12

6 в1705230 77,83

7 51712130 72,75

8 31713230 73,24

Среднее: 79,29

Сравнительный анализ гипнограмм для исследования зс4002е0 (строка 1 таблицы 1), построенных для этого исследования экспертом вручную и автоматически, приведён на рис. 2. Точность выявления стадий сна для этого исследования приведена в таблице 2.

Рис 2. Сравнительный анализ гипнограмм, построенных вручную (вверху) и автоматически (внизу)

Из таблицы 2 наблюдаем отсутствие существенных падений уровня достоверности по отдельным стадиям сна, что подчеркивает относительную равномерность распределения достоверности распознавания

Таблица 2. Точность распознавания стадий для исследования 5с4002е0

Бс4002е0 Автоматическое распознавание

XV 82 83 84 Я

Визуальный анализ \У 0 945 0011 0 005 0 001 0 001 0 038

Б1 0017 0 661 0 119 0 000 0017 0 186

Б2 0 021 0 193 0 678 0 099 0 000 0 008

83 ООП 0 000 0 096 0 734 0160 0 000

84 0 000 0 000 0 000 0 133 0 867 0 000

а 0 005 0 353 0 028 0 000 0 000 0 614

Исследования с применением базы данных клинических исследований, полученных с помощью оборудования фирмы ООО НПКФ «Медиком-МТД», позволили сформировать обучающую выборку из 3-х наиболее качественно построенных исследований Результаты сведены в таблицу 3

Таблица 3. Достоверность распознавания при использовании в качестве обучающей выборки наиболее качественно построенных исследований_

Распознаваемая выборка Достоверность распознавания

Исследования №№ 4, 6 и 7, обучение на них же 79,75%

Все исследования, обучение на исследованиях №4, №6 и №7 71,18%

Исследование №6, обучение на исследованиях №4 и №7 74,65%

Проведенные в данной таблице результаты экспериментальных исследований показали работоспособность алгоритма и применимость его к различным наборам данных Получено в среднем 75% совпадений между экспертными заключениями и результатами работы разработанной программной системы в условиях однородной выборки пациентов (принадлежащих к одной возрастной группе) и обучения на данных, подготовленных одним и тем же экспертом Это является приемлемым результатом для практического применения метода

Также проведены исследования влияния способов определения расстояния в многомерном пространстве на достоверность распознавания В частности, было проведено сравнение представления в виде квадрата евклидова расстояния и «расстояния городских кварталов» Получено улучшение достоверности распознавания в преимущественном количестве экспериментов до 10%

По результатам экспериментов можно сделать следующие заключения

Поскольку в основе предложенного метода используется обучение на экспертных данных (обучение с учителем), итоговая достоверность распознавания существенно зависит от качества этих данных Квалификация эксперта и то, насколько качественно им построена гипнограмма, используемая в качестве обучающей выборки, является определяющем моментом для дальнейшего успеха распознавания

Размер обучающей выборки влияет на распознавание Использование в качестве обучающей выборки комбинации исследований позволило добиться повышения точности распознавания

Применение квадрата евклидова расстояния в качестве меры расстояния обеспечивает лучшие результаты, поскольку позволяет придать вес отдаленным объектам в распределениях признаков

Увеличение числа информативных показателей, применяемых в процессе распознавания, положительно влияет на точность распознавания.

В заключении подводится итог проделанной работе, делаются выводы, перечисляются основные результаты

Сформулированы базовые принципы работы метода автоматического распознавания стадий сна и построения гипнограммы В отличие от известных методов классификации стадий сна, в разработанном методе реализован алгоритм обучения на статистических данных с элементами кластерного анализа и нечеткий логический вывод Такая комбинация подходов позволяет использовать все преимущества кластерного анализа при формальном описании стадий сна в пространстве признаков и возможности нечеткой логики по корректной обработке переходных состояний Метод характеризуется достаточной для работы врачей-сомнологов достоверностью построения гипнограммы и равномерностью распределения достоверности выявления стадий сна независимо от количества соответствующих им эпох

Предложен алгоритм обучения, обеспечивающий построение функций принадлежности на основе статистической информации с применением кластерных методов и нечеткой логики, отличающийся от аналогов возможностью учета всей статистической информации и обеспечением высокой точности описания предметной области с помощью нечетких логических правил, а также обладающий возможностью дообучения.

Предложена методология алгоритмизации представления с помощью сплайнов функций принадлежности, формируемых как с помощью статистических данных, так и задаваемых вручную

Разработаны программные средства, реализующая предложенные метод и алгоритмы, позволяющая автоматизировать процесс распознавания стадий сна и построения гипнограммы и функционирующая в составе программно-аппаратного комплекса «Энцефалан»

Проведены экспериментальные исследования, подтверждающие работоспособность предложенного метода

В приложении приводится иллюстративный материал, отображающий распределения значений физиологических параметров (признаков) и корреляционные

связи между ними и стадиями сна, примеры построенных функций принадлежности, примеры физиологических данных, соответствующих различным стадиям сна, примеры гипнограмм и примеры файлов данных

Таким образом, можно считать, что совокупность полученных в диссертации результатов является решением важной научно-технической задачи расширения возможностей автоматического распознавания стадий сна и построения гипнограм-мы путем комплексной реализации требований к решению задачи распознавания, т е поставленная цель исследований достигнута

Список работ по теме диссертационной работы

Публикации в ведущих рецензируемых изданиях рекомендованных ВАК Е С Захаров, П П Кравченко, А А Скоморохов «О решении задачи классификации стадий сна» Журнал «Вестник компьютерных и информационных технологий» Москва, Издательство «Машиностроение» , №5/2008, с 48-53

Е С Захаров, П П Кравченко, А А Скоморохов «Метод автоматизированного построения гипнограммы» Журнал «Известия ТПУ», Томск, Издательство Томского Политехнического Университета, т 311 , №5/2007, с 136-139

Скоморохов А А, Захаров Е С «Полисомнографические исследования и задача автоматизированного построения гипнограммы» Известия ТРТУ Тематический выпуск «Медицинские информационные системы» Таганрог Изд-во ТРТУ, 2006 №11(66), с 135-138

Городецкий И Г, Захаров Е С , Пономарева Е С «Опыт применения программно-аппаратной модели операторской деятельности в составе комплекса Реа-кор» Известия ТРТУ Тематический выпуск «Медицинские информационные системы» Таганрог Изд-во ТРТУ. № 11(66), 2006 г, с 3-4 Публикации в остальных изданиях

Городецкий И Г, Захаров Е С, Скоморохов А А «Исследование и оценка психофизиологического состояния человека-оператора в процессе выполнения совмещенной операторской деятельности» Сборник трудов шестой международной научно-практическая конференция «Пилотируемые полеты в космос» Москва, Звездный Городок 2006, с 267-269

Пономарева Е С , Захаров Е С , Скоморохов А А «Анализ психофизиологического состояния человека-оператора в процессе выполнения совмещенной операторской деятельности» Материалы 14-ой Международной конференции по нейро-кибернетике, посвященной 60-тилетию Победы советского народа в Великой Отечественной войне и 90-летию Ростовского государственного университета «Проблемы нейрокибернетики», Ростов-на-Дону, изд-во ООО "ЦВВР", т 1,2005, с 179-183

Городецкий И Г , Захаров Е С, Скоморохов А А «Адаптивная модель операторской деятельности в составе реабилитационного психофизиологического комплекса Реакор как средство оценки психофизиологического состояния оператора» Сборник трудов, Пятый Международный Аэрокосмический Конгресс, 1АС2006, Москва, 2 стр

Городецкий И Г, Захаров Е С, Скоморохов А А «Адаптивная модель совмещенной деятельности человека оператора в составе программно-аппаратного комплекса Реакор» Известия ТРТУ Тематический выпуск «Медицинские информационные системы» Таганрог- Изд-во ТРТУ, 2004 №6 с 36-39

Городецкий И Г, Захаров Е С , Скоморохов А А «Экспериментальные исследования и анализ психофизиологического состояния и деятельности человека-оператора» Известия ТРТУ Тематический выпуск «Медицинские информационные системы» Таганрог Изд-во ТРТУ, 2004 №6 с 39-42

Городецкий^И Г , Скомрохов А А, Артемов И В , Захаров Е С , «Адаптивная модель совмещенной деятельности человек-оператора» Инженерно-физические проблемы новой техники (с участием представителей стран СНГ), 20-22 мая, 2004, материалы 7-го всероссийского совещания семинара, Изд-во МГТУ им Н Э. Баумана с 70-71

Городецкий И Г, Захаров Е С , Матцкевич В А, Дорохов В Б, «Адаптивная модель операторской деятельности» Сборник трудов третьей международной конференции по когнитивной науке Москва 20-25 июня 2008-го года Тезисы доклада, т 1 с 239

Личный вклад автора в работах, написанных в соавторстве, состоит в следующем в работах [1] и [3] - синтез метода автоматизированного построения гипно-граммы, сочетающего в себе методы кластерного анализа и нечеткую логику, разработка программной модели и проведение экспериментальных исследований, в работе [2] предложен метод автоматизированного построения гипнограммы, основанный на сегментировании исходной записи по ЭЭГ-сигналу, в работе [8] составлен обзор современных методов автоматизированного построения гипнограммы, в работах [4], [5]. [6], [7], [9], [10], [11] и [12] - разработка программной реализации адаптивной модели совмещенной операторской деятельности, статистическая обработка экспериментальных данных, а также разработка методов автоматизированного распознавания и классификации психофизиологических феноменов и состояний

Соискатель Захаров Евгений Сергеевич

Тип ТТИЮФУ Заказ тир 100 экз

«

Оглавление автор диссертации — кандидата технических наук Захаров, Евгений Сергеевич

ВВЕДЕНИЕ.

ГЛАВА 1 СОВРЕМЕННОЕ СОСТОЯНИЕ ТЕОРЕТИЧЕСКОГО И АППАРАТНОГО ОБЕСПЕЧЕНИЯ ИССЛЕДОВАНИЙ СНА.

1.1. Исторические предпосылки и сущность задачи исследований сна.

1.2. Типы сигналов и характеристики регистрируемых физиологических показателей.

1.2.1. Электроэнцефалограмма.

1.2.2. Движения глаз (электроокулограмма, ЭОГ).

1.2.3. Мышечная активность (электромиограмма, ЭМГ).

1.2.4. Электрокардиограмма.

1.2.5. Дыхание.

1.2.6. Кожно-гальваническая реакция.

1.2.7. Уровень содержания кислорода в крови (Sp02).

1.3. Оборудование, применяемое для проведения полисомнографических исследований.

1.3.1. Общие сведения.

1.3.2. Каналы ЭЭГ, ЭМГ, ЭОГ и ЭКГ.

1.3.3. Канал рекурсии дыхания.

1.3.4. Канал положения тела.

1.3.5. Диктофон.

1.3.6. Регистрация данных, временная разметка записи.

1.3.7. Измерение амплитудно-временных и спектральных параметров ЭЭГ-сигнала.

1.3.8. Программное обеспечение.

1.4. Расчётные физиологические показатели, применяемые для решения задачи распознавания стадий сна.

1.5. Классификация стадий сна согласно стандарту R&K.

1.5.1. Стадия бодрствования (W).

1.5.2. Первая стадия сна (S1).

1.5.3. Вторая стадия сна (S2).

1.5.4. Третья стадия сна (S3).

1.5.5. Четвертая стадия сна (S4).

1.5.6. Стадия REM.

1.5.7. Сочетание стадии REM и других стадий сна.

1.5.8. Время движения.

1.5.9. ЭЭГ-активации.

1.5.10. Сводная таблица признаков стадий сна.

1.6. Выводы.

ГЛАВА 2 МЕТОДЫ РАСПОЗНАВАНИЯ СТАДИЙ СНА И ПОСТРОЕНИЯ ГИПНОГРАММЫ.

2.1. Анализ задачи классификации стадий сна и построения гипнограммы.

2.2. Обзор литературы по вопросам задачи распознавания стадий сна и построения гипнограммы

2.3. Общие принципы работы, классификация и базовые подходы, применяемые для распознавания данных многопараметрической диагностической системы.

2.3.1. Использование методов кластерного анализа для решения задач классификации.

2.3.2. Применение корреляционного анализа для решения задач классификации.

2.3.3. Нейросетевой подход к решению задачи распознавания стадий сна.

2.4. Использование аппарата нечёткой логики для решения задач классификации.

2.5. Методы обработки данных, получаемых с помощью многопараметрической диагностической системы.

2.5.1. Методы математической обработки электроэнцефалограмм.

2.5.2. Применение периодометрического анализа для исследования распределения значений размаха амплитуд сигналов ЭЭГ и поиска специфических графоэлементов.

2.6. Выводы.

ГЛАВА 3 РЕШЕНИЕ ЗАДАЧИ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ СТАДИЙ СНА И ПОСТРОЕНИЯ ГИПНОГРАММЫ

3.1. Сущность предлагаемого метода автоматического распознавания стадий сна и построения гипнограммы.

3.2. Обучение и дообучение на статистических данных.

3.3. Распознавание стадии сна и верификация полученной гипнограммы.

3.4. Представление функции принадлежности с помощью сплайнов.

3.5. Задание стандартов построения гипнограммы с распознаванием.

3.6. Полный алгоритм автоматического распознавания стадий сна и построения гипнограммы

3.7. Выводы.

ГЛАВА 4 РАЗРАБОТКА ПРОГРАММНОЙ МОДЕЛИ.

4.1. Структурная схема реализации алгоритма работы системы автоматического распознавания стадий сна н построения гипнограммы.

4.2. Структурные схемы программы.

4.3. Особенности программной реализации.

4.3.1. Структура классов.

4.3.2. Структуры данных.

4.3.3. Пользовательский интерфейс.

4.4. Реализация метода автоматического построения гипнограммы в составе программно-аппаратного диагностического комплекса «Энцефалан 131-01».

4.5. Выводы.

ГЛАВА 5 РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ.

5.1. Методика проведения экспериментальных исследований.НО

5.2. Распознавание по полному набору вторичных показателей.

5.3. Распознавание с обучением по одному исследованию.

5.4. Распознавание по выборочному набору вторичных показателей.

5.5. Исследование влияния логического вывода на достоверность распознавания.

5.6. Исследование влияния способа оценки расстояния в пространстве признаков на достоверность распознавания.

5.7. Исследование влияния на достоверность распознавания индивидуальных особенностей экспертов и состава выборки исходных статистических данных.

5.8. Распознавание с использованием максимального набора вторичных показателей.

5.9. Эксперименты с данными из базы PhysioNet.

5.9.1. Общая информация.

5.9.2. Обучение и распознавание на одном файле.

5.9.3. Исследование sc4002e0.

5.9.4. Исследование sc4012e0.

5.9.5. Исследование sc4102e0.

5.9.6. Исследование sc4112е0.

5.9.7. Исследование st7022j0.

5.9.8. Исследование st7052j0.

5.9.9. Исследование st712 ljO.

5.9.10. Исследование st7132j0.

5.9.11. Обучение на всех, распознавание всех.

5.9.12. Обучение на всех, распознавание каждого.

5.9.13. Обучение на каждом, распознавание каждого.

5.10. Выводы.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Захаров, Евгений Сергеевич

Актуальность проблемы. Современное состояние вычислительной техники и микропроцессорных технологий позволяет применять диагностическое оборудование, способное регистрировать и обрабатывать широкий спектр физиологических показателей на протяжённых промежутках времени. Это, в свою очередь, предоставляет специалистам возможность детально исследовать жизнедеятельность организма человека в различных состояниях: в процессе выполнения специфической деятельности, при воздействии на организм всевозможных нагрузок, в процессе сна. Результатом таких исследований являются длительные записи физиологических сигналов, которые необходимо обрабатывать - выявлять специфические признаки и осуществлять с их помощью классификацию различных сегментов исходной записи сигналов по определённым критериям. Одной из актуальных и интересных с научной и практической точки зрения задач в этой области является задача распознавания стадий сна и построения гипнограммы.

В настоящее время данная задача в большинстве случаев решается специалистами вручную путём длительной визуальной обработки многочасовых записей динамики изменений физиологических показателей (исследований). Такой анализ является с одной стороны трудоёмким и длительным, а с другой — субъективным. Исследования показывают, что у различных экспертов совпадение гипнограмм может составлять от 67% до 91%, в частности, сравнение построенных вручную гипнограмм для двух здоровых взрослых испытуемых в десяти лабораториях в Японии выявило их совпадение между собой лишь на 67-75,3%. Введение автоматизации процесса построения гипнограммы позволяет сэкономить большой объём рабочего времени, упростить работу специалистов в области исследования сна и сопутствующих ему процессов и явлений.

Изучение и автоматизация процесса распознавания стадий сна и построения гипнограммы - одна из современных проблем, стоящих на пути внедрения вычислительной техники в процесс обработки полисомнологических исследований. Данной теме был посвящен ряд работ: Гийяр Ж.М., Тиссо Р. 1973; Мартин В.Б., Джонсон Л.С. 1972; Кувахара X. 1988; Станус Е., Лакруа Б. 1987; Каплан А.Я 1999; Хайджонг П. 2000; Агарвал Р, Готман Д. 2001; Дорошенков Л.Г. 2007. Тем не менее, данная задача еще недостаточно проработна, и в рамках неё существует ряд ограничений и проблем, которые не позволяют говорить о полноценной применимости предложенных подходов.

Задача автоматизации этого процесса построения гипнограммы связана с рядом проблем. Стандарты и рекомендации, которыми руководствуются врачи, ориентированы, в первую очередь, на визуальный анализ и интерпретацию исходных данных, что приводит к неоднозначности их представления в виде математической модели. Длительность регистрации большого числа физиологических показателей приводит к получению больших объемов данных, что до недавнего времени являлось сдерживающим фактором на пути успешной автоматизации процесса обработки этих данных. В настоящее время прогресс в области компьютерных технологий позволяет манипулировать такими объёмами данных, однако ограничения по применимости стандарта по-прежнему являются сдерживающим фактором на пути эффективного решения данной проблемы.

В большинстве случаев для решения поставленной задачи использовались нейронные сети, что позволяло достичь практически значимой достоверности, однако процессы обучения и переобучения связаны с высокой вычислительной трудоёмкостью, а дообучение на основе новых статистических данных приводит к существенному снижению чувствительности к данным предыстории. В современной литературе присутствует информация об использовании скрытых сетей Маркова для построения гипнограммы, что также позволяет достичь сравнительно высокой достоверности в целом, однако не даёт равномерного по достоверности распознавания всех стадий сна в отдельности при низких вероятностях проявления отдельных стадий сна и переходов между стадиями в гипнограмме.

Необходимо отметить, что под достоверностью распознавания подразумевается процентное соотношение (или в пределах 0 1) суммарной длительности участков записи, для которых стадия сна, определённая экспертом, совпала со стадией сна, определённой автоматически, ко всей длительности записи.

Обобщение современных научных и практических результатов в области автоматизации процесса распознавания стадий сна и построения гипнограммы позволяет выделить следующие основные требования к решению данной задачи:

• высокая степень достоверности автоматического построения гипнограммы в целом, равномерность уровня достоверности по стадиям сна при сравнении с гипнограммой, построенной экспертом;

• возможность адаптации алгоритма под различные классификации стадий сна и правила построения гипнограммы;

• применимость алгоритма к данным различных групп пациентов (например, физиологические паттерны сна у различных возрастных категорий испытуемых могут существенно отличаться; в частности, у грудных детей, как правило, выделяют не пять, а всего две стадии сна);

• возможность обучения на статистических данных с возможностью дообучения по мере получения новых данных;

• низкие требования к вычислительным ресурсам и, как следствие, возможность функционирования в реальном времени (в настоящее время рядом исследовательских организаций прорабатывается возможность создания автономного прибора мониторинга сна);

• информационное обеспечение автоматизации распознавания стадий сна и построения гипнограммы для эффективной работы врача;

• возможность использования широкого набора физиологических показателей, помимо тех, на которые ориентирован стандарт.

Анализ достижений и обзор представленных в литературе методов решения данной задачи показал, что большинство методов не удовлетворяют всем перечисленным требованиям одновременно, а также, как правило, жёстко привязаны к какому-то одному стандарту. В связи с этим решение комплексной задачи с обеспечением указанных выше требований является актуальным и представляет практический интерес.

Целью работы является разработка метода и алгоритмов, позволяющих: расширить возможности автоматического распознавания стадий сна и построения гипнограммы путём комплексной реализации требований к решению задачи распознавания, в том числе обеспечить высокий уровень достоверности результатов, применимость алгоритма для различных экспертов и групп пациентов с возможностью обучения и дообучения на основе накопления статистической информации; реализовать сочетание возможностей распознавания на единой теоретической основе, как с помощью типовых стандартов, так и с помощью экспертных оценок; снизить требования к вычислительным ресурсам.

Объектом исследования являются методы и алгоритмы решения задачи автоматического распознавания стадий сна и построения гипнограммы.

Методы исследования основаны на использовании таких разделов теоретической информатики, как распознавание образов, нечёткая логика, кластерный анализ, корреляционный анализ, сплайн-интерполяция, а также на использовании специальных алгоритмов формирования признаков при обработке физиологических сигналов.

Научная новизна работы определяется следующими отличительными особенностями полученных существенных теоретических и практических результатов:

1. Метод комплексного решения задачи распознавания стадий сна и построения гипнограммы, позволяющий обеспечить высокий уровень достоверности распознавания и улучшить равномерность значений достоверности по отдельным стадиям, отличающийся простотой адаптации к стандартам построения гипнограммы и настройки под индивидуальные особенности работы специалистов (экспертов), возможностью обучения и дообучения на статистических данных.

2. Алгоритм обучения на основе статистических данных, отличающийся использованием принципов кластерного анализа для описания в многомерном пространстве распределений значений признаков с целью построения нечётких функций принадлежности, и алгоритм распознавания на основе элементов нечёткой логики, отличающийся возможностью обеспечения высокого уровня достоверности построения гипнограммы и равномерности значений достоверности распознавания отдельных стадий.

3. Алгоритм дообучения на вновь полученных статистических данных, состоящий в коррекции вида функций принадлежности и отличающийся малыми вычислительными затратами.

4. Методика и алгоритмизация аппроксимации функции принадлежности с помощью сплайна на основе дельта-преобразований второго порядка, отличающаяся возможностью обеспечения заданной точности аппроксимации и обеспечивающая низкую вычислительную трудоёмкость и высокое быстродействие при решении задачи распознавания.

Достоверность выводов и эффективность разработанного метода подтверждена проведением серий компьютерных экспериментов с применением базы клинических полисомнографических исследований, полученных с помощью сертифицированного оборудования, и построенных экспертами гипнограмм, апробацией на научных семинарах, публикацией результатов работ, внедрением полученных результатов. Эффективность разработанного метода и алгоритмов обусловливается тем, что на основе экспериментов было получено подтверждение высокой достоверности результатов распознавания ~85%.

Основные положения, выносимые на защиту:

• метод распознавания стадий сна и построения гипнограммы;

• алгоритм построения нечётких функций принадлежности на основе кластерного анализа и статистических данных;

• алгоритм коррекции функции принадлежности с учётом новых статистических данных;

• алгоритмизация аппроксимации функции принадлежности с помощью сплайн-функции на основе дельта-преобразований второго порядка.

Практическая ценность. Предложенные метод и алгоритмы имеют значимость для решения практической задачи распознавания стадий сна либо других психофизиологических состояний, которые могут быть описаны конечным числом вычисляемых показателей. Особый интерес представляет использование полученных результатов в составе программно-методического обеспечения программно-аппаратного диагностического комплекса «Энцефалан 131-01» производства ООО НПКФ «Медиком МТД». Это обеспечивает расширение спектра возможностей по применению комплекса в области исследований сна и, как следствие, повышает научную и практическую ценность этого оборудования. Кроме того, использование предлагаемого метода в арсенале возможностей по обработке физиологических данных значительно облегчает и ускоряет работу экспертов в автоматизированном режиме. Низкая требовательность алгоритма к вычислительным ресурсам, а также гибкость и простота адаптации к различным требованиям обусловливают его широкие возможности с практической точки зрения. Применения разработанных алгоритмов в сочетании с другими известными алгоритмами создают основу для эффективного комбинированного решения данной задачи.

Реализация и внедрение результатов работы.

Результаты работы использованы:

•в разработанном программно-методическом обеспечении «Электроэнцефалографические исследования» (подсистема «Сомнологические исследования») для прибора электроэнцефалографа-анализатора «Энцефалан-131-03», серийно выпускаемого ООО НПКФ «Медиком МТД»;

•в учебном процессе в Технологическом институте Южного федерального университета в г. Таганроге (ТТИ ЮФУ) на кафедре Математического обеспечения и применения ЭВМ при подготовке студентов специальностей 230105 «Программное обеспечение вычислительной техники и автоматизированных систем» и 010503 «Математическое обеспечение и администрирование информационных систем», в дисциплинах «Системы искусственного интеллекта» и «Цифровое управление, сжатие и параллельная обработка информации на основе оптимизированных дельта-преобразований второго порядка»;

•в учебном процессе в Технологическом институте Южного федерального университета в г. Таганроге (ТТИ ЮФУ) на кафедре Электрогидроакустической и медицинской техники при подготовке студентов по специальностям 200401 «Биотехнические и медицинские аппараты и системы» направления 200300 «Биомедицинская инженерия», в дисциплинах «Моделирование биологических процессов и систем» и «Управление в медицинских и биологических системах».

Использование результатов работы подтверждено актами об использовании.

Апробация работы. Основные результаты работы докладывались и обсуждались на: 5-ой международной конференции «Практикующий врач» (Италия, г. Римини, 9-16 сентября, 2006-й год), 4-ой ежегодной конференции студентов и аспирантов базовых кафедр Южного научного центра РАН (г. Ростов-на-Дону, 9-18 апреля, 2008-й год), 50-ой студенческой конференции ТРТУ (г. Таганрог, 20 марта, 2003-й год), 51-ой студенческой конференции ТРТУ (г. Таганрог, 25 марта, 2004-й год), 55-ой студенческой научной конференции (г. Таганрог, 27 марта, 2008-й год), всероссийской научно-технической конференции с международным участием «медицинские информационные системы» (г. Таганрог, 11-14 сентября 2006-й год).

Публикации. Результаты работы были представлены в 11 публикациях, из них 4 статьи в ведущих реферируемых изданиях, рекомендованных ВАК, 2 статьи в прочих изданиях, 5 тезисов докладов.

Структура и объем работы. Диссертация состоит из введения, 5-и глав, заключения, списка литературы и 4-х приложений. Материалы работы изложены на 168 страницах машинописного текста, содержат 21 таблицу, 24 рисунка, 73 библиографических источника, 24 страниц приложений, 1 акт о внедрении и 2 акта об использовании в учебном процессе.

Заключение диссертация на тему "Разработка метода и алгоритмов автоматического распознавания стадий сна и построения гипнограммы"

4.5. Выводы

Разработанная программная модель реализует в себе следующие алгоритмы:

1. Автоматическое построение функций принадлежности на основании экспертных данных.

2. Коррекция функций принадлежности с учётом вновь полученных данных.

3. Задание функций принадлежности вручную согласно стандартам.

4. Статистическая обработка распределений значений расчётных показателей.

5. Возможность импорта и экспорта данных, обеспечивающая взаимодействие с внешними программами.

6. Представление функций принадлежности в виде сплайнов.

7. Распознавание стадий сна и построение гипнограммы.

8. Анализ достоверности построенной гипнограммы.

9. Анализ достоверности выявления каждой из стадий сна.

10. Анализ ошибок распознавания.

Для отладки и апробации предложенного метода был разработан программный модуль для цифрового электроэнцефалографа-анализатора ЭЭГА-21/26 «Энцефалан-131-03», серийно выпускаемого ООО НПКФ «Медиком МТД» и предназначенного для проведения широкого спектра нейрофизиологических исследований. Такая интеграция позволяет осуществлять эксперименты с использованием реальных физиологических данных. Также в составе модуля реализованы средства визуального анализа данных. Модуль представляет собой гибкое программное средство, предназначенное для исследований стадий сна, позволяющее эффективно и наглядно осуществлять обучение на статистических данных и распознавание стадий сна. В архитектуру программы заложен принцип модульности, что позволяет с лёгкостью реализовывать альтернативные методы расчёта и визуализации. Модуль реализует описанный в главе 3 метод автоматического распознавания стадий сна и построения гипнограммы и осуществляет определение стадии сна для каждой конкретной эпохи. Для дальнейшего анализа эффективности работы алгоритма результаты представляются в виде классической гипнограммы (рис. 9) и сравниваются с экспертными гипнограммами, построенными по тем же самым данным.

Глава 5 Результаты экспериментальных исследований

5.1. Методика проведения экспериментальных исследований

В ходе экспериментальных исследований была поставлена задача подтверждения работоспособности предлагаемого метода и оценки его возможностей с помощью базы данных клинических полисомнографических исследований в качестве экспериментальной. Всего в базе находилось 7 исследований, построенных 3-мя экспертами для 7-ми различных пациентов. Сводные данные использованных исследований приведены в таблице 5.1.

Библиография Захаров, Евгений Сергеевич, диссертация по теме Теоретические основы информатики

1. Айвазян А., Бухштабер В. М., Енюков И. С Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. М.: Финансы и статистика, 1989.

2. Айвазян А., Енюков И. С Мешалкин Л. Д. Прикладная статистика: исследование зависимостей.М.: Финансыи статистика, 1985.

3. Айвазян А., Енюков И. С Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.

4. Алиев. Р. А. Управление производством при нечёткой исходной информации М: Энергоатомиздат, 1991, 240 с.

5. Алтунин А.Е., Семухин М.В. Модели и алгоритмы принятия решений в нечетких условиях Тюмень, Изд-во Тюменского университета, 2000. 352 с.

6. БеллманР.,Заде Л. Вопросы принятиярешений врасплывчатых условиях М.:Мир, 1976.

7. Борисов А.Н., Алексеев А.В., Меркурьев Г.В. Обработка нечёткой информации в системах принятиярешений М.: Радио и связь, 1989

8. БорисовА.Н.,Крумберг О.А., Федоров И.П. Принятиерешений на основе нечетких моделей. Примерыиспользования.Рига: "Зинатне", 1990.

9. Боровиков В.П., Боровиков И.П. Статистический анализ и обработка данных в среде Windows. М. ФИЛИНЪ. 1997. 600 с. Ю.Бразовский К.С.Оценка функциональных характеристик головного мозга у человека на основе совместной регистрации импеданса иэлектрической активности //Автореф. канд.дисс. Томск. 1999. 22 с. П.Вапник В. Н. Восстановление зависимостей по эмпирическим данным. М.: Наука, 1979.

10. Городецкий Й.Г., Захаров Е.С., Матцкевич В.А, Дорохов В.Б., государственного «Адаптивная модель операторской деятельности». Сборник трудов 133

11. Городецкий И.Г., Захаров Е.С, Скоморохов А.А. «Адаптивная модель совмещённой деятельности человека оператора в составе программноаппаратного комплекса Реакор» Известия ТРТУ. Тематический выпуск: «Медицинские информационные системы». Таганрог: 2004. №6. с. 36-39

12. Городецкий И.Г., Захаров Е.С, Скоморохов А.А. «Исследование и оценка психофизиологического состояния человека-оператора в процессе Изд-во ТРТУ, выполнения совмещённой операторской деятельности». Сборник трудов шестой международной научно-практическая конференция «Пилотируемые полёты в космос». Москва, Звёздный Городок: 2006, с.267-269

13. Городецкий И.Г., Захаров Е.С, Скоморохов А.А. «Экспериментальные исследования и анализ психофизиологического состояния и деятельности человека-оператора» Известия ТРТУ. Тематический выпуск: «Медицинские информационные системы». Таганрог: 2004.№6. с. 3912 Изд-во ТРТУ, 134

14. Гриняев Нечёткая логика в системах управления, Компьютерра №38/2001 г.

15. Дорохов В. Б. Применение компьютерных полисомнографических полиграфов в психофизиологии и для клинических исследований. ФИЗИОЛОГИЯЧЕЛОВЕКА, т. 28, №2/2002, с. 105-112

16. Журавлев Ю. И., Рязанов В. В., Сенько О. В. «Распознавание». Математические методы. Программная система. Практические применения. М.: Фазис,2006.ISBN5-7036-0108-8. 25.3агоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск:ИМСОРАН, 1999. ISBN5-86134-060-9.

17. Заде Л.А., Понятие лингвистической переменной и его применение к принятию приближенных решений., М.:Мир, 1976. 135

18. Каплан А.Я. Проблема сегментного описания ЭЭГ человека Физиология человека. 1/1999.Т. 25. с. 125

19. Каплан А.Я., Борисов СВ., Шишкин Л., Ермолаев В.А. Анализ сегментной структуры альфа-активности ЭЭГ человека. Российский физиол журн им.И.М.Сеченова. №4/2002 с 84-95. ЗО.Ковальзон В.М., Дорохов В.Б., Вербицкий Е.В. Третья международная конференция-школа "Сон окно в мир бодрствования". Журн. высш. нерв.деят. 2006. 56(3)

21. Кравченко П.П. Основы теории оптимизированных дельта- преобразований второго порядка. Цифровое управление, сжатие и параллельная обработка информации: Монография. Таганрог: Издательство ТРТУ, 1997. 200 с. ЗЗ.Кулаичев А.П. Компьютерная электрофизиология и функциональная диагностика, учебное пособие, Москва, Издательство «Форум», 2007, 639 с.

22. Малышев Н.Г., Берштейн Л.С., Боженюк А.В. Нечеткие модели для экспертных систем в САПР.М.: Энергоатомиздат, 1991.

23. Мандель И.Д. Кластерный анализ.— М.: Финансы и статистика, 1988. Зб.Мелихов А.Н., Берштейн Л.С., Коровин Я., Ситуационные советующие системы с нечёткой логикой, М. Наука, 1990 г.

24. Орловский А. Проблемы принятия решений при нечеткой исходной информации.,М.: Наука, 1981. 38.0совский Нейронные сети для обработки инофрмации. Москва: "Финансы и статистика", 2002. 136

25. Поспелова Д.А. Нечеткие множества в моделях управления и искусственного интеллекта, М., 1986.

26. Публикации в остальных изданиях

27. Сахаров В.Л., Андреенко А.С Методы математической обработки энцефалограмм -Таганрог: "Антон", 2000. -44 с

28. Сергеев Н.Е., Основы инженерных знание для задач ситуационного управления,ТРТУ, 1993 г.

29. Скоморохов А.А., Захаров Е.С. «Полисомнографические исследования и задача автоматизированного построения гипнограммы». Известия ТРТУ. Тематический выпуск. «Медицинские информационные системы». Таганрог: Изд-воТРТУ,2006.№11(66),с. 135-138

30. Скоморохов А.А., Захаров Е.С. Полисомнографические исследования и задача автоматизированного построения гипнограммы //Известия ТРТУ. Темат. выпуск: Медицинские информационныесистемы. 2006. 11. С 135-138.-ISBN 5-8327-0271-9.

31. Тэтано Т.,Асаи К.,Сугэно,Прикладные нечеткие системы,М: Мир, 1993.

34. Dement W., Kleitmann N., "The relation of eye movement during sleep to dream activity; an objective method for the study of dreaming," J. Exp. Psychol., vol. 55,pp.339-346, 1957.

35. Friedman L., Jones В. E. "Study of sleep-wakefulness states by computer graphics and cluster analysis before and after lesions of the pointine tegmentum in the cat," Electroencephalogr. Clin. Neurophysiol., vol. 57, pp. 43-56, 1984.

36. Gaillard J. M., Tissot R., "Principles of automatic analysis of sleep records with ahybrid system," Comput.Biomed. Res., vol. 6,pp. 1-13, 1973.

37. Gath L, Bar-On E. "Computerized methods for scoring of polygraphic sleep recordings," Comput.Programs Biomed., vol. 11,pp.217-223, 1980.

38. Haejeong P. Automated Sleep Stage Analysis Using Hybrid Rule-Based and Case-Based Reasoning: Ph. D. Dissertation: 05.07.2000 Seoul National University, 2000.-160 p.

39. Hastie Т., Tibshirani R., Friedman J. The Elements of Statistical Learning. Springer, 2001.ISBN 0-387-95284-5. 56.ГШ T. M., Shapiro D. M., Fink M., Kassebaum D. "Digital computer classifications of EEG sleep stages," Electroencephalogr. Clin. Neurophysiol., vol. 27,pp. 76-83, 1969.

40. Johnson L., Lubin A., NaitohP.,Nute C Austin M. "Spectral analysis of the EEG of dominant and nondominant alpha subjects during waking and sleeping," Electroencephalogr. Clin. Neurophysiol., vol. 26, pp. 361-370, 1969.

41. Kuwahara H., Higashi H., Mizuki Y., Tanaka S. M. M., Inanaga K. "Automatic real-time analysis of human sleep stages by an interval histogram method,"Electroencephalogr. Clin.Neurophysiol., vol. 70,pp.220-229, 1988. 138

42. Loomis A., Harvey F.,Hobart G.,"Cerebral states during sleep, as studied by human brainpotentials," J.Exp.Psychol., vol. 21,pp. 127-144, 1937.

43. Martin W. В., Johnson L. C Viglione S. S., Joseph P.N., Moses J. D. "Pattern recognition of EEG-EOG as a technique for all-night sleep stage scoring," Electroencephalogr. Clin.Neurophysiol., vol. 32,pp.417-427, 1972. 62.Pal S.K., Majumaer D.D. Effect of fuzzyfication on the plosive cognition system. "Int. J. Systems Sci.", 1978, v.9, N8, p.873-886

44. Putilov D.A., Verevkin E.G., Donskaya O.G., Putilov A.A. Segmental structure of alpha waves in sleep-deprived subjects. Somnologie Schlafforschung und Schlafmedizin. 2007; 11(3):202-210. 64.Ray S. R., Lee W. D.,Morgan С D.,Airth-Kindree W. "Computer sleep stage scoring-an expert system approach," Int. J. Biomed. Computing, vol. 19, pp. 43-61, 1986.

45. Rechtschaffen A., Kales A. A manual of standardized terminology, techniques and scoring system for sleep stages of human subjects. Washington: DC National Instituteof health Publications, 1968. 204.

46. Smith J. D., Karacan I., "EEG sleep stage scoring by an automatic hybrid system," Electroencephalogr. Clin.Neurophysiol., vol. 31,pp.231-237, 1971.

47. Smith J., Negin M., Nevis A. H. "Automatic analysis of sleep electroencephalograms by hybrid computation," IEEE Trans. Syst. Sci. Cybern., vol. SSC-5,pp.278-284, Oct. 1969.

48. Sneath P.H.A., Sokal R.R. Numerical taxonomy: theprinciples and practice of numerical classification. SanFrancisco:Freeman, 1973. 573 p.

49. Stanus E.,Lacroix В., Kerkhofs M.,Mendlewicz J. "Automated sleep scoring: A comparative reliability study of algorithms," Electroencephalogr. Clin. Neurophysiol., vol. 66,pp.448-456, 1987. 139

50. Tryon, R. (1939). Cluster Analysis. Ann Arbor, MI: Edwards Brothers. 72.www.physionet.org исселодваний 73.www.sleep.ru Сон и сомнология, Профессиональный ресурс для Международный архив физиологических клиницистов и исследователей 140