автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы и алгоритмы обработки информации в условиях неоднородности данных
Автореферат диссертации по теме "Методы и алгоритмы обработки информации в условиях неоднородности данных"
На правах рукописи
АВШАЛУМОВ АЛЕКСАНДР ШАМАИЛОВИЧ
Методы и алгоритмы обработки информации в условиях неоднородности данных
Специальность 05 13 01 - «Системный анализ, управление и обработка информации (промышленность)
Автореферат
диссертации на соискание ученой степени кандидата технических наук
Москва 2007
003161548
Работа выполнена в Московском государственном горном университете (МГГУ)
Научный руководитель
доктор технических наук, профессор
Бахвалов Лев Алексеевич
Официальные оппоненты доктор технических наук, профессор
Костров Алексей Владимирович (Владимирский государственный университет)
кандидат технических наук, доцент
Виноградова Наталья Александровна (Московский энергетический институт (технический университет)
Ведущая организация - Федеральное государственное учреждение «Государственный научно-исследовательский институт информационных технологий и телекоммуникаций» (ФГУ ГНИЙ ИТТ «Информика»)
Защита состоится «15» ноября 2007 г в 15— на заседании диссертационного совета Д 212 128 07 при Московском государственном горном университете по адресу 119991, Москва, Ленинский проспект, д 6
Отзывы на автореферат просим направлять по адресу 119991, Москва, Ленинский проспект, д 6, на имя ученого секретаря диссертационного совета в 2-х экземплярах
С диссертацией можно ознакомиться в библиотеке МГТУ Автореферат разослан «12» октября 2007 г
Ученый секретарь диссертационного совета доктор технических наук
профессор Куприянов Вячеслав Васильевич
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность. Решение современных задач управления сложными системами и объектами, широкомасштабное внедрение информационных технологий, необходимость повышения достоверности и качества исходной информации, лежащей в основе формирования эффективных управленческих воздействий настоятельно требуют дальнейшего развития методов и алгоритмов обработки экспериментальных данных, анализа и моделирования процессов (сигналов), характеризующих свойства изучаемого объекта Одним из направлений такого развития является создание эффективных методов и алгоритмов, учитывающих неоднородность исходной информации Такая неоднородность может носить различный характер и объективно обусловливаться разными причинами, связанными с особенностями конфетного объекта и/или со спецификой постановки задачи исследования При анализе процессов неоднородность может обусловливаться спонтанным изменением их характеристик, наличием в сигнале стохастической и детерминированной компонент, появлением аномальных наблюдений При исследовании поведения многофакторных объектов зачастую приходится учитывать присутствие влияющих факторов как количественного, так и качественного характера, а в задачах управления такими объектами - возможные вариации их свойств во времени или в зависимости от режима функционирования В задачах классификации неоднородность данных, их кластеризация являются предпосылкой успешного решения датой задачи
Работы по указанной проблематике велись многими учеными, начиная с трудов классиков математической статистики (Р Фишера, Г Шеффе, Дж Бокса и др ) и специалистов отечественной школы (В В Налимов, Г К Круг, ЕВ Маркова, ЭК Лецкий и др) Предложены различные алгоритмы фильтрации, включая простейший вариант медианного фильтра, методы выделения систематических трендов и аномальных наблюдений, обнаружения разладки процессов и тд Вместе с тем многие вопросы обработки неоднородных данных либо исследованы недостаточно глубоко, либо нуждается в пересмотре сама исходная посгановка задачи Кроме того, в последнее время все большее применение получают алгоритмы, основанные на использовании искусственных нейронных сетей Такие алгоритмы могут оказаться весьма эффективными именно при анализе неоднородных данных Все это в целом и определяет актуальность тематики данной работы
Цель исследований. Целью диссертационной работы является создание, развитие и исследование эффективных статистических и нейросетевых методов обработки информации в условиях различных видов неоднородностей экспериментальных данных, имея в виду повышение ее
достоверности и качества как основы для принятия эффективных управленческих решений
В соответствии с указанной целью в рамках диссертационной работы поставлены и решались следующие задачи
1 Уточнение понятия и классификация разновидностей неоднородности данных, систематизация и анализ имеющихся методов и алгоритмов их обработки
2 Исследование свойств медианной фильтрации как средства обработки неоднородных временных рядов и изучение возможности получения дополнительной информации о свойствах таких рядов путем сопоставления сигналов на выходах медианного фильтра и аналогичного фильтра скользящего среднего
3 Разработка алгоритмов обнаружения аномальных наблюдений в коррелированных случайных последовательностях и исследование возможности их применения для задачи выделения маломощных импульсных потоков на фоне интенсивной коррелированной помехи
4 Развитие нейросетевого подхода для решения ряда типовых задач классификации и построения математических моделей многофакторных объектов в условиях существенной структурной неоднородности экспериментальных выборок
5 Применение полученных теоретических результатов при решении практических задач из области медицинской техники, химико-фармацевтической и горной промышленности
Методы исследования. Полученные результаты исследования базируются на использовании методов и средств теории вероятностей и математической статистики, теории случайных процессов, математического (имитационного) моделирования, теории искусственных нейронных сетей
Защищаемые научные положения и их новизна.
1 Выявленные характерные свойства скользящей медианной фильтрации при обработке стохастических, детерминированных и смешанных процессов как средства повышения достоверности информации
2 Доказательство возможности получения дополнительной информации при анализе процессов с временной неоднородностью путем сопоставления сигналов на выходах медианного фильтра и аналогичного фильтра скользящего среднего
3 Новый критерий обнаружения аномальных наблюдений в коррелированных временных рядах, базирующийся на идее выявления нарушений гладкости их траекторий, и алгоритмы такого обнаружения
4 Методика выявления и анализа маломощных импульсных потоков на фоне интенсивной коррелированной помехи на основе разработанных алгоритмов обнаружения аномальных наблюдений
5 Оригинальные каскадные искусственные нейронные сети, предназначенные для эффективного решения задач классификации и построения математических моделей многофакторных объектов в условиях структурной неоднородности данных
Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются корректным использованием методов математической статистики, теории случайных процессов, аппарата теории искусственных нейронных сетей, результатами имитационного моделирования и практического использования разработанных алгоритмов и методов обработки неоднородной информации
Научная значимость работы состоит в разработке новых подходов, методов и алгоритмов обработки информации в условиях различного вида неоднородностей, где традиционные методы анализа становятся малоэффективными
Практическая значимость работы. Результаты исследований, выполненных в диссертационной работе, могут быть использованы при создании программно-алгоритмического обеспечения систем поддержки принятия управленческих решений, автоматизированных систем научных исследований, компьютеризированных научных приборов и диагностических комплексов, информационно-измерительных систем и АСУ в различных отраслях промышленности
Реализация результатов. Результаты работы были использованы при разработке медицинского КВЧ-диагностического комплекса, для построения математической модели установки химико-фармацевтического назначения и модели прогнозирования содержания радона в атмосфере горных выработок шахты 45 Джезказганцветмет по экспериментальным данным
Апробация работы. Результаты работы и ее основные положения докладывались на Всероссийской научно-практической конференции «Информационные и управляющие системы» (Тула, 2005г ), ХХХП, ХХХ1П, XXXIV Международных конференциях «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» - IT+SE'2005, IT+SE'2006, IT+SE'2007 (Ялта-Гурзуф, 2005 - 2007 г), Второй международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности» (Санкт-Петербург, 2006 г), 52-м Международном научном коллоквиуме (IWK) - (Ильменау, Германия, 2007 г ), на заседании кафедры «Автоматизированные системы управления» (АСУ) Московского государственного горного университета
Публикации По результатам исследований опубликовано 9 научных
работ
Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, заключения и списка литературы из 102 наименований, включает 159 страниц текста, 65 рисунков, 13 таблиц
СОДЕРЖАНИЕ РАБОТЫ
Во введении показана актуальность темы диссертационной работы, сформулированы цели и задачи исследования, изложены основные положения, выносимые на защиту, научная новизна и практическая значимость работы, представлены сведения о ее апробации, публикациях, а также дана краткая характеристика содержания работы
В первой главе вводится исходное понятие неоднородности наблюдаемых данных, под которой понимается наличие в них элементов различных генеральных совокупностей Выделяются основные виды неоднородностей, такие как временная неоднородность, факторная (дискретная), структурная Для каждого вида обсуждаются варианты конкретных постановок задач, описанных в научной литературе, методов и алгоритмов их решения Отмечается, что в последнее время для решения многих из них наряду со статистическим подходом используется и иной подход, основанный на применении искусственных нейронных сетей (ИНС) В этой связи дается краткий обзор наиболее распространенных ИНС и областей их приоритетного использования
На основании анализа рассмотренных материалов для дальнейшего рассмотрения выделены три основных направления, а именно
- анализ свойств медианой фильтрации как средства обработки дискретных последовательностей (рядов) с временной неоднородностью,
- разработка новых методов выделения аномальных наблюдений в коррелированных случайных последовательностях,
- развитие нейросетевого подхода для решения некоторых типовых задач при наличии структурных неоднородностей
Во второй главе анализируются свойства медианных скользящих фильтров при их использовании для обработки стохастических временных рядов, детерминированных сигналов и процессов, содержащих обе эти компоненты По определению, скользящим медианным фильтром шириной т именуется преобразователь, выходной сигнал которого уг в некоторый текущий дискретный момент времени t формируется из входного временного ряда , х,.1, х,, х,+1, в соответствии с формулой
Уг = у, (х) = Ме(х,.ь хг_1+ь , хг-1, хь хг+1, , х,+и, х1+!), (1)
где Мв=Ме(хих2, ,хт) = х(М) , х0) , ] = 1, 2, , т= 21 +1 - элементы вариационного ряда, т е упорядоченных в порядке возрастания (неубывания) значений х2, , хт х(1) = тт(х], х2, , Хщ) < х(2) < х(3) < < х(т) = тах(х},
Медианный фильтр относится к категории нелинейных низкочастотных (сглаживающих) фильтров и обладает рядом достаточно
очевидных специфических свойств Для более полного выяснения этих свойств использован специально спланированный имитационный эксперимент в сочетании с последующей обработкой и графическим представлением результатов При этом для более наглядного суждения об отличительных особенностях медианной фильтрации осуществлялось сопоставление свойств медианного фильтра со свойствами классического фильтра скользящего среднего при одинаковой ширине т
При исследовании свойств медианных фильтров при случайных воздействиях использован классический алгоритм идентификации объектов в частотной области при подаче на вход пробного сигнала типа дискретного «белого шума» В работе приводится план имитационного эксперимента и обосновывается выбор длины реализации N и ширины сглаживающего окна Н при проведении спектрального анализа процессов и определении искомых характеристик медианного фильтра амшштудно-частотной характеристики Л{Л), фазо-частотаой ф(/к), функции когерентности Щк) Аналогичные характеристики определялись на одинаковых сигналах и для фильтра скользящего среднего той же ширины
В ходе имитационного эксперимента генерировались дискретные процессы типа «белого» шума с различными одномерными функциями распределения вероятностей (12 вариантов с разными значениями показателей асимметрии и эксцесса) На рис 1 в качестве примера представлены АЧХ медианного фильтра для равномерного, гауссовского и экспоненциального распределений в сопоставлении с АЧХ фильтра скользящего среднего Как и ожидалось, для фильтра скользящего среднего АЧХ остается неизменной для любой функции распределения, для медианного фильтра она существенно изменяется для разных одномерных законов распределения вероятностей
..... N-
___ )■
ч
Равномерное распределение
Гауссовское распределение
Экспоненциальное распредел
Рисунок 1 - сопоставление АЧХ медианного фильтра и фильтра скользящего среднего
Установлено, что наиболее существенно амплитудно-частотная характеристика медианного фильтра зависит от показателя эксцесса, и получены ахшроксимационные формулы, отражающие эти зависимости
Для случая фильтрации детерминированных сигналов сформулирован ряд утверждений, характеризующих свойства медианного фильтра В частности, выявлены условия, когда медианный фильтр ведет себя как безынерционное звено, условия полного подавления импульсной составляющей сигнала, зоны искажения формы детерминированного сигнала при медианной фильтрации
Отлитая медианной фильтрации от фильтрации с помощью фильтра скользящего среднего продемонстрированы на ряде характерных примеров, а именно: для вариантов фильтрации прямоугольной и треугольной периодической волны , синусоидального сигнала с периодом То > т.
Исследованы свойства медианного фильтра при обработке неоднородных сигналов, т.е. сигналов, вероятностные свойства которых могут изменяться во времени, или сигналов, представляющих собой определенную комбинацию процессов различных 'шпов. К такого рода сигналам можно отнести зашумленные детерминированные сигналы, нестационарные случайные процессы с не статщон арностями разного вида, модулированные процессы, смеси стохастических процессов и т.п. Рассмотрены некоторые характерные разновидности такого рода сигналов (анализируемый сигнал х(!) - затум ленный детерминированный периодический процесс, х(У содержит апериодическую детерминированную и стохастическую компоненты, хШ - белый шум с изменяющейся одномерной функцией распределения вероятностей).
При проведении исследования основное внимание обращено на сопоставление выходных сигналов медианного фильтра и фильтра скользящего среднего той же ширины, имея в виду, что различие в свойствах фильтров должно оо идее привести и к различиям в их выходных сигналах Это в свою очередь можно использовать при анализе информативных свойств исходных анализируемых сети ал он, выявлении некоторых новых информативных признаков - в том числе и в ситуациях, когда традиционные методы обработки оказываются малоэффективными.
Принципиальная возможность получения подобной дополнительной информации наиболее наглядно появилась на примере обработки сигнала х(0 , который спонтанно изменяет вид функции распределения. Сигнал представляет собой случайное чередование 9 отрезков дискретного «белого шума», амплитуды которых подчиняются трем симметричным распределениям с различными значениями показателя эксцесса Ех = О, Ех-2,89, Ех- В,66. Длины этих отрезков также случайны. Суммарная длина реализации - ] 0000 отсчетов (рис. 2); сигнал х(1) имеет нулевое среднее значение и единичную дисперсию
Рисунок 2 - реализация неоднородного дискретного «белого» шума Сигнал х({) профильтрован с помощью фильтра скользящего среднего и медианного фильтра одинаковой ширины т = 11. Выходные сигналы фильтров УяЩ и Ую(0 представлены на рис 3. Явные различия между данными сигналами 1троявляются еще более четко, если анализировать
отношение дисперсий (/). з^ (/), / = 1, 2,..,, Ь, определяемых на скользящих временных интервалах. Анализ изменения кривой к(}) - ^(0/^(0 в принципе дает возможность выделить всю последовательность изменения функций распределения и - пусть приближенно - найти точки такого изменения. При этом следует подчеркнуть, что ни спектральный анализ, ни какие-либо иные достаточно простые методы обработки стохастических сигналов, традиционно используемые для их анализа, не позволяют столь же успешно решить данную задачу.
Рисунок 3 --процессы на выходах фильтра скользящего среднего и медианного фильтра В третьей главе рассматривается задача обработки коррелированных временных радов с точечными нарушениями гладкости их траекторий. В первую очередь это задача обнаружения аномальных наблюдений. Под аномальными в отличие от ранее использовавшихся постановок данной задачи понимаются наблюдения, достаточно грубо нарушающие гладкость траектории наблюдаемой дискретной последовательности Иными словами, аномальными будут считаться точки, соответствующие положительному или отрицательному выбросам процесса, сугаествешю искажающим те или иные характеристики ег о гладкости
Возможны различные способы формирования критериев, связанных с характеристиками гладкости процесса и позволяющих обнаружить их значимые отклонения от нормы, что и будет свидетельствовать о наличии аномальности. В работе предложены и исследуются два таких алгоритма, основанных на следующих предпосылках:
а) Наблюдаемый дискретный процесс 1(1) может быть представлен в виде суммы г(1) = х(С) + ¡(().
б) Процесс х(1) является дискретным гаусеовским процессом с дисперсией и нормированной автокорреляционной функцией , ¿=0,1,2,,...
в) Процесс гф состоит из импульсов, искажающих значения х(1) и приводящих к появлению аномальности наблюдений, моменты появления импульсов случайны и неизвестны Иными словами, выброс носит «точечный» характер
г) Предполагается, что импульсы разделены по крайней мере единичным интервалом
д) Количество выбросов относительно невелико по сравнению с общим числом наблюдений N
е) Амплшуды импульсов малы по сравнению с стх, что делает пракгачески невозможным их визуальное выявление
В первом из алгоритмов в качестве характеристик, связанных с гладкостью траекторий, используются, что вполне естественно, разности первого порядка V, где ,гы наблюдаемые значения
временного ряда, I Очевидно, что положительному выбросу будет
соответствовать некоторая точка для который справедливы следующие соотношения Vк ~гк >0, \>ш =гш -гк <0, а для отрицательного выброса В точке х1 - V, = г, - ги < О, У!+1 = гм - г, > 0
При выполнении предпосылки б) о гауссовости процесса хф и отсутствии импульсной составляющей Щ приращения V, также подчиняются гауссовскому распределению Поэтому можно построить на плоскости (У^м), эллипс рассеяния приращений с заданной доверительной вероятностью Р, содержащей экспериментальные точки, когда имеет место только процесс хф Границы такого эллипса определяются соотношением
1 1^-2^(1) V,
Су 11-Рте О-)]
где ¿{2)- Р-квантиль -распределения с двумя степенями свободы
Отсюда следует критерии обнаружения аномальных наблюдений первого алгоритма аномальными считаются точки, выходящие за границу эллипса рассеяния Ясно, что при этом желательно использовать достаточно высокий уровень доверительной вероятности Р (например, 0,99 - 0,999) с тем, чтобы снизить риск отнесения к аномальным точек, не являющихся таковыми
Основанный на этой идее алгоритм выделения аномальных наблюдений включает в себя следующую последовательность операций
а) Вычисление приращений V, временного ряда , г = 2, ;У
б) Оценивание дисперсии ряда приращений а^ процесса г, и его нормированной корреляционной функции для единичного сдвига
в) Выбор доверительной вероятности Р (обычно Р — 0,990 - 0,999)
г) Выделение аномальных наблюдений точка ^относится к категории
аномальных, если имеет место неравенство Ц >%*(2), г = 2,И
д) Анализ выделенных точек на предмет исключения некоторых ложно выделенных точек Необходимость данного пункта связана с тем, что
каждую точку выброса сопровождают две точки отклонений в противоположную сторону - меньшей амплитуды, но способной все равно выйти за границы эллипса рассеяния. Это, так называемые, еателлитные точки. В работе приведены рекомендации по их идентификации. В конечном итоге остаются только те точки, которые достаточно надежно отнесены к категории аномальных.
е) Исключение обнаруженных аномальных наблюдений из временного ряда выделенные точки заменяются на новые значения, которые определяются с помощью линейной интерполяции по двум соседним точкам.
Отмечается, что описанная процедура обнаружения аномальных наблюдений со статистической точки зрения носит приближённый характер. Для улучшения качества метода предлагается придать ему итерационный характер Первая итерация реализуется с помощью указанной выше процедуры. Вторая итерация осуществляется аналогично первой, но с использованием скорректированных по пункту с) значений временного ряда. При этом новый эллипс рассеяния будет более узким, а выделенные ранее точки уже не будут выходить за его i-раницу. Зато могут выявиться новые аномальные наблюдения. Итерационный процесс может быть продолжен до тех пор, пока на очередной итерации не будет выявлено ни одного нового аномального наблюдения или их количество резко уменьшится но сравнению с предыдущими итерациями.
Работоспособность данного алгоритма продемонстрирована на модельном примере, где к исходному случайному процессу х,, полученному путем пропускания гаусеовекого белого шума через линейную динамическую систему 3-го порядка, в случайные моменты времени добавлены импульсы с очень малой амплитудой / =±0,035 ах, имитирующие появление аномальности. Общее число наблюдений N -1000; количество аномальных наблюдений NA - 50 В результате применения алгоритма на первой итерации выделены 32 аномальных наблюдения (см рис 4а выделеиные точки находятся вне эллипса рассеяния), на второй итерации выделено 26 точек (рис. 4Ь), третьей итерации не потребовалось
■ . : jfi
m
Рисунок 4 - выделение аномальных наблюдений на первой и второй итерациях
Из общего числа выделенных точек 44 - выделены правильно, б аномальных точек не обнаружено; 12 точек ошибочно отнесено к разряду аномальных После дополнительного анализа на предмет идентификации
сателлитных точек, общее число аномальных наблюдений оказалось равным 51с правильной локализацией 44 из них
Второй алгоритм основан на идее выявления статистически значимого отклонения наблюдаемого значения г, от точки г*, получаемой путем линейной интерполяции по двум соседним точкам и Показано, что в конечном итоге данный алгоритм сводится к вычислению приращений второго порядка У{2) -Ум , /=3,АГ и оценке их дисперсии Выделение аномальных наблюдений производится с помощью следующего правила точка г, относится к категории аномальных, если имеет место
неравенство > щ_Р <т^т г где щ_Р - квантиль гауссовского
распределения, соответствующий доверительной вероятности Р В принципе при решении многих прикладных задач данному алгоритму также следует придать итерационный характер
Алгоритм был использован для анализа того же модельного примера Уже на первой итерации он обнаружил 53 аномальные точки, локализация 45 из них правильная, 8 точек ложных, 5 аномалий не выявлено Устранение сателлитных точек позволило уменьшить количество ложно выделенных точек до 5 Второй итерации в данном случае не потребовалось Очевидно, что второй алгоритм в данном случае оказался более эффективным
Отмечено, что проблема выделения и устранения влияния аномальных наблюдений достаточно деликатна, по суш требуя сугубо индивидуального рассмотрения каждого такого наблюдения с тем, чтобы, исключая часть наблюдений как аномальные, не потерять ценную информацию об особенностях и тонких свойствах изучаемого процесса
Предложено использовать разработанные алгоритмы обнаружения аномальных наблюдений для целей выделения и оценки параметров маломощных пуассоновских потоков импульсов на фоне сравнительно мощного коррелированного случайного процесса Для реализации этой идеи создана методика выделения и оценки параметров такого потока при условии, что функция распределения амплитуд импульсов /(Л,) - /(Л,,, 02, ,вк) известна с точностью до параметров @\,02, , Ок, которые также должны быть определены по наблюдаемой реализации, а количество импульсов потока невелико по отношению к числу дискретных наблюдений (не более чем 10 - 15 %)
Методика апробирована с помощью имитационного эксперимента со следующими характеристиками исходный коррелированный процесс получен путем четырехкратного пропускания дискретного белого шума с нулевым математическим ожиданием через инерционное звено с постоянной времени, равной 10 дискретным единицам времени, дисперсия процесса =0,01647, длина наблюдаемой реализации - Л^ 20020 дискретных значений Импульсный поток - Пуассоновский с интенсивностью А = 0,046, число точек импульсного потока равно 917 Функция распределения
амплитуд импульсов потока - экспоненциальная f(Au) = в ехр(-вАи), 9= 250 Очевидно, что мощность потока относительно мала, составляя примерно 0,1% от мощности процесса zt В результате использования методики в конечном итоге получены следующие оценочные значения для интенсивности потока - Л = 0,045, для параметра в распределения амплитуд - в - 250,8 з что свидетельствует о высокой эффективности использованного алгоритма
Четвертая глава посвящена развитию нейросетевых методов обработки информации применительно к существенно неоднородным данным В условиях такой неоднородности известные нейросетевые парадигмы зачастую оказываются малоэффективными В подобных ситуациях предлагается использовать каскадные ИНС (КИНС) Такие сети формируются как каскадное соединение по крайней мере двух искусственных нейронных сетей - быть может различного типа
Предлагаемые каскадные ИНС отличаются от известаых вариантов гибридных сетей организацией процесса обучения, включающего в себя
- обучение сети первого каскада с использованием всей исходной обучающей выборки,
- формирование по результатам обучения указанной сети (ИНС первого каскада) обучающей выборки для сети (или нескольких сетей) второго каскада, такое формирование может осуществляться путем сортировки элементов исходной выборки, использованием некоторого преобразования исходной информации и т д,
- продолжение такого рода операций для последующих каскадов, если таковые имеются или необходимость которых выявляется в ходе обучения
Таким образом, существенным отличительным признаком предлагаемых каскадных ИНС является использование различных обучающих выборок для обучения ИНС различных каскадов, причем эти обучающие выборки формируются на основе результатов обучения ИНС предыдущего каскада В целом сам процесс обучения осуществляется последовательно от первого каскада до последнего
Возможности предложенной разновидности ИНС продемонстрированы при решении трех типовых задач
- классификации с разноудаленными классами,
- классификации с разноинформативными данными,
- построение математической модели объекта при наличии нескольких рабочих режимов
Первая из перечисленных задач решалась на основе использования искусственных нейронных сетей типа многослойного персешрона (MLP) в условиях, когда априори известно, к какому именно классу принадлежит каждый элемент Х2 =|*,„хг2, s = 1>2> >N обучающей выборки
(«обучение с учителем») При этом постулируется возможность существенной неоднородности в размещении точек обучающей выборки,
относящихся к разным классам, в п - мерном пространстве (по принципу «где густо, где пусто») Иными словами, точки некоторых классов удалены друг от друга на значительные расстояния и поэтому легко разделяемы, в то время как точки каких-то других классов слабо удалены друг от друга и разделить их затруднительно Кратко такую задачу классификации можно назвать задачей классификации с разноудаленными классами Многослойный персешрон в подобных случаях становится малоэффективным Тогда предлагается использовать каскадирование нескольких многослойных персептронов
Пусть требуется различить т классов, и А, , А2 , , Ат - множества точек наблюдений, относящихся к этим классам В качестве первого каскада синтезируется многослойный персешрон, содержащий п входов и т выходов Если после обучения такой персешрон с приемлемой степенью надежности различает все т классов, то задачу можно считать решенной Однако для варианта разноудаленных классов, как правило, сеть надежно различает лишь к классов (например, А] , А2 , , А/(), а точки остальных классов плохо различимы, вследствие чего имеет место появление значительного числа ошибок классификации
Образуем из этих точек новое множество В = Аш 11 Аш и и А„„ и преобразуем исходный персешрон для распознавания точек множеств А], Аг , , А/с, В Очевидно, он будет иметь к+1 выход Второй каскад строится с использованием нового персешрона, предназначенного для различения точек, относящихся к разным классам, входящим во множество В, и имеющего число выходов, равное числу этих классов При этом для его обучения используются только те элементы обучающей выборки, которые соответствуют классам, принадлежащим множеству В
Ясно, что все предыдущие рассуждения, связанные с первым каскадом, теперь могут быть повторены применительно к множеству В и т д Такое наращивание (каскадирование) персептронов продолжается до тех пор, пока не будет обеспечено распознавание всех классов (если, конечно, это возможно) Естественным обобщением данного рассмотрения является вариант, когда на первом этапе удается лишь подразделить исходную совокупность Л;, , , Аь на несколько подмножеств В] ,Вз, ,Вь,Ь<т, каждое из которых возможно содержит несколько элементов А} Эта ситуация может иметь место и на последующих этапах Общее количество используемых персептронов в любом случае не превысит (т - 1) При больших т это существенно меньше, чем, например, в известном способе попарной классификации, когда количество требуемых персептронов равно т(т-1)/2
Фактически подобный подход позволяет существенно повысить качество классификации и в условиях несбалансированности обучающей выборки, когда сильно разнятся количества наблюдений, относящихся к разным классам
Вторая задача классификации с разноинформативными данными гакже характеризуется наличием неоднородности данных, составляющих
обучающую выборку, но иной природы Имеется в виду, что, хотя общее количество наблюдаемых переменных (факторов) п может быть очень велико, уровни их информативности зачастую сильно различаются Обычно всегда можно выделить относительно немногочисленную ipyimy наиболее существенных факторов, и вторую группу (очень часто весьма многочисленную) малоинформативных переменных, пренебречь влиянием которых, тем не менее, было бы опрометчиво В случае подобной разноинформативности данных предлагается использовать их предварительное сжатие Такое сжатие в рамках нейросетевой парадигмы может быть осуществлено с помощью автоассоциативных ИНС
Автоассоциативная искусственная нейронная сеть (АИНС) формально относится к категории многослойных персептронов, содержит п входов, такое же количество п выходов, некоторое количество скрытых слоев, причем в одном из них - сжимающем слое - число нейронов т < п Значения на выходах нейронов сжимающего слоя оЦ,ои^, ,outm отображают исходные п - мерные данные в пространство меньшей размерности т практически без потери основной полезной информации В то же время подобное уменьшение размерности может облегчить решение основной задачи классификации
В рамках идеи каскадирования нейросетей предлагается несколько вариантов ИНС, в которых в качестве первого каскада используется АИНС;, а во втором каскаде - либо самоорганизующиеся (самообучающиеся) сети (например, сеть Кохонена), либо сети, использующие алгоритм обучения с учителем (например, тот же MLP)
При решении задачи построения модели статического нелинейного объекта с варьирующимися характеристиками предполагается, что выход объекта Y зависит от вектора входных контролируемых и управляемых факторов X и вектора контролируемых, но не управляемых переменных z, кроме того, имеет место случайная аддитивная помеха е , искажающая значения выходной измеряемой величины В отличие от стандартной постановки данной задачи рассматривается ситуация, когда объект может функционировать в различных режимах, определяемых соотношениями между отдельными составляющими вектора Z При этом зачастую оказывается затруднительным установить момент перехода из одного режима в другой - например, вследствие естественных флуктуации характеристик используемого сырья Для каждого из режимов может иметь место своя функция отклика В такой ситуации применение традиционных процедур идентификации по сути позволяет получит лишь усредненную на множестве всех режимов функцию отклика, что делает ее практически непригодной, например, для целей оптимизации технологического процесса Фактически здесь необходимо решить две взаимосвязанные задачи Первая из них - это задача распознавания (классификации) режима, вторая -задача оценки функций отклика по структурированной выборке, когда
оценивание функции ^.(х,^) осуществляется с использованием только тех элементов выборки, которые отнесены к данному ;-му режиму
Каскадные сети очень хорошо приспособлены для идентификации объектов такого рода При решении первой задачи может быть использована любая из ИНС, предназначенная для целей классификации с использованием метода обучения без учителя (например, самоорганизующаяся сеть Кохонена) Такого рода сеть образует первый каскад ИНС Для решения второй задачи целесообразно использовать двухслойные персептроны Общее их количество будет равно числу различных режимов, а вся совокупность в целом является вторым каскадом сети
Предложенная разновидность ИНС успешно апробирована на примере построения модели пилотной установки химико-фармацевтического назначения
В пятой главе приводятся данные о практическом использовании теоретических результатов работы, созданных алгоритмов и методов анализа данных в условиях неоднородностей
Программная реализация способа получения дополнительной информации на основе сопоставления сигналов на выходах медианного фильтра и фильтра скользящего среднего и двухкаскадная ИНС использованы в качестве составной части программно-алгоритмического обеспечения медицинского КВЧ-диагностического комплекса ДКМ-01
Комплекс предназначен для проведения компьютерного экспресс-обследования пациента на основе анализа структуры сигналов, излучаемых органами, тканями и системами организма человека в диапазоне крайне высоких частот (мм-диапазон радиоволн) с целью определения оталонений от структуры сигналов, принятых за относительную норму, выявления на этой основе наличия и степени функциональных нарушений В настоящее время КВЧ-диагностический комплекс ДКМ-01 прошел квалификационные испытания, по результатам которых получено Регистрационное удостоверение Федеральной службы по надзору в сфере здравоохранения и социального развития (№ ФС 022а2006/3746-06 от 20 июля 2006 года) и Сертификат соответствия Госстандарта России № РОСС 1Ш ИМ04 В05924
При обработке сигнала от антенно-измерительного блока комплекса в первую очередь вычисляется оценка исходного спектра (периодограмма) низкочастотной модулирующей составляющей КВЧ-сигнала, принимаемого антенной Далее определяются сглаженные оценки спектра с использованием стандартного сглаживающего окна Хемминга и медианного фильтра, после чего из них удаляются систематические компоненты Получаемые при этом разностные кривые позволяют сформировать несколько диагностических параметров, связанных со степенью подобия упомянутых разностных кривых Показано, что информативность подобного способа обработки периодограмм связана с наличием в исходном спектре маломощных систематических компонент
Используемый в ДКМ-01 нейросетевой классификатор предназначен для интегральной оценки функционального состояния отдельных органов и тканей человека по четырем отмеченным ранее градациям «норма» - класс О, «удовлетворительно» - класс 1, «невыраженная патология» - класс 2, «.выраженная патология» - класс 3 В качестве входной информации в классификаторе используется совокупность информативных параметров, получаемых в ходе обработки принимаемого сигнала, причем из их общего числа предварительно отобраны 11 наиболее значимых, включая упомянутые выше параметры, полученные при обработке периодограмм
Все попытки создать ЙНС с использованием известных подходов оказались не очень удачными, поскольку выяснилось, что классы 0 и 1 различаются очень плохо Практически все случаи класса 0 были классифицированы как класс 1 Объективно это скорее всего связано с тем, что различия между градациями «норма» и «удовлетворительно» зачастую трудноуловимы В связи с этим было решено использовать идею каскадирования сетей В качестве первого каскада использовался трехслойный персепгрон с числом входов п = 11, тремя выходами (т = 3), содержащий по 10 нейронов в каждом скрытом слое Он обучался распознаванию классов 2 и 3, а также объединенного класса В , составленного из случаев, относящихся к первоначальным классам 0 и 1
Второй каскад также представляет собой персептрон с одиннадцатью входами, двумя скрытыми слоями и двумя выходами, количество нейронов в первом скрытом слое равно 11, во втором - 8 Для обучения данной сети использовалась только те элементы обучающей выборки, которые были отнесены к классу В персептроном первого каскада Результаты обучения представлены в табл 1
Таблица 1
Выборка (всего 585 элементов) Класс 0 Класс 1 Класс 2 Класс 3 Всего
Обучающая Количество элементов 25 129 123 123 400
Правильная классификация 23 99 87 117 326
% правильных ответов 92% 77% 71% 95% 81,5%
Тестовая Количество элементов 35 62 32 59 188
Правильная классификация 30 49 19 52 150
% правильных ответов 86% 79% 59% 88% 80%
Учитывая весьма сложный характер задачи, результаты обучения можно признать более чем удовлетворительными
Рассмотрена возможность применения алгоритмов выделения аномальных наблюдений ршмограмм сокращений сердца на основе предложенных алгоритмов, использующих критерий нарушения гладкости наблюдаемых реализаций Показано, что такой способ анализа ршмограмм может оказаться полезным с точки зрения получения дополнительной диагностической информации
Решена задача построения прогнозной модели содержания радона в атмосфере горных выработок шахты 45 Джезказганцветмет по
экспериментальным данным Предполагается, что основными факторами, влияющими на радиационную обстановку рудничной атмосферы, являются следующие горнотехнологические параметры Х1 - объем камеры (м3), Х2 -доля объема камеры, приходящаяся на объем панели (участка), Хз -среднесуточная масса взрываемого взрывчатого вещества (кг), Х4 - доля объема камеры, приходящаяся на единицу массы взрываемого взрывчатого вещества (м3/кг), Х5 - тип вентиляционной ветви в месте отбора пробы (Х5 =1 - вентиляционная выработка входящей струи воздуха, Х5 = 2 -вентиляционная выработка рабочей струи воздуха, X; = 3 - вентиляционная выработка исходящей струи воздуха), Х6 - количество аэродинамических связей панели (участка), Х7 - трещиноватость (в зависимости от степени трещиноватости переменной Х7 {Х7 = 3 - трещиноватость сильная, Х7 = 2 -трещиноватость средняя, Х7 — 1 - трещиноватость слабая), Х& - глубина разработки панели (камеры),(м), Х9 - наличие вентилятора местного проветривания (ВМП) в камере (при наличии ВМП Х$ = 1, при отсутствии -Хр = 0), Хю - сменная добыча руды (т)
В качестве отклика 7 используется величина концентрации радона (Мэл/л)/1000 Она позволяет оценить содержание радона в среднем по шахте и, при известных объемах отработанного воздуха, оценить воздействие шахты по радиационному фактору на экологию атмосферы в районе расположения
Для построения модели использованы экспериментальные данные, полученные службой радиационной безопасности НПО Джезказганцветмег и содержащие 31 наблюдение Приведенные экспериментальные данные ранее использовались для построения регрессионной модели В результате получена адекватная линейная модель, содержащая всего три значимых фактора Х2, Х4, Х8 7= 24,7971 - 12,7848 Х2 +0 0120 Х4 - 0 0716 Х8 с остаточной дисперсией = 8,037
Исследованы различные варианты ИНС для получения аналогичной модели Показано, что наилучший вариант получается при использовании каскадной сете Целесообразность использования каскадной сети связана с тем обстоятельством, что в данной задаче часть факторов носит количественный характер, а часть качественный или близкий к нему характер К последней категории можно отнести факторы Хз, Х5, Хй. Х7, Хд Поэтому предлагается использовать каскадную сеть, где в качестве первого каскада используется автоассоциативная сеть 1зИ7к2Ь705, а в качестве второго каскада - двухслойный персептрон 17И3 О/ Первая сеть обучается на воспроизведение на своем выходе значений Х3, Х5, Х& Х7, Х9 , после чего фиксируются величины & , образующиеся на выходе сжимающего слоя к2 Для обучения персептрона второго каскада формируется новый набор данных, включающий в себя 31 наблюдение факторов X], Х2, Х4, Хз, Хю , соответствующие значения переменных Л1;, Б? и выход 7 В результате получена модель со следующими показателями качества дисперсия ошибки предсказания для элементов обучающей выборки (21 наблюдение) оказалась
равной = 2,36, для элементов тестовой выборки (10 наблюдений) а] = 7,58 , для всех наблюдений - = 3,89
Анализ полученной нейросетевой модели свидетельствует о том, что частная зависимость ¥= (р1(Х1,Х4) действительно близка к линейной Однако зависимости 7 = <р3(Х4,Х8), 7 = р4(5,,5'2) носят явно нелинейный характер Кроме того, очевидно, что нельзя пренебречь и суммарным влиянием факторов качественного характера Хз, Хз, Хе, Х7, Хд
В заключении сформулированы основные результаты работы
ЗАКЛЮЧЕНИЕ
В диссертационной работе осуществлено решение актуальной научной задачи создания статистических и нейросетевых методов обработки и анализа информации в условиях неоднородности экспериментальных данных
Основные научные и практические результаты, полученные лично автором
1 Уточнено исходное понятие неоднородности наблюдаемых данных, предложена классификация видов неоднородности, проведена систематизация и дан критический анализ известных постановок задачи обработки неоднородных данных, методов и алгоритмов ее решения
2 Исследованы свойства медианной фильтрации при анализе стохастических, детерминированных и смешанных процессов и выявлены ее специфические особенности как средства обработки неоднородных временных рядов для повышения ее достоверности
3 Исследована возможность получения дополнительной информации о свойствах неоднородных временных рядов путем сопоставления сигналов на выходах медианного фильтра и аналогичного фильтра скользящего среднего
4 Предложен новый критерий обнаружения аномальных наблюдений в коррелированных временных рядах, базирующийся на идее выявления нарушений гладкости их траекторий, и осуществлена разработка соответствующих алгоритмов обнаружения
5 Разработана методика выделения маломощных импульсных потоков на фоне интенсивной коррелированной помехи, основанная на использовании алгоритмов обнаружения аномальных наблюдений
6 Предложен новый вариант искусственных нейронных сетей -каскадные ЙНС и продемонстрирована их эффективность для решения ряда типовых задач классификации и построения математических моделей многофакторных объектов в условиях существенной структурной неоднородности экспериментальных выборок
7 Полученные теоретические результаты применены при решении практических задач из области медицинской техники, химико-фармацевтической и горной промышленности
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1 А Ш Авшалумов, Г Ф Филаретов Медианные фильтры как средство обработки стохастических сигналов в информационных системах// Известия ТулГУ Серия «Вычислительная техника Информационные технологии Системы управления», вып 4 Информационные системы -Тула Изд-воТулГУ, 2005 -С 9-15
2 А Ш Авшалумов, Г Ф Филаретов Медианная фильтрация периодограмм как средство повышения информативности спектрального анализа стохастических сигналов //Материалы XXXII Международной конференции «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» - IT+SE'2005 - С 310 — 313
3 А Ш Авшалумов, Г Ф Филаретов Методы выделения неоднородностей временных рядов //Сборник тезисов докладов VI Международной Крымской конференции «Космос и биосфера», 2005 -С 211-212
4 АШ Авшалумов, КБ Судаков, ГФ Филаретов Новая информационная технология системной диагностики функциональной активности органов человека //Медицинская техника, 2006, №3 С 13 -18
5 А Ш Авшалумов, Г Ф Филаретов Медианная фильтрация стохастических сигналов //Материалы ХХХЗП Международной конференции «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» - IT+SB'2006 - С 408 - 411
6 АШ Авшалумов, ГФ Филаретов Каскадирование искусственных нейронных сетей при решении задач классификации //Сборник трудов Второй международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности», Санкт-Петербург, 2006, том 5 - С 93-95
7 А Ш Авшалумов, Г Ф Филаретов Искусственные нейронные сети для обработки неоднородных данных //Материалы XXXIV Международной конференции «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» - IT+SE'2007 С 429 - 432
8 А Ш Авшалумов, Г Ф Филаретов Алгоритмы обнаружения аномальных наблюдений в коррелированных временных рядах // Вестник Московского энергетического института, 2007, №3 - С 118124
9 А Avslialumov, G Filaretov Detection and Analysis of Impulse Pomt Sequences on Correlated Disturbance Phone //52 Internationales Wissenschaftliches Kolloquium, 10-13 09 2007 TU Ilmenau Conference Proceedings, V 1, pp 95 -100
Подписано в печать Формой 60x90/16
Объем 1 п л Тираж 100 экз Заказ № - - ■
Типография МПГУ, Ленинский пр ,6
Оглавление автор диссертации — кандидата технических наук Авшалумов, Александр Шамаилович
Введение.
Глава 1. Систематизация и анализ основных методов обработки неоднородных данных.
1.1. Понятие неоднородности данных и классификация их основных разновидностей.
1.2. Методы и алгоритмы анализа неоднородных данных.
1.3. Основные парадигмы искусственных нейронных сетей.
1.4. Уточнение основных направлений исследования.
Выводы по главе 1.
Глава 2. Медианные методы обработки временных рядов.
2.1 Исходный алгоритм медианной обработки данных.
2.2. Методика анализа характеристик медианного фильтра при 49 случайных воздействиях.
2.3. Результаты анализа характеристик медианного фильтра при случайных воздействиях.
2.4. Анализ свойств медианного фильтра при детерминированных воздействиях.
2.5. Анализ свойств медианного фильтра при обработке неоднородных сигналов.
Выводы по главе 2.
Глава 3. Алгоритмы анализа коррелированных временных рядов.
3.1. Обнаружение аномальных наблюдений в коррелированных временных рядах.
3.2. Алгоритмы обнаружения аномальных наблюдений в коррелированных временных рядах.
3.3. Анализ импульсных потоков на фоне коррелированной помехи.
Выводы по главе 3.
Глава 4. Развитие нейросетевых методов как средства обработки неоднородных данных.
4.1. Основная идея и область применения.
4.2. Каскадные персептронные сети как средство классификации неоднородных данных.
4.3. Каскадные сети со сжатием информации.
4.4. Каскадные ИНС для целей построения математической модели объекта г ~-------ашми переменными.
Выводы по главе 4.
Глава 5. Применение разработанных методов анализа неоднородных данных.
5.1. Медицинский КВЧ-диагностический комплекс.
5.2. Обработка периодограмм с применением медианной фильтрации при спектральном анализе сигналов.
5.3. Каскадный нейросетевой классификатор функционального состояния органов и тканей человека.
5.4. Алгоритм выделения аномальных наблюдений как средство анализа ритмограмм сердца.
5.5 Разработка нейросетевой модели прогноза содержания радона в атмосфере горных выработок.
Выводы по главе 5.
Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Авшалумов, Александр Шамаилович
Решение современных задач управления сложными системами и объектами, широкомасштабное внедрение информационных технологий, необходимость повышения достоверности и качества исходной информации, лежащей в основе формирования эффективных управленческих воздействий настоятельно требуют дальнейшего развития методов и алгоритмов обработки экспериментальных данных, анализа и моделирования процессов (сигналов), характеризующих свойства изучаемого объекта. Одним из направлений такого развития является создание эффективных методов и алгоритмов, учитывающих неоднородность исходной информации. Такая неоднородность может носить различный характер и объективно обуславливаться разными причинами, связанными с особенностями конкретного объекта и/или со спецификой постановки задачи исследования.
При анализе процессов неоднородность может обуславливаться спонтанным изменением их характеристик, наличием в сигнале стохастической и детерминированной компонент, появлением аномальных наблюдений. При исследовании поведения многофакторных объектов зачастую приходится учитывать присутствие влияющих факторов как количественного, так и качественного характера, а в задачах управления такими объектами - возможные вариации их свойств во времени или в зависимости от режима функционирования. В задачах классификации неоднородность данных, их кластеризация является предпосылкой успешного решения данной задачи.
Работы по указанной проблематике велись многими учеными, начиная с трудов классиков математической статистики (Р. Фишера, Г. Шеффе, Дж. Бокса и др.), основоположников теории оптимальной фильтрации (Н. Винера, Р. Калмана, Л. Заде и др.), специалистов отечественной школы ( ЯЗ. Цыпкин, Р.Л. Стратонович, В.В. Налимов, Г.К. Круг, Е.В. Маркова, Э.К. Лецкий и др.). В их работах, а также в трудах их многочисленных последователей рассмотрены самые разные постановки задачи с учетом специфических особенностей конкретных областей применения (управление, радиотехника и теория связи, фильтрация, анализ стохастических процессов, статистический анализ, задачи классификации и пр.). По своей сути в большинстве случаях речь идет об обработке именно неоднородных данных, хотя впрямую это, как правило, не отмечается.
Несмотря на обилие работ в данной области многие вопросы обработки неоднородных данных либо исследованы недостаточно глубоко, либо нуждается в пересмотре сама исходная постановка задачи. Кроме того, в последнее время все большее применение получают алгоритмы, основанные на использовании искусственных нейронных сетей (ИНС). Такие алгоритмы могут оказаться весьма эффективными именно при анализе неоднородных данных. Все это в целом и определяет актуальность тематики данной работы.
Целью диссертационной работы является создание, развитие и исследование эффективных статистических и нейросетевых методов обработки информации в условиях различных видов неоднородностей экспериментальных данных, имея в виду повышение ее достоверности и качества как основы для принятия эффективных управленческих решений.
В соответствии с указанной целью в рамках диссертационной работы поставлены и решались следующие задачи:
1. Уточнение понятия и классификация разновидностей неоднородности данных, систематизация и анализ имеющихся методов и алгоритмов их обработки.
2. Исследование свойств медианной фильтрации как средства обработки неоднородных временных рядов и изучение возможности получения дополнительной информации о свойствах таких рядов путем сопоставления сигналов на выходах медианного фильтра и аналогичного фильтра скользящего среднего.
3. Разработка алгоритмов обнаружения аномальных наблюдений в коррелированных случайных последовательностях и исследование возможности их применения для задачи выделения маломощных импульсных потоков на фоне интенсивной коррелированной помехи.
4. Развитие нейросетевого подхода для решения ряда типовых задач классификации и построения математических моделей многофакторных объектов в условиях существенной структурной неоднородности экспериментальных выборок.
5. Применение полученных теоретических результатов при решении практических задач из области медицинской техники, химико-фармацевтической и горной промышленности.
Полученные результаты исследования базируются на использовании методов и средств теории вероятностей и математической статистики, теории случайных процессов, математического (имитационного) моделирования, теории искусственных нейронных сетей.
На защиту выносятся следующие научные положения, обладающие новизной:
1. Выявленные характерные свойства скользящей медианной фильтрации при обработке стохастических, детерминированных и смешанных процессов как средства повышения достоверности информации.
2. Доказательство возможности получения дополнительной информации при анализе процессов с временной неоднородностью путем сопоставления сигналов на выходах медианного фильтра и аналогичного фильтра скользящего среднего.
3. Новый критерий обнаружения аномальных наблюдений в коррелированных временных рядах, базирующийся на идее выявления нарушений гладкости их траекторий, и алгоритмы такого обнаружения.
4. Методика выявления и анализа маломощных импульсных потоков на фоне интенсивной коррелированной помехи на основе разработанных алгоритмов обнаружения аномальных наблюдений.
5. Оригинальные каскадные искусственные нейронные сети, предназначенные для эффективного решения задач классификации и построения математических моделей многофакторных объектов в условиях структурной неоднородности данных.
Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждается корректным использованием методов математической статистики, теории случайных процессов, аппарата теории искусственных нейронных сетей, результатами имитационного моделирования и практического использования разработанных алгоритмов и методов обработки неоднородной информации.
Научная значимость работы состоит в разработке новых подходов, методов и алгоритмов обработки информации в условиях различного вида неоднородностей, где традиционные методы анализа становятся малоэффективными.
Результаты исследований, выполненных в диссертационной работе, могут быть использованы при создании программно-алгоритмического обеспечения систем поддержки принятия управленческих решений, автоматизированных систем научных исследований, компьютизированных научных приборов и диагностических комплексов, информационно-измерительных систем и АСУ ТП в различных отраслях промышленности.
Результаты работы использованы при разработке медицинского КВЧ-диагностического комплекса, для построения математической модели установки химико-фармацевтического назначения и модели прогнозирования содержания радона в атмосфере горных выработок шахты 45 Джезказганцветмет по экспериментальным данным .
Результаты работы и ее основные положения докладывались на Всероссийской научно-практической конференции «Информационные и управляющие системы» (Тула, 2005г.), XXXII, XXXIII, XXXIV Международных конференциях «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» - 1Т+8Е'2005, 1Т+8Е'2006, 1Т+8Е'2007 (Ялта-Гурзуф, 2005 г., 2006 г., 2007 г.), Второй международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности» (Санкт-Петербург, 2006 г.), 52-ом Международном научном коллоквиуме (1\¥К) - (Ильменау, Германия, 2007 г.), на заседании кафедры «Автоматизированные системы управления» (АСУ) Московского государственного горного университета.
Основные положения и результаты диссертационной работы опубликованы в 9 печатных изданиях [77-85], в том числе в 2 изданиях, рекомендуемых ВАК РФ, а также в трудах 5 международных и 1 Всероссийской конференциях.
Диссертационная работа состоит из введения, пяти глав, заключения и списка литературы.
Заключение диссертация на тему "Методы и алгоритмы обработки информации в условиях неоднородности данных"
Выводы по главе 5
1. Приведены результаты успешного практического применения медианной фильтрации как способа сглаживания периодограмм стохастических процессов и каскадных нейронных сетей в задаче классификации функционального состояния органов и тканей организма человека. Соответствующие алгоритмы включены в состав программно-алгоритмического обеспечения медицинского КВЧ-диагностического комплекса, эффективно используемого в медицинской практике.
2. Рассмотрена возможность применения алгоритмов выделения аномальных наблюдений ритмограмм сокращений сердца на основе критерия гладкости наблюдаемых реализаций. Показано, что такой способ анализа ритмограмм может оказаться полезным с точки зрения получения дополнительной диагностической информации.
3. Доказана возможность и эффективность применения двухкаскадной ИНС для построения модели прогнозирования содержания радона в атмосфере горных выработок шахты 45 Джезказганцветмет по экспериментальным данным.
Заключение
В диссертационной работе осуществлено законченное исследование в области обработки и анализа информации в условиях неоднородности экспериментальных данных и получены следующие основные результаты:
1. Уточнено исходное понятие неоднородности наблюдаемых данных, предложена классификация видов неоднородности, дан критический анализ известных постановок задачи обработки неоднородных данных, методов и алгоритмов ее решения.
2. Исследованы свойства медианной фильтрации при анализе стохастических, детерминированных и смешанных процессов и выявлены ее специфические особенности как средства обработки неоднородных временных рядов.
3. Исследована возможность получения дополнительной информации о свойствах неоднородных временных рядов путем сопоставления сигналов на выходах медианного фильтра и аналогичного фильтра скользящего среднего.
4. Предложен новый критерий обнаружения аномальных наблюдений в коррелированных временных рядах, базирующийся на идее выявления нарушений гладкости их траекторий, и осуществлена разработка соответствующих алгоритмов обнаружения.
5. Разработана методика выделения маломощных импульсных потоков на фоне интенсивной коррелированной помехи, основанная на использовании алгоритмов обнаружения аномальных наблюдений.
6. Предложен новый вариант искусственных нейронных сетей -каскадные ИНС и продемонстрирована их эффективность для решения ряда типовых задач классификации и идентификации в условиях существенной структурной неоднородности экспериментальных выборок.
7. Полученные теоретические результаты применены при решении практических задач из области медицинской техники, химико-фармацевтической и горной промышленности.
Библиография Авшалумов, Александр Шамаилович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы экономики. Учебник для вузов. - М.: ЮНИТИ, 1998. 1022 с.
2. Андерсон Т. Введение в многомерный статистический анализ. Перев. с англ. под ред. Б. В. Гнеденко, М., Физматгиз, 1963.
3. Андре-Обрехт Р. Сегментация речевых сигналов в реальном масштабе времени. В сб. «Обнаружение изменения свойств сигналов и динамических систем», М.: МИР, 1989, с.226-251.
4. Андерсон Т. Статистический анализ временных рядов. М.: МИР, 1976.
5. Бакут П. А., Жулина Ю. В., Иванчук Н. А. Обнаружение движущихся объектов. М.: Советское Радио, 1980.
6. Бард И. Нелинейное оценивание параметров. М.: Статистика, 1979.
7. Бахвалов JLA. Моделирование систем. Учебное пособие для вузов. Изд-во МГГУ, 2006.
8. Бен дат Дж. Основы теории случайных шумов и ее применение. М.: «Наука», 1965.
9. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: МИР, 1989.
10. Ю.Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1. М.: МИР, 1973.
11. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 2. М.: МИР, 1974.
12. Болыпев JI.H., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1965.
13. З.Боровиков В.П., Боровиков И.П. STATISTICA -статистический анализ и обработка данных в среде Windows. М.: Информационно-издательский дом «Филинъ», 1998.
14. Бородюк В.П., Лецкий Э.К. Статистическое описание промышленных объектов. М.: Энергия, 1971.
15. Ван Трисс Е. Теория обнаружения. Оценок и модуляции. М.: Советское радио, 1972.
16. Вилски A.C. Обнаружение резких изменений в динамических системах. В сб. «Обнаружение изменения свойств сигналов и динамических систем», М.: МИР, 1989, с. 28-61.
17. П.Виноградова H.A., Филаретов Г.Ф., Леньшин В.Н., Свиридов В.Г. и др. Основы построения информационно-измерительных систем. М.: изд-во МЭИ, 2004.
18. Галушкин А.И. Нейрокомпьютеры. Кн.З: Учебное пособие для вузов. М.: ИПРЖР, 2000.
19. Головко В.А. Нейронные сети: обучение, организация и применение. М.: ИРПЖР, 2001.
20. Гольденберг П.М., Матюшкин Б.Д., Поляк М.Н. Цифровая обработка сигналов. М.: Радио и связь, 1985.
21. Гумбель Э. Статистика экстремальных значений. М.: МИР, 1965.
22. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. Выпуск1.М.: МИР, 1971.
23. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. Выпуск2. М.: МИР, 1972.
24. Ершов A.A. Стабильные методы оценки параметров. АиТ, 1978, №8. 25.3айдель А.Н. Элементарные оценки ошибок измерения. Наука, Ленингр.отд., 1968.
25. Каллан Роберт. Основные концепции нейронных сетей.: Пер. с англ. -М.: Издательский дом «Вильяме», 2001.
26. Кендалл М.Дж., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973.
27. Кендалл М.Дж., Стьюарт А. Теория распределений. М.: Наука, 1966.
28. Клигене Н., Тельскнис Л. Методы обнаружения моментов изменения свойств случайных процессов. АиТ, 1983, №10.
29. Кокс Д., Льюис П. Статистический анализ последовательности событий. М.: МИР, 1969.
30. Крамер Г., Лидбеттер М. Стационарные случайные процессы. М.: Мир, 1969.
31. Круг Г.К., Лисенков А.Н. Планирование эксперимента в условиях непрерывного временного дрейфа. Тр. МЭИ, 1966. вып. 67.
32. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия-телеком, 2001
33. Кудряшов В.К., Филаретов Г.Ф. Построение и моделирование адаптивного фильтра Калмана. В сб. «описание научных принципов.», Пущино, 1980.
34. Куликов Е.И., Трифонов А.П. Оценка параметров сигналов на фоне помех. М.: Советское радио, 1978.
35. Ли Р. Оптимальные оценки, определение характеристик и управление. М.: Наука, 1966.
36. Маркова Е.В. Лисенков А.Н. Планирование эксперимента в условиях неоднородностей.М.: Наука, 1973.
37. Марпл-мл. С. Цифровой спектральный анализ и его приложения. М.: МИР, 1990.
38. Мердок Дж. Контрольные карты (Предисл. Адлера Ю. П.). М.: Финансы и статистика, 1986.
39. Мирский Г .Я. Аппаратурное определение характеристик случайных процессов. М.: Энергия, 1972.
40. Миттаг Ч.-Й., Ринне Ч. Статистические методы обеспечения качества. М.: Машиностроение, 1995.
41. Михайлов В. М. Вариабельность ритма сердца: опыт практического применения метода. Изд. второе, перераб. и доп.: Иваново: Иван. гос. мед. академия, 2002.
42. Налимов В.В. Применение математической статистики при анализе вещества. М.: Физматгиз, 1960
43. Нидеккер И. Г. Проблема математического анализа сердечного ритма. // Физиология человека 1993; №3.
44. Никифоров И.В. Применение последовательного анализа к процессам авторегрессии. АиТ, 1975, №8, с. 174-177.
45. Никифоров И.В. Модификация и исследование процедуры кумулятивных сумм. АиТ, 1980, №9, с. 74-80.
46. Никифоров И.В. Последовательное обнаружение изменения свойств временных рядов. М.: Наука, 1983.
47. Поляк В.Т., Цыпкин ЯЗ. Помехоустойчивая идентификация. В сб. трудов IV симпозиума ИФАК «Идентификация и оценка параметров систем», 1976.
48. Поляк Ю.Г. Вероятностное моделирование на электронных вычислительных машинах. М.: Советское Радио, 1971.
49. Прэтт У. Цифровая обработка изображений. Кн. 2.М.: МИР, 1982.
50. Пугачёв В. С. О распределении числа выбросов случайного процесса. -В кн.: нелинейные и оптимальные системы. М.: Наука, 1971, с. 374 381.
51. Радченко Ю.С. Эффективность приема на фоне комбинированной помехи с дополнительной обработкой в медианном фильтре. «Журнал радиоэлектроники», 2001, №7.
52. Сб. «Введение в теорию порядковых статистик» М.: Статистика, 1970.
53. Себер Дж. Линейный регрессионный анализ. М.: МИР, 1980.
54. Сергиенко А.Б. Цифровая обработка сигналов. СПб.: Питер, 2003.
55. Сосулин Ю.Г., Фишман М.М. Оптимальное обнаружение сигналов со случайным моментом появления. Изв. АН СССР, Техн. кибернетика, 1977, №3.
56. Тихонов В.И., Кульман Н.К. Нелинейная фильтрация и квазикогерентный прием сигналов. М.: Советское радио, 1972.
57. Торговицкий И.Ш. Методы определения момента изменения характеристик случайных величин (обзор). Зарубежная электроника, №1, 1976.
58. Уоссерман Ф. Нейрокомпьютерная техника. М.: МИР, 1992.
59. Филаретов Г.Ф., Общая процедура построения контролирующих алгоритмов, Тезисы докладов IV Всесоюзной конференции «Перспективные методы планирования и анализа экспериментов при исследовании случайных полей и процессов», Петрозаводск, 1991.
60. Филаретов Г. Ф., Джордан Б. Применение автоассоциативных нейронных сетей для сжатия информации. XXX международная конференция. Информационные технологии в науке, образовании, телекоммуникации, бизнесе. Украина, Крым, Ялта-Гурзуф, 19-28 мая 2003 г.
61. Фомин Я. А. Теория выбросов случайных процессов. М.: Связь, 1980.
62. Фу К. Последовательные методы распознавания образов и обучения машин. М.: Наука, 1971.
63. Хазен Э. М. Методы оптимальных статистических решений и задачи оптимального управления. М.: Советское Радио, 1968.
64. Хан Г. Шапиро С. Статистические модели в инженерных задачах. М.: МИР, 1969.
65. Хартман К., Лецкий Э., Шеффер В. И др. Планирование эксперимента в исследовании технологических процессов. М.: МИР, 1977.
66. Химмельблау Д. Анализ процессов статистическими методами. М.: МИР, 1973.
67. Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука, 1968.71.111еффе Г. Дисперсионный анализ. М.: Физматгиз, 1963.
68. Ширяев А. Н. Обнаружение спонтанно возникающих эффектов. Докл. АН СССР, 1961,138, №4.
69. Ширяев А. Н. Задача скорейшего обнаружения нарушения стационарного режима. Докл. АН СССР, 1961, 138, № 5.
70. Яноши А. Теория и практика обработки результатов измерений. М.: МИР, 1968.75. http://revlab.bidmc.harvard.edu/DvnaDx/case-studv/hrv/76.www.ssga.ru/erudietes-info/info technology/comp model (цифровая обработка изображений на ЭВМ).
71. А.Ш. Авшалумов, К.В. Судаков, Г.Ф. Филаретов. Новая информационная технология системной диагностики функциональной активности органов человека. Медицинская техника, 2006, №3, с. 13 — 18.
72. А.Ш. Авшалумов, Г.Ф. Филаретов. Медианная фильтрация стохастических сигналов. Материалы XXXIII Международной конференции «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» IT+SE'2006, с. 408 -411.
73. А.Ш. Авшалумов, Г.Ф. Филаретов. Каскадирование искусственных нейронных сетей при решении задач классификации. «Высокие технологии, фундаментальные и прикладные исследования». Т. 5:
74. Сборник трудов Второй международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности», Санкт-Петербург, 2006, с. 93-95.
75. А.Ш. Авшалумов, Г.Ф. Филаретов. Искусственные нейронные сети для обработки неоднородных данных. Материалы XXXIV Международной конференции «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» IT+SE'2007, с. 429 - 432.
76. А.Ш. Авшалумов, Г.Ф. Филаретов. Алгоритмы обнаружения аномальных наблюдений в коррелированных временных рядах // Вестник Московского энергетического института. 2007. №3.
77. A. Avshalumov, G. Filaretov. Detection and Analysis of Impulse Point Sequences on Correlated Disturbance Phone. 52. Internationales Wissenschaftliches Kolloquium, 10-13.09.2007, TU Ilmenau. Conference Proceedings, Volume 1.
78. А.Ш. Авшалумов, Г.Ф. Филаретов. Методы выделения неоднородностей временных рядов. Сборник тезисов докладов VI Международной Крымской конференции «Космос и биосфера», 2005, с. 211-212.
79. Robbins Н., Monro S. // Ann. math, statist. 1951. Т. 22. p. 400.
80. Tukey J.W. Exploratory Data Analysis. Addison- Wesley, Reading Mass., 1971.
81. Bourland H., Kamp Y. Auto-association by Multilayer Perceptrons and singular Value Decomposition. Biological Cybernetics, 59,1988, p. 291-294.
82. Lomnicki A.A., Zaremba S.K. On estimating the spectral density function of a stochastic process. Y.Roy.Stat.Soc., В19,13,1957.
83. Elman J. Finding structure in time/ Cognitive Science, 1990, №14, p. 179211.
84. Tenney R., Hebbert R., sandel N. A tracking filter for maneuvering sources, IEEE Trans. Aut. Control, AC-22,246-251 (april 1977).
85. Tugnait J, haddad A. A detection- estimation scheme for state estimation in switching environments, Automatica, 15,477-481 (july 1979).
86. Tugnait J. Adaptive estimation and identification for discrete systems with Markov jamp parameters. IEEE Trans. Aut. Control, AC-27, 1054-1065 (oct. 1982).
87. Glasser M. Linear regression analysis with missing observations among the independent variables. J. Amer. Statist. Assoc., v. 59,1964, №307.
88. Haitovsky Y. Missing data in regression analysis. J. Roy. Statist. Soc., ser. B, v. 30,1968, №1.
89. Huber P.J. Robust statistics: A Review, Ann. Math. Stat., v.43,1972, №4.
90. Rao C.R. Estimation of heteroscedastic variances in linear models. J. Amer. Statist. Assoc., v. 65,1970.
91. Simon Haykin. Neural Networks: A Comprehensive Foundation. Second Edition. McMaster University. Prentice-Hall. 1999.
92. Willsky A.S. A servey of design methods for failure detection in dynamic systems, Automatica, 12,601-611,1976.
93. Winer N. Extrapolation, interpolation and smoothing of stationary time series. New York. 1949.
-
Похожие работы
- Исследование оптико-электронных методов получения и обработки информации о неоднородностях морской среды
- Разработка моделей и алгоритмов диагностики подводных неоднородностей по поверхностным эффектам с применением вейвлет-преобразования
- Алгоритмы обнаружения изображений объектов на телевизионных изображениях в условиях априорной неопределенности
- Совершенствование котнроля качества деталей подшипников вихретоковым методом на основе автоматизации распознавания дефектов поверхностей качения с использованием искусственных нейронных сетей
- Разработка и исследование методики количественной оценки внутренних неоднородностей кабельных цепей методом импульсной рефлектометрии
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность