автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Аналитические и процедурные модели для информационной системы распознавания графических объектов в условиях неопределенности

кандидата технических наук
Лыонг Хак Динь
город
Тамбов
год
2014
специальность ВАК РФ
05.25.05
Диссертация по документальной информации на тему «Аналитические и процедурные модели для информационной системы распознавания графических объектов в условиях неопределенности»

Автореферат диссертации по теме "Аналитические и процедурные модели для информационной системы распознавания графических объектов в условиях неопределенности"

На правах рукописи

Лыонг Хак Динь

АНАЛИТИЧЕСКИЕ И ПРОЦЕДУРНЫЕ МОДЕЛИ

ДЛЯ ИНФОРМАЦИОННОЙ СИСТЕМЫ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Специальность 05.25.05 «Информационные системы и процессы» (технические науки)

Автореферат диссертации на соискание ученой степени кандидата технических наук

2014

Тамбов-2014 005548596

005548596

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Тамбовский государственный технический университет» (ФГБОУ ВПО «ТГТУ») на кафедре «Информационные системы и защита информации».

Научный руководитель

Официальные оппоненты:

Ведущая организация

доктор технических наук, профессор Алексеев Владимир Витальевич

Ищук Игорь Николаевич,

доктор технических наук, доцент, Федеральное государственное казенное образовательное учреждение высшего профессионального образования Военный учебно-научный центр ВВС «Военно-воздушная академия им. проф. Н. Е. Жуковского и Ю. А. Гагарина» (г. Воронеж), 12 кафедра, начальник

Зайцев Александр Владимирович,

доктор технических наук, профессор, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский авиационный институт (национальный исследовательский университет)» (МАИ), кафедра «Системы автоматического и интеллектуального управления», профессор

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Пензенский государственный технологический университет»

Защита состоится 27 июня 2014 г. в 15 ч на заседании диссертационного совета Д 212.260.05 в ФГБОУ ВПО «ТГТУ» по адресу: 392000, г. Тамбов, ул. Ленинградская, д. 1, ауд. 160.

С диссертацией можно ознакомиться в библиотеке и на сайте ФГБОУ ВПО «ТГТУ», http://tstu.ru/.

Автореферат разослан « апреля 2014 г.

Ученый секретарь диссертационного совета

Селиванова Зоя Михайловна

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. В последнее время исследователями много внимания уделяется вопросам построения и использования информационных систем (ИС), работающих с графическими объектами. Кроме того, в ряде информационных систем, в частности образовательного, метеорологического или медицинского назначения, информация, необходимая специалисту для принятия решения, заключена иногда в еле различимых изменениях графического объекта по сравнению с эталонным объектом. Поиск этих отличий сопровождается, как правило, наличием неопределенности, обусловленной недостаточным качеством сканирования графических объектов; шумами и фоном различной природы; недостаточной квалификацией специалистов, а в ряде случаев целенаправленными действиями по нарушению режимов работы информационных систем. Уменьшение влияния неопределенности возможно различивши способами: повышением качества сканирования объектов, помехозащищенности; повышением качества распознавания графических объектов и т.п.

Практика показала, что зачастую пользователь не знает, как лучше выявить отличия между исследуемым графическим объектом и, например, эталонным. Этим обусловлено невысокое качество результатов поиска даже при использовании таких известных и зарекомендовавших себя ИС, как Гугл или Яндекс. Поэтому на смену релевантности приходит понятие «пертинентность» -соответствие полученной информации информационной потребности. Однако для поиска на основе пертинентности необходимо детально формализовать информационную потребность пользователя.

В работе представлены результаты исследования, направленные на повышение эффективности функционирования информационных систем на основе созданных моделей, применение которых обеспечивает повышение качества распознавания графических объектов в условиях неопределенности.

Степень разработанности темы исследования. Проблемам повышения эффективности функционирования информационных систем на основе формализации информационной потребности пользователя, повышения качества распознавания графических объектов посвящены работы Э. В. Попова, Г. С. Поспелова, Д. А. Поспелова, Р. Шенка и др.

Исследованию распознавания образов посвящен ряд работ, в частности, эти вопросы нашли отражение в трудах Б. В. Анисимова, С. А. Айвазяна, В. М. Безрука, Дж. Бокса, В. Н. Вапника, А. А. Горелика, Г. Дженкинса, Р. Дуда, В. В. Круглова, В. Г. Небабина, Э. Патрика, В. А. Скрипкина, К. Фукунаги, А. Я. Червоненкиса и др. Эти работы внесли существенный вклад в развитие теории и практики исследуемой предметной области. Однако их содержание не в полной мере отражает особенности распознавания графических объектов, главными из которых является малый объем априорных данных относительно эталонных описаний распознаваемых образов, сложность создания оптимальных алгоритмов распознавания сигналов на основе адекватных вероятностных моделей по совокупности показателей качества. Остаются нерассмотренными вопросы улучшения пертинентности поиска сведений за счет качества распознавания графических объектов в условиях неопреде-

ленности. В связи с этим в ряде работ предлагается использовать коллокации для поиска и кластеризации информационных объектов.

В процессе исследования сформулированы выводы, свидетельствующие, в частности, о недостаточности аппарата математической статистики для построения эффективных моделей поиска и кластеризации сведений.

Таким образом, практическая задача заключается в развитии информационных систем на основе повышения пертинентности результатов поиска сведений за счет повышения качества распознавания графических объектов в условиях неопределенности.

Объект исследования — процесс распознавания графических объектов.

Предметом исследования являются модели распознавания графических объектов в условиях неопределенности, обеспечивающие заданное качество их распознавания.

Целью исследования является повышение эффективности информационной системы за счет применения разработанных моделей, обеспечивающих заданное качество распознавания графических объектов и оценки пертинентности его результатов в условиях неопределенности.

Научная задача исследования заключается в необходимости разработки моделей распознавания графических объектов в условиях неопределенности на основе определения информационной потребности пользователя с применением математического аппарата теории нечетких множеств.

Для достижения цели исследования и решения научной задачи необходимо решить частные задачи:

1. Провести анализ предметной области. Выполнить обоснование и выбор критериев соответствия сведений, информационной потребности пользователя.

2. Разработать аналитические модели распознавания графических объектов и оценки пертинентности этого процесса.

3. Разработать процедурную модель решения задачи распознавания графических объектов.

4. Оценить эффективность полученных в ходе исследования моделей и живучесть системы, построенной с применением разработанных моделей.

Научная новизна диссертации заключается в разработке моделей, обеспечивающих повышение качества распознавания графических объектов в условиях неопределенности, а именно:

- аналитическая модель распознавания графических объектов, отличающаяся построением системы уравнений для определения коэффициентов огибающих сплайнов на выделенных временных интервалах, решение которой формирует набор признаков, характеризующих графический объект;

- аналитическая модель процесса распознавания графического объекта, отличающаяся введением параметров «полнота» и «точность», обобщающей временной ^-нормы, включающей функции принадлежности для формирования оценки пертинентности;

- процедурная модель решения задачи распознавания графических объектов, отличающаяся определением динамических характеристик распознаваемого объекта на основе кубических сплайнов;

Теоретическая и практическая значимость. Теоретическая значимость результатов исследования заключается в развитии: теории распознавания образов при решении задач распознавания графических объектов в условиях неопределенности путем построения моделей, обеспечивающих повышение качества распознавания графических объектов; теории информационного поиска на основе предложенного критерия и модели оценки пертинентности результатов распознавания графического объекта.

Практическая значимость результатов исследования заключается в программной реализации разработанных моделей и возможности определения количественных показателей эффективности функционирования И С в различных предметных областях на основе формализации информационной потребности пользователя в виде совокупности некоторых коллокаций.

Методология и методы исследования. Для решения поставленных задач и разработки соответствующих моделей применены методы теорий информационного поиска, нечетких множеств, распознавания образов, сетей Петри.

Положения, выносимые на защиту:

— аналитическая модель распознавания графических объектов, обеспечивающая перевод графического объекта в соответствующий набор признаков и позволяющая в автоматизированном режиме определять характеристики, обеспечивающие качество распознавания;

— аналитическая модель процесса распознавания графического объекта, обеспечивающая требуемую пертинентность результата, на основе учета понятий полнота и точность поиска, а также взвешенной F-нормы;

— процедурная модель решения задачи распознавания графических объектов, позволяющая определять динамические характеристики распознаваемого объекта на основе кубических сплайнов для достижения требуемой пертинентности.

Степень достоверности и апробация результатов исследования. Достоверность научных результатов обеспечивается полнотой анализа предметной области и подтверждается корректным применением математического аппарата теории информационного поиска, нечетких множеств, распознавания образов, сетей Петри, согласуемостью полученных теоретических результатов с результатами вычислительных экспериментов.

Основные результаты работы докладывались и обсуждались на: Международной научно-практической конференции «Техника и безопасность объектов уголовно-исполнительной системы - 2011» (г. Воронеж); VIII Всероссийской научно-практической конференции «Математические методы и информационно-технические средства» (г.Краснодар, 2012); Международной научно-практической конференции «Техника и безопасность объектов уголовно-исполнительной системы» (г. Воронеж, 2013); Всероссийской научно-практической конференции «Актуальные проблемы деятельности подразделений уголовно-исполнительной системы» (г. Воронеж, 2013); Международной научно-технической конференции «Современные информационные технологии» (г. Пенза, 2014); XIV Международной конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 2014).

Результаты исследования использованы в информационной системе, применяемой в учебном процессе для формирования образовательного контента в соответствии с профессионально-ориентированными требованиями направления подготовки и при контроле качества формируемых у студентов профессиональных компетенций в ФГБОУ ВПО «ТГТУ». Аналитические и процедурные модели распознавания графических объектов использованы при разработке концепции и структуры информационной интеллектуальной системы для автоматизации процессов принятия решений о состоянии пациента в ООО «Медтехника», что подтверждено актами использования.

По результатам выполненных исследований опубликовано 32 печатных работ, в том числе 7 статей в научных изданиях, рекомендуемых ВАК при Минобрнауки РФ.

В публикациях, написанных в соавторстве, лично автору принадлежат: результаты анализа предметной области [3, 4, 12, 17, 18, 30]; формулировки постановок задач [9, 10, 14, 19, 20, 22]; построение и анализ моделей, выносимых на защиту [6, 7, 24, 28, 29, 31, 32]; результаты применения [1, 2, 23, 25 - 27] и оценки эффективности использования моделей [5, 8, 11, 13, 15, 16, 21].

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка использованных источников и приложений. Общий объем работы составляет 118 страниц основного текста, включая 20 рисунков. Список использованных источников включает 141 наименование.

Основные результаты исследования, соответствуют п. 7 паспорта специальности 05.25.05 «Информационные системы и процессы».

Работа выполнена в рамках приоритетных научных направлений стратегического развития Института автоматики и информационных технологий, Научно-образовательного центра моделирования и управления информационными процессами и системами и информационной безопасности ФГБОУ ВПО «ТГТУ», научных школ ФГБОУ ВПО «ТГТУ» и ФГБУН «Институт радиотехники и электроники им. В. А. Котельникова» РАН, а также при поддержке госконтракта № П292 ФЦП «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы».

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы цель и задачи исследования, научная новизна, практическая значимость результатов работы, основные положения, выносимые на защиту, приведена аннотация диссертационной работы.

В первой главе «Современное состояние вопроса распознавания графических объектов в информационных системах» проведен анализ подходов к решению задачи построения и применения информационных систем распознавания графических объектов. Рассмотрены методы и модели распознавания графических объектов, основанные на различных принципах. Показано, что практически все виды систем распознавания графических объектов, таких, например, как графики, диаграммы, осциллограммы электроэнцефало-

граммы, фонокардиограммы, реоэнцефалограммы, результаты плетизмографии, спектрального анализа и т.п., базируются на строго формализованном описании каждого класса объектов или явлений на языке признаков. Обосновано, что подход к построеншо аналитических и процедурных моделей распознавания графических объектов, представлению и оценке информационной потребности пользователя, при их использовании, необходимо осуществлять на основе применения теории нечетких множеств, а показателем соответствия результата распознавания информационной потребности пользователя является пертинентность — важная составляющая задачи повышения эффективности функционирования ИС.

На основании выполненного анализа обоснованы объект и предмет исследования, сформулированы цель и задачи исследования.

Во второй главе «Аналитические модели для информационных систем распознавания графических объектов» представлено описание разработанных аналитических моделей распознавания графического объекта и процесса его распознавания для формирования оценки пертинентности на основе математического аппарата теории нечетких множеств.

В результате исследования моделей информационных процессов распознавания графических объектов построена аналитическая модель их распознавания на основе кубических сплайнов, которая является комбинацией аналитической модели построения кубических сплайнов и логико-лингвистической модели, позволяющей установить соответствие между набором признаков графического объекта и табличным набором этих признаков, т.е. отнести графический объект к одному из известных классов. Применение известных таблиц откликов систем на возмущения различных видов позволяет определить соответствующие им корреляционные функции выходного и входного процессов, соответственно: r'yX{t), r^(t).

Таким образом, соотнесение графического объекта x^t) к определенному

классу К„ / = 1, п осуществляется набором правил, фрагмент которых имеет вид

IFrJx(i) is м\ and r]yx(t) is M\, ..., rlx{t)\sMxn,

THEN S11 (/) = a) + b) (t -1,,) + 4 (/ - )2 + 4 (t -1,)ъ

2 6

AND К, te [t,i = \7n\

IFr>)isM* and/¿(0is Mf,..., /-¿(i)isM*,

к ik

THEN Sk(t) = af +bUt-tl) + 2jr{t-ti)2

2 о

ANDK, = s^', t e [/,_,, / = Г777. (1)

В выражении (1) м\ - значение соответствующего элемента терм-множества; а^ , Ь^ , , - коэффициенты полиномов третьей степени, определяемые решением системы дифференциальных уравнений для граничных условий и условия непрерывности первой и второй производной сплайна.

Таким образом, значения корреляционных функций и преоб-

разуются в соответствующий набор признаков с применением процедуры построения сплайнов.

Для того чтобы определить эффективность применения разработанной модели, необходимо формализовать информационную потребность пользователя. В главе описан предложенный подход к формализации информационной потребности пользователя на основе теории нечетких множеств и понятии «коллокация» как взаимного расположения объектов на определенных расстояниях друг от друга. Множество всех термов, характеризующих существенные признаки графического объекта

'1 '2 '3 ' '/-1 '/ 4 '

где е 5, р^ е Я- бинарное множество, 1 < у < п, у = 1,1, / е И, называется коллокацией, а р определяет присутствие или отсутствие некоторого признака. Для определения того, насколько близко один признак должен быть расположен к другому, вводится нечеткость парой лингвистических переменных /?и А р. . Лингвистическая переменная Ли = <г, Тг, ТУ, Сг, Мг>, где г — «расстояние между признаками» — имя лингвистической переменной; Тг = {«большое», «среднее», «малое»} — терм-множество значений лингвистической переменной; Сг - синтаксическое правило, порождающее названия переменной; Мг - семантическое правило, которое ставит в соответствие каждой нечеткой переменной ее смысл, т.е. для каждого нечеткого множества У е Ог(Тг) определяет : /V —» [0; 1]. Лингвистическая переменная Ак = <а, Та, Н, Са, Ма>, где а - «ожидаемая степень пертинентности коллока-ции»; Та - {«положительное», «нейтральное», «отрицательное»}; С а - синтаксическое правило, порождающее названия переменной а; Ма — семантическое правило, которое ставит в соответствие каждой нечеткой переменной ее смысл, т.е. для каждого нечеткого множества Е 6 Оа(Та) определяет число \1Е:Н—>[0; 1]. В исследовании использована непрерывная аппроксимация

функции для задания 1вида \\у : ^ -> [0; 1] такая, что V/ е /V,

Принято, что й/ е Н/ — произвольный элемент вида (2), количество термов в котором равно /. Поставив Л/ в соответствие I — 1 значений лингвистической переменной Яц, обозначим

его вектором •••, 1), в том смысле,

что задает расстояние между г'-м и (г +/)-м элементом коллокации /?/,

/ = 1, / — 1.

С синтаксической точки зрения кортеж <Л/, /?,> представлен в виде высказывания: «признак я^'2 следует за признаком на расстоянии цГ1 и

признак следует за ними на расстоянии цГ2 и признак л^''4 следует

за ними на расстоянии и ... и признак следует за ними на расстоянии

». Тогда с точки зрения семантики функция принадлежности вычисляется как

\Чч(Х)= Т_АН(х,)), (3)

' 1=1,1-1 '

гдех, б Ж, / = 1, /-1, Х = {*,, х2,..., .

Кортеж значений q = <//;, Л,, ЛЛ> определен как информационная потребность пользователя. Каждая такая тройка характеризует мнение пользователя о некоторой коллокации. Пользователь формулирует свою информационную

потребность в виде нечетких высказываний, например: «Если терм гхух =

= Я, ^ и терм ^ = Д2 и терм з^ = К, и ... и терм = Л,_ь

то Ал = «К,».

На основе д — <И[, Н(, /1 ¡¡> строится функция принадлежности (), характеризующая позитивное или негативное влияние появления некоторой коллокации на ожидаемую пользователем пертинентность. Она определяется как функционал:

Ж: (цЛ;С), цл.)->[0;1]. (4)

В главе определены семантические требования к функционалу (4), выраженные в форме тождеств.

При фиксированном X, 1У(\1И1(Х), \1А') задается прямой на е [0; 1].

Тогда, заменим в (X) согласно (3), а (X), на , получим

/=1, /-1 <=1, /-1 Введенные лингвистические переменные (/?и Ак) позволяют формализовать информационную потребность пользователя в виде совокупности значений q = </?/, У?;, А[{>, т.е. построить модель процесса распознавания графических объектов (поиска сведений). Функция принадлежности формализует пертинентность по признаку, соответствующему коллокации Л/.

Поскольку решением задачи распознавания является некоторое множество £) е О, для которого существует ц*, такой, что О — Ад ), то для решения задачи введен критерий эффективности решения задачи распознавания графического объекта, основанный на понятиях полноты и точности:

- полнота поиска г =-; (6)

а+с

— точность поиска р =-. (7)

а + Ъ

Кроме того, рассчитываются

а+с1 Ь + с , ,

асс =- и егг =- - коэффициенты аккуратности и

а + Ъ + с + й ал-Ъ + с + й

ошибки.

Значения коэффициентов а, Ь, с, с1 рассчитываются в результате применения модели распознавания графических объектов (1) и округляемых до натурального числа. В качестве критерия эффективности информационного поиска взята двухпараметрическая свертка полноты и поиска, названная /^-нормой:

г_(1+РУ о2=

Р2р + г ' а

где а - коэффициент, определяющий предпочтения тому или иному параметру а е [0; 1].

Эти результаты позволяют определить функцию принадлежности (\хл(д)), как ожидаемую пользователем степень пертинентности, удовлетворяющих потребности (д). Тогда полнота и точность поиска, как составляющие пертинентности, определяются следующими выражениями:

р = ^-. (9)

Тогда в силу (2) /^-норма примет вид при выполнении условия релевантности (в качестве д будут приняты только результаты, составляющие множество релевантных результатов (£)')):

ГО, | О' |= 0;

2 \хА(я)

N

1 + Цл О?)+7^77^(9)

|£>'|>0. (Ю)

Согласно (10) получена некоторая функция F, значение которой определяет предпочтительность результата, для удовлетворения заданной информационной потребности пользователя. Тогда решение задачи нахождения множества объектов О = Лд*) из множества всех объектов П при условии, что <7 <= О? — множество «непустых» результатов, определяется выражением:

О* =/Гаг§тахИ]. (11)

V )

Выражения (2 - 11) определяют аналитическую модель процесса распознавания графических объектов, результаты которого обладают заданной пертинентностью.

Для реализации разработанных аналитических моделей необходимо построить соответствующие процедурные модели и провести исследования по определению требований к необходимым информационным ресурсам и особенностям применяемых баз данных.

В третьей главе «Процедурные модели распознавания графических объектов в информационных системах» представлены процедурные модели решения задачи распознавания графических объектов на основе сплайнов, а также результаты моделирования процесса распределения ресурсов в информационных системах для решения задач распознавания графических объектов и решения задачи определения структуры баз данных.

Исследование разработанных моделей позволило построить процедурную модель решения задачи распознавания графических объектов, представленную

Рис. 1. Блок-схема алгоритма процедурной модели

В главе приведены результаты моделирования процесса распределения ресурсов в информационных системах для решения задач распознавания графических объектов с применением разработанных моделей.

Реализация разработанных моделей предъявляет определенные требования к используемым базам данных. Решение задачи построения структур баз данных (БД) позволило определить структуру БД, обеспечивающую наилучшую производительность.

В четвертой главе «Практическое применение разработанных моделей и оценка эффективности их применения» приведены примеры реализации разработанных моделей в И С различного назначения, представлены результаты оценки эффективности ИС.

Применение разработанных моделей в информационной системе образовательного назначения, реализованной в программной среде МООБЬЕ, позволило повысить ее эффективность на 12% за счет получения результата распознавания, удовлетворяющего требуемой пертинентности пользователя при оценке качества формируемых компетенций.

В процессе судебно-психиатрической экспертизы применяется автоматизированная информационная интеллектуальная система для принятия решения о диагнозе пациента. Диаграмма прецедентов, отражающая отношения между актерами и прецедентами, в том числе и при принятии заключений, представлена на рис. 2. Тоном выделены элементы диаграммы, в которых использованы разработанные модели.

Рис. 2. Диаграмма прецедентов

В данной системе разработанные модели включены в прецеденты: оформление медицинской документации; оценка общей опасности; решение о постановке на активное диспансерное наблюдение (АДН); полная характеристика. Более качественное, по сравнению с существующими системами, распознавание таких графических объектов, как электроэнцефалограммы, фонокар-диограммы, реоэнцефалограммы позволило повысить качество принимаемых заключений судебно-психиатрической экспертизы на 15%.

Проведенная оценка пертинентности результатов распознавания графического объекта в представленных выше системах, основанная на использовании понятий полноты и точности, показала, что применение разработанных моделей на 18% повышает эффективность функционирования ИС.

На рисунке 3 представлена сравнительная оценка длительности процесса распознавания графических объектов. При размере выборки М = 5000 он достигает 72 секунды для традиционной системы распознавания, и 57 секунд для системы с применением разработанных моделей, а требуемый объем памяти для хранения данных меньше, примерно, в 11 раз.

в традиционной системе распознавания — — в разработанной

Рис. 3. Зависимость длительности процесса распознавания (0 от размера выборки (М)

В процессе проведения исследования была проведена оценка влияния введенных в структуру информационной системы моделей на ее живучесть. Для оценки живучести исследуемой структуры применен подход к оценке живучести внутренней структуры ИС с использованием распределенных информационных систем. Процесс расчета оценки живучести ИС с применением разработанных моделей проведен с использованием системы МАТЬ А В Я2010а с ППП ТчГЫТ версии 6.0.4.

Результаты моделирования показали, что внедрение разработанных моделей в ИС не ухудшает ее живучесть.

Таким образом, поставленная научная задача решена, цель исследования достигнута.

В заключении сформулированы основные результаты диссертационного исследования:

1. Проведенный анализ предметной области на основе системного описания задач распознавания графических объектов в информационных системах позволил выделить системные компоненты и определить общесистемные характеристики процесса распознавания графических объектов, благодаря чему обеспечивается построение эффективных информационных систем, а также осуществить обоснование и выбор критериев соответствия сведений информационной потребности пользователя.

2. Разработана аналитическая модель распознавания графических объектов, отличающаяся использованием соответствующего множества кубических сплайнов для перевода графического объекта в соответствующий набор признаков и позволяющая в автоматизированном режиме определять характеристики, обеспечивающие качество распознавания объектов.

3. Разработана аналитическая модель процесса распознавания графического объекта, отличающаяся учетом понятий полнота и точность поиска, а также взвешенной /''-нормы и определяющая требуемую пертинентность результатов процесса.

4. Разработана процедурная модель решения задачи распознавания графических объектов, отличающаяся определением динамических характеристик распознаваемого объекта на основе кубических сплайнов.

5. Оценка эффективности применения полученных в ходе исследования моделей показала, что их применение позволяет повысить эффективность ИС образовательного назначения на 12%, а ИС, применяемых в психиатрии, — на 15%. Оценка живучести ИС с учетом применения разработанных моделей показала, что их внедрение в систему не ухудшает ее живучесть.

Рекомендации и перспективы дальнейшей разработки темы. Разработанные модели целесообразно применять в информационных системах распознавания графических объектов образовательного и специального назначения для принятия решений, обоснованность которых зависит от качества распознавания графических объектов.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи в изданиях, рекомендованных ВАК при Минобрнауки России".

1. Подход к формированию набора информационных ресурсов образовательного назначения на основе нечетких сетей Петри / Д. X. Лыонг, О. Г. Иванова, Т. О. Авдеева, М. Ауад, М. Аль-Балуши // Приборы и системы. Управление, контроль, диагностика. - 2012. - № 3 - С. 55 - 58.

2. Интеллектуальная система обучения с адаптивным построением курса обучения на ЬМБ Моос11е / Д. X. Лыонг, Т. О. Авдеева, М. Ауад, М. Аль-Балуши // Приборы и системы. Управление, контроль, диагностика. - 2012. -№3-С. 71-74.

3. Формализация информационной потребности с помощью коллока-ций на основе теории нечетких множеств для пертинентного поиска текстовых сведений / Д. X. Лыонг, 10. Ю. Громов, Д. В. Поляков, М. Шихук // Информация и безопасность. — Воронеж : Издательско-полиграфический центр Воронежского государственного университета. — 2012. — Т. 15. — № 2. - С. 213 —218.

4. К вопросу о моделировании процесса распределения ресурсов в информационных системах. / Д. X. Лыонг, К. А. Набатов, Ю. В. Минин, С. Н. Коршиков // Информация и безопасность. - Воронеж: Издательско-полиграфический центр Воронежского государственного университета. —2012. — №4.-С. 461 -470.

5. Применение распределенных информационных систем для оценки живучести нечетких графов / Д. X. Лыонг, М. А. Хорохорин, А. А. Долгов, М. Ауад // Информация и безопасность. - Воронеж: Издательско-полиграфический центр Воронежского государственного университета. — 2012. — Т. 15,-№2.-С. 245-248.

6. Аналитическая модель распознавания информационного процесса в системе поддержки принятия решений / В. В. Алексеев, Ю. Ю. Громов, Д. X. Лыонг, Ю. В. Минин // Вестник Воронежского института МВД России. -Воронеж : ИМВД РФ, 2013. - № 4. - С. 221 - 225.

7. Распознавание информационного процесса в системе поддержки принятия решений / В. В. Алексеев, Д. X. Лыонг, Ю. В. Минин, С. Н. Сатышев // Приборы и системы. Управление, контроль, диагностика. - 2014. - №1. -С. 47-49.

Статьи в других изданиях:

8. Оценка живучести сетевых структур с использованием системы Ма^аЬ / Д. X. Лыонг, А. А. Долгов, О. Г. Иванова, М. Ауад // Вестник Воронежского института ФСИН России. - Воронеж : ООО ИПЦ «Научная книга». -2011. —№ 1.-С. 56-59.

9. Управление информационными процессами при нечеткой информации / Д. X. Лыонг, Ю. В. Минин, А. Ю. Громова [и др.] // Вестник Воронежского института ФСИН России. - Воронеж: ООО ИПЦ «Научная книга». -2011. — № 1. — С. 71 —75.

10. Управление информационными процессами в системах с использованием качественной информации / Д. X. Лыонг, Ю. В. Минин, А. Ю. Громова [и др.] // Вестник Воронежского института ФСИН России. - Воронеж: ООО ИПЦ «Научная книга». - 2011. - № 2 - С. 64 - 68.

11. Интеллектуальная информационная система оценки устойчивости функционирования сетевых информационных систем / Д. X. Лыонг, Н. Ю. Аль-Тамими, М. П. Аль-Балуши [и др.] // Техника и безопасность объектов уголовно-исполнительной системы - 2011 : сб. материалов Междунар. науч.-практ. конф. 6, 7 октября 2011 г. : в 2 т. / ФКОУ ВПО Воронежский

институт ФСИН России. — Воронеж : ИПЦ «Научная книга». — 2011. — Т. 1. — С. 382-388.

12. Некоторые вопросы интеллектуальной информационной системы оценки функционирования сетевых информационных систем / Д. X. Лыонг, Н. Ю. Аль-Тамими, М. П. Аль-Балуши, М. Ауад, Ю. В. Минин // Техника и безопасность объектов уголовно-исполнительной системы — 2011 : сб. материалов Междунар. науч.-практ. конф., 6-7 октября 2011 г.: в 2 т. / ФКОУ ВПО Воронежский институт ФСИН России. — Воронеж : ИПЦ «Научная книга». -

2011.-Т. 1,-С. 389-394.

13. Оценка надежности средств парирования внешних воздействий / Д. X. Лыонг, Н. Ю. Аль-Тамими, М. П. Аль-Балуши, М. Ауад, Ю. В. Минин // Техника и безопасность объектов уголовно-исполнительной системы — 2011 : сб. материалов Междунар. науч.-практ. конф., 6-7 октября 2011 г. : в 2 т. / ФКОУ ВПО Воронежский институт ФСИН России. - Воронеж: ИПЦ «Научная книга».-2011.-Т. 1.-С. 394-399.

14. Применение нечетких сетей Петри для решения задачи адаптивного структурирования информационных ресурсов / Д. X. Лыонг, Т. О. Авдеева, К. М. Копылов, О. Г. Иванова // Математические методы и информационно-технические средства : тр. VIII Всерос. науч.-практ. конф., 22-23 июня 2012 г. -Краснодар : Краснодарский университет МВД России, 2012. - 278 с. - С. 3.

15. Применение цепных дробей для оценки живучести сетевых информационных систем в условиях неопределенности / Д. X. Лыонг, А. И. Елисеев, М. П. Аль-Балуши, М. Ауад // Математические методы и информационно-технические средства : тр. VIII Всерос. науч.-практ. конф., 22—23 июня 2012 г. -Краснодар : Краснодарский университет МВД России, 2012. - 278 с. - С. 71.

16. К вопросу о показателях живучести сетевых информационных систем / Д. X. Лыонг, А. И. Елисеев, М. А. Хорохорин, А. А. Долгов П Математические методы и информационно-технические средства : тр. VIII Всерос. науч.-практ. конф., 22-23 июня 2012 г. - Краснодар : Краснодарский университет МВД России, 2012. - 278 с. - С. 74.

17. Использование математического аппарата нечеткой логики для определения пертинентности результатов поиска текстовых сведений / Д. X. Лыонг, Д. В. Поляков, М. П. Аль-Балуши, М. Ауад // Математические методы и информационно-технические средства : тр. VIII Всерос. науч.-практ. конф., 22-23 июня 2012 г. - Краснодар : Краснодарский университет МВД России,

2012.-278 с.-С. 163.

18. К вопросу построения математической модели кластеризации текстовых сведений / Д. X. Лыонг, Д. В. Поляков, В. В. Самойлов, М. П. Аль-Балуши // Математические методы и информационно-технические средства : тр. VIII Всерос. науч.-практ. конф., 22—23 июня 2012 г. - Краснодар : Краснодарский университет МВД России, 2012. - 278 с. - С. 164.

19. Построение пертинентного запроса к информационно-поисковой машине на основе математического аппарата нечеткой логики / Д. X. Лыонг, Д. В. Поляков, В. В. Самойлов, М. Ауад // Математические методы и инфор-

мационно-технические средства: тр. VIII Всерос. науч.-практ. конф., 22-23 июня 2012 г. - Краснодар : Краснодарский университет МВД России, 2012.-278 с.-С. 167.

20. Определение целевой функции поиска текстовых сведений в сети Интернет / Д. X. Лыонг, Д. В. Поляков, М. П. Аль-Балуши, М. Ауад // Математические методы и информационно-технические средства : тр. VIII Всерос. науч.-практ. конф., 22-23 июня 2012 г. - Краснодар : Краснодарский университет МВД России, 2012. - С. 168.

21. К вопросу оценки живучести сложных систем с использованием распределенных систем на основе графовой модели / А. А. Долгов, Д. X. Лыонг, А. И. Елисеев, М. А. Хорохорин // Прикладная математика, управление и информатика : сб. науч. работ, 3-5 октября 2012 г. - Белгород : БелГУ. - 2012. -Т.2. - С. 287 - 292.

22. Костерин, Е. В. Определение исходных данных задачи синтеза оптимальных логических структур сетевых баз данных / Д. X. Лыонг, Е. В. Костерин, А. С. Моисеев // Прикладная математика, управление и информатика: сб. науч. работ, 3—5 октября 2012 г. — Белгород : БелГУ. — 2012. — Т. 2. — С. 425-428.

23. К вопросу об управлении пространственно распределенными информационными системами / М. Аль-Балуши, Д. X. Лыонг, А. А. Долгов, М. А. Хорохорин, Ю. В. Минин // Актуальные проблемы деятельности подразделений УИС : сб. материалов Всерос. науч.-практ. конф. 29 мая 2013 г.: в 2 т. -Воронеж : ИПЦ «Научная книга». - 2013. - Т. 1. - С. 54 — 58.

24. Процедура принятия решений в информационной тренажерной системе при условии ограниченного времени прохождения / Д. X. Лыонг, А. С. Моисеев, М. Аль-Балуши, Ю. В. Минин // Актуальные проблемы деятельности подразделений УИС : сб. материалов Всерос. науч.-практ. конф. 29 мая 2013 г.: в 2 т. - Воронеж: ИПЦ «Научная книга». - 2013. - Т. 1. -С. 106- 109.

25. Практическое использование экспертных систем в психиатрии / Д. X. Лыонг, В. А. Перфильев, А. В. Клишина [и др.] // Актуальные проблемы деятельности подразделений УИС : сб. материалов Всерос. науч.-практ. конф. : в 2 т. - Воронеж : ИПЦ «Научная книга». - 2013. - Т. 1. - С. 136 - 139.

26. Разработка экспертной системы для судебной психиатрии (часть 1) / Д. X. Лыонг, В. А. Перфильев, А. В. Клишина [и др.] // Актуальные проблемы деятельности подразделений УИС : сб. материалов Всерос. науч.-практ. конф. 29 мая 2013 г. : в 2 т. - Воронеж : ИПЦ «Научная книга». - 2013. - Т. 1. -С. 140- 143.

27. Разработка экспертной системы для судебной психиатрии (часть 2) / Д. X. Лыонг, В. А. Перфильев, А. В. Клишина [и др.] // Актуальные проблемы деятельности подразделений УИС : сб. материалов Всерос науч-практ. конф., 29 мая 2013 г. : в 2 т. - Воронеж : ИПЦ «Научная книга». — 2013. — Т. 1. — С. 144- 147.

28. Определение информационно-управляющих воздействий в системах с использованием качественной информации / Д. X. Лыонг, Ю. В. Минин, О. Г. Иванова, В. В. Алексеев // Современные информационные технологии. — Пенза : Изд-во «Пензенская государственная технологическая академия». -2013.-№17.-С. 117-121.

29. Процедура идентификации объекта в интеллектуальной информационной системе / Д. X. Лыонг, В. А. Горин, Ю. В. Минин, В. В. Алексеев // Техника и безопасность объектов уголовно-исполнительной системы : материалы Междунар науч.-практ. конф., октября 2013 г. / Воронежский институт ФСИН России. - Воронеж: ИГГЦ «Научная книга», 2013. -С. 182-183.

30. Обзор современных систем распознавания образов / П. И. Карасев, Д. X. Лыонг, А. А. Лебедев, В. В. Алексеев // Техника и безопасность объектов уголовно-исполнительной системы : материалы Междунар. науч.-практ. конф., 3-4 октября 2013 г./ Воронежский институт ФСИН России. - Воронеж : ИПЦ «Научная книга», 2013. - С. 151 - 153.

31. Задача распознавания информационного процесса в системе поддержки принятия решений / П. И. Карасев, Д. X. Лыонг, Ю. В. Минин, В. В. Алексеев // Информатика: проблемы, методология, технологии: материалы XIV Междунар. конф., 6-8 февраля 2014 г. : в 3-х т. - Воронеж : Издательско-полиграфический центр ВГУ, 2014. - Т. 2. - С. 98 - 102.

32. К вопросу об идентификации информационного процесса в системе поддержки принятия решений / Д. X. Лыонг, А. С. Моисеев, Ю. В. Минин, В. В. Алексеев // Современные информационные технологии : тр. Междунар. науч.-техн. конф. — Пенза : Пензенский государственный технологический университет, 2014. - Вып. 19. - С. 28 - 30.

Подписано в печать 22.04.2014. Формат 60х 84/16. 0,93 усл. печ. л. Тираж 100 экз. Заказ № 203

Издательско-полиграфический центр ФГБОУ ВПО «ТГТУ» 392000, г. Тамбов, ул. Советская, д. 106, к. 14 Телефон (4752) 63-81-08 e-mail: izdatelstvo@admin.tstu.ru

Текст работы Лыонг Хак Динь, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

Министерство образования и науки Российской Федерации Федеральное государственное образовательное учреждение

высшего профессионального образования «Тамбовский государственный технический университет»

На правах рукописи

ЛЫОНГ ХАК ДИНЬ

АНАЛИТИЧЕСКИЕ И ПРОЦЕДУРНЫЕ МОДЕЛИ ДЛЯ ИНФОРМАЦИОННОЙ СИСТЕМЫ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Специальность 05.25.05 Информационные системы и процессы

Диссертация на соискание ученой степени кандидата технических наук

Научный руководитель:

доктор технических наук, профессор

В.В. Алексеев

ТАМБОВ-2014

СОДЕРЖАНИЕ

Стр.

Введение.................................................................. 4

1 Современное состояние вопроса распознавания графических объектов в информационных системах............................ 10

1.1 Анализ подходов к решению задачи распознавания графических объектов в информационных системах............ 10

1.1.1 Анализ особенностей систем распознавания с «обучением»

и без «обучения»........................................................ 10

1.1.2 Анализ методов распознавания графических объектов, основанных на кластеризации....................................... 15

1.1.3 Анализ цифровых способов обработки графических объектов...................................................................................... 19

1.2 Обзор программных средств распознавания графических объектов.......................................... 23

1.3 Методы оценки информационной потребности пользователя 25

1.3.1 Традиционные методы оценки информационной потребности пользователя............................................ 25

1.3.2 Методы оценки информационной потребности пользователя

на основе пертинентности............................................ 28

1.4 Выводы по главе 1. Постановка задачи на исследование...... 33

2 Аналитические модели для информационных систем распознавания графических объектов 35

2.1 Модели информационных процессов при распознавании графических объектов................................................. 35

2.2 Аналитическая модель распознавания графических объектов на основе сплайнов......................................... 39

2.3 Формализация информационной потребности пользователя

с помощью коллокаций.............................................. 44

2.4 Аналитическая модель процесса поиска сведений, результаты которого обладают требуемой пертинентностью. 51

2.5 Выводы по главе 2...................................................... 56

3 Процедурные модели для информационных систем распознавания графических объектов...................................... 58

3.1 Процедурная модель решения задачи распознавания графических объектов................................................ 58

3.2 Процедурная модель распознавания графических объектов

на основе сплайнов..................................................... 59

3.3 Моделирование процесса распределения ресурсов в информационных системах.......................................... 63

3.4 Модель решения задачи построения структур баз данных..... 75

3.5 Выводы по главе 3...................................................... 80

4 Практическое применение разработанных моделей и оценка эффективности их применения....................................... 81

4.1 Применение моделей в интеллектуальной системе образовательного назначения....................................... 81

4.2 Информационная система распознавания графических объектов для судебной психиатрии.................................. 85

4.3 Оценка эффективности применения разработанных моделей 94

4.3.1 Оценка живучести информационной системы с использованием системы таЙаЬ...................................... 94

4.3.2 Исследование вычислительных характеристик применения разработанных моделей...................................................... 99

4.4 Выводы по главе 4...................................................... 100

Заключение............................................................... 102

Список использованных источников............................... 104

Приложение А. Пример графического объекта.................. 119

Приложение В. Копии актов использования результатов исследования............................................................ 120

ВВЕДЕНИЕ

Актуальность темы исследования.

В последнее время исследователями много внимания уделяется вопросам построения и использования информационных систем (ИС) работающих с графическими объектами. Кроме того, в ряде информационных систем, в частности образовательного, метеорологического или медицинского назначения информация, необходимая специалисту для принятия решения заключена в, иногда еле различимых, изменениях графического объекта, в сравнении с эталонным объектом. Поиск этих отличий сопровождается, как правило, наличием неопределенности, обусловленной недостаточным качеством сканирования графических объектов; шумами и фоном различной природы; недостаточной квалификацией специалистов, а в ряде случаев, целенаправленными действиями по нарушению режимов работы информационных систем. Уменьшение влияния неопределенности возможно различными способами: повышением качества сканирования объектов, помехозащищенности, повышением качества распознавания графических объектов и т.п.

Практика показала, что, зачастую, пользователь не знает, как лучше выявить отличия между исследуемым графическим объектом и, например, эталонным. Этим обусловлено невысокое качество результатов поиска, даже при использовании таких известных и зарекомендовавших себя ИС, как Гугл или Яндекс. Поэтому на смену релевантности приходит понятие пертинентность - соответствие полученной информации информационной потребности. Однако, для поиска на основе пертинентности, необходимо детально формализовать информационную потребность пользователя.

В работе представлены результаты исследования направленные на повышение эффективности функционирования информационных систем на основе созданных моделей, применение которых обеспечивает повышение качества распознавания графических объектов в условиях неопределенности.

Степень разработанности темы исследования. Проблемам повышения эффективности функционирования информационных систем на основе формализации информационной потребности пользователя, повышения качества распознавания графических объектов посвящены работы Попова Э.В., Поспелова Г.С., Поспелова Д.А., Шенка Р., и др.

Исследованию распознавания образов посвящен ряд работ, в частности, эти вопросы нашли отражение в трудах Анисимова Б.В., Айвазяна С.А., Безрука В.М., Бокса Дж., Вапника В.Н., Горелика А.А., Дженкинса Г., Дуда Р., Круглова В.В., Небабина В.Г., Патрика Э., Скрипкина В.А., Фукунаги К., Червоненкиса А.Я., и др. Эти работы внесли существенный вклад в развитие теории и практики исследуемой предметной области. Однако их содержание не в полной мере отражает особенности распознавания графических объектов, главными из которых является малый объем априорных данных относительно эталонных описаний распознаваемых образов, сложность создания оптимальных алгоритмов распознавания сигналов на основе адекватных вероятностных моделей по совокупности показателей качества. Остаются не рассмотренными вопросы улучшения пертинентности поиска сведений за счет качества распознавания графических объектов в условиях неопределенности. В связи с этим в ряде работ предлагается использовать коллокации для поиска и кластеризации информационных объектов.

В процессе исследования сформулированы выводы, свидетельствующие, в частности, о недостаточности аппарата математической статистики для построения эффективных моделей поиска и кластеризации сведений.

Таким образом, практическая задача заключается в развитии информационных систем на основе повышения пертинентности результатов поиска сведений за счёт повышения качества распознавания графических объектов в условиях неопределенности.

Объект исследования - процесс распознавания графических объектов.

Предметом исследования являются модели распознавания графических объектов в условиях неопределенности, обеспечивающие заданное качество их распознавания.

Целью исследования является повышение эффективности информационных систем за счёт применения разработанных моделей, обеспечивающих заданное качество распознавания графических объектов и оценки пертинентности его результатов в условиях неопределенности.

Научная задача исследования заключается в необходимости разработки моделей распознавания графических объектов в условиях неопределенности на основе определения информационной потребности пользователя с применением математического аппарата теории нечетких множеств.

Для достижения цели исследования и решения научной задачи

необходимо решить частные задачи:

1. Провести анализ предметной области. Выполнить обоснование и выбор критериев соответствия сведений информационной потребности пользователя.

2. Разработать аналитические модели распознавания графических объектов и оценки пертинентности этого процесса.

3. Разработать процедурную модель решения задачи распознавания графических объектов.

4. Оценить эффективность, полученных в ходе исследования, моделей и живучесть системы, построенной с применением разработанных моделей.

Теоретическая и практическая значимость. Теоретическая значимость результатов исследования заключается в развитии: теории распознавания образов на решение задач распознавания графических объектов в условиях неопределенности путем построения моделей, обеспечивающих повышение качества распознавания графических объектов; теории информационного поиска на основе предложенного критерия и модели оценки пертинентности результатов распознавания графического объекта.

Практическая значимость результатов исследования заключается в программной реализации разработанных моделей и возможности определения количественных показателей эффективности функционирования ИС, в различных предметных областях, на основе формализации

информационной потребности пользователя в виде совокупности некоторых коллокаций.

Методология и методы исследования. Для решения поставленных задач и разработки соответствующих моделей применены методы теорий информационного поиска, нечетких множеств, распознавания образов, сетей Петри.

Положения, выносимые на защиту, и их научная новизна:

- аналитическая модель распознавания графических объектов, отличающаяся построением системы уравнений для определения коэффициентов огибающих сплайны на выделенных временных интервалах, решение которой формирует набор признаков, характеризующих графический объект;

- аналитическая модель процесса распознавания графического объекта, отличающаяся введением параметров «полнота» и «точность», обобщающей временной F-нормы, включающей функции принадлежности для формирования оценки пертинентности;

- процедурная модель решения задачи распознавания графических объектов, отличающаяся определением динамических характеристик распознаваемого объекта на основе кубических сплайнов;

- результаты оценки эффективности применения разработанных моделей и оценки живучести ИС с использованием системы MATLAB.

Степень достоверности и апробация результатов исследования. Достоверность научных результатов обеспечивается полнотой анализа предметной области и подтверждается корректным применением математического аппарата теории информационного поиска, нечетких множеств, распознавания образов, сетей Петри, согласуемостью полученных теоретических результатов с результатами вычислительных экспериментов.

Основные результаты работы докладывались и обсуждались на: Международной научно-практической конференции «Техника и безопасность объектов уголовно-исполнительной системы-2011» (г. Воронеж); VIII Всероссийской научно-практической конференции «Математические методы и информационно-технические средства»,

2012 (Краснодар); Международной научно-практической конференции «Техника и безопасность объектов уголовно-исполнительной системы», 2013 (г. Воронеж); Всероссийской научно-практической конференции «Актуальные проблемы деятельности подразделений уголовно-исполнительной системы», 2013 (г.Воронеж); Международной научно-технической конференции «Современные информационные технологии», 2014 (г. Пенза); XIV Международной конференции «Информатика: проблемы, методология, технологии», 2014 (г. Воронеж).

Результаты исследования использованы в информационной системе, применяемой в учебном процессе для формирования образовательного контента в соответствии с профессионально-ориентированными требованиями направления подготовки и при контроле качества формируемых у студентов профессиональных компетенций в ФГБОУ ВПО «Тамбовский государственный технический университет». Аналитические и процедурные модели распознавания графических объектов использованы при разработке концепции и структуры информационной интеллектуальной системы для автоматизации процессов принятия решений о состоянии пациента в ООО «Медтехника», что подтверждено актами использования.

По результатам выполненных исследований опубликовано 32 печатных работ, в том числе 7 статей в научных изданиях, рекомендуемых ВАК Минобрнауки РФ.

В публикациях, написанных в соавторстве, лично автору принадлежат результаты: анализа предметной области [3, 4, 12, 17, 18, 30]; формулировки постановок задач [9, 10, 14, 19, 20, 22]; построения и анализа моделей, выносимых на защиту [6, 7, 24, 28, 29, 31, 32]; результаты применения [1, 2, 23, 25-27] и оценки эффективности использования моделей [5, 8, 11, 13, 15, 16,21].

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка использованных источников. Общий объем работы составляет 118 страниц основного текста, включая 20 рисунков. Список использованных источников включает 141 наименование.

Основные результаты исследования, соответствуют п. 7 паспорта

специальности 05.25.05 - Информационные системы и процессы.

Работа выполнена в рамках приоритетных научных направлений стратегического развития Института автоматики и информационных технологий, Научно-образовательного центра моделирования и управления информационными процессами и системами и информационной безопасности ФГБОУ ВПО «ТГТУ», научных школ ФГБОУ ВПО «ТГТУ» и ФГБУН «Институт радиотехники и электроники им. В.А.Котельникова» РАН, а также при поддержке госконтракта № П292 ФЦП «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы».

В первой главе «Современное состояние вопроса распознавания графических объектов в информационных системах» проведен анализ подходов к решению задачи распознавания графических объектов в информационных Системах, рассмотрены методы и модели распознавания графических объектов, основанные на различных принципах.

Во второй главе «Аналитические модели для информационных систем распознавания графических объектов» представлено описание разработанных аналитических моделей распознавания графических объектов на основе сплайнов, аналитической модели процесса поиска сведений, результаты которого обладают требуемой пертинентностью, построения пертинентного запроса к информационной системе на основе математического аппарата теории нечетких множеств.

В третьей главе «Процедурные модели для информационных систем распознавания графических объектов» представлены процедурные модели решения задачи распознавания графических объектов распознавания графических объектов на основе сплайнов, а также результаты моделирования процесса распределения ресурсов в информационных системах для решения задач распознавания графических объектов и решения задачи определения структуры баз данных.

В четвертой главе «Практическое применение разработанных моделей и оценка эффективности их применения» приведены примеры их реализации в ИС различного назначения, представлены результаты оценки эффективности ИС.

ГЛАВА 1. СОВРЕМЕННОЕ СОСТОЯНИЕ ВОПРОСА РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ В ИНФОРМАЦИОННЫХ СИСТЕМАХ

1.1 Анализ цодходов к решению задачи распознавания графических объектов в информационных системах

В литературе, в том числе и в ГОСТ, представлено достаточно большое количество определений информационной системы [2, 5, 28, 126, 128]. При проведении исследования считается, что информационная система (ИС) это эрготехническая система, предназначенная для отображения и преобразования некоторой части реального мира в интересах удовлетворения информационных потребностей пользователя. Составляющими ИС являются: техническая часть - вычислительные и коммуникационные подсистемы; эргатическая часть - ползователь, а также программное, лингвистическое и другие виды обеспечения, информационные ресурсы.

1.1.1 Анализ особенностей систем распознавания с «обучением» и без «обучения»

4

Многообразие алгоритмов и способов распознавания, достаточно полно представлено в трудах [7-9, 12, 18, 27, 46, 46, 97, 101, 111, 116, 117, 124]. В них даны основные понятия модели, постановка задач распознавания, изложены базовые подходы к решению задач построения моделей для распознавания различных классов объектов, способов их описан�