автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Разработка и исследование методов и алгоритмов нечеткой классификации объектов имиджей документов
Автореферат диссертации по теме "Разработка и исследование методов и алгоритмов нечеткой классификации объектов имиджей документов"
На правах рукописи
003485ЭЬ(
СРУН СОВИЛА
РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ И АЛГОРИТМОВ НЕЧЕТКОЙ КЛАССИФИКАЦИИ ОБЪЕКТОВ ИМИДЖЕЙ ДОКУМЕНТОВ
Специальность: 05.13.17 —Теоретические основы информатики.
- 3 ДЕК 2009
АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата технических наук
Таганрог - 2009
003485957
Работа выполнена в Технологическом институте Южного федерального университета в г.Таганроге.
НАУЧНЫЙ РУКОВОДИТЕЛЬ:
доктор технических наук, профессор Вишняков Юрий Муссович
ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ:
доктор технических наук, профессор, Чернухин Юрий Викторович;
кандидат технических наук, Спиридонов Олег Борисович.
ВЕДУЩАЯ ОРГАНИЗАЦИЯ:
ОАО «ТАНТК им. Г.М. Бериева» г.Таганрог.
Защита диссертации состоится « 25 » декабря 2009 г. в 14-20 на заседании диссертационного совета (Д 212.208.21) при Южном федеральном университете по адресу: 347928 г.Таганрог, пер.Некрасовский, 44, ауд. Д-406.
С диссертацией можно ознакомиться в Зональной научной библиотеке ЮФУ по адресу: г. Ростов-на-Дону, ул. Пушкинская, 148.
Автореферат разослан «19» декабря 2009г.
Ученый секретарь
диссертационного совета Д 212.208.21, доктор технических наук, профессор Чернов Н.И.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. В настоящее время все большее значение приобретает перевод бумажных документов в электронные аналоги и в связи с этим большое значение придается созданию различного рода информационных архивов, в том числе и таких как электронные библиотеки. Однако, накопленные человечеством объемы бумажной информации настолько велики, что их перевод в электронные аналоги требует разработки специальных методов обработки документов. Так, бумажный документ сканируется, в результате чего получается электронная копия документа виде цифровой фотографии - имиджа (image), далее имиджа обрабатывается до получения требуемых параметров его качества. Улучшение имиджа включает программное выравнивание, конвертирование, удаление шумовых и фоновых элементов, нормализацию и т.д. За этапом имиджинга следует этап компьютерной обработки, связанный с приведением документа к одному из машинных форматов (PDF, HTML, MS Office и пр.) и дополнением его описания некоторой вспомогательной информацией. При этом в процессе преобразования имиджингового представления документа в машинные форматы, как правило, приходится распознавать разного типа объекты: текстовые блоки, таблицы и рисунки и связывать их целостно вместе в описании документа.
Настоящая диссертация посвящена разработке и исследованию методов и алгоритмов нечеткой классификации объектов имиджей документов.
Объект исследований. Методы и модели нечеткой классификации объектов имиджей документов.
Цели и задачи работы. Разработка и исследование методов и алгоритмов нечеткой классификации объектов имиджей документов.
Для достижения поставленной цели исследования были решены следующие основные задачи:
1. Проведено исследование состояния области обработки имиджей в части распознавания и классификации составляющих их объектов и сформулированы основные проблемы предметные области.
2. Разработана объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов.
3. Разработан метод классификации, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
4. На основе экспериментальных данных сформирована система признаков, лежащая в основе идентификации объектов.
5. Разработана структура классифицирующей функции на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков по предложены идентификационным признакам.
6. Разработана методика нахождения оптимальных коэффициентов доверия для каждого из признаков классификации.
7. Разработан метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализации имиджей букв.
8. Проведены экспериментальные исследования основных теоретических положении диссертации.
Методы исследования. Для решения выше перечисленных задач использованы методы математического и комбинаторного анализов, методы нечеткой логики, методы статистического анализа, распознавания образов, цифровой обработки изображений, технологии программирования.
Научная новизна работы состоит в следующем:
1. Предложена новая объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов на основе нечеткой логики.
2. Предложен метод классификации объектов имиджа, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
3. Предложена система признаков, лежащая в основе идентификации объектов имиджа и для нее разработана классифицирующая функция, вычисление которой осуществляется на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков.
4. Предложены модифицированный метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализация графических представлений символов.
Основные положения, выносимые на защиту. На защиту выносятся следующие научные положения и результаты диссертационного исследования:
1. Объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов на основе нечеткой логики.
2. Метод классификации объектов имиджа, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
3. Система признаков, лежащая в основе идентификации объектов имиджа.
4. Классифицирующая функция, вычисление которой осуществляется на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков.
5. Модифицированный метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализация графических представлений символов.
Теоретическая и практическая значимость результатов исследования.
1. Предложена новая объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов на основе нечеткой логики.
2. Предложен метод классификации объектов имиджа, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
3. Предложена система признаков, лежащая в основе идентификации объектов имиджа и для нее разработана классифицирующая функция, вычисление которой осуществляется на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков.
4. Предложены модифицированный метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализация графических представлений символов.
Разработанные методы и алгоритмы нечеткой классификации объектов имиджей документов могут быть использованных в системах обработки в бумажных документов с целью создания их электронных аналогов.
Достоверность результатов. Подтверждается использованием аппарата математического и комбинаторного анализов, нечеткой логики, оптимизации, статистического, распознавания образов и цифровой обработки изображений, а также подтверждается результатами сравнительного анализа и проведенных модельных экспериментов.
Использование результатов работы. Результаты диссертационного исследования подтверждается актами о внедрении результатов исследования в рамках работ по госбюджетной НИР №12456 и учебном процессе по дисциплине "Организация электронных архивов данных" магистерской программы "Интеллектуальные системы" по направлению 230100 "Информатика и вычислительная техника" факультета автоматики и вычислительной техники Таганрогского технологического института Южного федерального университета.
Апробация результатов работы. Основные результаты работы неоднократно докладывались и обсуждались на конференциях и- семинарах различного уровня, в том числе:
-III Всероссийской научной конференции молодых ученых, аспирантов и студентов "Информационные технологии системной анализ и управление" (Таганрог, ТРТУ, 2005г); "
-VIII Всероссийской научной конференции молодых ученых, студентов и аспирантов "Техническая кибернетика, радиоэлектроника и системы управления (КРЭС'06)" (Таганрог, ТРТУ, 2006г);
-Всероссийской научной школы-семинара молодых ученых, аспирантов и студентов "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки" (Таганрог, ТТИ ЮФУ, 2007г);
-Всероссийской научной школы-семинара молодых ученых, аспирантов и студентов "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки" (Таганрог, ТТИ ЮФУ, 2008г);
-VI Всероссийской научной конференции молодых ученых, аспирантов и студентов "Информационные технологии, системы анализ и управление" (Таганрог, ТТИ ЮФУ, 04-05 декабря 2008г).
-Всероссийская научная школа-семинар студентов, аспирантов и молодых ученых "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки" (Таганрог, ТТИ ЮФУ, Июня 2009г).
Публикации. По материалам диссертации автором опубликовано 9 печатных работ, в том числе одна статья в издании из списка, рекомендованного ВАК, в которых отражены основные результаты диссертационного исследования.
Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения и приложений. Текст изложен на 149 страницах, содержит 31 рисунков, 34 таблицы, список литературы из 128 наименований.
Диссертационное исследование было выполнено в международной лаборатории ELDIC факультета автоматики и вычислительной техники Таганрогского технологического института Южного федерального университета.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ.
Во введении обоснована актуальность темы диссертационного исследования, показана существующая степень разработки проблемы, сформулированы цель и задачи исследования, а также положения и результаты, выносимые на защиту, определены научная новизна и практическая значимость результатов исследования, приведены данные об апробации и использовании научных результатов, о публикациях и структуре диссертационной работы.
В первом разделе проанализированы существующие походы к сегментации и проведена систематизация методов классификации и кластеризации объектов имиджей документов. Также приведен краткий обзор методов классификации на основе обучения по прецедентам, например, таких как Байесовский подход, поход на основе нейронной сети, машинное обучение на основе опорных векторов и разреженной просеивающей сети. В результате этого обзора выделены основные проблемы области исследования и сформулированы пути их решения.
Во втором разделе разработана объекто-сегментированная имиджинговая модель документа, определены эталонные классы векторов признаков, разработаны общие процедуры формирования эталонных классов и обучения нечеткого классификатора объектов имиджей документов.
В качестве признаков объектов предложено использовать распределение цветов, число отдельных объектов, число вертикальных и горизонтальных линий.
Пусть имидж документ G, который содержит / объектов, а через Graph(g) его объекто-сементированное имиджинговое описание. Тогда данное описание можно представить в виде: G={Graph1(g),..., Graphw(g)..., Graph1 (д)}. Здесь Graphw(g) является описанием w-ro объекта имиджа документа G, l<w<l\ Описание объекта имиджа документа будем представлять в виде тройки вида: Graph(g) = {<уи Ть D, >}, где У= {уьу2,—,ур} - множество признаков объекта имиджа. Каждый признак у (¡6/, где J={1, 2,..., р}) описываются соответствующей лингвистической переменной; = {Г/, ... - терм-множество
лингвистической переменной у,-, ш, - число значений признака. Для описания
термов Tj (i€L, где L={1,2.....mj), используются нечеткие переменные <
Т-, Dt, Cfj{di) > т. е. значение Tj описывается нечетким множеством Cfj(di) в базовом множестве D„ Cfj{d{) = {< ц^д {d^/dieDi >}, где D, - базовое множество признака yh
Описание эталонного класса объекта имиджа документа Standard(s) = <у„ Т„ D„ Ф,>. Здесь Ф^ = {ф[, ф12,..., - множество
коэффициентов обучающей выборки лингвистической переменой yh Для описания термов Tj, соответствующих значениям признака у{, будем использовать кортежи вида < Tj, Dh Cij(di) >, где C[j{d{) = ф*-. Здесь фу- является эталонным коэффициентом обучающей выборки для i-ro признака и соответствуету'-му терму.
Процесс формирования описания эталонного класса х имеет следующий вид:
1. Эксперт формирует объекты для класса
2. Создаются анализаторы для сбора информации об объекте имиджа в соответствии с каждым признакам, т.е. определяется й, для признака^,;
3. На основе d, формируются С^(с^) для описания термов
4. Сбора информации о 'й¡) определяется фу для каждого терма и Ф, для признака^;
5. И в заключение определяется эталонный коэффициент Ф.
Таким образом, разработанная объекто-сегментированная имиджинговая модель документа, эталонные классы векторов признаков, общие процедуры формирования эталонных классов и обучения нечеткого классификатора объектов имиджей документов составляет теоретическую базу для дальнейшего исследования.
В третьем разделе разработана модель классифицирующей функции, проведен ее анализ и сконструированы алгоритмы настройки классифицирующей функции по обучающей выборке.
Функция близости Р между объектом имиджа Сгар1г(и эталонным классом 51апйагй(ъ) определим в следующем виде: Р(ОгарН(^, 51апйагй(з)) = ^¡(СгарЩ^), $1апйагй($)),...,^(Сгарк(%), Б1апс1агс1($)), ...,/р(СгарЬ(^, где
¡,(Сгар]г(2), 81апс1агс1(8))={11[(Сгарк(&, 51апйагй(з)),..„ Ц(Сгарк(&), 81апйагй(8)),..„ 1\1т^СгарЬ^), Бктйагй^))}. Здесь /1] - частичная функция близости объекта имиджа к классу 5 по /-му признаку и у-му терму. Пусть а, частичные коэффициенты доверия для /-го признака соответственно. Тогда функцию можно
Учитывая результаты второго раздела, проведем подробный статистический анализ для каждого признака.
1. Анализ объектов имиджей документов по признаку "Распределения цветов", пусть G={gi, g2,--,gi,—,g2ss} - множество диапазона распределения цветов (в режиме серого цвета) от 0-255, gi - количество точек имиджа в 1-м диапазоне, 0<1<255. Алгоритм вычисления dt имел следующий вид:
Thr := ((Widthimage*HeightImage)*0.1)/100;{Thr - порог в 0.1} di := 0;{ Widthlmage - ширина и Height/mage - высота имиджа } For i:= 0 to 255do ifg, > Thr then d, = dj+1;
Значение данного признака (mi) равно 2, описывающих тип объекта имиджа "текст или таблица", "рисунок". Нечеткое множество "текст или таблица" для
Здесь Б, е[0,255].
2. Анализ объектов имиджей документов по признаку "Число отдельных объектов". Переменная 61 обозначает отношение информационной области имиджа и числа отдельных объектов, находящихся в ней, вычисляется в следующим
представить в виде: Fa(Graph(g), Standard(s)) =
где
fi=^jemi hj.
TP
образом: d2 = —, где TP - количество точек и NO - количество объектов, в имидже. Значение данного признака (т2) равно 2, описывающих тип объекта имиджа "текс", "рисунок" и " таблица". Эти нечеткие множества для d2 можно задать функциями принадлежностями CjV C?L2 и С253. Отображают в следующим
(X ,d2 — 1400
образом: c«l(d2) = г м^уг1
Ц V.1550-1400/ J 2
(1 ,d2> 6000; r[1 + (J™L)T\d2< 2400;
, , , , я0 , . . I \1950-2400/ I ' п
<*,№) = + d2<60oo. ■HC6№)= Lr'.—vrlw ДеСЬ
1 [ 44000-6000/ j 2 h+(_J- d > 2400.
4 V[ V2600—2400/ J 1
d26D2, D26[0, +oof.
3. Анализ объектов имиджей документов по признаку "Число вертикальных линий". Переменной d} поставим в соответствие два события: количество вертикальных линий и среднее количество точек по вертикали с высотой имиджа в соотношении 1/6. Ее можно определить по следующей формуле: d3=NVL*CVl6, где NVL - количество вертикальных линий в имидже, а CVI6 - булева переменная, принимающие значение 1, если среднее количество точек по вертикали по отношению к высоте имиджа составляет пропорцию не менее чем 1/6, в противном случае данная переменная равно 0. Значение данного признака (т3) равно 1, для тип объект объекта имиджа "текс, рисунок пли таблица". Тогда, нечеткое множество "текс, рисунок или таблица" значений для нечеткой переменной d3 можно задать
(1 ,d3> 3
функцией принадлежности = К + d < 3 > D36[0,100].
4. Анализ объектов имиджей документов по признаку "Число горизонтальных линий". Переменную d4, которая обозначает два события, а именно, количество линий и среднее количество точек по горизонтали в пропорций к ширине имиджа 1/6, можно вычислить по следующей формуле: d4=NHL*CH16, где NHL - количество горизонтальных линий в имидже; CHI6- булева переменная, равная 1, если среднее количество точек по горизонтали размера ширины имиджа относится в пропорции более чем 1/6. И эта переменная равна 0 в противном случае. Значение данного признака (т4) принято равным 2, описывающих тип объекта имиджа "текст или рисунок" и "таблица". Эти нечеткие множества для
переменной d4 можно задать функциями принадлежностями С^Л(с14) = [l + (у) ] .
fl >14
Qä2(d4)=| |i + (d4"14)2p d <14 соответственно- Здесь d4SD4, Д|6[0,100].
Процедура формирования описания коэффициентов эталонных классов по обучающей выборке имеет следующий вид:
Пусть касс Gr" = [дг',дг2.....grf, ...,дг*} содержит q разных объектов, vG[l..q],
1. Для всех v, определить значения для /-го признака,у'-го терма;
2. Вычислить все средние значения коэффициентных множеств эталонный коэффициент обучающей выборки лингвистической переменой yt для /-го признака
5)' isr'
Ф; = [Ф'^Ф^-.ФЬ,}в соответствии с формулой ф} = 4 ;
Для определения класс объекта имиджа документа необходимо построить классифицирующие функции. Пусть объекта является входными данными классификатора и он должен ее сравнить с множеством эталонных ситуаций В качестве меры для определения степени близости нечеткой ситуации нечеткой ситуации sL-6S предлагается использовать в следующем:
1. Функция близости с использованием понятия нечетких равенств ситуаций:
С"Огго,5е) = где ^(с^.С) = &Г.,Г(Лечи^ШХ^Ш), а
« если
€ [1 - С, С] и
С]; (1)
кециЩ'^д.С^)) :
Сц°Ш е [1 — с. г] или
^ е [1 - с, £].
Будем считать, что ситуации ¿г0 и нечетко равны, gr0 ~ если Г/,иС9гь,«е) > с, где ¡€[0.6, /у, ¿-некоторый порог нечеткого равенства ситуаций.
Наиболее близкой рг0 эталонной ситуаций будем считать такую ситуацию (яг£5), которая имеет максимальной значения степени равенства с gro.
/Г/Ч1'(5'-о-^) = тах5е5Ре''"(5Го,5). (2)
2. Функция близости с использованием понятия расстояния порядковых
—-—:—-1 , где
/¡<"5(Саг°, С5«) = ш^сЦ'Ш.а Ми/(С2Г«№).сДй) = - (3)
Здесь г - положительное целое число. При выборе значение г можно использовать либо манхэттенское расстояние (г=1), либо таксонометрическое расстояние /-=2.
Минимальное расстояние между признаками текущей ситуации gr0 и эталонной ситуацией ^-(Х-Й)) нужно вычислять по формуле:
= (4)
Рассмотрим алгоритм сегментации текстового блока, для чего будем использовать метод заполнения сплошных областей. Однако в данном способе существует проблема с выделением графических представлении символов «¡», <ф>; «:», «Ё», «ё» потому, что в написании этих букв присутствует точка, которая распознается как самостоятельный объект в отдельности от символа. Для устранения недостатка предлагается ввести следующую проверку. Если точка является самостоятельным объектом, то она вносится в список объектов типом "точка". В противном случае точка объединяется с символом.
При нормализации (увеличении или уменьшении изображения) графических представления символов пропорции в начертании символов могут искажаться. Для этого необходимо выровнять неравномерности в написании различных букв алфавита, например, в букве «¡». Алгоритм нормализации должен выделить эту букву и нормализовать ее применительно к размеру 49x49 пикселов, во первых, за счет добавления пустого места по краям, а во вторых, за счет масштабирования с различными коэффициентами по осям. Нормализация проводится на основе следующей вычислительной процедуры:
1
¡Р(»/>Ь)(
соеГ = Ь / ч»/, пе^Н = И * сое^ newW = Ц
I
еЬе{
сое{ =Ь/Ь, печ^ЛУ = * сое^ newH = Ь;
Для улучшения качества распознавания букв предлагается использовать комбинацию разных методов распознавания (по методу Паркса и Хэмминга), а в случае рассогласования их результатов использовать словарную базу данных.
В четвертом разделе разрабатывается программный комплекс для моделирования классификации объектов имиджей документов и приводятся результаты экспериментального исследования разработанной нечеткой классификации объектов имиджей документов.
Логическая структура программного комплекса для моделирования нечеткой классификации объектов имиджей документов имеет следующий вид:
Рисунок 1. Логическая структура программного комплекса.
Здесь каждому блоку приписаны следующие функции:
1. Загрузка исходного имиджа документа;
2. Сегментация имиджа на блоки в соответствие критерием сегментации имиджа ниже;
3. Классифицирование объектов имиджа документа в соответствии с эталонными классами (ниже будет обсуждена структура классификатора объектов);
4. Поиск краев областей объектов (ниже проведен исходный код поиска краев между областями);
5. Сегментирование блоков имиджа построенных по пункту 2;
6. Определение краевой границы между блоками классов выполняется по предложен в диссертации алгоритма поиска точной границы между объектами имиджа.
Разработанный в диссертации алгоритма поиска оптимальных коэффициентов для основных признаков имеет следующий вид.
Пусть заданы и объектов имиджей документов, которые образуют множество
.....^с,.....gxu}, t6fL.ii]. Если некоторый объект gx„ принадлежит
некоторому эталонному классу е, то для этого объекта эксперт приписывают функция близости Е," значение, равное 1, если оценивание производится на основе
нечеткого равенства. Функция близости Е? равное 0, если оценивание производится по расстоянию порядковых шкальных признаков.
Классификатор для каждого объекта дхс строить свою функцию близости Рг{9х1^г), которая вычисляется классификатором по отношению к ситуации, соответствующей г-ощ объекту эталонного класса. Классификатор принял правильно решение, если г = е, в противном случае классифицирование для ^-ого объекта имиджа проведено не правильно.
Повышение точности классификации достигается путем подбора оптимальных коэффициентов доверия по каждому признаку. Для этого вводится степень неуверенности вычисления функции принадлежности д?, которое вычисляется по формуле ^¡{^.^.к^к^) = - Ре^дхс,ве)\. Далее вычисляются минимальная Ает1п(к1,к2.к2,к4) = тт(йе1,Ае1,...,Аеи)1 максимальная йетах{к1,кг,къ,к4) =
тах(А{,Ае2.....Аеи) и средняя А^к^^.к^.к^) = Е^АЦк^^.к^к^/и степени
неуверенности. Далее по обучающей выборке осуществляется полный перебор коэффициентов к и, исходя из минимальной ошибки, определяются оптимальные коэффициенты. Ниже в Табл. 1 приведены оптимальные коэффициенты по каждому из признаков для разных типов объектов.
Таблица 1. Прлзстл&лгнл« оптимальных коэффициентов для каждых признаков.
Распределение цветов Число отдельных ооьектов Число вертикальных линий число горизонтальных линий
а 02 "3 <ц
Нечеткое равенство ситуаций
Текст 25 Б9 1 1
Рисунок 93 77 1 1
Таблица 49 1 81 97
Расстояние порядковых шкальных признаков
Текст 5 77 1 1
Рисунок 29 1 1
Таблица 25 1 85 73
С целью проверки утверждения о повышения точности классификации при использования оптимальных значении коэффициентов был проведен эксперимент, в котором классификация проводилось без использования оптимальных коэффициентов (все коэффициенты равны 1) и их использованием. Результаты этого эксперимента представлены в Табл. 2.
Таблица 2. Представление ошибок с исполыованнем п без _исиольщванчн кщффнцпентив._
Ьез использования ко зффщщснтодС использованием коэффициентов
Нечеткое равенство ситуацш!
Тскст 0.1 0.34 0,15 7% 0,04 0.08 0,04 2°Ь
Рисунок 0.09 0.45 0.16 6% 0.05 0.36 0,09 1%
Таблица 0.03 0.47 0.23 12% 0.03 0.37 0.1 6° о
Расстояние порядковых шкальных признаков
Текст 0,03 0.51 0.12 6° о 0.04 0.08 0.06 2° о
Рисунок 0,02 0.41 0.14 5% 0.02 0.25 0.08 2°о
Таблица 0,0-1 | 0.52 0.29 12°о 0.04 0.43 0.14 6°Ь
Из Табл. 2 следует, что использование оптимальных коэффициентов признаков уменьшает ошибку классификации объектов более чем в 2 раза.
Следует отметить, что точность нечеткой классификации существенно зависит от размера сегментации имиджа, что представлено результатами проведенных в диссертации экспериментов для классифицирующей функции близости с использованием понятия нечетких равенств ситуаций (Рис. 2).
---Максимальное неуверенное значение системы вычисления
----- Среднее неуверенное значение системы вычисления
.......- Ошибка классификатор го эксперту процента пространства
................Ошибка классификатор го существующим объектов имиджа
Рисунок 2. Распределение ошибок классификации с использованием понятия нечетких равенств ситуаций при сегментации страницы по различным блокам.
А также результаты для случая использования оптимальных коэффициентов при классификации на основе порядковых шкальных признаков показаны на Рис. 3.
1
.......... Среднее неуверенное анвчение системы вычисления
—........Ошибка классификатора экспертупрезента пространства
-----ОшиЗка клвссификаторгсосуществукзшимоСъектее имиджа
Рисунок 3. Распределение ошибок классификации с использованием понятия порядковых шкальных признаков при сегментации страницы по различным блокам.
Из представленных на Рис. 2 и Рис. 3 графиков также следует, что классификатор работает наилучшим образом, когда страница состоит из 2, 3 или 4 сегментов.
Результаты экспериментов по предложенным в диссертации модифицированному способу распознавания символов на тестовой выборке из 150 слов (791 символ) приведены в Табл. 3.
Таблица 3. Результаты экспериментов распознавания графических символов
Изображение букв
Нено рмализованные Нормализованные
Число Символо в Число Слов Время Число Символов Число Слов Время
■Ч" Парке 723/79191.40% 107/15071.33% 5с/ сим. 732/79192.54% 109/15072.66% 5 с/ сим.
Г* z Хэмминг 754/79195.32% 122/150 81.33% 73с/ сим. 767/79196.96% 132/15088% 28 с/ сим.
н Парке + Хэмминга 779/79198.48% 144/15096% 78с/ сим. 776/79198.10% 143/15095.33% 33с/ сим.
(Ч Парке 2/7910.25% 0/1500% 5с/ сим. 684/79186.47% 83/15055.33% 5с/ сим.
« Хэмминг 4/7910.50% 0/1500% 73с/ сим. 702/79188.74% 85/15056.66% 28с/ сим.
ь Парке + Хэмминга 4/7910.50% 0/1500% 78с/ сим. 752/79195.06% 121/15080.66% ... 33с/ . сим.
V© Парке 3/7910.37% 0/1500% 5 с/ сим. 694/79187.73% 84/15056% 5с/ сим.
— Z н Хэмминг 4/7910.50% 0/1500% 73с/ сим. 713/79190.13% 102/150 68% 28с/ " сим.
Парке + Хэмминга 5/7910.63% 0/1500% 78с/ сим. 767/79196.96% 135/15090% ... 33с/ ~ сим.
Из Табл. 3 видно, что модификация примерно на 10-20% улучшает правильное распознавание как на нормализованных, так и ненормализованных изображениях символов.
В заключении приводятся основные научные результаты, полученные в диссертационной работе.
ПУБЛИКАЦИИ ПО ТЕМЕ РАБОТЫ
1. Срун С. Применение метода Паркса в распознавании печатных текстов. // III Всероссийская научная конференция молодых ученых, аспирантов и студентов "Информационные технологии системной анализ и управление". - Таганрог, изд-во ТРТУ, 2005г. с161-162.
2. Срун С. Конвертация бумажных документов в электронные аналоги. // IV Всероссийская научная конференция молодых ученых аспирантов и студентов "Информационные технологии системной анализ и управление". Таганрог, изд-во ТРТУ, 2006г. с 19-21.
3. Срун С. Решение задачи о неэквивалентности входных изображений и эталонов для распознавания рукопечатных текстов. // VIII Всероссийская научная конференция студентов и аспирантов "Техническая кибернетика, радиоэлектроника и системы управления". - Таганрог, изд-во ТРТУ, 2006г. С248-250.
4. Срун С. Разработка программного обеспечения для реализации решения задачи о неэквивалентности входных изображений и эталонов для распознавания рукопечатных текстов. // VIII Всероссийская научная конференция студентов и аспирантов "Техническая кибернетика, радиоэлектроника и системы управления". - Таганрог, изд-во ТРТУ, 2006г. с249-250.
5. Срун С. Разработка метода классификации графических объектов для распознавания изображений. // Сборник трудов Всероссийской научной школы-семинара молодых ученых, аспирантов и студентов "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки". - Таганрог, изд-во ТТИ ЮФУ, 2007г. с24-27.
6. Срун С. Исследование и разработка метода классификации графического документа объекта для распознавания. // Технологии Microsoft в теории и практике программирования: труды V-ой Всероссийской конференции студентов, аспирантов и молодых ученых. Южный регион, Таганрог, изд-во ТТИ ЮФУ, 2008г. - с54-59.
7. Срун С. Основной способ для задачи классификации и его применение. [Текст] // VI Всероссийская научная конференция молодых ученых, аспирантов и студентов "Информационные технологии, системный анализ и управление". -Таганрог, изд-во ТРТУ, 2008г. с20-22.
8. Срун С. Об одном подходе к улучшению качества распознавания текста. [Текст] // Известия ЮФУ. Технические науки. Тематический выпуск "Интеллектуальный САПР". - Таганрог: Изд-во ТТИ ЮФУ, 2009, № 4(93). -256с. C189-I94.
9. Срун С. Метод классификации графических объектов на основе установления эквивалентности нечетких высказываний, [текст] // Всероссийская научная школы-семинара молодых ученых, аспирантов и студентов "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки". - Таганрог, изд-во ТТИ ЮФУ, 2009г. С26-34.
Технологический институт Южного федерального университета в г. Таганроге
347928, Ростовская область г. Таганрог, пер. Некрасовский 44.
Оглавление автор диссертации — кандидата технических наук Срун Совила
ВВЕДЕНИЕ.
1. АНАЛИЗ СОВРЕМЕННОГО СОСТОЯНИЯ В ОБЛАСТИ ОБРАБОТКИ ИМИДЖЕЙ ДОКУМЕНТОВ.
1.1. Анализ существующих походов сегментации имиджей документов.
1.2.Систематизация методов классификации и кластеризации объектов имиджа.
1.3. Методы классификации с обучением по прецедентам.7.
1.4. Выводы по разделу.
2. РАЗРАБОТКА ОПИСАНИЙ ОБЪЕКТО-СЕГМЕНТИРОВАННОЙ ИМИДЖИНГОВОЙ МОДЕЛИ ДОКУМЕНТА И ЭТАЛОННЫХ КЛАССОВ.
2.1. Анализ признаков классификации для построения объекто-сегментированного имиджингового представления документа и выбор математического аппарата исследований.
2.2. Разработка объекто-сегментированной имиджинговой модели представления документа.
2.3. Разработка эталонного класса для объекто-сегментированной имиджинговой модели представления документа.
2.4. Общий подход к построению классификатора объекто-сегментированного имиджингового документа.
2.5. Выводы.
3. РАЗРАБОТКА МЕТОДА КЛАССИФИКАЦИИ ОБЪЕКТОВ ИМИДЖЕЙ ДОКУМЕНТОВ.
3.1. Выбор модели классифицирующей функции.
3.2. Разработка методов анализа объектов имиджей документов по основным признакам классификации.
3.3. Формирование признаков эталонных классов.
3.4. Разработка вида классифицирующих функций.
3.5. Выделение символов и слов в текстовых блоках имиджей документов.
3.6. Разработка алгоритма нормализации графического символа.
3.7. Комбинированное использование методов распознавания символов.
3.8. Выводы.
4. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ МЕТОДОВ АНАЛИЗОВ
И КЛАССИФИКАЦИИ ОБЪЕКТОВ ИМИДЖЕЙ ДОКУМЕНТОВ.
4.1. Структура программного комплекса для моделирования нечеткой классификации объектов имиджей документов.
4.2. Разработка и исследование алгоритма поиска оптимальных коэффициентов для основных признаков.
4.3. Экспериментальное исследование точности нечеткой классификации объектов имиджей в зависимости от числа сегментов имиджа.
4.4. Экспериментальное исследование комбинации методов распознавания символов.
4.5. Вывод.
Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Срун Совила
Актуальность темы
В настоящее время в связи с развитием глобальных информационных коммуникаций все большее значение приобретает доступ к информации, представленной в электронном виде. В связи с этим большое значение придается созданию различного рода информационных архивов, в том числе и таких как электронные библиотеки. Однако, накопленные человечеством объемы бумажной информации настолько велики, что их перевод в электронные аналоги требует разработки специальных информационных технологий, в противном случае проблема может быть не решаемая.
При компьютерной обработке бумажного документа для получения его электронного аналога выделяют следующие этапы. Вначале бумажный документ сканируется, в результате чего получается электронная копия документа виде цифровой фотографии - имиджа (image). Далее имидж обрабатывается для получения нужных параметров его качества. Улучшение имиджа включает программное выравнивание, конвертирование с улучшением качества, удаление шумовых и фоновых элементов, нормализацию и пр. Данный процесс в компьютерной обработке называют имиджингом (imaging). Иначе говоря, имиджинг - это процесс получения аутентичных качественных изображений бумажных документов. В компьютерную обработку термин имиджинг пришел из микрофильмирования, однако сегодня он широко используется применительно к электронным изображениям. Имиджинг является начальным этапом в работе любой системы компьютерной обработки бумажных документов [35, 36, 70].
Очевидно, что с имиджами документов гораздо удобнее работать в сравнении с бумажными документами. Их можно копировать, накапливать в архивах, отправлять по компьютерной сети и т.д. Однако имидж нельзя редактировать, осуществлять по нему контекстный поиск, поскольку он является целостным и нерасчленимым на отдельные составляющие. Поэтому создание электронного аналога бумажного документа на этапе имиджинга не закапчивается и составляет только один из этапов компьютерной обработки бумажных документов.
Следующий этап компьютерной обработки связан с преобразование документа к одному из машинных форматов (PDF, HTML, MS Office и пр.) и дополнением его описания некоторой вспомогательной информацией. Такая обработка обязательна для включения документов в электронные архивы. На данном этапе выполняется преобразование имиджей документов в тексты на основе процедуры распознаванием (Optical Character Recognition/Image Character Recognition, сокращенно OCR/ICR). В процессе преобразования имиджингового представления документа в машинные форматы, как правило, приходится распознавать разного типа объекты: текстовые блоки, таблицы и рисунки и связывать их целостно вместе в описании документа [120, 121]. В дальнейшем такое представление документа в виде описания множества представляющих его объектов будем называть объекто-сегментированным имиджинговым описанием документа (ОСИОД).
Сегодня автоматическое получение ОСИОД является сложной и до конца не решенной задачей, ее исследованию посвящен ряд научных работ. Так, этой проблемой занимался ряд авторитетных исследователей, которые внесли своими научными трудами значительный вклад в развитие по данной предметной области. Среди них следует отметить работы Аникеева М. В. [45], Борисова Е. С. [73], Вежневеца А. П. [88], Качаевы Т. В. [97], Ковригина А.В. [84], Кучуганова А. В. [74], Лапинскую Г. В. [74], Прохорова А. [35, 36], Путятина Е. П. [10-12], Толкачёва А. Н.[7], Травина А., Тыщенко О. Б., Федорова В. М. [45], Цопкало Н. Н. [41, 43, 45, 47, 48], Шалымова Д. С., Южикова В. С. [95-97], Хлопова А. Н. [83, 84], Affan Mustofadee [81], Buffa F. [76], Claus D., Hao Y.[77], Hsien Wu [75], Kanade T. [85], Miguel Po[75], Porceddu I [76], Schofield E. [78], Shi Y. [77], Tsang Ing Ren [87], Zhang D., Zhang X. [77]. Кроме того, ряд коммерческих организаций также занимается подобными исследованиями и внедрением их результатов в компьютерные технологии обработки бумажных документов. Это такие известные фирмы и корпорации как ConeiForm [40], FineReader [39], Ко fax [38] Microsoft Office Development Imaging [125], Recognita [127], SimpleOCR [126] и др. В то же время многочисленность и разноплановость исследований в этой проблемной области говорит о том, что общее решение данной проблемы и сегодня далеко от своего окончательного решения. Данное обстоятельство послужило основанием к формулировке темы диссертационного исследования в рамках этой проблематики.
Настоящая диссертация посвящена разработке и исследованию методов и алгоритмов нечеткой классификации объектов имиджей документов
Объект исследования
В настоящей работе исследуется объекто-сегментированная имиджинговая модель документа и способы ее автоматического создания на основе разрабатываемых в диссертации методов и моделей классификации объектов имиджей.
Цели и задачи работы
Цель диссертационного исследования состоит в разработке и исследовании методов и алгоритмов нечеткой классификации объектов имиджей документов.
Для достижения поставленной цели в диссертации решаются следующие основные задачи:
1. Проводятся анализируется состояние исследований области обработки имиджей в части распознавания и классификации составляющих их объектов, и формулируются основные проблемы.
2. Разрабатывается объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов.
3. На основе выбранного математического аппарата разрабатывается метод классификации, в основе которого лежит классифицирующая функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
4. С учетом экспериментальных данных формируется система признаков, лежащая в основе идентификации объектов.
5. Разрабатывается структура классифицирующей функции на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков по предложены идентификационным признакам.
6. Разрабатывается методика нахождения оптимальных коэффициентов доверия для каждого из признаков классификации.
7. Разрабатывается метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализации имиджей букв.
8. Проводятся экспериментальные исследования основных теоретических положении диссертации.
Основные научные результаты
1. Предложена новая объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов на основе нечеткой логики.
2. Предложен метод классификации объектов имиджа, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
3. Предложена система признаков, лежащая в основе идентификации объектов имиджа и для нее разработана классифицирующая функция, вычисление которой осуществляется на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков.
4. Предложены модифицированный метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализация имиджей букв.
Основные положения, выносимые на защиту
1. Объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов на основе нечеткой логики.
2. Метод классификации объектов имиджа, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
3. Система признаков, лежащая в основе идентификации объектов имиджа.
4. Классифицирующая функция, вычисление которой осуществляется на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков.
5. Модифицированный метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализация имиджей букв. '
Практическая ценность результатов диссертационной работы состоит в том, что разработанные методы и алгоритмы нечеткой классификации объектов имиджей документов могут быть использованных в системах обработки в бумажных документов с целью создания их электронных аналогов.
Практическая значимость диссертации подтверждается актами о внедрении результатов исследования в рамках работ по госбюджетной НИР №12456 и учебном процессе по дисциплине "Организация электронных архивов данных" магистерской программы "Интеллектуальные системы" по направлению 230100 "Информатика и вычислительная техника" факультета автоматики и вычислительной техники Таганрогского технологического института Южного федерального университета.
Предлагаемые методы нечеткой идентификации и классификации объектов имиджей были программно реализованы и внедрены в научно-исследовательский процесс международной лаборатории ELDIC, факультета автоматики и вычислительной техники Таганрогского технологического института Южного федерального университета.
Апробация работы
Результаты работы докладывались и обсуждались на научно-практических конференциях:
- III Всероссийской научной конференции молодых ученых, аспирантов и студентов "Информационные технологии системной анализ и управление" (Таганрог, ТРТУ, 2005г);
- VIII Всероссийской научной конференции молодых ученых, студентов и аспирантов "Техническая кибернетика, радиоэлектроника и системы управления (КРЭС'06)" (Таганрог, ТРТУ, 2006г);
- Всероссийской научной школы-семинара молодых ученых, аспирантов и студентов "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки" (Таганрог, ТТИ ЮФУ, 2007г);
- Всероссийской научной школы-семинара молодых ученых, аспирантов и студентов "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки" (Таганрог, ТТИ ЮФУ, 2008г);
- VI Всероссийской научной конференции молодых ученых, аспирантов и студентов "Информационные технологии, системы анализ и управление" (Таганрог, ТТИ ЮФУ, 04-05 декабря 2008г).
- Всероссийская научная школа-семинар студентов, аспирантов и молодых ученых "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки" (Таганрог, ТТИ ЮФУ, Июня 2009г).
По теме диссертации автором опубликовано 9 печатных работ, в которых отражены основные результаты диссертации, в том числе одна статья в издании из списка, рекомендованного ВАК.
Структура работы
Материал основной части диссертационной работы изложен на 149 страницах машинописного текста. Диссертация состоит из введения, четырех разделов, заключения и списка литературы из 128 наименований, содержит 31 рисунок, 34 таблицы и 4 приложения на 33 страницах.
Заключение диссертация на тему "Разработка и исследование методов и алгоритмов нечеткой классификации объектов имиджей документов"
4.5.Вывод
В данном разделе разработан программный комплекс и поставлены на нем эксперименты по нечеткой классификации объектов имиджей.
1. Данные эксперименты показали, что: разработанные алгоритмы нечеткой классификации являются работоспособными и позволяют проводить идентификацию объектов имиджей типа "Текст", "Рисунок" и "Таблица".
2. Разработанный алгоритм поиска оптимальных коэффициентов позволил вычислить их значения и использовать их при проведении экспериментов по нечеткой классификации объектов имиджа.
3. Проведенное экспериментальное исследование точности нечеткой классификации объектов имиджей в зависимости от числа сегментов имиджа позволило построить гистограмму зависимости ошибки классификации в зависимости от размера сегментации имиджа. Данная гистограмма позволяет подобрать подходящие размеры сегментации имиджа с целью уменьшения ошибки классификации.
Таким образом, результаты экспериментов подтвердили полученные основные теоретические положения и результаты диссертационного исследования.
ЗАКЛЮЧЕНИЕ
Один из важных этапов компьютерной обработки связан с преобразование документа к одному из машинных форматов. Такая обработка обязательна для включения документов в электронные архивы. В процессе преобразования имиджа документа в машинные форматы, как правило, приходится распознавать разного типа объекты: текстовые блоки, таблицы и рисунки и связывать их целостно вместе в описании документа.
Существующие методы на основе текстурной сегментации для данной задачи являются не всегда приемлемыми потому, что рисунок на имидже документа, как правило, представляет собой набор объектов, неоднородных по текстуре и регулярности. Поэтому текстурную сегментацию можно использовать только для выделения областей с текстом и частично для выделения контуров рисунков.
Настоящая диссертация выполнена в рамках этой проблемы и посвящена разработке и исследованию методов и алгоритмов нечеткой классификации объектов имиджей документов на основе предложенной системы признаков.
При проведения диссертационного исследования решены следующие научные задачи:
1. Исследовано состояние области обработки имиджей в части распознавания и классификации составляющих их объектов и сформулированы основные проблемы этой предметной области.
2. Разработана и исследована объекто-сегментированная имиджипговая модель документа и модели описания эталонных классов объектов.
3. Разработан и исследован метод классификации, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
4. Сформирована и исследована на основе экспериментальных данных система признаков, лежащая в основе идентификации объектов.
5. Разработана структура классифицирующей функции на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков по предложены идентификационным признакам.
6. Разработана методика нахождения оптимальных коэффициентов доверия для каждого из признаков классификации.
7. Разработаны метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализации имиджей букв.
8. Проведены экспериментальные исследования разработанной в диссертации нечеткой классификации объектов имиджей, которые подтвердили основные теоретические положения диссертационного исследования.
В диссертации получены следующие новые научные результаты:
1. Предложена новая объекто-сегментированная имиджинговая модель документа и модели описания эталонных классов объектов на основе нечеткой логики, отличающаяся тем, что она учитывает характерные признаковые особенности графических объектов имиджа.
2. Предложен метод классификации объектов имиджа, в основе которого лежит классифицирующих функция, отображающая близость объектов имиджа и объектов эталонных классов на основе функции принадлежности нечеткой логики.
3. Предложена система признаков, лежащая в основе идентификации объектов имиджа и для нее разработана классифицирующая функция, вычисление которой осуществляется на основе понятия нечетких равенств ситуаций и на основе расстояния порядковых шкальных признаков.
4. Предложен модифицированный метод разбиения блоков текста на отдельные графические представления символов и слов, а также нормализации имиджей букв.
Все разработанные методы нечеткой идентификации и классификации объектов имиджей были программно реализованы и экспериментально исследованы.
Диссертационное исследование было выполнено в международной лаборатории ELDIC факультета автоматики и вычислительной техники Таганрогского технологического института Южного федерального университета.
Библиография Срун Совила, диссертация по теме Теоретические основы информатики
1. Корриган Дж. Компьютерной графики текст. // Секреты и решения пер. с англ. Куликова Д. А. - М.: Энтроп, 1995г. - 352с.
2. Боресков А.В. Компьютерная графика текст. // Первое знакомство. -М.: Финансы и статистика, 1996г. 175с.
3. Аксенов A. Demodesign 3D programming FAQ. 2005г. h ttp:// algolist.manual .ru/graph i cs/3 dfaq/index. php.
4. Игнате!iko А. Современные технологии улучшения качества 3D-изображений. http://www.uraldev.ru/articles/printview.php?id=l.
5. Davert Алгоритм текстурирования. — 2003 г.
6. Хашковский В.В., Толкачёв А.Н. Оптимизация отбора оптимальных признаков на основе применения методов моделирования эволюции для задачи распознавания текста. — 2005г.
7. Розенфелъд А. Распознавание и обработка изображений с помощью вычислительных машин Текст. // пер. с англ. Гуревича И. Б. [и др.] ; под ред. Лебедева Д.С. М.: Мир, 1972г.
8. Дуда Р., Харт 77. Распознавание образов и анализ сцен М.: Мир, 1976г. -511с.
9. Гиренко А.В., Ляшенко В.В., Машталир В.П., Путятин Е.П. Метод корреляционного обнаружения объектов Харьков: АО "БизнесИнформ", 1996г. 112с.
10. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М:Машиностроение, 1990г. — 320с.
11. Путятин Е.П. Нормализация и распознавание изображений. rhttp://sumschool. sumdu.edu.ua/is-02/rus/lectures/pytyatin/pytyatin.htm.
12. Бондаренко А.В., Галактионов В.А., Горемычкин В.И., Ермаков А.В., Желтое С.Ю. Исследование подходов к построению систем автоматического считывания символьной информации. М.: — 2003г.
13. Ясницкий Л.PI. Введение в искусственный интеллект текст. // Учеб. Пособие для вузов — М.:Издательский центр«Академия» 2005 г, 176с[103-105].
14. Комарцова Л.Г., Максимов А.В. Нейрокомпьютеры текст. // Учеб. Пособие для вузов. 2-е изд., перераб. И доп. - М.: Изд-во МГТУ им. Н. Э. Баумана, 2004г. - 400с[178-187].
15. Осовский С. Нейронные сети для обработки информации // Пер. с Польского И.Д. Рудинского. — М.: Финансы и статистика, 2002г. -344с.
16. Калан, Роберт. Основные концепции нейронных сетей // Пер. с англ. -М. Издательский дом Вильяме, 2003г. — 228с.
17. Астанин С.В. Методы и системы распознавания образов Электронный ресурс. // Центр дистанционного образования ТРТУ. -Таганрог: ЦДО ТРТУ, 2005г. 169с.
18. Поваркова Алла Компьютерный анализ изображений: общие сведения, системы, примеры использования. "Компания Аконд" Санкт-Петербург.rhttp://www.infectology.ru/microscopy/today/analysis/index.aspx.
19. Васильев В.Н., Гуров И.П., Потапов А. С. Математические методы и алгоритмическое обеспечение анализа и распознавания изображений в информационно-телекоммуникационных системах текст. // СПБГУ ИТМО Санкт-Петербург. - 46с.
20. Мелихов А.Н., Берштейн JI.C., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой текст. // Гл. ред. физ.-мат.лит., М.: Наука. 1990г. - 272с.
21. Блюмин C.J1., Шуйкова И.А., Сараев П.В., Черпаков И.В. Нечеткая логика алгебраические основы и приложения текст. // Монография — Липецк ЛЭГИ, 2002г. 113с.
22. Фынаев В.И. Модели систем принятия решений текст. // Учебное пособие Таганрог: Изд-во ТРТУ, 2005г. — 118с.
23. Ярушкина Н.Г. Основы теории нечетких и гибридных систем текст. // Учебное пособие. М.: Финансы и статистика, 2004г. - 320с.
24. Вишняков Ю.М., Кияшко А.Б. Нечеткие интеллектуальные системы по курсу "Системы искусственного интеллекта" текст. // Руководство к циклу лабораторных работ. Таганрог: Изд-во ТРТУ, 1999г. 68с.
25. Мациевский С.В. Нечеткие множества текст. // Учебное пособие. -Калининград Изд-во КГУ, 2004г. 176с.
26. Астанин С.В Информационно-советующие системы с нечеткой логикой По курсу "Интеллектуальные технологии" текст. // Руководство к лабораторной работе. Таганрог: Изд-во ТРТУ, 1999г. -36с.
27. Бородянский И.М., Ткаченко Г.И., Лапшин В.Б. Интеллектуальные средства измерений текст. // Учебное пособие. Таганрог: Изд-во ТТИ ЮФУ, 2008г. 66с.
28. Поспелов Д.А. Логико-лингвистические модели в системах управления текст. // М.: Энергоиздат, 1981г. - 231с.
29. Пушкин В.Н. Оперативное мышление в больших системах текст. // М.: Энергия, 1965г. -257с.
30. Тихомиров O.K. Структура мыслительной деятельности человека текст. // М.: Изд-во МГУ, 1969г. 158с.
31. Гусак А.А. Высшая математика Т. 2. текст. // Учебник для студентов вузов. — 3-е изд., стереотип. — Мн.: ТетраСистемс, 2001г. — 448с.
32. Вишняков Ю.М., Кодачигов В.И., Родзин С.И. Учебно-методическое пособие для самостоятельной работы по курсам "Системыискусственного интеллекта", "Методы распознавания образов" текст. // Таганрог: Изд-во ТРТУ, 1999г. 132с.
33. Срун С. Об одном подходе к улучшению качества распознавания текста. Текст. // Известия ЮФУ. Технические науки. Тематический выпуск "Интеллектуальный САПР". Таганрог: Изд-во ТТИ ЮФУ, 2009, № 4(93). - 256с. с189-194.
34. Прохоров А. Технологии перевода бумажных документов в электронные, текст. // Журнал КомпьютерПресс 2002, №9. [http://compress.ru/article.aspx?id=l 1802&iid=459]
35. Прохоров А. Системы оптического распознавания документов, текст. // Журнал КомпьютерПресс 2001, №9. [http://www.compress.ru/article.aspx?id=T 1745&iid:=458]
36. Морзеев Ю. Технологии машинного зрения, текст. // Журнал КомпьютерПресс 2002, №7.http://www.compress.ru/article. aspx?id=l 1745&iid=458.38. http://www.lcofax.com/capture/39. http://www.abbyy.com/40. http://www.cuneiform.ru/
37. Цопкало П.И. Разработка и исследование методов и средств распознавания текста факсимильных сообщений, текст. // дис. к.т.н. : 05.13.17, науч. рук. Бабенко Л. К. Таганрог: [б. и.], 2003. - 200с.
38. Павлидис Т. Алгоритмы машинной графики и обработки изображений, текст. // М.:, Радио и связь, 1986.
39. Аникеев М.В., Федоров В.М., Цопкало Н.Н. Алгоритм распознавания бланков факсимильных сообщений. // Известия ТРТУ. Специальный выпуск «Материалы XL VII научно-технической конференции». Таганрог: ТРТУ, 2002г. №1(24), с. 146-147.
40. Горбанъ А.Н., Россиев Д.А. Нейронные сети на персональном компьютере Новосибирск: Наука, 1996г.
41. Цопкало Н.Н. База данных изображений символов для тестирования алгоритмов OCR. текст. // V Всероссийская научная конференция студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления». Таганрог, 2000г. с362.
42. Цопкало Н.Н. Распознавание символов печатного текста по структурным признакам с использованием нейросети. текст. // Сборник трудов второго регионального научно-практического семинара «Информационная безопасность юг России». Таганрог, 2000г. с 130-135.
43. Борисов А.Н., Алексеев А.В., Крумберг О.А. и др. Модели принятия решений на основе лингвистической переменой, текст. // Рига: Зинатне, 1982г.-256с.
44. Еэ/скова И.В., Поспелов Д.А. Принятие решений при нечетких основаниях, текст. // I. Универсальная шкала. изв. АН СССР. Техн. киберникк. - 1977г.
45. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений, текст. // М.: Мир, 1976. 165с.
46. Заде J1.A. Основы нового подхода к анализу сложных систем и процессов принятия решений. М.: Знание, 1974г.
47. Орлов А.И. Задачи оптимизации и нечеткие переменные. М.: Знание, 1980г.
48. Мелихов А.Н., Берштейи А.С. Конечные четкие и расплывчатые множества. Часть 1. Четкие множества, текст. // Таганрог: Изд-во ТРТИ, 1980г.- 101с.
49. Нечеткие множества и теория возможностей. Последние достижения / Под ред. Р. Ягера. М.: Радио и связь, 1986г. — 391с.
50. Поспелов Д.А. Логико-лингвистические модели в системах управления. М.: Энергоиздат, 1981г. — 231с.
51. Фишберн П. Теория полезности для принятия решений. М.: Наука, 1978г.-352с.
52. Трахтенгерц Э.А. Компьютерная поддержка принятия решений. — М.: СИНТЕГ, 1998г.
53. Круглое В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. 2-е изд. - М.: Горячая линия-Телеком, 2002г.
54. Шикын Е.В. Компьютерная графика текст. // Динамика, реалистические изображения. -М.: ДИАЛОГ-МИФИ, 1995г. 287с.
55. Романычева Э.Т. Инженерная и компьютерная графика текст. // Учебник для вузов с дистанционным обуч. 2-е изд., перераб. - М.: ДМК Пресс 2001г. - 586с.
56. Поляков А.Ю. Методы и алгоритмы компьютерной графики в примерах на Visual С++, текст. СПб.: БХВ-Петербург, 2002г. 400с.
57. Ласло М. Вычислительная геометрия и компьютерная графика на С++, текст. // пер. англ. Львова В. М.: БИНОМ, 1997г. - 301с.
58. Пономаренко С.И. Пиксел и вектор, текст. // Принципы цифровой графики. СПб.: БХВ-Петербург, 2002г. - 477с.
59. Мураховский В.И. Компьютерная графика, текст. // Популярная энциклопедия. М.: АСТ-Пресс СКД, 2002г. - 639с.
60. Марр Д. Зрение: информационный подход к изучению представления и обработки зрительных образов Текст. // Пер. с англ. Гуревич Н.Г.\ под ред. Гуревича И.Б. М.: Радио и связь, 1987г. - 400с.
61. Гренаидер У. Лекции по теории образов: в 3 т. Т. 2 : Анализ образов. Текст. // Пер. с англ. Гуревича И. под ред. Журавлева Ю. М.: Мир, 1981г. -448с.
62. Гренандер У. Лекции по теории образов: в 3 т. Т. 3 : Регулярные структуры. Текст. // Пер. с англ. Гуревича И. под ред. Журавлева Ю. -М.: Мир, 1983г. -432с.
63. Загоруйко Н.Г. Методы распознавания и их применение. Текст. -М.: Советское радио, 1972г. — 208с.
64. Лисин С. Системы оптического распознавания текста. Текст. // Журнал КОМПЬЮТЕР-ИНФОРМ, №16, 2002. [http://www.ci.ru/infonn 16 02/р 22text.htm]
65. Арлазаров В.Л, Троянкер В.В., Котович Н.В. Адаптивное распознавание символов. 2000г. rhttp://ocrai.narod.ru/adaptive.html.
66. Борисов Е.С. Сегментация изображения текста. 2008г. http://mechanoid.narod.rU/misc/segmentator/index.html#ocr-piter.
67. Кучуганов А.В., Лапинская Г.В. Распознавания рукописных текстов. -2006г. http://mns.udsu.ru/conf/repoiJt/Kuchuganov2.pdf|
68. Miguel Ро, Hsien Wu Handwritten Character Recognition. 2003 r. | http://innovexpo.itee.uq.edu.au/2003/exhibits/s804636/thesis.pdfl
69. Buffa F., Porceddu I. Temperature forecast and some seeing minimization. A case study using neural network model. — 1997. http ://www. pd. astro. it/TNG/TechRep/rep67/rep67. html.
70. Hao Y., Shi Y., Zhang D., Zhu X. An effective result-feedback neural algorithm for handwritten character recognition. // International journal of Neural Parallel & Science Computations, Vol. 9, No. 2, pp. 139-150. -2001.
71. Schofield E. Concepts in pattern recognition. 2001. rhttp://userver.ftw.at/~schofiel/patterns.htmn
72. Neural Networks. 2003. rhttp://documents.wolfram.com/applications/neuralnetworks/index2.html.
73. Neural Networks: Advanced tutorial. 2002. http://www.pmsi.fr/home-gb.htm.
74. Affan Mustofadee Classification of muscles from ultrasound image sequences. 2009.http://www.wepapers.com/Papers/28748/Classification of muscles from ultrasound image sequences. Master's Thesis.
75. Bernd Jahne Digital Image Processing, 5th edition, Springer. 2002.
76. Хлопов A.M. Исследование алгоритма автоматической классификации цветных изображений. 2006г. http://elibrary.ru/item.asp?id==9253355.
77. Ковригин, А.В. Синтез и анализ алгоритмов автоматической классификации цветных изображений. // Ковригин А. В., Хлопов А. Н., II Исследовано в России: элект. журн. 2005. -236. 2417-2422с. http.V/zhumal. ape.relarn.ru/articles/2005/236.pdfl
78. Kanade Т. Picture processing by computer complex and recognition of human faces. 1973.
79. Гаисалее P., Вудс P. Цифровая обработка изображений. 2006г.
80. Tsang Ing Ren Pattern Recognition and Complex Systems. 2000.
81. Yand G, Huang T. S. Human face detection in complex background. // Pattern Recognition, vol. 27, no. 1, pp. 53-63, 1994.
82. Graf H. P., Chen Т., Petajan E., Cosotta E. Locating faces and facial parts. // Proc. First Int'l Workshop Automatic Face and GestureRecognition, pp. 41-46, 1995.
83. Ming-Hsuan Yang, Kriegman D., Ahuja N. Detecting faces in images: A survey. // IEEE Transaction on Pattern Analysis and Machine Intelligence (PAMI), vol. 24, no. 1, pp. 34-58, 2002.
84. Michael D. Garris, Darrin L. Dimmick. Form Design for High Accuracy Optical Recognition. // IEEE Transactions RAMI, June 1996.
85. Rocha J., Sakoda В., Zhou J., Pavlidis T. Deferred Interpretation of Grayscale Saddle Features for Recognition of Touching and Broken Characters. // Proceedings of Document Recognition, SPIE, vol. 2181, San Jose, CA, pp. 342-350, February 1994.
86. Гонсалес P. Цифровая обработка изображений. // Москва Техносфера, 2005. с. 812-836.
87. Южиков B.C. Сегментация изображений страниц древних рукописей. // Казанский осударственный Университет. ("http://rcdl2007.pereslavl.ru/papers/paper 49 vl.pdf)
88. Южиков B.C. Автоматическая классификация шрифта старопечатных текстов. — 2009г.http://textualheritage.org/content/view/272/13 8/lang.russian/~.
89. Южиков B.C., Качаева Т.В. Автоматизированная система распознавания и классификации резюме. 2007. ЬЦр://е1аг.и5и.гиЛ1ет5-Ьу-аи1Ьог?аи1Ьог=Южиков,+В.+С.
90. Губанов П.В. Автоматическая сегментация текстурированных изображений на основе локальных распределении характеристик. — 2000г.rhttp://www.tsu.ru/webdesign/tsu/Library.nsf/designobiects/vestnik271/$fil e/Gubanov74.pdf.
91. Ковтун KB. Текстурная сегментация изображений на основании марковских случайных полей.rhttp://www.irtc.org.ua/image/Files/kovtun/kovtun usim 2003(4) rus.pdf.
92. Henry A. Rowley, Shumeet Baluja, and Takeo Kanade, "Human face detection in visual scenes", Technical Report CMUCS-95-158R, School of Computer Science, Carnegie Mellon University, November 1995.
93. Roth D., Yang M.-H., Ahuja N. "A SNoW-based face detector" in Advances in Neural Information Processing Systems 12 (NIPS 12), MIT Press, Cambridge, MA, pp. 855-861, 2000.
94. Viola P., Jones. M. "Robust Real-time Object Detection" In Proc. 2nd Int'l Workshop on Statistical and Computational Theories of Vision — Modeling, Learning, Computing and Sampling, Vancouver, Canada, July 2001.
95. Воронцов К. В. "Байесовские алгоритмы классификации. Черновики лекций". http://www.ccas.ru/voron/download/Bayes.pdfl
96. Lawrence S., Giles C. Overfitting and neural networks: Conjugate gradient and backpropagation. In Proceedings of the IEEE International Conference on Neural Networks, pages 114— 119. IEEE Press, 2000.
97. Vapnik, V., Lerner, A. J., "Generalized portrait method for pattern recognition" Automation and Remote Control, vol. 24,no. 6, 1963.
98. Charles Elkan "Naive Bayesian learning" Adapted from Technical Report No. CS97-557, Department of Computer Science and Engineering, University of California, San Diego, September 1997.
99. Александр Веэ/сневец "Нестандартные нейросетевые архитектуры" электронный журнал "Графика и Мультимедиа" http://cgm.graphicon.ru/metodvi/nestandartnyie neyrosetevyie arhitektury i.html.
-
Похожие работы
- Разработка и исследование логического вывода в базах нечетких знаний продукционного типа с целью принятия решений в интеллектуальных системах
- Методы обработки изображений на основе теории нечетких множеств в информационно-измерительных системах
- Алгоритмы и программные средства идентификации парето-оптимальных нечетких систем на основе метаэвристических методов
- Разработка и исследование методов повышения качества нечеткого управления сложными динамическими объектами
- Теория, методы и алгоритмы анализа обоснованности нечетких классификационных моделей управления в сложных технических системах
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность