автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Модели и алгоритмы распознавания железнодорожной технической документации

кандидата технических наук
Бурсиан, Елена Юрьевна
город
Санкт-Петербург
год
2010
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Модели и алгоритмы распознавания железнодорожной технической документации»

Автореферат диссертации по теме "Модели и алгоритмы распознавания железнодорожной технической документации"

На правах рукописи

Бурсиан Елена Юрьевна 004617923

МОДЕЛИ И АЛГОРИТМЫ РАСПОЗНАВАНИЯ ЖЕЛЕЗНОДОРОЖНОЙ ТЕХНИЧЕСКОЙ ДОКУМЕНТАЦИИ

Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

1 б ДЕК 2010

Санкт-Петербург 2010

004617923

Работа выполнена в Федеральном государственном образовательном учреждении высшего профессионального образования «Петербургский государственный университет путей сообщения» на кафедре «Математика и моделирование»

Научный руководитель: доктор технических наук, профессор

Ходаковский Валентин Аветикович

Официальные оппоненты: доктор физико-математических наук,

профессор Береславский Эдуард Наумович

Ведущая организация: Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», им. В.И. Ульянова (Ленина).

Защита диссертации состоится 28 декабря 2010 г. в 13 часов на заседании диссертационного совета Д 218.008.06 при Петербургском государственном университете путей сообщения по адресу: 190031, г. Санкт-Петербург, пр. Московский, 9, в ауд. 1-217.

С диссертацией можно ознакомиться в библиотеке Петербургского государственного университета путей сообщения.

Автореферат разослан 26 ноября 2010 г.

Ученый секретарь диссертационного совета

кандидат физико-математических наук, доцент Карпушев Сергей Иванович

к.т.н., профессор

Кудряшов В. А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящее время наиболее перспективным является электронный способ хранения, обработки и передачи информации. Во многих отраслях решается проблема создания средств эффективного ведения электронной документации. В железнодорожной отрасли также ведутся работы по переводу технической документации на электронные носители информации с целью повышения эффективности мониторинга, диагностики и технического обслуживания, повышения оперативности поиска и устранения неисправностей.

Серьёзным препятствием переходу на электронную форму документации является наличие значительного массива бумажных документов, связанных с существующими техническими системами, построенными до появления адекватных средств ведения и хранения электронной документации. В связи с вышеизложенным необходимо снабдить автоматизированное рабочее место (АРМ) средствами автоматического распознавания для специализированной технической документации систем железнодорожной автоматики.

Задача распознавания технических документов представлена в научной литературе значительным количеством работ, касающихся как основ теории распознавания, так и имеющих прикладной характер. Разработкой основ теории распознавания занимается научная школа под руководством академика РАН Ю. И. Журавлёва. Среди современных отечественных авторов следует отметить теоретические работы К. В. Рудакова, В. JI. Матросова, Ю. П. Пытьева, Е.В. Дюковой и работы прикладного характера JI. М. Местецкого, Я. А. Фурмана и И. А. Рейера.

В развитие задач анализа и обработки изображений, прикладных задач технического чтения значительный вклад внесли зарубежные исследователи R. О. Duda, Р. Е. Hart, R. С. Gonzalez, H. Blum, T. Y. Zhang, С. Y. Suen.

Во многих работах исследуются проблемы организации информационной поддержки систем железнодорожной автоматики, анализируются способы представления информации, технологии внесения изменений в техническую документацию, форматы хранения и структуры данных, рассматриваются алгоритмы предварительной обработки изображения текста, особенности структурных методов распознавания символов и графических объектов.

При этом задача автоматического распознавания технической документации для систем железнодорожной автоматики остаётся нерешённой вследствие наличия значительного объёма документов невысокого качества, рукописных текстов и отсутствия эффективных методов их обработки. Тем самым является актуальной задача

совершенствования методов и средств распознавания специализированной технической документации для систем железнодорожной автоматики как инструментов построения и модернизации специализированной электронной базы данных, основанной на этой документации.

Объектом исследования является процесс распознавания специализированной технической документации для систем железнодорожной автоматики.

Предмет исследования - методы, модели и алгоритмы распознавания текстовой и табличной информации.

Целью диссертационной работы является повышение вероятности распознавания символов специализированной технической документации для систем железнодорожной автоматики. Для достижения поставленной цели в работе решалась научная задача: совершенствование методов и алгоритмов распознавания специализированной технической документации для систем железнодорожной автоматики как инструментов построения и модернизации специализированной электронной базы данных, основанной на этой документации.

Для достижения поставленной цели и решения научной задачи в работе осуществляется решение подзадач исследования:

1. Разработка методов предварительной обработки изображения листа монтажной документации (ЛМД) с целью устранения шумов и помех. Проверка эффективности предлагаемых методов.

2. Разработка алгоритма сегментации изображения ЛМД и определения главной таблицы на изображении и методов автоматического распознавания специальных знаков и структуры таблиц.

3. Разработка модели процесса автоматического распознавания чертёжных рукописных символов, представленных в таблицах монтажной документации систем железнодорожной автоматики.

4. Создание модели процесса автоматического распознавания для ЛМД как целостной структуры.

На защиту выносятся:

1. Методы и алгоритмы предварительной обработки изображений специализированной технической документации для систем железнодорожной автоматики.

2. Алгоритм распознавания структуры монтажных карточек и схем комплектации.

3. Модель процесса автоматического распознавания символов технической документации.

4. Модель распознавания монтажных карточек и схем комплектации для систем железнодорожной автоматики как целостных структур.

Методы исследования. Для решения задач, поставленных в диссертационной работе, применялись методы распознавания образов,

теории вероятностей и математической статистики, элементы теории графов, аппарат дифференциальной геометрии и алгебраические методы.

Для устранения дефектов изображения использовались способы фильтрации изображения, основанные на теории дискретного преобразования Фурье. В частности, разработка средств полосовой и низкочастотной фильтрации была основана на теоремах быстрого дискретного преобразования Фурье. При разработке алгоритмов распознавания символов была использована теория контурного анализа, элементы теории вычислительной геометрии, теоретические основы алгоритмов скелетизации изображения и корреляционный анализ.

При создании прототипа программы распознавания изображений специализированной технической документации для систем железнодорожной автоматики использовалась интегрированная среда разработки программного обеспечения Visual С++.

Достоверность научных результатов, полученных в диссертационной работе, основана на строгости применяемых методов, аналитических преобразований и подтверждена численными экспериментами и практическими результатами опытной эксплуатации. Адекватность предлагаемых методов и средств установлена с помощью экспериментальных исследований.

Научная новизна:

1. Разработан метод и инструмент эффективного удаления шумов из изображения технической железнодорожной документации, вызванных многократным копированием, сконструированный с учётом особенности данной документации.

2. Предложен комплекс методов распознавания таблицы для специализированной технической документации, отличающийся от применявшихся ранее малой трудоёмкостью и возможностью построения таблицы по её фрагментам.

3. Разработанная модель процесса автоматического распознавания символа технической документации отличается новым алгоритмом выбора параметров построения скелета символа, основанным на концепции распространения волновых фронтов от границ области.

4. Предложенный алгоритм распознавания изображения ЛМД отличается от применяемых ранее подходом, при котором ЛМД рассматривается как целостная структура.

Практическая значимость. Результаты, полученные в ходе исследования, реализованы в виде программного модуля для автоматизированного рабочего места ведения технической документации (АРМ-ВТД), и позволят увеличить эффективность построения и модернизации электронной базы данных систем железнодорожной автоматики.

Предложены средства восстановления утерянных электронных специализированных технических документов на основе данных/ сохранившихся на бумажном носителе информации. Созданы средства электронного документооборота технической железнодорожной документации.- Методы и средства распознавания монтажных карточек и схем комплектации для систем железнодорожной автоматики внедрены в АРМ-ВТД, оформлен акт внедрения.

Апробация и реализация. Алгоритм распознавания специализированной технической документации систем железнодорожной автоматики применён для создания и модернизации электронной базы данных монтажной документации систем железнодорожной автоматики.

Результаты работы докладывались на научных семинарах и заседаниях кафедры «Математика и моделирование» ПГУПС (2006-2009 гг.) и на конференции «50-летие КФ ИрГУПС» (2005г.).

Публикации. По результатам диссертационного исследования опубликовано 6 статей, в том числе две статьи в журналах, рекомендованных ВАК.

Структура и объём работы. Диссертационная работа представлена введением, четырьмя главами, списком литературы и приложениями, при этом составляет 150 стр. основного текста, содержит 114 рисунков, 4 приложения и 2 таблицы. Библиографический список составляют 83 наименования.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении аргументирована актуальность исследования, обоснована практическая значимость работы. Определён объект исследования.

В первой главе работы отмечены особенности и описана структура изображения специализированной технической документации для систем железнодорожной автоматики, как объекта распознавания.

Анализ структуры и особенностей изображения специализированной технической документации являлся необходимым условием создания эффективной методики её распознавания. Исследования показали, что структура изображения ЛМД представляет собой систему двух объектов: главной части, представляющей собой таблицу, содержащую основную информацию, и дополнительной части, оформленной в виде текста, второстепенных таблиц или графических объектов. Для построения электронной базы данных необходимо выделить на изображении таблицу, содержащую основную информацию.

В ячейках таблицы с помощью чертёжных рукописных символов или электронными шрифтами отражены технические характеристики приборов.

Линии таблицы либо проведены вручную, либо напечатаны на принтере или ротапринтной машине. При этом изображение имеет дефекты, вызванные либо многократным копированием, либо особенностями состояния оригинала, с которого осуществлялось сканирование, либо применением копировальных машин старого образца.

Ведущими разработками в области распознавания печатного и рукописного текстов, таблиц и схем являются пакеты программ оптического чтения текстов FineReader и FormReader, CuneiForm, OmniPage, TextBridge, ReadirisPro. Применение данных пакетов для распознавания специализированной технической документации не является эффективным из-за невысокого качества изображения железнодорожной документации и отсутствия учёта её особенностей. При этом под особенностями понимается использование специальных структурных типов таблиц и наличие специальных знаков.

Выполненный в главе анализ современного состояния проблемы распознавания, включая задачу предварительной обработки изображения, определения информативных характеристик элементов изображения и создания алгоритмов идентификации, позволил поставить цель и задачи научной работы, сформулировать необходимые условия их решения.

Вторая глава исследования посвящена разработке методов предварительной обработки сканированных изображений ЛМД с целью устранения шумов и удаления помех.

Задача предварительной обработки изображения решалась с помощью низкочастотной и полосовой фильтрации двумерного сигнала, представленного матрицей X = [xll],i = l,m,j = \,n , элементами которой являются значения яркостей пикселей изображения. Матрица X раскладывалась по системе ортогональных функций, представленной матрицами F, F'1, где F - любая ортогональная или унитарная матрица.

При проведении численных экспериментов в качестве преобразования F применялось разложение по функциям Уолша, дискретное комплексное преобразование Фурье и дискретное косинус-преобразование, F'1 = FT , F'] =F - условия ортогональности для вещественных и комплексного преобразований соответственно. F-.X-+Y, где Y = FXFT,Х = F~XY(F~X)T . Далее осуществлялась низкочастотная или полосовая фильтрация Y -» У,, и производилось обратное преобразование.

В экспериментальных исследованиях для всех преобразований применялись алгоритмы быстрых преобразований (использовался метод Кули-Тьюки) со временем работы 0(тп(1пт + \пп)), так как фактические размеры обрабатываемой матрицы градаций яркости изображения монтажных карточек и схем комплектации для систем железнодорожной автоматики - тхп, те [3500,5000], п е [4000,7000].

Для ослабления влияния выделенных гармоник на характеристики изображения (контрастность, гистограммы яркости пикселей фона и объекта, неоднородность фона, плавность границ объектов) использовался фильтр.

Согласно теории пространственной фильтрации матрица коэффициентов ослабления А = [Яи ] вычислялась по формуле Л, = <р0„) .

где =Тг9,г9 ' ~ да^Р^ частота, Хи -

коэффициент ослабления при двумерной частоте (/,/,) . Период Т задавался в пикселях, <р(г) - функция, определяющая изменение коэффициента понижения амплитуд.

Для комплексного преобразования Фурье = ^ , И = ^ , для

вещественного косинус-преобразования и преобразования Уолша = т , И = п,(т,п - ширина и высота изображения). Форма фильтра задавалась с помощью функции: <р(0 = (1 + ехр(а(/ - Г1)))"1 > где а - параметр, определяющий крутизну среза. Для фильтра низких частот а > 0, высоких - а< О . На рис. 2.1 изображены графики функций к = <р{0 для а = \,а = 4,а = 8; на рис. 2.2-для а = -1,а = -4,а = -8.

Полосовой фильтр строился как произведение фильтров низких и высоких частот с разными периодами Т, задающими «срезы» по низким и высоким частотам. При этом модуль параметра СС принимал равные

- к-к1 к1

значения для каждого из сомножителей: л — , где

В процессе исследования был сделан вывод, что применение функций Уолша следует осуществлять только при распознавании горизонтальных и вертикальных линий таблиц. Применение

вещественного косинус-преобразования и комплексного преобразования Фурье позволило получить практически одинаковые результаты, соответствующие поставленной цели.

В работе предложено применение низкочастотной фильтрации как метода устранения неинформативных частей скелетного представления Символа при обработке изображения специализированной технической документации. Полосовая фильтрация позволила добиться устранения неоднородности фона и распознавать символы, расположенные в исходном изображении на границе изменения яркости фона.

В работе предложен метод целевой параметрической фильтрации, направленный на устранение дефектов изображения горизонтальных и вертикальных линий. Областью применения метода является распознавание изображений специализированной технической документации, полученных многократным копированием или с помощью ротапринтной машины. При этом главной задачей фильтрации является задача улучшения изображения линий таблицы, так как без правильного построения таблицы повышение эффективности распознавания символов бесперспективно.

Разработан прототип программы с выбором системы базисных функций и полуавтоматическим подбором параметров фильтрации, основанный на теоретических положениях низкочастотной фильтрации, использующий фильтрующую функцию ср{0 . Численные эксперименты, проведённые с помощью модуля предварительной обработки, показали эффективность предложенных средств и методов.

В третьей главе диссертации обосновывался алгоритм распознавания структуры таблицы ЛМД. При этом предполагалось, что таблица представлена системой горизонтальных и вертикальных линий, либо проведённых от руки, либо построенных на матричном принтере или на принтере с невысоким качеством печати. Изображения линий могли иметь разрывы и полости, вызванные помехами и многократным копированием. Далее подразумевается, что всё сказанное для горизонтальных линий относится также и к вертикальным линиям.

При создании алгоритма автоматического распознавания структуры ЛМД были разработаны.

1. Процедуры определения горизонтальных линий и устранения разрывов линий с оценкой времени их работы.

2. Алгоритм распознавания структуры таблицы с учётом особенностей специализированной технической документации для систем железнодорожной автоматики.

3. Прототип программы для проведения численных экспериментов с целью проверки эффективности работы процедуры и алгоритма.

4. Метод распознавания линий таблицы, основан на следующих положениях.

1. Линии таблицы представлены на изображении в виде горизонтальных объектов, вследствие этого области их расположения эффективно устанавливались с помощью алгоритма определения длинных горизонтальных последовательностей пикселей объекта.

2. Вследствие дефектов изображения алгоритм, указанный в первом пункте, позволяет получить только отдельные фрагменты линий. Изображение таблиц монтажных карточек и схем комплектации содержит несколько десятков линий, являющихся почти горизонтальными, то есть отклонения линий таблицы от горизонтали не превышают нескольких градусов. При этом на каждой линии может иметься более десяти разрывов. Таким образом, необходимо применять процедуру поиска всех разрывов на линиях таблицы.

Случаи взаимного расположения фрагментов изображений горизонтальных линий представлены на рис. 3.1 тремя ситуациями: а, Ь, с. Ситуация а соответствует разрыву без наложения, случай Ь - разрыву с наложением, в ситуации с второстепенный фрагмент линии повторяет рисунок линии выше или ниже основного фрагмента. При этом ситуацию а, соответствующую «разветвлению» линии без нарушения связности, целесообразно обрабатывать с помощью процедуры закраски области на растре как один фрагмент линии.

а. Ъ.

с

Рис. 3.1. Варианты разрывов изображений горизонтальных линий

Подавляющее большинство разрывов горизонтальных линий на изображениях монтажных карточек и схем комплектации - разрывы без наложений. Поиск и удаление разрывов без наложения можно эффективно осуществлять с помощью построения диаграммы Вороного для точек расположенных на концах фрагментов всех горизонтальных линий.

При этом решается следующая задача. На плоскости имеется N точек. Для каждой точки требуется найти все соседние точки, удалённые от данной точки на расстояние не более чем е. Количество ближайших соседей ограничено параметром т . N точек - концы фрагментов горизонтальных линий (N = 2М , М - количество фрагментов). Задача устранения разрывов без наложения решается за время о(1п( М)М) + 0{тМ).

Поиск разрывов с наложением эффективно производится с помощью традиционной процедуры, основанной на упорядочивании фрагментов п0 значениям ординат начальных точек фрагментов. На основе рассматриваемого метода был создан прототип программы распознавания горизонтальных линий. На рис. 3.2 представлен фрагмент таблицы монтажной карточки без устранения разрывов. На рис. 3.3 показан тот же фрагмент после применения процедуры устранения разрывов. При этом с помощью предлагаемого метода были устранены разрывы горизонтальных линий, соответствующие ситуации, в которой второстепенный фрагмент линии повторяет рисунок линии, расположенной выше, разрыв без наложения в конце первой горизонтальной линии и разрывы без наложения вертикальных линий.

I I 1

Рис. 3.2. Фрагмент с разрывами Рис. 3.3. Фрагмент без разрывов

Экспериментальные исследования, выполненные с помощью прототипа программы распознавания горизонтальных линий, подтвердили эффективность предложенного метода.

С целью распознавания структуры таблицы монтажных карточек и схем комплектации был разработан метод вычисления координат колонок и ячеек, определения конфигурации таблицы и представления её в виде графа, вершинами которого являются ячейки таблицы и вся таблица. При этом вершины соединялись рёбрами в том случае, когда соответствующие им ячейки находились одна над другой, вершина соответствующая всей таблице соединялась ребрами с верхними ячейками. Структура таблицы монтажных карточек представлять в виде дерева.

В четвёртой главе диссертации представлена модель процесса автоматического распознания символов технической документации и модель распознавания монтажных карточек и схем комплектации как целостных структур. Предполагается, что изображения символов выполнены чертёжными шрифтами вручную, машинописью или получены от принтера без применения художественных гарнитур. При этом считается, что все знаки записаны раздельно, лишь в редких случаях имеет место случайное «приклеивание» соседних знаков. То есть, не ставится задача расшифровки слитного рукописного текста, которая значительно сложнее.

Предлагаемая модель процесса автоматического распознавания символов технической документации основывалась на применении

методов теории графов и принципов статистического подхода в задачах распознавания образов. Для каждого изображения символов таблицы строился вектор информативных характеристик хе К" размерности п , Множество распознаваемых изображений символов разбивалось на подмножества с равными количествами ветвей скелетных графов. В каждом подмножестве разбиения п=кт , где п - размерность вектора информативных характеристик элементов разбиения, к - количество ветвей скелетных графов элементов разбиения, т - размерность вектора информативных характеристик для каждой ветви скелетного графа.

Возможные результаты распознавания кодировались точками дискретного пространства уеУ, выбиралось пространство распознающих функций Г,/еГ,/При этом предполагалось, что на задано пространство вероятностных мер Р . В работе рассматривались методы распознавания символов, основанные на топологических свойствах скелетных графов (связность, количество циклов, степени вершин) и сравнении информативных характеристик распознаваемых и эталонных символов.

Для каждого символа, встречающегося в таблицах железнодорожной документации, строился набор обучающих данных (набор эталонов) Ту ~ {(Х1,У )Ум,(х„у )еЛ" хУ , где Ту = {(хпу )}", - выборка из N элементов векторной случайной величины с неизвестным распределением к е Р, х, вектор информативных характеристик эталона. При этом предполагалось, что возможно принципиально различное написание символов, поэтому N - число элементов в наборе Ту, как правило, было отлично от единицы. С целью построения наборов обучающих данных Ту были разработаны средства создания и модификации электронной базы данных эталонных символов.

Известно, что основная проблема при формализации и решении задач распознавания образов применительно к заданной предметной области - формирование набора информативных признаков х е Л". Одним из основных способов формирования набора информативных признаков символа является построение скелета плоской замкнутой области, соответствующей символу на изображении.

Скелетом 5 замкнутой ограниченной области О назовём геометрическое место точек х„ центров замкнутых кругов С^О) , удовлетворяющих следующим условиям.

1. Замкнутые круги С,о(г) принадлежат области О (с,о (/-)<=£).

2. Замкнутые круги СХа{г) не содержатся в других замкнутых кругах, принадлежащих области О (3(г,) с £>: С^(г,) с:Сч(г),Сх><7,

При этом при применении алгоритма построения скелета возникает проблема «стрижки скелета», состоящая в определении и удалении неинформативных частей скелетного представления, так как любая точка максимума кривизны границы области является началом линии скелета.

Скелетный граф области строился с помощью кусочно-линейной аппроксимации кривых, составляющих скелет. В каждой точке скелета определялась толщина символа, которая равна удвоенному расстоянию от точки скелета до границы области, соответствующей символу на изображении. Распознавание символа осуществлялось при помощи сравнения наборов информативных характеристик х и х0, созданных на основе скелетных графов распознаваемого и эталонного объектов.

В работе предлагается алгоритм построения скелета области, основанный на моделировании распространения по изображению области плоских волн, начинающихся в точках границы области (рис. 4.1).

Рис. 4.1. Распространение волн

На первом этапе предлагаемого алгоритма применялась процедура обхода границы, в результате работы которой все точки границы получали последовательные номера в соответствии с порядком обхода границы (на рис. 4.1 граница области закрашена чёрным цветом). Далее в каждой точке границы осуществлялась генерация волны, при этом цвет волны вычислялся в формате RGB, яркости цветов считались равными номеру точки, полученному при обходе границы.

На следующих этапах производилось последовательное построение волновых фронтов, распространяющихся от границ области, и осуществлялась закраска пикселей, принадлежащих волновым фронтам. Работа алгоритма заканчивалась, когда вся область была закрашена.

В качестве точек скелета выбирались точки, которые имели соседние по 4-связному растру точки, яркости которых отличались от

яркостей данных точек на величину большую некоторого порога, являющегося параметром алгоритма скелетизации. На рис. 4.1 линия резкого перепада яркости соответствовала линии скелета. Скелет S (рис. 4.2) формировался из точек, расположенных на границе скачкообразного изменения яркости пикселей. На рис. 4.3 представлены скелетные графы символов, построенные с помощью предлагаемого алгоритма и линейной аппроксимации скелета S.

В ходе исследования были разработаны алгоритм и прототип программы с целью сравнительного изучения скелетизации с помощью алгоритмов последовательного удаления граничных точек, алгоритма утончения (Т. Y. Zhang, С. Y. Suen) и с помощью моделирования распространения плоских волн от границ изображения символа.

На основе численных экспериментов сделан вывод, что при обработке изображения символов высокого качества с толщиной линии не более четырёх пикселей нельзя отдать предпочтение какому-либо из алгоритмов. В случае изображения среднего качества при использовании первых двух алгоритмов появляются неинформативные элементы скелета, и возникает необходимость в разработке дополнительных процедур дам удаления лишних элементов скелетного представления символов.

Предложенная модель процесса автоматического распознания символов, расположенных в ячейках таблицы монтажных карточек и схем комплектации, основана на следующих положениях.

1. Распознавание символов целесообразно осуществлять во время или после определения параметров таблицы монтажных карточек и схем комплектации, при этом границы изменения линейных характеристик символа (толщины написания линии и размеры прямоугольника, ограничивающего область расположения) являются установленными.

2. При условии, что толщина линии на изображении не превышает нескольких пикселей, применение алгоритма последовательного удаления граничных пикселей объекта с целью построения скелета символа не приводит к существенным искажениям скелетного графа.

3. Если толщина написания линии символа ограничена несколькими десятками пикселей, то скелет символа, построенный с помощью волнового алгоритма, при условии распространения волн от границ области, обладает всеми информативными характеристиками объекта, необходимыми для отнесения его к одному из символов.

4. При построении базы данных эталонных символов, встречающихся в таблицах монтажных карточек и схем комплектации для систем железнодорожной автоматики, следует ограничиться типичными и ординарными случаями изображения символов, так как нестандартные и нехарактерные особенности образуют необозримое множество написаний. База данных эталонных символов может быть представлена только

соответствующими им скелетными графами, так как для типичных изображений символов вся существенная информация содержится в скелетных графах. При этом нетипичные особенности могут образовывать специальную базу данных.

5. При создании базы данных скелетных графов эталонных символов рассматриваемые скелетные графы следует разбить на классы гомеоморфных графов и составлять наборы информативных признаков х отдельно для каждого из классов. При этом количество признаков в наборе х элементов одного класса является постоянным.

6. Сравнение распознаваемых символов следует осуществлять только с эталонными символами из базы данных, скелетные графы которых являются гомеоморфными скелетным графам распознаваемых символов. При этом ветви скелетных графов необходимо упорядочить таким образом, чтобы соответствующие ветви гомеоморфных графов имели одинаковые номера.

7. Над координатами вершин всех полученных графов необходимо произвести аффинные преобразования, с целью стандартизации прямоугольников, ограничивающих графы. С целью создания наборов информативных характеристик на каждой ветви скелетного графа следует выбрать определённое количество точек, являющееся параметром алгоритма, и вычислить в них характеристики ломаных, представляющих ветви графов, (углы наклона ребер, значения кривизны).

8. Сравнение наборов информативных характеристик, составленных из комплексных угловых коэффициентов звеньев ломаных соответствующих ветвям скелетных графов, с помощью выборочной корреляционной функции применимо для любых скелетных графов. При этом гипотеза о принадлежности распознаваемого изображения к классу данного эталонного символа не отвергается, если

Кч-ЛФ0-9'

г (д) =_-КУМ*Аб _

-Ч(АМ*,1, -^(Л))^;,4«*,]/*. -М,.(Д))([ху],+д-мЩ'

= = ^»(Д) ~ алгебраическое

дополнение элемента ги(Д), [*,.], - компонента вектора [х,] с номером /, [х,] - вектор угловых коэффициентов скелетных графов с номером /.

9. Сравнение наборов информативных характеристик, составленных из координат точек, в которых рёбра скелетных графов пересекаются с массивами горизонтальных и вертикальных линий, и вычисление

расстояния Хаусдорфа рн(А,,А2) между полученными множествами пересечений Д и Аг с целью определения наиболее близкого эталонного символа применимо для скелетных графов, представленных простыми цепями. При этом расстояние Хаусдорфа рн(А„А2) определялось следующим образом: р„(А1,А2) = тах(а( Л, ,А2'),а(А2,А,)) , где

= зирр(х,4г), р(х,А) = Ыр{х,у).

«Л, У**

На основе изложенных положений была создана модель процесса распознавания рукописных чертёжных символов, разработан алгоритм и прототип программы распознавания рукописных чертёжных символов, расположенных в ячейках таблицы монтажных карточек и схем комплектации для систем железнодорожной автоматики. Численные эксперименты показали, что с помощью предлагаемого алгоритма можно добиться эффективности распознавания 75% для рукописных изображений невысокого качества.

Монтажные карточки оформлены в виде таблиц, алгоритм распознавания является средством автоматизации построения и пополнение электронной базы данных, рассматриваемой документации, поэтому вся текстовая информация должна быть представлена в виде элементов, включаемых в структуры, соответствующие таблицам. При распознавании всего документа, представленного в виде таблицы, в настоящем исследовании был предложен следующий метод.

1. Применение средств автоматического распознавания структуры таблицы и символов монтажных карточек и схем комплектации. Определение координатных характеристик прямоугольников расположения символов и ячеек таблицы.

2. Формирование для каждой ячейки таблицы набора строчек, состоящих из последовательностей кодов.

3. Установление основных внутренних и внешних структурных связей монтажных карточек и схем комплектации для систем железнодорожной автоматики, формирование системы внутренних ссылок на ячейки таблицы и системы внешних ссылок на другие таблицы.

4. Воспроизведение распознанной таблицы в символьном виде, отражающем структуру таблицы и текст ячеек.

С целью распознавания ячейки таблицы как структуры, состоящей из последовательности строчек, составленной из отдельных кодов, был предложен следующий метод.

1. Построение гистограмм высоты и ширины символов, за исключением высоких, узких и широких символов, с использованием результатов их распознавания. Вычисление средних значений высоты и ширины символа таблицы и доверительных интервалов для данных значений.

2. Определение границ возможных значений межстрочных расстояний с помощью средних значений ширины и высоты символов.

3. Разбиение множества символов ячейки на подмножества символов, относящихся к одной строке ячейки.

4. Упорядочивание символов в каждой строке ячейки и разбиение строк на отдельные коды.

С целью установления внутренних и внешних связей между ячейками таблицы и другими таблицами применялись следующие процедуры.

1. Формирование последовательностей кодов, встречающихся в таблице (словарь таблицы) со ссылкой на ячейку, строчку ячейки и номер слова.

2. Определение колонок численных кодов.

3. Установление совпадающих колонок и частично совпадающих колонок.

4. Дополнительное распознавание текста в заголовках колонок с использованием информации об обратной нумерации колонок.

С целью проверки эффективности метода распознавания для монтажных карточек и схем комплектации как целостных структур был разработан прототип программы её распознавания, численные эксперименты показали эффективность предлагаемого метода для изображений рукописных монтажных карточек, полученных многократным копированием оригинала.

В заключении изложены выводы и основные результаты исследования.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Разработаны специализированные методы, модели и алгоритмы предварительной обработки изображений ЛМД для систем железнодорожной автоматики. Создан прототип программы, осуществляющий данные методы.

2. Обоснованы и конструированы специализированные способы сегментации изображения в целях отделения его структурных элементов: таблиц, символов и специальных знаков применительно к монтажным карточкам и схемам комплектации систем железнодорожной автоматики.

3. Предложены модель, алгоритм и программа процесса автоматического распознавания символов специализированной технической документации для систем железнодорожной автоматики. Разработан новый алгоритм построения скелета символа, основанный на распространении волн, начинающихся в точках границы символа. Создан

прототип программы, осуществляющий построение скелета, с помощью рассматриваемого алгоритма.

4. Разработаны методы распознавания монтажных карточек и схем комплектации как целостных структур, что позволило добиться повышения эффективности обработки изображения специализированной технической документации.

5. Предложены способы представления распознанной информации. Создан прототип соответствующей программы.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Основные работы, опубликованные в журналах перечня ВАК:

1. Бурсиан Е. Ю. Алгоритм распознавания чертёжных рукописных символов. Приборостроение. Известие ВУЗов. № 7. 2008.

2. Бурсиан Е. Ю. Распознавание таблиц монтажных карточек технической железнодорожной документации. Известия Санкт-Петербургского университета путей сообщения. Выпуск 2.2010. Список работ соискателя, опубликованных по теме диссертации:

1. Бурсиан Е. Ю. Кластеризация распознаваемых объектов на основе корреляционных функций скелетных графов. Математика в ВУЗе. Труды международной научно-практической конференции. Санкт-Петербург. 2004.

2. Бурсиан Е. Ю. Предварительная обработка изображения технологической карты. Математика в ВУЗе. Труды международной научно-практической конференции. Новгород. 2005.

3. Бурсиан Е. Ю. Распознавание железнодорожной документации. Известия Санкт-Петербургского университета путей сообщения. Выпуск 3. 2007.

4. Бурсиан Е. Ю. Моделирование распознавания рукописных символов в таблицах технологических карт систем железнодорожной автоматики. Известия Санкт-Петербургского университета путей сообщения. Выпуск 1. 2009.

Выступления на конференциях:

1. Бурсиан Е. Ю. Фильтрация изображения распознаваемых объектов на электротехнической схеме. Конференции 50-летие КФ ИрГУПС. 2005.

Подписано к печати 24.11.2010 г. Печ.л. - 1,0

Печать - ризография. Бумага для множит, апп. Формат 60x841/16

Тираж 100 экз._Заказ № Но?__

Тип. ПГУПС. 190031, С-Петербург, Московский пр.д.9

Оглавление автор диссертации — кандидата технических наук Бурсиан, Елена Юрьевна

СПИСОК УСЛОВНЫХ СОКРАЩЕНИЙ И ОСНОВНЫЕ

ОБОЗНАЧЕНИЯ.

ВВЕДЕНИЕ

Глава I. Структура изображения листа монтажной железнодорожной документации. Анализ технических средств распознавания документов и теоретических основ алгоритмов обработки изображения чертежей и текстовой информации

1.1 Структура и особенности изображения листа монтажной документации для систем железнодорожной автоматики.

1.2 Пакеты программ технического чтения.

1.3 Алгоритмы предварительной обработки изображения.

1.4 Теоретические основы алгоритмов распознавания.

1.5 Выводы и постановка задачи исследования.

Глава II. Предварительная обработка изображения листа монтажной документации с целью удаления шумов и искажений

2.1 Перевод изображений технических железнодорожных документов в чёрно-белую палитру без применения алгоритмов фильтрации.

2.2 Устранение шумов перед переводом изображения в черно-белый вид.

2.3 Применение преобразования Уолша

2.4 Устранение шумов с помощью вещественного косинус-преобразования и комплексного дискретного преобразования Фурье.

2.5 Удаление помех перед разграничением объекта и фона.

2.6 Влияние качества фильтрации на последующую обработку изображения.

2.7 Выводы.

Глава III. Распознавание таблиц железнодорожной документации.

3.1 Распознавание таблиц при высоком качестве изображения.

3.2 Поиск горизонтальных и вертикальных линий для таблиц, построенных вручную.

3.3 Алгоритм поиска разрывов без наложения для горизонтальных линий.

3.4 Алгоритм поиска разрывов с наложением.

3.5 Распознавание структуры таблицы монтажной документации для систем железнодорожной автоматики.

3.6 Выводы.

Глава IV. Модели процессов распознавания символов и распознавания таблицы монтажной документации для систем железнодорожной автоматики как целостной структуры.

4.1 Особенности задачи распознавания символьной информации, представленной в таблицах ТЖД

4.2 Выделение связных множеств и выдвижение гипотез о принадлежности рассматриваемых множеств к семейству изображений символов как модель процесса автоматической сегментации символов внутри ячеек

4.3 Скелетизация множества

4.4 Граница множества и алгоритм обхода границы.

4.5 Алгоритмы построения скелетного графа символа для изображения высокого качества

4.6 Алгоритм построения скелетного графа символа для изображения невысокого качества

4.7 Построение базы данных скелетных графов эталонных символов для монтажной документации систем железнодорожной автоматики.

4.8 Проверка гипотезы о принадлежности распознаваемой области множеству символом и выбор символа с помощью базы данных скелетных графов эталонных символов.

4.9 Объединение символов, расположенных в ячейках таблицы, в слова и строки. Модель распознавания листа монтажной документации и представление распознанной информации в виде, соответствующем структуре таблицы в целом

Выводы.

Глава V. Основные результаты исследования.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Бурсиан, Елена Юрьевна

Развитие железнодорожного транспорта обусловлено разработкой и внедрением в производственный процесс наукоёмких технологий с целью его полной или частичной автоматизации. Необходимым условием применения современных производственных технологий является требование ведения документации на электронном носителе. Таким образом, важным составным элементом производственного процесса является комплекс технических средств поддержки работы с документами.

Вся техническая информация должна быть представлена на электронном носителе в структурированном виде, соответствующем её смысловому содержанию, то есть необходимо разработать многофункциональную программу создания, модификации и использования электронной базы данных железнодорожной документации.

Исходная техническая информация для электронной базы данных в значительном числе случаев представлена в виде рукописных чертежей или копий с них на бумажном носителе, поэтому необходим пакет программ для предварительной обработки изображения и его последующего распознавания с целью представления железнодорожной документации в сжатой и удобной для использования форме.

Известные программы машинного распознавания предназначены главным образом для чтения печатных текстов (FineReader). Разработки пакетов прикладных программ широкого профиля для расшифровки технической рукописной информации далеки от своего завершения. В данном случае также следует учесть, что при распознавании узкоспециализированной инженерной документации необходимо использовать дополнительные данные о возможном смысловом содержании текстографической информации с целью более эффективного распознавания.

Учитывая вышесказанное, необходимо отметить, что для автоматизации процесса создания электронной базы данных железнодорожной документации требуется узкоспециализированный пакет программ чтения и декодирования инженерной транспортной информации или программные средства широкого профиля с возможностью их адаптации к задачам обработки изображения технической документации и адекватного её отражения в электронной базе данных рассматриваемой отрасли.

В данной работе рассматривается подход, связанный с созданием узкоспециализированного комплекса программ обработки железнодорожной документации, в частности расшифровке схем комплектации приборов железнодорожных станций и монтажных карточек данных приборов, так как в настоящее время значительная часть документов отрасли относится к вышеуказанному типу.

Разработка эффективного комплекса программ распознавания изображения технической документации возможна при соблюдении следующих условий.

• Применение новых математических методов при построении алгоритмов предварительной обработки непосредственного распознавания.

• Использование обобщённого метода, включающего различные методы расшифровки технической документации;

• Адаптация методов к распознаванию железнодорожной документации с целью использования возможного смыслового содержания декодируемой информации.

Таким образом, целью настоящей работы является эффективная модификация современных методов обработки и распознавания изображения с целью применения их для построения электронной базы данных железнодорожной документации и создание прототипа комплекса программ для апробации вышеуказанных модификаций. Данная научная задача является актуальной, так как построение электронной базы данных вручную является трудоёмким процессом, при этом эффективные пакеты программ для выполнения этой работы отсутствуют.

Для достижения поставленной цели и решения научной задачи в работе осуществляется решение подзадач исследования:

1. Разработка методов предварительной обработки изображения листа монтажной документации с целью устранения посторонних неинформативных элементов, шумов и помех. Проверка эффективности предлагаемых методов.

2. Разработка алгоритма сегментации изображения листа монтажной документации и определения главной таблицы на изображении.

3. Разработка методов автоматического распознавания специальных знаков и структуры таблиц.

4. Разработка модели процесса автоматического распознавания чертёжных рукописных символов, представленных в таблицах монтажной документации систем железнодорожной автоматики.

В ходе решения данной задачи были получены следующие положения:

1. Методы и алгоритмы предварительной обработки изображений специализированной технической документации для систем железнодорожной автоматики.

2. Алгоритм распознавания структуры монтажных карточек и схем комплектации.

3. Модель процесса автоматического распознавания символов технической документации.

4. Модель распознавания МКСЖА и СКСЖА как целостных структур. Научная новизна работы состоит в том, что разработан метод и инструмент эффективного удаления шумов из изображения листа ТЖД, вызванных многократным копированием, сконструированный с учётом особенности данной документации; предложен комплекс методов распознавания таблицы для специализированной технической документации, отличающийся от применявшихся ранее малой трудоёмкостью и возможностью построения таблицы по её фрагментам.

Разработанная модель процесса автоматического распознавания символа ТЖД отличается новым алгоритмом выбора параметров построения скелетов для символов специализированной технической документации, основанным на концепциях предварительного определения характеристик границ символа и распространения волновых фронтов от границ области. Предложенный алгоритм распознавания изображения МКСЖА или СКСЖА отличается от применяемых ранее подходом, при котором ЛМД рассматривается как целостная структура.

Заключение диссертация на тему "Модели и алгоритмы распознавания железнодорожной технической документации"

4.10. Выводы

Модель процесса автоматического распознавания символов специализированной технической документации имеет следующие особенности.

• Распознавание символов, расположенных в ячейках таблицы, осуществляется после распознавания общей структуры таблицы, так как после данного этапа примерные размеры символов, их средняя толщина и множества предполагаемого расположения становятся известными.

• Алгоритм построения скелета символа основывается на моделировании распространения волновых фронтов, начинающихся от границ связного множества и сопоставлении определённого цвета каждой точке его границы и установлении точек скелета символа по скачкообразному изменению цвета (величина скачка сравнивается с пороговым значением, являющимся параметром алгоритма).

• Инструмент создания и пополнения базы данных скелетных графов эталонных символов позволяет учитывать особенности шрифта и подчерка. "

• Сравнение скелетных графов распознаваемых и эталонных символов производится с учётом топологических характеристик графов после установления гомеоморфизма последних. При сопоставлении соответствующих ветвей гомеоморфных графов осуществляется подразбиение ребер, выполняемое в целях уравнивания количества вершин на сопоставляемых ветвях.

• Модель распознавания монтажной карточки или схемы комплектации как целостной структуры, включает в себя структуризацию текста ячейки, объединение разрозненных символов в слова и строки и алгоритм распознавания ячейки таблицы монтажной карточки или схемы комплектации.

• Модель распознавания монтажной карточки или схемы комплектации включает в себя установление внутренних и внешних связей между ячейками таблицы и другими таблицами.

Глава У. Основные результаты исследования

В ходе исследования были получены следующие основные результаты.

1. Разработаны специализированные модели и алгоритмы предварительной обработки изображений листов монтажной документации для систем железнодорожной автоматики. Создан прототип программы, осуществляющий данные методы.

2. Обоснованы и сконструированы специализированные способы сегментации изображения в целях отделения его структурных элементов: таблиц, символов и специальных знаков применительно к монтажным карточкам и схемам комплектации систем железнодорожной автоматики.

3. Предложена модель, алгоритм и программа процесса автоматического распознавания символов специализированной технической документации для систем железнодорожной автоматики. Разработан новый алгоритм построения скелета символа, основанный на распространении волн, начинающихся в точках границы символа. Создан прототип программы, осуществляющий построение скелета, с помощью рассматриваемого алгоритма.

4. Разработаны методы распознавания монтажных карточек и схем комплектации как целостных структур, что позволило добиться повышения эффективности обработки изображения специализированной технической документации.

5. Предложены способы представления распознанной информации. Создан прототип соответствующей программы.

Полученные результаты имеют практическую ценность.

1. Предложенная модель процесса автоматического распознавания символов применима при распознавании произвольных текстов.

2. Предлагаемые алгоритмы и способы позволят увеличить эффективность внедрения электронной базы данных систем железнодорожной автоматики.

3. Разработанный метод автоматического распознавания технологической карты систем железнодорожной автоматики позволяет существенно автоматизировать работу оператора по созданию электронной базы технологических карт систем железнодорожной автоматики.

Библиография Бурсиан, Елена Юрьевна, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Ту Дж., Гонсалес Р. Принципы распознавания образов / под р. Журавлева Ю. И. М.: Мир, 1978. - 401 с.

2. Банков А. М., Кузин Е. С., Шамис A. Л! Пакет программ для распознавания рукописной символьной и графической информации // Искусственный интеллект. Кн. 1, — М.: Радио и связь, 1990, 179 с.

3. Хармут X. Теория секвентного анализа. — М.: Мир 1980. 152 с.

4. Престон П. Пространственно-частотная фильтрация объектов. — М.: Мир 1980.-172 с.

5. Фурман Я. А., Кревецкий А. В., Передреев А. К., Роженцов А. А., Хафизов Р. Г., Егшина И. JL, Леухин А. Н. Введение в контурный анализ и его приложения к обработке изображений и сигналов. — М.: ФИЗМАТЛИТ, 2002. 588 с.

6. Фурман Я. А., Кревецкий А. В. Комлекснозначные и кватернионные сигналы и подходы к их обработке // Изв. вузов. Приборостроение, 4, 2006.-102 с.

7. Котович А. А., Славин В. Н. Распознавание скелетных образов // Методы и средства работы с документами. Сборник трудов Института системного анализа РАН 2000. М.: УРСС, 2000. - 347 с.

8. Canny J. A. Computational approach to edge detection: IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986. Vol. 8, N 6, pp 679-698.

9. Lam L. Suen C. An Evaluation of Parallel Thinning Algorithms for Character Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, № 9, 1995. p. 914-919.

10. Местецкий JI. А., Рейер И. А. Непрерывное скелетное представление изображения с контролируемой точностью // Международная конференция «Графикон-2004». М.: МГУ. 2004.-269 с.

11. Местецкий Л. А., Семёнов А. Б. Преобразование цветных изображений на основе жирных Б-сплайновых кривых // Труды международной конференции «Графикон-2003» 2003. — 252 с.

12. Шикин Е. В., Боресков А. В., Шикина Г. Е. Компьютерная графика М.: Финансы и статистика, 1996. — 173 с.

13. Математическая энциклопедия — М.: Советская энциклопедия, 1982. — 5 т. 658 с.

14. Логно Д. В., Соболев А. С. Модифицированные алгоритмы Форчуна и Ли скелетизации многоугольной фигуры // Труды международной конференции «Графикон-2001», 2001. 121 с.

15. Рейер И. А. Сегментация штрихов и их соединений при распознавании рукописного текста // Труды международной конференции «Графикон-1999», 1999.-151 с.

16. Препарата Ф., Шеймос М. Вычислительная геометрия. Введение М.: Мир, 1989-149 с.

17. Lee D. T. Medial axes transform of planar shape // IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-4 (1982), 363-369p.

18. Гэри M. P., Джонсон Д. С. Вычислительные машины и труднорешаемые задачи М.: Мир, 1982 - 411 с.

19. Кнут М. Искусство программирования для ЭВМ М.: Мир, 1978 - 3 т. 272 с.

20. Zhang T. Y., Suen С. Y. A fast parallel algorithm for thinning digital patterns. // IEEE, Communications of the ACM. Vol. 27. - № 3 - 1984. - 236 p.

21. Гнеденко Б. В. Курс теории вероятностей — М.: Наука, 1988 — 406 с.

22. Боровков А. А. Математическая статистика —М.: Наука, 1984 469 с.

23. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа-М.: ФИЗМАТЛИТ, 2006 570 с.

24. Добеши И. Десять лекций по вейвлетам — Ижевск: 2004.

25. Чуй К. Введение в вейвлеты М.: Мир, 2001 - 412с.

26. Старовойтов В. В. Локальные геометрические методы цифровой обработки и анализа изображений Минск, 1997.

27. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Исследование зависимостей: Справ, изд. Айвазяна С. А. / Под ред. М. : Финансы и статистика, 1985. — 487 с.

28. Архангельский А. Я. Программирование в С++ Builder 6 M.: Бином, 2005.-1162 с.

29. Бабенко К. И. Основы численного анализа — Ижевск: РХД, 2002. — 848 с.

30. Баскакова Л. В., Журавлев Ю. И. Модель распознающих алгоритмов с представительными наборами и системами опорных множеств // Журнал вычислительной математики и математической физики. Т. 21, № 5. М.: УРСС, 1981.-1264 с.

31. Бауэр Ф. Л., Гооз Г. Информатика М.: Мир, 1990. - 742 с.

32. Беннет Д. Visual С++ 5 M.: Диалектика, 1998. - 767 с.

33. Берж К. Теория графов и её применение М.: Издательство иностранной литературы, 1962. - 319 с.

34. Биллингсли П. Сходимость вероятностных мер — М.: Наука, 1981. 431 с.

35. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики М.: Наука, 1983-415 с.

36. Братчиков И. Л., Ань Хан Тхе Новые методы предварительной обработки для систем распознавания рукописного текста // Вестник СПбГУ. Сер. 10, 2008, вып. 1,-16 с.

37. Вайнцвайг M. Н., Полякова М. П. О моделировании мышления // От моделей поведения к искусственному интеллекту М.: УРСС, 2006. - 286 с.

38. Ван дер Варден Б. Л. Алгебра М.: Наука, 1976. - 648 с.

39. Вапник В. Н., Червоненкис А. Я. Теория распознавания образов — М.: Наука, 1974.-415 с.

40. Василенко М. Н., Соколов М. Б. Применение метода процессного моделирования для анализа тональных рельсовых цепей // Вестник Ростовского государственного университета путей сообщения, 4 — 2007. -31 с.

41. Власов А. В., Шамис А. Л. Экспериментальные системы зрительного восприятия для роботов // Интегральные роботы, — М.: Мир, 1975, — 28 с.

42. Вороной Г. Ф. Собрание сочинений. Т. 1 Т. 2 - К.: 1952. — 368 с.

43. Гонсалес Р. С., Вудс Р. Е., Эддинс С. Л. Цифровая обработка изображений в среде МАТЛАБ М.: Техносфера, 2006. - 203 с.

44. Горбачёв А. М. Автоматизация синтеза кабельных сетей железнодорожной автоматики и телемеханики // Известия Петербургского Университета Путей Сообщения. СПб.: Петербургский государственный университет путей сообщения, 2009. -№1. С. 52-61.

45. Горелик А. Л., Скрикин В. А. Методы распознавания М.: Высшая школа, 1989.

46. Грегори К. Использование Visual С++ 6 М.: Вильяме, 2000. - 849 с.

47. Грис Д. Наука программирования М.: Мир, 1984. - 416 с.

48. Дейтел X. М., Дейтел П. Дж. Как программировать на С++ — М.: Бином, 1998.-1021 с.

49. Дуда Р., Харт П. Распознавание образов и анализ сцен М.: Мир, 1976.,— 511 с.

50. Дюк В. А. Компьютерная психодиагностика СПб.: Братство, 1994. - 363 с.

51. Журавлев Ю. И. Избранные научные труды М.: Магистр, 1998. - 420 с.

52. Журавлев Ю. И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики М.: Наука, 1978. Вып. 33.-5 с.

53. Журавлев Ю. И., Рязанов В. В., Сенько О. В. Распознавание. Математические методы. Программная система. Практические применения —М.: Фазис, 2005. — 159 с.

54. Загоруйко Н. Г. Методы распознавания и их применение М.: Сов. радио, 1972.-206 с.

55. Загоруйко Н. Г. Прикладные методы анализа данных и знаний — Новосибирск: Изд-во Института математики, 1999. — 211 с.

56. Зуев Ю. А. Метод повышения надежности классификации при наличии .нескольких классификаторов, основанный на принципе монотонности // ЖВМиМФ. М.: УРСС, Т. 21. № 1, 1981. 157 с.

57. Ильин В. А., Ким Г. Д. Линейная алгебра и аналитическая геометрия — М.: Издательство Московского Университета, 2007. — 392 с.

58. Калверт Ч., Рейсдорф К. Borland С++ Builder 5 Киев: Диасофт, 2001. -937 с.

59. Капустий Б. Е., Русын Б. П., Таянов В. А. Новый подход к определению вероятности правильного распознавания объектов множеств // УСиМ, 2, 2005. 8 с.

60. Келли Дж. JI. Общая топология М.: Наука, 1981.-431 с.

61. Кокс Д., Хинкли Д. Теоретическая статистика М.: Мир, 1978. — 558 с.

62. Колмогоров А. Н. Теория информации и теория алгоритмов М.: Наука, 1987. 163 с.

63. Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ М.: МЦНМО, 2004. - 955 с.

64. Кочетков Д. В. Распознающие алгоритмы, инвариантные относительно преобразований пространства признаков // Распознавание, классификация, прогноз: Мат. методы и их применение Вып. И — М.: Наука, 1989.-178 с.

65. Крамер Г. Математические методы статистики — М.: Мир, 1976 —302 с.

66. Кудрявцев В. Б., Андреев А. Е., Гасанов Э. Э. Теория тестового распознавания -М.: ФИЗМАТЛИТ, 2007. 355 с.

67. Лбов Г. С. Методы обработки разнотипных экспериментальных данных — Новосибирск: Наука, 1981. 212с.

68. Лбов Г. С., Старцева Н. Г. Логические решающие функции и вопросы статистической устойчивости решений — Новосибирск: Изд-в. Ин-та математики СО РАН, 1999. 150 с.

69. Лепский А. Е., Броневич А. Г. Математические методы распознавания образов Таганрог: ТТИЮФУ, 2009.- 156 с. . .

70. Лутманов С. В. Курс лекций по методам оптимизации Ижевск: РХД, 2001.-368 с.

71. Мирошниченко С. Ю., Мишустин В. Н., Дегтярёв С. В. Распознающий аппаратно-программный диагностирующий комплекс // Изв. вузов. Приборостроение, 2, 2005. 112 с.

72. Новиков Ф. А. Дискретная математика для программистов СПб.: Питер, 2004.-301 с.

73. Овсиенко В. Ю., Табачников С. Л. Проективная дифференциальная геометрия М.: МЦНМО, 2008. - 237 с.

74. Ope О. Теория графов М.: Наука, 1980. - 336 с.

75. Пытьев Ю. П. Морфологический анализ изображений // Докл. АН СССР. Т. 269, № 5. М.: УРСС, 1983. 1061 с.

76. Рашевский П. К. Курс дифференциальной геометрии М.: УРСС, 2003. -428 с.

77. Стокман Джордж, Шапиро Линда Компьютерное зрение М.: Бином. Лаборатория знаний, 2006. - 752 с.

78. Федорчук В. В., Филиппов В. В. Общая топология. Основные конструкции М.: Издательство Московского Университета, 1988. - 251 с.

79. Форсайт Дэвид А., Понс Джин Компьютерное зрение. Современный подход М.: Вильяме, 2004. - 928 с.

80. Чен Ш. К. Принципы проектирования систем визуальной информации — М.: Мир, 1994.

81. Ширяев А. Н. Вероятность М.: Наука, 1989 - 638 с.

82. Blum Н. A transformation for extracting new descriptors of shape // Models for the Perception of Speech and Visual Form, MIT Press, 1967.8 7 6 5 4 3 2 1

83. Аи/е- /ч/ю* нми/г-чоЯ" ими г- чооо^ лниме-зю* нмшг-воо"-/7/?/ г гс//г и. НО /ГСМР! Нхг>пе-*> НОРУ Р 4 <

84. У н/чп/ег-ЯСОх /440* дуи-дал^л-, »,ео Ими//. /440'* рмш/- гччо* нмш/ -/чча~ ШЧ' .иу ■ .вг УАК-вБ^ "■/А/7ЛРР ч<ипР<*, кме/г- 4гхо //мл/г-гвос пчо НМШЗ-':<№)* кБл^а/-^1. К/ » •И/ иг

85. ЧА&Ь'Г^ УД,Г?/7 С 9А' ЧАРУР<*~ О НССРць,6 елш > н/ги/мг-зго н /"¿улгг-зго нлпгу^г-эге. »/«ШЬ-ШОО мг-?о/М1 -//го НМШ1- /440 иу и? •X/