автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.14, диссертация на тему:Разработка математического и программного обеспечения автоматизированной системы поиска оптимального набора признаков при параметрическом подходе в задачах распознавания

кандидата технических наук
Юдина, Ольга Вадимовна
город
Череповец
год
2000
специальность ВАК РФ
05.13.14
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка математического и программного обеспечения автоматизированной системы поиска оптимального набора признаков при параметрическом подходе в задачах распознавания»

Оглавление автор диссертации — кандидата технических наук Юдина, Ольга Вадимовна

ВВЕДЕНИЕ.

ГЛАВА 1. ОСОБЕННОСТИ ПАРАМЕТРИЧЕСКОГО ПОДХОДА В ЗАДАЧАХ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБРАЗОВ.

1.1 Анализ известных методов и решений при использовании параметрического подхода в задачах распознавания.

1.1.1 Параметрический подход в задачах распознавания.

1.1.2 Критерии оптимальности решения при выборе признаков.

1.1.3 Общее описание проблемы поиска оптимального набора признаков в задачах классификации.

1.2 Особенности формирования бинарных изображений.

1.2.1 Виды возмущающих факторов.

1.2.2 Искажения бинарн ых изображений.

1.3 Классификация признаков бйнарных графических образов.

1.4 Постановка задачи разработки алгоритмического и программного обеспечения автоматизированной системы поиска оптимального набора признаков.

ГЛАВА 2. МЕТОД ПОИСКА ОПТИМАЛЬНОГО НАБОРА ПРИЗНАКОВ ПРИ ИСПОЛЬЗОВАНИИ ПАРАМЕТРИЧЕСКОГО ПОДХОДА В ЗАДАЧАХ РАСПОЗНАВАНИЯ.

2.1 Анализ разделяющей способности набора признаков.

2.1.1 Измерение расстояний между объектами.

2.1.2 Построение матриц расстояний.

2.2 Оценка эффективности признаков, используемых в задаче распознавания.

2.2.1 Характеристики эффективности признаков.

2.2.2 Определение обобщенной эффективности признака.

2.2.3 Алгоритм первоначального отбора признаков.

2.3 Процедура поиска оптимального набора признаков.

2.3.1 Построение оптимального набора признаков.

2.3.2 Алгоритм решения задачи линейного программирования симплексным методом.

2.3.3 Принятие решения об оптимальном наборе признаков.

ГЛАВА 3. АДАПТАЦИЯ ПРОЦЕДУРЫ ПОИСКА ОПТИМАЛЬНОГО НАБОРА ПРИЗНАКОВ В УСЛОВИЯХ ВЛИЯНИЯ ВОЗМУЩАЮЩИХ

ФАКТОРОВ.

3.1 Признаки бинарных изображений.

3.1.1 Признаки, основанные на анализе плотности изображения.

3.1.2 Признаки, основанные на построении и анализе гистограмм уровней яркости изображения.

3.1.3 Признаки, основанные на анализе формы изображения.

3.1.4 Признаки, основанные на описании огрубленного эталона графического образа на бинарном изображении.

3.2 Исследование обобщенной эффективности признака в условиях влияния возмущающих факторов.

3.2.1 Характеристики эффективности признаков в условиях искажений.

3.2.2 Вычисление обобщенной эффективности.

3.2.3 Моделирование искажений.

3.2.4 Исследование устойчивости признаков в условиях искажений

3.3 Методика адаптации процедуры поиска оптимального решения в условиях влияния возмущающих факторов.

3.3.1 Применение алгоритма ИСОМАД.

3.3.2 Определение параметров кластеризации.

3.3.3 Процедура оптимизации набора признаков с учетом искажений.

3.3.4 Решение задачи динамического программирования.

ГЛАВА 4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ПОИСКА ОПТИМАЛЬНОГО НАБОРА ПРИЗНАКОВ ПРИ ПАРАМЕТРИЧЕСКОМ ПОДХОДЕ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБРАЗОВ.

4.1 Описание экспериментальной системы.

4.2 Экспериментальное исследование алгоритмов поиска оптимального набора вектора признаков и методики их адаптации.

4.2.1 Методика проведения исследования.

4.2.2 Исследование зависимости между уровнем ошибки распознавания и количеством признаков для изображений различного качества.

4.3 Применение системы в задаче распознавания сложных графических образов (на примере иероглифов).

Введение 2000 год, диссертация по информатике, вычислительной технике и управлению, Юдина, Ольга Вадимовна

Задача распознавания возникает во многих приложениях, связанных с классификацией наблюдаемых объектов: в системах технического зрения, системах распознавания звуковых и визуальных образов.

Одним из основных путей решения проблемы распознавания яв-ляется параметрический подход. В его основе лежит выделение различных признаков, элементов объекта, анализ которых позволяет принять решение об отношении этого объекта к тому или иному классу. Однако, эффективность системы распознавания, ориентированной на использование параметрического подхода, во многом зависит от выбора признаков, используемых для идентификации объекта.

Наибольшую актуальность эта проблема приобретает при создании систем оптического распознавания символов, осуществляющих преобразование информации с бумажных носителей в электронную форму. В настоящее время описано достаточно много признаков для классификации графических образов, представленных бинарными изображениями, однако остается открытым вопрос эффективного выбора и оптимизации набора признаков. Его значимость возрастает, в первую очередь, для случаев, когда предъявляемые для распознавания графические образы принадлежат более чем сотне, а порой и тысяче классов, при этом сами образы могут быть настолько сложными, что для их распознавания необходимо использование более десятка различных признаков. Так, до сих пор нельзя считать полностью решенной задачу автоматического распознавания таких сложных графических образов, как иероглифы.

На настоящий момент успех решения задачи выбора и оптимизации набора признаков »при построении систем распознавания, как правило, зависит от квалификации и интуиции разработчиков. В этой связи, проблема построения автоматизированной системы поиска оптимального набора признаков при параметрическом подходе в задачах распознавания является весьма актуальной.

Целью работы является разработка математического и программного обеспечения автоматизированной системы, позволяющей находить из предложенной совокупности признаков оптимальный набор, обеспечивающий заданную точность распознавания предъявленной группы бинарных изображений, вводимых в ЭВМ с помощью сканера с печатных носителей. В соответствии с поставленной целью, в работе решаются следующие основные задачи:

- анализ современного состояния проблемы распознавания и особенностей ее решения на основе параметрического подхода, описание признаков, используемых в задачах распознавания бинарных графических образов и существующих методик нахождения разделяющего набора;

- разработка и математическое описание метода поиска оптимального набора признаков; разработка алгоритмического обеспечения автоматизированной процедуры поиска оптимального набора признаков;

- разработка методики и алгоритмов адаптации процедуры поиска оптимального набора признаков к влиянию искажающих факторов процесса- формирования бинарных изображений;

- разработка программного обеспечения экспериментальной автоматизированной системы поиска оптимального набора признаков для исследования предложенных методик и алгоритмов.

Для решения поставленных в работе задач использован аппарат теории распознавания образов, математического программирования, теории вероятностей и математической статистики, методы обработки и анализа монохромных изображений.

Научная новизна результатов работы состоит в следующем:

1.Разработана новая методика анализа разделяющей способности заданной совокупности признаков при параметрическом подходе в задачах распознавания, основанная на построении и анализе матрицы взаимных расстояний между классами, заданными своими эталонными представителями, применимая в условиях отсутствия априорной информации о распознаваемых объектах.

2.Разработаны методика и алгоритмы автоматизированного поиска оптимального набора признаков при параметрическом подходе в задаче распознавания, обеспечивающие нахождение среди заданной совокупности признаков минимального подмножества с разделяющей способностью не ниже, чем у исходной совокупности.

3.Предложены характеристики для оценки эффективности признаков, используемых для классификации сложных бинарных графических образов .и методика их расчетов, основанная на анализе результатов разделения классов изображений в пространстве признаков.

4.Разработаны методика и алгоритм адаптации процедуры поиска оптимального набора признаков бинарных графических образов, ' в условиях влияния искажающих; воздействий на процесс формирования их изображений, обеспечивающие требуемый, либо максимально возможный при использовании заданной совокупности признаков, уровень надежности распознавания.

Практическая ценность работы заключается в том, что:

1.Описаны, классифицированы и программно реализованы более 90 признаков, используемых для распознавания бинарных изображений.

2.Даны рекомендации по выбору признаков для распознавания сложных графических образов - иероглифов.

3.Исследованы зависимости между допустимым уровнем ошибки распознавания графических образов, представленных бинарными изображениями, и размером оптимального набора признаков, обеспечивающего уровень ошибки, не выше допустимого, в условиях влияния возмущающих воздействий на процесс формирования изображений.

4.Разработано программное обеспечение-экспериментальной автоматизированной системы поиска оптимального набора признаков, осуществляющей расчет характеристик для оценки эффективности признаков, используемых в задачах распознавания бинарных графических образов и ведущей поиск оптимального набора среди заданной совокупности признаков.

5.Результаты диссертации используются в учебном процессе в череповецком филиале Санкт-Петербургского государственного технического университета в курсе «Системы искусственного интеллекта» для специальности 220400 -Программное обеспечение вычислительной техники и автоматизированных систем.

6.Полученные результаты использованы при проектировании автоматизированной системы выявления и распознавания государственных регистрационных знаков движущихся транспортных средств, разработанной Череповецким научным координационным центром РАН по заданию Мэрии г. Череповца для Череповецкого отдела ГИБДД.

Основные положения диссертационной работы докладывались и обсуждались на четырех научно-технических конференциях, а также на научно-технических семинарах Череповецкого государственного университета и Череповецкого научного координационного центра РАН в 1996-1999 гг.

По материалам диссертации опубликовано 5 печатных работ.

В структурном отношении работа состоит из четырех глав, списка литературы и приложений.

В первой главе проведен анализ современного состояния проблемы распознавания образов, в результате которого были исследованы достоинства и недостатки параметрического подхода в задачах распознавания, общее состояние проблемы поиска разделяющего набора признаков в задачах классификации, указаны основные критерии оптимальности решения при выборе, признаков.

Рассмотрены особенности формирования бинарных изображений, вводимых в ЭВМ при помощи сканера.

Описаны типы 'признаков, применяемые для распознавания бинарных изображений, проведена их классификация. Определен круг основных решаемых в работе проблем.

Во второй главе приводится методика анализа разделяющей способности заданной совокупности признаков при параметрическом подходе в задачах распознавания, основанная на анализе матрицы взаимных расстояний между классами, заданными своими эталонными представителями. Предлагаются характеристики для оценки эффективности признаков и схема их расчета. Задача поиска оптимального набора признаков сформулирована в виде задачи линейного программирования. Разработаны алгоритмы автоматизированного поиска оптимального набора признаков, основанные на решении задачи линейного программирования.

В третьей главе описаны признаки, применимые для распознавания бинарных изображений, проведено исследование обобщенной эффективности признака в условиях влияния возмущающих факторов. Предложены характеристики для оценки эффективности признаков, используемые в условиях влияния возмущающих факторов.

Приведена методика и алгоритм адаптации процедуры поиска оптимального набора признаков бинарных графических образов, в условиях влияния искажающих воздействий на процесс формирования их изображений, обеспечивающие требуемый, либо, максимально возможный при использовании заданной совокупности признаков, уровень надежности распознавания.

В четвертой • главе приведено описание экспериментальной системы Hieroglyph, позволяющей рассчитывать параметры признаков бинарных изображений, содержащихся в библиотеке, оценивать характеристики признаков, составлять матрицы расстояний, производить вычисления, предусмотренные алгоритмом предварительной обработки, а также вычисления, необходимые для решения задачи линейного и динамического программирования. Приведены результаты экспериментальных исследований предложенных методик и алгоритмов. Исследованы зависимости между уровнем ошибки и количеством признаков для изображений различного качества. Даны рекомендации по выбору признаков для распознавания сложных графических образов - иероглифов. Рассмотрены перспективы развития автоматизированной системы поиска оптимального набора признаков.

На основании результатов проведенных исследований сделан вывод об обоснованности предложенного в диссертационной работе подхода к построению математического и программного обеспечения решения проблемы оптимизации набора признаков при параметрическом подходе в задачах распознавания.

Рассмотрены пути дальнейшего применения системы в задаче распознавания сложных графических образов.

На защиту выносятся:

1.Методика анализа разделяющей способности заданной совокупности признаков при параметрическом подходе в задачах распознавания.

2.Методика и алгоритмы автоматизированного поиска оптимального набора признаков при параметрическом подходе в задаче распознавания.

3.Характеристики для оценки эффективности признаков, используемых для классификации сложных бинарных графических образов и методика их расчетов.

4.Методика и алгоритм адаптации процедуры поиска оптимального набора признаков бинарных графических образов в условиях влияния искажающих воздействий на процесс формирования их изображений.

Заключение диссертация на тему "Разработка математического и программного обеспечения автоматизированной системы поиска оптимального набора признаков при параметрическом подходе в задачах распознавания"

Выводы по четвертой главе

1. На основании предложенного метода поиска оптимального набора признаков, разработана автоматизированная система поиска оптимального набора признаков бинарных образов, предложена ее функциональная схема. Разработано программное обеспечение для расчета более девяноста признаков бинарных изображений и вычислений, предусмотренных алгоритмами выбора признаков.

2. Проведено исследование предложенной процедуры поиска оптимального набора признаков на 136 бинарных изображениях сложных графических образов, на основании которого сделан вывод об обоснованности предположений о формировании коэффициентов эффективности признаков и использовании предложенных моделей. Даны рекомендации по выбору признаков для распознавания сложных графических образов (иероглифов).

3. Выполнены исследования устойчивости процедуры поиска оптимального набора признаков с использованием простейшей имитационной модели искажений бинарных изображений и направленные на анализ зависимостей ошибки распознавания от количества использованных признаков.

4. Результаты проведенных исследований позволяют сделать вывод об обоснованности предложенного подхода к построению математического и программного обеспечения решения проблемы оптимизации набора признаков при параметрическом подходе в задачах распознавания.

Заключение

В диссертационной работе на основе полученных теоретических и практических результатов разработано математическое и программное обеспечение автоматизированной системы поиска оптимального набора признаков при параметрическом подходе в задачах распознавания, обеспечивающей нахождение среди заданной совокупности признаков минимального подмножества с разделяющей способностью не ниже, чем у исходной совокупности и отличающейся от известных аналогов новыми методиками и алгоритмами поиска, а также значительным снижением общих требований, предъявляемых к априорной информации о распознаваемых объектах. Наиболее существенные научные и практические результаты заключаются в следующем:

1.Разработана новая методика анализа разделяющей способности заданной совокупности признаков при параметрическом подходе в задачах распознавания.

2.Разработаны методика и алгоритмы автоматизированного поиска оптимального набора признаков при параметрическом подходе в задаче распознавания, обеспечивающие нахождение среди заданной совокупности признаков минимального подмножества с разделяющей способностью не ниже, чем у исходной совокупности.

3.Предложены характеристики для оценки эффективности признаков, используемых для классификации сложных бинарных графических образов и методика их расчетов.

4.Проведен анализ основных возмущающих факторов процесса формирования бинарных изображений, вводимых в ЭВМ с печатных носителей и разработана методика адаптации процедуры поиска оптимального набора признаков в условиях влияния возмущающих факторов.

5.Исследованы зависимости между долей ошибок при классификации и размером оптимального набора признаков, обеспечивающего уровень ошибки, не выше допустимого, для классов графических образов, представленных эталонными изображениями и изображений с заданными искажениями.

6.Проведен анализ и классификация существующих признаков, программно реализованы 94 признака для распознавания сложных бинарных изображений.

7.Даны рекомендации по выбору признаков для распознавания сложных графических образов - иероглифов.

8.Разработано программное обеспечение экспериментальной системы автоматизированного поиска оптимального набора признаков.

9.Предложенные методики нашли применение при проектировании автоматизированной системы выявления и распознавания государственных регистрационных знаков движущихся транспортных средств, разработанной Череповецким научным координационным центром РАН по заданию Мэрии г. Череповца для Череповецкого отдела ГИБДД.

Библиография Юдина, Ольга Вадимовна, диссертация по теме Системы обработки информации и управления

1. Х.Айриг С., Айриг Э, Сканирование. Профессиональный подход // Попурри, Минск, 1997, 171с.

2. Анисимов Б.В., Курганов ° В.Д., Злобин В.К., Распознавание и цифровая обработка изображений // Высшая школа, 1983г., 294с.

3. Ахметов К., .Богданов В., Системы распознавания текстов в офисе // КомпьютерПресс, №3, 1999г., С.38-42.

4. Ахметов К., Сканеры и OCR // КомпьютерПресс, №9, г.1995, С.140-150.

5. Борисов А.Н. и др., Обработка нечеткой информации в системах принятия решений // Радио и связь, 1989 г., 304с.

6. Бутаков Е.А. и др., Обработка изображений на ЭВМ // М. Радио и связь, 1987 г., 240 с.

7. Гладкова Г.В., Способ отображения информации // патент 98102035/09, G09F19/02, 1999/01/27

8. Гонсалес Дж., Ту Р., Принципы распознавания образов // Мир, 1978 г., 412 с.

9. Горский Н., Анисимов В., Горская JI., Распознавание рукописного текста: от теории к практике // Политехника, Санкт-Петербург, 1997, 126 с.

10. Грешилов A.A., Прикладные задачи математического программирования // М., Изд-во МГТУ, 1990г., 189с.

11. Гутер P.C., Овчинский Б.В., Элементы численного анализа и математической обработки результатов // М., Наука, 1970 г., 432 с.

12. Денисов A.A., Колесников Д.Н., Теория больших систем управления // Ленинград, Энергоиздат, 1982 г., 287с.

13. Дуглас Дж. Ньюлин, Устройство, способ и система для визуального отображения речевых сообщений // заявка 97119737/09 от 1997.11.14. индекс G06F19/00

14. Дуда Р., Харт П., Распознавание образов и анализ сцен // Мир, 197 6 г.", 511 с.

15. Елтаренко Е.А., Методы оценки и выбора инженерных и управленческих решений // М., издательство МИФИ, 1987 г., 50с.

16. Засухин Е.А., Способ распознавания графического образа материального объекта // заявка 92010391/09 от 1992.12.07

17. Здор С.Е., Широков В.В., Оптический поиск и распознавание // М., Наука, 1973г., 238 с.

18. Золотов и др., Компьютерное устройство для чтения плоскопечатанного текста .// заявка 96115319/09 от 1996.08.16

19. Искусственный интеллект. Справочник /Под ред. Д.А. Поспелова // М. Радио и связь, 1990 г., 304 с.

20. Искусственный интеллект. Справочник /Под ред. Э.В. Попова // М. Радио и связь, 1990 г., 464 с.

21. Кини P.JI., Райфа X., Принятие решений при многих критериях: предпочтения и замещения // М., радио и связь, 1981 г., 560с.

22. Короткий С.Н. Введение в распознавание образов // Монитор, №1, 1995г., С.8-11.

23. Кузин JI.T., Основы кибернетики // Энергия, 1973 г.

24. Кузнецов Ю.Н. и др. Математическое программирование // М., Высш. школа, г.1980, 302с.

25. Кумэ X., Статистические методы повышения качества // М., Финансы и статистика, 1990 г., 2 98с.

26. Лысенко B.JI., Способ распознавания кодированных изображений .// заявка 95108376/09 1995/05/22

27. Мазо Б.Л., Оптические читающие терминалы: Концепции построения // Интеллектуальные читающие терминалы., М., ИНЭУМ, 1985 г., с. 5-21.

28. Маккормик Джон, Читающие системы. // М: СовАминко, 1990 г., 226с.

29. Малыгин Л.Л., Питерцев М.Э., Юдина О. В., Оптимизация выбора признаков при параметрическом подходе к распознаванию текстовых меток на движущихся объектах // XIII Межвузовская Военно-научная конференция: Тезисы докладов, ч.И, С.20.

30. Математическая статистика /Под ред. Длина А.М. // М., Высш. школа, 1975 г., 398с.

31. Мину М., Математическое программирование. Теория и алгоритмы // Наука, 1990 г., 488 с.

32. Монсен Л., Использование Microsoft Excel 97 // Санкт-Петербург, Издательский дом Вильяме, г.1998, 338с.

33. Муртаф В., Современное линейное программирование. Теория и практика // М., Мир, 1984г., 223С.

34. Научно-технический отчет за 1994 г. Проект 34.90. Адаптивная система обработки деловых форм. // Институт системного анализа РАН, Москва, 1994 г, 72 с.

35. Нелюбин Jl.Л., Перевод и прикладная лингвистика // Высшая школа, 1983г., 2Обе.

36. Николь Н., Альбрехт P., Excel. Электронные таблицы // М., ЭКОМ, 1996 г., 342с.

37. Нильсон Н., Искусственный интеллект. Методы поиска решений // Мир, 197 3 г.

38. Носенко И.А., Начала статистики для лингвистов // М., Высшая школа, 1982 г., 155с.

39. Стандарты по издательскому делу: Справочное документальное пособие, под ред. Грузинской H.H.// М.: Книга, 1982 г., 415с.

40. Попов Э.В., Экспертные системы: Решение неформализованных задач в диалоге с ЭВМ // Наука, 1987г., 288 с.

41. Потапов А.И., Юдина О.В., Использование преобразований Фурье для распознавания сложных графических изображений // Диагностика, информатика и метрология 95: Тезисы докладов научно-технической конференции. Санкт-Петербург, 1995, С.179.

42. Пратт У.К., Цифровая обработка изображений // Мир, 1982г., т. 1, 2.

43. Романов В.Ю., Популярные форматы файлов для хранения графических изображений на IBM PC // М., Унитех, 1992г., 155с.

44. Российский рынок распознающих программ, обзор // КомпьютерПресс, №12, г.1999, С.26-32.

45. Словарь китайско-русский, под ред. Ошанина И.М. // М., Наука, 1983 г., 551с.

46. Тайц A.A., Тайц A.M., Самоучитель Adobe PhotoShop 5.5 // Санкт-Петербург, 1999 г., 599с.114

47. Технологии печатающих устройств // КомпьютерПресс, №5, г.1994, С.3-17.

48. Федотов Н.Г., Методы- стохастической геометрии в распознавании образов // М., радио и связь, 1990г., 139с.

49. Фор А., Восприятие и распознавание образов // М., Машиностроение, 1989г., 271с.

50. Фу К., Последовательные методы в распознавании образов и обучении машин // Наука, 1971

51. Фу К., Структурные методы в распознавании образов. // Мир, 1977 г., 320 с.

52. Фурман Я.А. и др., Цифровые методы обработки и распознавания бинарных изображений // Красноярск, изд-во Красноярского ун-та, 1993г., 245с.

53. Bhaskaran, Method and apparatus for recognition of graphic symbols ' // US4949388,06.1990, GTX Corporation.

54. Bredley, System and method for enhanced character recognition accuracy by adaptive probability weighting // US5455872, 10/1995.

55. Bredley, System and method for enhanced character recognition accuracy by adaptive probability weighting // US5455872, 10/1995.

56. Colley et al., Integrated method and apparatus for. character and symbol recognition // US5251268, 10.1993, Electric Power Research Institute, Inc.

57. Colley et al., Integrated method and apparatus for character and symbol recognition // US5251268, 10.1993, Electric Power Research Institute, Inc.

58. Epperson, Autonomous computer input device and marking instrument // US5247137, 09.1993.

59. Fromme, Method and apparatus for computer program // US50758447 1991.12

60. Fromme, Method and apparatus for computer program encapsulation // US5075847, 12.1991, Hewlett-Packard Company.

61. Gerety et al., Method and apparatus for controlling execution of tools in a computer-aided software engineering system // US5212792, 05/1993, Hewlett-Packard Company.

62. Groezinger, Image recognition edge detection method and system // US4969202, 11.1990, Honeywell Inc.

63. Groezinger, Image recognition edge detection method and system // US5115477, 05.1992, Honeywell Inc.

64. Handley et al., Merging three optical character recognition outputs for improved precusing a minimum edit distance function // US5459739, 10.1995.

65. Katsuta Y., Two tone and multiple image discrimination and signal binarization system // // United States patent, patent number 4,999,629, Mar/12,1991, 6p

66. Kenneth W., Borgrndale, Michael D. Flannery et al, Method for dynamically processing non-text components in compound documents // // United States patent, patent number 4,933,880, Jun.12.1990, 20p

67. Kiyko V.M., Recognition of Objects in Images of Paper Based Line Drawings // Proc. of ICDAR'95, pp. 970-973, IEEE, Montreal, Canada, 1995.

68. Kosiba, D.A., Kasturi R., Automatic Invoice Interpretation: Invoice Structure Analysis // Proc. of the 13th International Conference on Pattern Recognition IAPR'96, pp. 721-725, IEEE, Vienna, Austria, 1996.

69. Laucht Horst, Optischest Kodierverfahren sowie zugehöriges Ausleseverfahren // Bundesrepublik

70. Deutchland // Deutches Patentamt Offenlegungsschrift, DE 3817402.Al

71. Nakano, Image understending system // US4907285, 1990/03

72. Nobuta, Image communicatian apparatus and image database system using the same // US51553744 1992/10

73. Orazaki, Information retrieval apparatus and interface for retrieval of mapping information utilizing hand-drawn retrieval requests // US5148522, 09.1992, Kabushiki Kaisha Toshiba.

74. Pavlidis T., Zhou J., Page Segmentation and Classification // Computer Vision, Graphics and Image Processing, 54(6), pp. 484-496, 1992.

75. Roye, Method and apparatus simplifying runlegh data from scanning of images // US4821336 , 1989.04

76. Safari R., at al, Form Registration: A Computer Vision Approach // Proc. of ICDAR'97, IEEE, Ulm, Germany, 1997

77. Scott, Line alinment apparatus and process //■ US5434 932, 07.1995.

78. Shimonosawa, Picture image communication apparatus //US5418625 1995/05

79. Suzuki at al., Apparatus for image reading or processing // US5126724, 06.1993, Canon Kabushiki Kaisha

80. Tachikawa et al, Character recognition method for recognizing character in an arbitrary rotation position // // United States patent, patent number 5,031,225, Jul. 9.1991, 22p

81. Tadokoro, Facsimile apparatus and the method // US5224180 1993/06

82. Tanioka H., Apparatus and method for treating encoded image data including correction for encoding/decoding deterioration // United States patent, patent number 5,023,919, June, 11, 1991, 9p

83. Tanioka H., Image processing system // United States patent, patent number 4,959,868, 25/09/1990, lOp

84. Tsunekava, Apparatus for reading drawing // US43888610 1983/06

85. Wadhwa et al., Computer-aided software engineering facility // US5295222, 03.1994, Seer Technologies, Inc.

86. Yoda, Image filing apparatus for serially storing input information // US5185821, 02/1993, Kabushiki Kaisha Toshiba.

87. Wong K., Casey R. Wahl F., Document Analysis System // Proc. of the 6th International Conference on Pattern Recognition ICPR'82, IEEE, 1982.

88. Wu S., U. Manber, Fast Text Searching Allowing Errors // Communications of the ACM 35, pp. 83-91, 1992

89. Yan C.D., Tang Y.Y., Suen C.Y., Form Understanding System Based on Form Description Language // Proc. of ICDAR'91, pp. 283-293, IEEE, 1995.

90. Yuan J., Tang Y.Y., Suen C.Y., Four Directional Adjacency Graphs (FDAG) and Their Application in