автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка и исследование методов распознавания рукописных арабских текстов

кандидата технических наук
Салюм Саид Салех
город
Ижевск
год
2003
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и исследование методов распознавания рукописных арабских текстов»

Оглавление автор диссертации — кандидата технических наук Салюм Саид Салех

ВВЕДЕНИЕ.

Г л а в а 1. МЕТОДОЛОГИЧЕСКИЕ И АЛГОРИТМИЧЕСКИЕ ОСОБЕННОСТИ РАСПОЗНАВАНИЯ АРАБСКИХ ТЕКСТОВ.

1.1. Элементы грамматики арабского языка в свете задач распознавания.

1.2. Основные этапы распознавания и подходы к их решению.

1.3. Сопоставление задач распознавания арабского и русского текстов.

1.4. Интерактивные системы распознавания.

1.5. Автономные системы распознавания.

1.6. Выводы по первой главе и постановка задачи исследования. ч

Глава2. АЛГОРИТМЫ ВЫДЕЛЕНИЯ СКЕЛЕТА ШРИФТА.

2.1. Подготовка изображения.

2.2. Выделение скелета.

2.3. Определение ширины фонта.

2.4. Конфигурация строк.

2.5. Сегментация знаков.

2.6. Выводы по второй главе.

Г л а в а 3. АЛГОРИТМЫ РАСПОЗНАВАНИЯ.

3.1. Объекты арабского текста и карта строки.

3.2. Распознавание знаков.

3.3. Распознавание символов.

3.3.1. Граф символа.

3.3.2. Метод циркуляционной нумерации.

3.3.3. Сектор относительного положения.

3.3.4. Ширина линии.

3.3.5. Тип соединения.

3.3.6. Пример распознавания символа.

3.4. Распознавание слов.

• 3.5. Выводы по третьей главе.,.

Г л а в а 4. СИСТЕМА РАСПОЗНАВАНИЯ И БАЗЫ ДАННЫХ.

4.1. Описание программы.

4.2. Структура базы данных.

4.3. Анализ результатов распознавания.

4.4. Испытания системы распознавания.

4.4.1. Распознавание знаков.

4.4.2. Арабский текст.

4.4.3. Русский текст.

4.4.4. Китайский текст.

4.4.5. Линейные рисунки.

4.4.6. Скорость распознавания.

4.5. Выводы по четвертой главе.

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Салюм Саид Салех

Количество информации, которое может быть сохранено и обработано настольными компьютерами, увеличивается с большой скоростью, но легкость, с которой компьютер и пользователь обмениваются информацией, становится серьезным препятствием. Интерфейсы пользователя должны быть эффективны и естественны для пользователя. В то время как произошел сильный прогресс в представлении данных пользователю, например, инструменты визуализации данных, первичный режим ввода данных от человека в компьютер - все еще клавиатура. Речевое распознавание и распознавание текстов допускают другие, более естественные формы человеко-машинной связи, которые недавно были интегрированы во многие программы потребителя (например, Microsoft Office ХР, Apple's Newton, MessagePad, CrossPad A.T., Cross и IBM, и т.д). Однако, чтобы эти методы ввода были экономичны и адаптированы к пользователю, их точность распознавания должна быть достаточно высокой, чтобы пользователь выполнял только минимум исправлений.

В то время как многие из сегодняшних данных введены непосредственно в компьютеры, использующие клавиатуру, все еще существует много задач, в которых люди имеют тенденцию предпочитать почерк вводу с клавиатуры. Note-taking (например, в классной комнате) - задача, которую можно все еще решить более эффективно вручную для большинства пользователей. Кроме того, в то время как люди могут писать вручную очень быстро, ввод данных в компьютер, используя комбинацию мыши и клавиатуры - процесс, относительно занимающий время. Персональные цифровые помощники (PDAs) - карманные устройства потребителя, которые могут сохранять календари и записные книжки, обеспечивать доступ к email, и содержать другие инструментальные средства производительности. Эти устройства слишком маленькие, чтобы иметь целые клавиатуры, или иногда могут быть слишком маленькие для любой клавиатуры вообще, требуя ручки или интерфейсы голоса для ввода данных. Наконец, некоторые естественные языки содержат очень большое количество символов (например, Kanji содержит 4,000 обычно используемых символов) делая ввод с клавиатуры более трудной задачей. Для этих языков, распознавание почерка имеет потенциал, чтобы обеспечить намного более эффективный метод ввода данных.

Проблема распознавания почерка была темой исследования в течение более чем трех десятилетий. Только в последние годы появилась прогрессивная технология, где программы потребителя, основанные на распознавании почерка, стали возможными и коммерчески доступными. Имеются много типов проблем (с изменяющейся сложностью) в пределах распознавания почерка, основанного на том, как данные представлены в системе распознавания, на каком уровне эти данные можно однозначно разделить на части (например, отдельные символы или слова), и кто будет использовать устройство распознавания. Типичная система распознавания почерка фокусируется на множестве этих проблем. Таблица, приведенная ниже, показывает основные области применения распознавания текстов и технические требования к ним.

Некоторые области применения распознавания текстов

Применение Требования Точность

Интерфейс для персонального цифрового помощника (PDA) Зажатое распознавание символов; „ скорость реального времени > 99 % на неестественный набор символов (graffiti)

Рукописные примечания (интерактивное) Распознавание Сегментация в индивидуальные слова; большой словарь категорий слов; может быть выполнен в пакетном режиме, поэтому, не должны быть в режиме реального времени Приблизительно 85 % - 95 % точности слова если обучение пользователя (зависимо от автора) адекватное количество данных

Распознавание почтового адреса Большой объем; должно быть в реальном масштабе времени; требует минимум ошибок, поэтому, норма отказа большая > 99 % на ПОЧТОВОМ ИНДЕКСЕ, городе и стране приблизительно 25 % - 35 % отклоняет

Интерактивное подтверждение подписи Должно иметь низкую ложную норму отклонения, при поддержании низкой ложной нормы ввода 2 % - 5 % Равная норма ошибок

В последние десять лет появились несколько программ распознавания арабского языка, разработанных арабскими фирмами и использующихся ара-боязычными странами, за исключением OMNI Page Pro от фирмы OMNI (США) выпускающей самую распространенную программу для распознавания английского языка. В настоящее время эти программы не пользуются спросом на рынке, за исключением Auto Reader компании Sakhr (Египет), дочерней корпорации Alamiya (Кувейт). Последние две версии этой программы продаются только со специальной электронной карточкой в целях защиты. Однако, в скором времени филиал всемирно известной компании IBM в Египте должен выпустить (или уже выпустил) свой продукт для распознавания арабского языка. Стоимость таких продуктов обычно $1500±$300.

Цель работы. Целью диссертационной работы является повышение достоверности распознавания рукописных и машинописных арабских текстов.

Для достижения поставленной цели в работе ставятся следующие задачи:

1. Исследование грамматических и графологических особенностей арабских текстов в свете задачи распознавания.

2. Разработка методики подготовки изображения текста к выделению информативных признаков.

3. Разработка метода выделения скелета, обеспечивающего требуемое качество.

4. Разработка методики выделения строк, знаков, символов, слов и подслов.

5. Разработка модели текста, отображающей топологию, геометрические параметры и взаимосвязи элементов арабского текста.

6. Разработка метода распознавания рукописных и машинописных текстов арабского языка.

7. Сравнительный анализ достоверности и эффективности предложенных алгоритмов.

Методы исследования. Теоретические исследования выполнены с использованием теории множеств, математической логики, теории распознавания образов.

Экспериментальные исследования выполнены с помощью разработанной программной системы и некоторых известных продуктов на реальных арабских и русских текстах, иероглифах китайского языка, а также реальных и искусственных рисунках.

Научная новизна. К наиболее значимым научным результатам исследования относятся:

1. Метод утончения участков объекта, отличающийся тем, что с целью повышения качества скелетных линий в бинарное изображение введено понятие "неопределенного" цвета и, с целью повышения надежности распознавания текстов - вычисление параметра ширины исходных линий.

2. Модель текста в виде плоского графа, отображающего топологию, геометрические параметры и взаимосвязи символов, знаков, специфических элементов синтаксиса языка и методика формирования (извлечения из изображения) этой модели.

3. Метод распознавания рукописных и машинописных текстов, заключающийся в сопоставлении предложенного плоского графа текста с эталонными моделями языка.

Практическая ценность. Разработанные методы выделения информативных признаков на изображениях текстов арабского языка, модели и методы их распознавания положены в основу программной системы OCReader, позволяющей обеспечить требуемую достоверность распознавания всех элементов арабских рукописных и машинописных текстов.

Кроме того, разработанные модели и методы обеспечивают дальнейшее совершенствование программных продуктов, предназначенных для распознавания, сжатия, реферирования и поиска текстов в системах электронного документооборота

Реализация результатов работы. Результаты диссертационной работы внедрены в Центральном департаменте вычислительной техники (GHQ Armed Forces, Арабские эмираты) для ввода с бумажных носителей в электронные хранилища рукописных и машинописных текстов, написанных арабским шрифтом.

Апробация работы. Основные положения диссертационной работы докладывались на 3 международных конференциях: на III Международной научно-технической конференции 23-24 мая, 2001, Ижевск; Beirut, Lebanon 25-29 June 2001; на IV Международной научно-технической конференции 19-22 февраля, Ижевск, 2003.

Публикации. По теме диссертации опубликовано 5 работ.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 120 машинописных страницах с таблицами и иллюстрациями. Список литературы включает 114 наименований.

Заключение диссертация на тему "Разработка и исследование методов распознавания рукописных арабских текстов"

4.5. Выводы по четвертой главе

На базе разработанных методов и алгоритмов создана программная система OCReader для распознавания рукописных и машинописных арабских текстов. Выполнен сравнительный анализ достоверности и эффективности системы OCReader с наиболее известной программой для арабских текстов AutoReader, а также с самой популярной в мире программой Fine Reader.

Эксперименты проводились на арабских текстах, русских буквах, китайских иероглифах и линейных рисунках.

Экспериментальные исследования показали, что разработанные методы выделения информативных признаков на изображениях текстов арабского языка, модели и методы их распознавания позволили повысить надежность и достоверность распознавания. В то же время, быстродействие несколько снизилось и, хотя дальнейшее усовершенствование программы OCReader в техническом и технологическом плане несомненно повысит ее быстродействие в 10-15 раз, очевидно, качество работы в ряде приложений важнее, чем быстродействие, поскольку сокращает время ручного редактирования введенного текста.

ЗАКЛЮЧЕНИЕ

В настоящей работе исследованы пути повышения достоверности методов и программ распознавания рукописных и машинописных арабских текстов для систем офисного документооборота и электронных хранилищ данных.

Для достижения поставленной цели исследования в работе получены следующие основные результаты.

1. Выявлены грамматические и графологические особенности правописания арабских текстов, влияющие на алгоритмы их распознавания.

2. Предложен метод утончения объекта, который максимально сохраняет исходную форму объекта и гарантирует непрерывную связность точек скелета благодаря введенному в работе понятию "неопределенный цвет" в бинарном изображении, т.е. переходу к трехзначной логике.

3. Для повышения достоверности распознавания использована ширина линии как дополнительный параметр.

4. Предложено распознавать символы и знаки отдельно, а потом связывать их отношениями места.

5. Разработана методика выделения строк, знаков, символов, слов и подслов.

6. Создано несколько методов для распознавания знаков (метод параллельной сегментации знака, метод сгибания линий, метод направленных дуг, метод распределенных критических точек (КТ)), которые применяются поочередно: если первый метод не позволяет получить желаемый результат, то используется второй и т.д.

7. Предложен метод циркуляционной нумерации именованных КТ, который позволяет повысить достоверность и быстродействие последующего распознавания символов благодаря стандартизации и сокращению вариантов расположения КТ.

8. Разработана модель текста в виде графа, отображающего топологию, геометрические параметры и взаимосвязи элементов арабского текста, а также методика ее извлечения из изображения.

9. Разработан метод распознавания рукописных и машинописных текстов, заключающийся в сопоставлении предложенного плоского графа текста с эталонными моделями языка.

10. На базе разработанных методов и алгоритмов создана программная система OCReader для распознавания рукописных и машинописных арабских текстов. Выполнен сравнительный анализ достоверности и эффективности с рядом известных программ.

Библиография Салюм Саид Салех, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Аммерааль Л. STL для программистов на С++. М.: ДМК, 1999. - 239с.

2. Гайдышев И. Анализ и обработка данных. СПб.: Питер, 2001. -751 с.

3. Грегори К. Использование Visual С++ 6. М: Вильяме, 1999. - 849с.

4. Дуда Р., Харт П. Распознавание образов и анализ сцен / Пер с англ. —1. М.: Мир, 1976.-512 с.

5. Егоров С. Ф. Исследование и разработка алгоритмов структурного описания и анализа топологии изделий радиоэлектроники в системах контроля. -Ижевск, 1998.-155 с.

6. Круглински Д.Д. Программирование на Visual С++ 6. СПб.: Питер,2001.-819 с.

7. Кучуганов В.Н. Автоматический анализ машиностроительных чертежей. Иркутск, 1985. - 110 с.

8. Кучуганов В.Н. Разработка и исследование алгоритмов для автоматического анализа и классификации изображений / Дисс. на соискание степени канд. техн. наук. Ижевск, 1971. - 159 с.

9. Кучуганов В.Н., С.С. Салюм Распознавание Арабского текста //Информационные технологии в инновационных проектах. -Ижевск 2003. С. 118-120.

10. Ю.Кучуганов В.Н., Салюм С.С. Распознавание текстов арабского языка // Перспективные информационные технологии и интеллектуальные системы . № 4(16), http://pitis.tsure.ru.11 .Лэйси Д.М. Visual С++ 6 Desktop. СПб.: Питер, 2001. - 725 с.

11. Новиков Ф.Ф. Дискретная математика для программистов. — СПб.:: Питер, 2001.-301 с.

12. Павлтдис Т. Алгоритмы машинной графики и обработки информации / Пер с англ. М.: Радио и связь, 1986. - 400 с.

13. Н.Павлтдис Т. Иерархические методы в структурном распознавании образов. ТИИЭР, 1971. -Т.67. -№5. - С. 39-49.

14. Петров М.Н. Молочков В.П. Компьютерная графика. СПб.: Питер,2002. 734 с.

15. Пономаренко С. Пиксель и вектор принципы цифровой графики. — v СПб.: Мастер медиа, 2002. 475 с.

16. Порев В. Компьютерная графика. СПб.: БХВ-Петербург, 2002. - 427с.

17. Рихтер Д. Windows для профессионалов. СПб.: Питер, 2001. - 713с.

18. Садыков С.С. Кан.В.Н. Самандаров И.Р. Методы выделения структурных признаков изображений. Ташкент: Фаню, 1990. - 101 с.

19. Садыков С.С. Самандров И.Р. Скелетизация бинарных изображений. // Зарубежная радиоэлектроника, 1985. №11. - С. 30-37.

20. Секунов Н. Самоучитель Visual С++ 6. М.: bhv, 1999. - 940 с.

21. Стукалина Е.Ф. Программно — аппаратные средства анализа и распознавания изображений дистанционного изображения. Ижевск, 2002. - 155 с.

22. Холзнер С. Visual С++ 6. СПб.: Питер, 1999. - 569 с.

23. Юань Ф. Программирование графики для Windows. СПб.: Питер, 2002.-1070 с.

24. Abdelazim Н., Hashish М. Arabic reading machine // 10th National Computer Conf. Riyadh, Saudi Arabia, 1988. Pp. 733-740.

25. Abutaleb A.S. Automatic thresholding of gray-level pictures using two dimensional entropy, computer vision and graphics, and image processing. Vol47, Nol, july 1989.-Pp. 22-32.

26. Ahmad S. A usable real-time 3D hand tracker, in 28 Asilomar conference on signals, systems and computers, IEEE computer society press, 1995. Pp. 146-151.

27. A1-Badr B.,Haralick R. Segmentation-free word recognition with application to Arabic, 3rd Int. Conf. on Document Analysis and Recognition, Montreal, 1995.-Pp. 355-359.

28. A1-Emami S. Usher M. On-line recognition of handwritten Arabic characters, IEEE Trans. Pattern Anal Machine Intell, 1990. Pp. 704-710.

29. Almuallim H., Yamaguchi S. A method of recognition of Arabic cursive handwriting, IEEE, Trans. Pattern Anal, and Machine Intell, 1987. Pp. 715-722.

30. Al-Sadoun H.B., Amin A.A. New structural technique for recognizing printed Arabic text, Int. J. of Pattern Recognition and Artif. Intell, 1995. Pp. 101125.

31. Al-Yousefi H., Udpa S.S. Recognition of Arabic characters, IEEE Trans. Pattern Anal, and Machine Intell. PAMI-14, 1992. Pp. 853-857.

32. Amin A. IRAC: Recognition and understanding systems, Applied Arabic Linguistic and Signal and Information Processing, Hemisphere, New York, 1987. — Pp. 159-170.

33. Amin A. Machine recognition of handwritten Arabic word by the IRAC II system, 6th Int. Conf. on Pattern Recognition, Munich, 1982. Pp. 34-36.

34. Amin A., Al-Fedaghi S. Machine recognition of printed Arabic text utilising a natural language morphology. Int. J. of Man-Machine Studies, 1991. Pp. 769-788.

35. Amin A., Al-Sadoun H. A segmentation technique of Arabic text // 11th Int. Conf. on Pattern Recognition, 1992. Pp. 441-445.

36. Amin A., Al-Sadoun H. Handprinted Arabic character recognition system// 12th Int. Conf. on Pattern Recognition, 1994. Pp. 536-539.

37. Amin A., Kaced A., Haton J.P., Mohr R.L. Handwritten Arabic characters recognition by the IRAC system // 5th Int. Conf. on Pattern Recognition, Miami, USA, 1980.-Pp. 729-731.

38. Amin A., Mari J.F. Machine recognition and correction of printed Arabic text, IEEE Trans. Man Cybem, 1989. Pp. 1300-1306.

39. Amin A., Masini G. Machine recognition of muti-fonts printed Arabic texts // 8th Int. Conf. on Pattern Recognition, Paris, 1986. Pp. 392-395.

40. Amin A., Masini G., Haton J.P. Recognition of handwritten Arabic words and sentences // 7th Int. Conf. on Pattern Recognition, Montreal, 1984. Pp. 10551057.

41. Arcelli C., Cordelia L.P. Levialdi S. From local maxima to connected skeleton // IEEE Trans. Pattern analysis Machine Intelligence, 1981. PAMI. - 3. - Pp. 134-143.

42. Belaid A., Haton J.P. A syntactic approach for handwritten mathematical formula recognition, IEEE Trans. Pattern Anal. Machine Intell, 1984. Pp. 105-111.

43. Belaid A., Masini G. Segmentation of line drawings for recognition and interpretation, Technology and Sc. Informatics, 1983. Pp. 121-134.

44. Bernd J. Digital image processing concepts algorithms and scientific appli-catios. Berlin: Springer. 1995. - 240 p.

45. Berthod M., Jancenn P. Le pretraitement des traces manuscrits sur une ta-blette graphique, 2eme, congres AFCET-INRIA, Toulouse, France, 1979. Pp. 195209.

46. Blum H.F. Transformation for extracting new description of shape. // Sysmposium on Models for the Perception of Speech and Visual form. — M.I.T. Press, 1964.

47. Brown M.K., Ganapathy S. Preprocessing technique for cursive script word recognition, Pattern Recogn, 1983. -Pp.1-12.

48. Burr DJ. Designing a handwritten reader, 5th Int. Conf. on Pattern Recognition, Miami, USA, 1980. Pp. 715-722.

49. Castleman R.R. Digital image processing. New Jersy: Printice hall,. 1996. -665 p.

50. Christogher K.I. Combining deformable models and neuralnetworks for handprinted digit recognition, for the degree of Doctor of philosophy. Torinto, 1994. -86 p.

51. Downing J., Leon C.K. Psychology of reading. — Macmillan, 1988. — 247 p.

52. E1-Dabi S., Ramsis R., Kamel A. Arabic charcter recognition system: Statistical approach for recognizing cursive typewritten text, Pattern Recogn, 1990. Pp. 485-495.

53. E1-Khaly F., Sid-Ahmed M. Machine recognition of optically captured machine printed Arabic text, Pattern Recog, 1990. Pp. 1207-1214.

54. E1-Sheikh Т., Guindi R. Computer recognition of Arabic cursive script, Pattern Recogn, 1988. Pp. 293-302.

55. E1-Sheikh T.S., El-Taweel S.G. Real-time Arabic handwritten character recognition, Pattern Recogn. conf., 1990. Pp. 1323-1332.

56. Fehri M., Ahmed M.A. Hybrid RBF/HMM approach for recognition multifont Arabic text, Laboratory RIADI-ENSI, Tunisia, 1998. Pp. 322-329.

57. Focht L.R., Burger A.A. Numeric script recognition processor for postal zip codeapplication//Int. Conf. Cybernetics and Society, 1976. Pp. 486-492.

58. Forney D. The Viterbi algorithm, Proc. IEEE 61, 3, 1973. Pp. 268-278.

59. Freeman H. On the encoding of arbitrary geometric configuration, IEEE. Trans. Electronic Сотр. EC-10, 1968. Pp. 260-268.

60. Govindan V.K., Shivaprasad A.P. Character recognition A-review, Pattern Recogn, 1990.-Pp. 671-683.

61. Guillevic D., Suen C.Y. Cursive script recognition: A fast reader scheme, 2nd Int.Conf. on Document Analysis and Recognition. Japan 1993. — Pp. 311-314.

62. Нагтоп L.D. Automatic recognition of printed and script. Proc. IEEE, 1972. -Pp. 1165-1177.

63. Hussain M.A. Automatic recognition of sign language gestures. // Masters thesis, Jordan university of scince and technology. Irbid, 1999. — 114 p.

64. Impedovo S., Ottaviano L., Occhinegro S. Optical character recognition- A survey, Int. J. of Pattern Recogn. and Artif. Intell. S, 1991. Pp. 1-24.

65. Jambi K. Arabic charcter recognition: Many approaches and one decade, Arabian J. Sc. Eng. 16,4,1991.-Pp. 499-509.

66. Kamel M., Zhao A. Extraction of binary character/Graphics image of grayscale documents image. CVGIP: Graphical models and image processing, Vol.55, — No 3,1993.-Pp. 203-217.

67. Kim J., Tappert C.C. Handwriting recognition accuracy versus tablet resolution and sampling rate // 7th Int. Conf. on Pattern Recognition, Montreal, 1984. — Pp. 917-918.

68. Kurdy B.M., Joukhadar A. Multifont recognition system for Arabic characters, 3rd Int. Conf. and Exhibition on Multi-lingual Computing (Arabic and Roman Script), U.K, 1992.-Pp. 731-739.

69. Lecolinet E., Baret O. Cursive Word Recognition: Methods and Strategies, Fundamentals in Handwriting Recognition, Impedovo, 1994. Pp. 235-263.

70. Margner V. SARAT A system for the recognition of Arabic printed text// 11th Int. Conf. on Pattern Recognition, 1992. - Pp. 561-564.

71. Marr D. Vision. Freemann, 1982.

72. Meftouh R., Laskri M.T. Generation of the sense of a sentence in Arabic language with a connectionist approach. // ACS/IEEE international conference on Computer systems and applications. -Beirut 25-29June, 2001. Pp. 125-127.

73. Michael J.Y. Mastering Visual С++ 6. USA, SYBEX, 1996. - 1379 p.

74. Nouboud F., Plamondon R. On-line recognition of handprinted characters: Survey and beta tests, Pattern Recogn, 1990. Pp. 1031-1044.

75. Nouh A., Sultan A., Tulba R. An approach for Arabic character recognition, J. Eng. Sc. 6,2, 1980.-Pp. 185-191.

76. Parhami B.,Taraghi M. Automatic recognition of printed Farsi texts, Pattern Recog. 14, 6, 1981.-Pp. 395-403.

77. Pavlidis T.A. Thinning algorithm for discrete binary images // CGIP, 1980. -Vol. 13.-Pp.l42-157.

78. Pfaltz J.L. Rosenfeld A. Computer representation of planar regions by their skeletons // С ACM, 1972. Vol 10. - Pp. 119-125.

79. Plamondon R., Baron R. On-line recognition of handprint schematic pseudocode for automatic Fortran code generator // 8th Int. Conf on Pattern Recognition, Paris, 1986. Pp. 741-745.

80. R.H. Davis and J. Lyall. Recognition of handwritten characters a review, Image and Vision Computing, 1986. Pp. 208-218.

81. Rafael C.G., Richard E.W. Digital image processing. New Yourk: ADDISON-WESLEY, 1993.-715 p.

82. Rayner R., Pollastek A. The Psychology of reading. PrenticHall, 1989.

83. Riseman E.M., Ehrich R.W. Contextual word recognition usig binary diagrams, IEEE Trans. Computer, 1971. Pp. 397-403.

84. Rosenfeld A., Davis L.S. A not on thinning. // TR-381, University of Maryland, 1976.

85. Rosenfeld А., Как A.C. Digital picture processing. 2nd Academic Press. N. Yourk, 1982.-Pp. 185-190.

86. Rosenfeld A., Pfalz J.L. Seguential operations in digital picture processing. // JASM, 1966. Vol. 13. -№ 4. - Pp. 471-494.

87. Rosenfeld A., Waszka J.S. Picture Recognition. Communication and cybernetics, 1976.

88. Rosenfeld A.A. Characterization of parallel thinning algorithms // Information and control, 1975. Vol. 29. - Pp. 286-291.

89. SaadaIlah S., Yacu S. Design of an Arabic character reading machine, Proc. of computer Processing of the Arabic language, Kuwait, 1985. Pp. 356-363.

90. Saloum S.S. Arabic Hand-Written Text Recognition // ACS/IEEE International Conference on Computer Systems and Applications. -Beirut, Lebanon 25-29 June 2001. Pp 106-109.

91. Saloum S.S., Arabic Hand-written Text Recognition Using Critical Points, Sixth Multi-Conference on Systemics, Cybernetics and Informatics (SCI2002), Orlando, Florida, U.S.A.

92. Saloum S.S., Handwriten text thinning algorithms, информационные технологии в инновационных проектах, Труды III международной научно-технической конференции 23-24, мая, Ч. 1. —Ижевск 2001, С.189-192.

93. Sasanuma S. Carl surface dyslexia occare in Japanese. Lawrence Erlbaum Associates, 1984.

94. Schuermann J. Reading Machines // 6th Int. Conf on Pattern Recognition, Munich, 1982.-Pp.1031-1044.

95. Scott D.C. OnLine handwriting recognition using multiple pattern class models, for the degree of Doctor of philosophy. Michigan, 2000. - 185 p.

96. Shoukry A., Amin A. Topological and statistical analysis of line drawing, Pattern Recogn. Orlando, 1983. Pp. 365-374.

97. Shoukiy A.A. Sequential algorithm for the segmentation of typewritten Arabic digitized text, Arabian J. Sc. and Eng, 1991. Pp. 543-556.

98. Spanjersberg A.A. Experiments with automatic input of handwritten numerical data into alarge administrative system, IEEE Trans, 1978. Pp. 286-288.

99. Srihari S. From pixel to paragraphs: the use of models in text recognition, Second Annual Symp on Document Analysis and Information Retrieval, Las Vegas, USA, 1993.-Pp. 47-64.

100. Stefanelli R., Rosenfeld A. Some parallel thinning algorithms for digital pictures.//JACM, 1971.-Vol. 18.-Pp. 255-264.

101. Suen C.Y., Berthod M., Mori S. Automatic recognition of handprinted characters, the state of the art, Proc. IEEE, 1980. Pp. 469-483.

102. Suen C.Y., Shingal R., Kwan C.C. Dispersion factor: A quantitative measurement of the quality of handprinted characters, Int. Conf. of Cybernetics and Society, 1977. Pp. 681-685.

103. Tamura H. A comparision of line thinning algorithms from digital geometry viewpoint. // Proc Fourth Intern. Joint Conf. On Pattern Recognition. Kyoto, November 1978. Pp. 715-719.

104. Taylor I., Taylor M.M. The Psychology of reading. NewYork Academic,1983.

105. Ullmann J.R. Advance in character recognition, Application of Pattern Recognition, ed. K. S. Fu, 1982. Pp. 197-236.

106. Wakayama T. A core-line tracing algorithm based on maximal square moving, IEEE Trans. Pattern Analysis and Machine Intell. PAMI-4, 1982. Pp. 6874.

107. Ward J.R., Kuklinski T. A model for variability effects in handprinted with implication for the design of handwritten character recognition system, IEEE Trans. Man Cybern, 1988. Pp. 438-451.

108. Wood W.A. Transition network grammars for natural language analysis, CAMC-13, 1970. Pp. 591-602.

109. Yamadori A. Idiogram reading in alexia, Brain, 1975.

110. Yamid A., Haraty R. A Neuro-Heuristic Approch for segmenting Handwritten Arabic text // ACS/IEEE international conference on Computer systems and applications. -Beirut 25-29 June 2001. Pp.l 10-113.

111. APPROVE GHQ Armed Forces Central Computer Department Lt. Coi. Ali Moh'd Hameed9 » Nov 2003.1. Certificate

112. Of Ph.D. thesis results introduction (application) Saloum Said Saleh

113. Electronic document bank creation.

114. The application of Ph. D. thesis by Saloum S.S. results allows: To reduce the above operations cost; To increase labour efficiency; To increase the speed of documents searching.

115. Committee president: Committee-men:1.. Col. Ali Moh'd Hameed1. Eng. Bahaa Fayez1. Eng. Mohammed Mohsen

116. УТВЕРЖДАЮ GHQ Вооруженные силы Центральный департамент выч. техники Лейтенант полковник Али Мох'д Хамидподпись9» ноября 2003 г.1. Сертификато результатах применения кандидатской диссертации Салюма Сайда Салеха

117. Ввода текстовых документов

118. Создания банка электронных документов

119. Применение результатов кандидатской диссертации Салума С.С. позволяет:- Уменьшить стоимость вышеупомянутых операций;- Увеличить эффективность труда; Повысить скорость поиска документов.

120. Председатель комитета:подписьЛейтенант полковник1. Али Мох'д Хамид

121. Члены комитета:подписьИнженер Бахаа Файезподпись1. Инженер Мохаммед Мохсен