автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Параметрическая и структурная адаптация систем распознавания текстовых меток на видеоизображениях
Автореферат диссертации по теме "Параметрическая и структурная адаптация систем распознавания текстовых меток на видеоизображениях"
/
Воскресенский Евгений Михайлович
Параметрическая и структурная адаптация систем распознавания текстовых меток на видеоизображениях
Специальность 05.13.01 - Системный анализ, управление и обработка информации (промышленность)
Автореферат диссертации на соискание ученой степени кандидата технических наук
2 г июл 2010
Рыбинск-2010
004607375
Работа выполнена в Институте менеджмента и информационных технологий (филиале) Санкт-Петербургского государственного политехнического университета в г.Череповце
Научный руководитель
кандидат технических наук Царев Владимир Александрович
Официальные оппоненты:
доктор технических наук, профессор Юдин Виктор Васильевич
кандидат технических наук Юдина Ольга Вадимовна
Ведущая организация
Институт систем обработки изображений РАН, г. Самара
Защита состоится 7 июля 2010 г. в 12 часов на заседании диссертационного совета Д 212.210.04 в Рыбинской государственной авиационной технологической академии им. П. А. Соловьева по адресу. 152934, г. Рыбинск, Ярославская область, ул. Пушкина, 53.
С диссертацией можно ознакомиться в библиотеке Рыбинской государственной авиационной технологической академии им. П. А. Соловьева
Автореферат разослан «4» июня 2010 г.
Ученый секретарь диссертационного совета
Конюхов Б. М.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Системы распознавания текстовых меток на видеоизображениях (СРТМ), используемые в составе различных информационно-управляющих систем, применяются для оптической идентификации (как правило, движущихся) объектов контроля, имеющих регистрационные надписи, например, промышленных изделий, упакованных продуктов, наземных транспортных средств, грузовых контейнеров, денежных купюр и т.п. Целью применения таких систем является избавление человека от рутинных операций, а также решение задач, с которыми он физически не способен справляться в режиме реального времени (конвейерная обработка изделий, поиск в базе данных и т.п.).
СРТМ являются частным случаем ОСИ-систем, представленных системами распознавания текста различного происхождения (печатного, рукопечатного, рукописного). Методы оптического распознавания текста описаны в работах таких российских и зарубежных ученых как Горский Н.Д., Арлазаров В.Л., Ян Д.Е., №зЫ(1а Н., 1трес1оуо Э. и др. Достаточно большое количество научных публикаций посвящено описанию различных прикладных СРТМ. На основе этих публикаций можно сделать вывод, что в настоящее время сложился общепринятый подход к представлению алгоритмической части СРТМ в виде многоуровневой системы эвристических алгоритмов анализа изображений и распознавания графических образов.
Как правило, алгоритмы СРТМ, используемых в промышленности и на транспорте, обладают множеством параметров, настройка которых позволяет адаптировать систему к заданным условиям эксплуатации при первичном внедрении СРТМ. Адаптация СРТМ также необходима при существенных изменениях условий ее эксплуатации (оптической схемы, освещения, фона и пр.) и при изменении требований пользователя к показателям эффективности системы. Эффективность СРТМ принято характеризовать, с одной стороны, «качеством» распознавания (на входных видеоизображениях как содержащих образ текстовой метки, так и не содержащих такого образа). С другой стороны- длительностью рабочего цикла по обработке одного видеокадра, которая часто ограничена требованием распознавания в реальном времени. В настоящее время эффективность большинства эксплуатируемых СРТМ зачастую не соответствует современным требованиям, что обусловлено не только несовершенством используемых алгоритмов, но и нередко неудачно настроенными параметрами.
Количество параметров СРТМ, как правило, довольно велико. Например, распространенные российские системы распознавания автомобильных номеров обладают более чем тремя десятками только открытых для пользователя параметров используемых алгоритмов. Зависимость значений критериев эффективности СРТМ от значений настраиваемых параметров носит сложный алгоритмический характер, что исключает применение аналитических методов вычисления оптимальных параметров. Кроме того, однократное вычисление значений критериев эффективности СРТМ при заданных значениях параметров
алгоритмов нередко требует существенных вычислительных затрат времени, что затрудняет применение известных методов оптимизации. В результате в настоящее время настройка СРТМ производится, в основном, вручную и приблизительно. Такой подход требует от настройщика системы высокой квалификации, сравнимой с квалификацией разработчика, и не гарантирует нахождение оптимальных параметров.
С учетом того факта, что количество ежегодных внедрений отдельных видов СРТМ в России уже измеряется тысячами и непрерывно растет, проблема обеспечения эффективности функционирования таких систем и автоматизации процесса их внедрения является весьма актуальной.
Цель работы
Целью диссертационной работы является повышение эффективности функционирования систем распознавания текстовых меток на видеоизображениях путем совершенствования процессов разработки и адаптации таких систем с учетом условий эксплуатации.
Основные задачи
Для достижения указанной цели в работе поставлены и решены следующие основные задачи:
- Разработка математической модели СРТМ, представляющей СРТМ в виде множественной композиции эвристических алгоритмов.
- Разработка на базе предложенной математической модели методов параметрической адаптации СРТМ к заданным условиям эксплуатации.
- Разработка способа повышения эффективности СРТМ за счет ее структурной адаптации, не требующей модификации используемых алгоритмов,
- Апробация предложенных модели и методов на примере оптоэдектронной системы идентификации объектрв подвижного состава железнодорожного транспорта.
Предмет исследования - методы и средства параметрической и структурной адаптации алгоритмического обеспечения СРТМ.
Методы исследования
Для решения поставленных задач использованы методы теории вероятностей и математической статистики, основы теории оптимизации и принятия решений, методы обработки изображений, математический аппарат теории распознавания образов.
Научная новизна
В, работе выделен и исследован класс иерархических эвристических алгоритмов анализа изображений и распознавания графических образов, лежащих в основе большинства современных СРТМ. Предложен набор моделей, методов и программных средств, обеспечивающих повышение эффективности функционирования СРТМ за счет совершенствования процессов разработки и внедрения таких систем. Научной новизной обладают: 1. Математическая модель СРТМ, обеспечивающая описание и исследование СРТМ в виде множественной композиции базовых специализированных эвристических алгоритмов анализа видеоизображений. Модель включает в себя вероятностные критерии эффективности всей СРТМ и критерии
эффективности отдельных составляющих алгоритмов и устанавливает зависимость между такими критериями.
2. Метод параметрической адаптации СРТМ. Метод основан на модели из п. 1 и заключается в декомпозиции СРТМ на алгоритмы-компоненты эвристического анализа изображений, статистической оценке значений вероятностных критериев эффективности системы и оценке затрат времени на анализ системой единицы входных данных. Он позволяет обеспечить практическую решаемость задачи вычисления квазиоптимальных (оптимальных в рамках заданных экзаменационной последовательности изображений и дискретизации значений параметров) значений параметров большинства существующих СРТМ по сравнению с известными способами их настройки.
3. Метод параметрической адаптации подсистемы принятия решений СРТМ, Метод основан на модели из п. 1 и заключается в декомпозиции СРТМ на алгоритмы-компоненты, формирующих списки альтернативных решений на промежуточных этапах анализа входного видеоизображения. Метод позволяет обеспечить практическую решаемость задачи вычисления квазиоптимальных (оптимальных в рамках заданных экзаменационной последовательности изображений и дискретизации значений параметров) значений параметров подсистемы принятия решений, управляющей размерами списков альтернативных решений.
4. Способ структурной адаптации СРТМ, обеспечивающий без сопутствующей модификации образующих СРТМ алгоритмов уменьшение среднего времени анализа последовательности входных видеоизображений как содержащих, так и не содержащих образы текстовых меток движущихся объектов контроля.
Практическая ценность
1. Предложена методика оценки затрат времени на подготовку экзаменационных данных и на вычисление оптимальных параметров алгоритмов СРТМ, на основе которых производится целенаправленный выбор способа декомпозиции СРТМ.
2. Предложена методика кластеризации экзаменационной выборки видеоизображений, позволяющая сопоставить подмножествам видеоизображений подходящие квазиоптимальные наборы параметров.
3. Разработаны алгоритмы и произведена параметрическая адаптация модуля распознавания системы идентификации объектов подвижного состава железнодорожного транспорта «АКБСБ», разработка которой выполнялась на базе ИМИТ СПбГПУ и научно-производственной компании «Малленом» (г. Череповец) по заказам администрации станции Череповец Северной Железной Дороги, ОАО «Лукойл-Ухтанефтепереработка», ОАО «Лукойл-Волгограднефтепереработка».
4. Разработаны программные инструментальные средства параметрической адаптации алгоритмов СРТМ, используемые в научно-производственной компании «Малленом» при разработке оптоалектронных систем контроля, среди которых: семейство систем идентификации автотранспортных
средств «Автомаршал», системы контроля печатной продукции, системы распознавания текстовой маркировки на стальных слябах, трубах и др. 5. Результаты исследований используются в учебном процессе ИМИТ СПбГПУ в рамках дисциплины «Основы теории распознавания образов» для специальности 230105 - Программное обеспечение вычислительной техники и автоматизированных систем. Апробация работы
Основные положения диссертации докладывались и обсуждались на всероссийской научно-практической конференции «Образование. Наука. Бизнес. Особенности регионального развития и интеграции» (Череповец, 20042008 гг.), Межвузовском конкурсе-конференции «Технологии Microsoft в теории и практике программирования» (Санкт-Петербург, 2005 г., 2007 г., 2008 г.), IIX международной научной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Йошкар-Ола, 2007), международной научной конференции «Распознавание образов и обработка информации 2007» (Минск, 2007), всероссийской научной конференции студентов и аспирантов «Молодые исследователи - регионам» (Вологда, 2008 г.), Вторых ежегодных смотрах-сессиях аспирантов и молодых ученых Вологодской области по отраслям наук (Вологда, 2008 г.), IX международной научной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Нижний Новгород, 2008), а также на научных семинарах научно-технической лаборатории систем технического зрения и экспертных систем ИМИТ СПбГПУ, кафедры ИУС ФТК СПбГПУ и кафедры МПО ЭВС РГАТА им. П.А. Соловьева. Публикации
По материалам диссертации опубликовано 16 печатных работ (из них 4 в научных изданиях, рекомендованных ВАК, одна монография). На защиту выносятся:
1. Математическая модель СРТМ.
2. Метод параметрической адаптации СРТМ.
3. Метод параметрической адаптации подсистемы принятия решений СРТМ.
4. Способ структурной адаптации СРТМ.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения и приложения. Объем работы составляет 181 страницу. Работа содержит 32 рисунка, 9 таблиц, список использованной литературы из 86 наименований, 5 приложений на 18 страницах.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность работы, сформулирована цель и поставлены задачи проводимых исследований, определены научная новизна и практическая значимость результатов, приведены сведения о публикациях и апробации полученных результатов.
В первой главе дается общая характеристика СРТМ как особого подкласса ОСЯ-систем распознавания текста, а также определяется круг проблем, связанный с разработкой и адаптацией СРТМ.
СРТМ включает в себя ЭВМ, средства ввода видеоданных, а также алгоритмическую часть, обычно реализуемую в виде единого программного модуля распознавания. В большинстве случаев он представляется в виде композиции алгоритмов, решающих отдельные логические подзадачи распознавания текстовых меток. Алгоритм локализации (АЛ) выделяет прямоугольную зону видеоизображения, потенциально содержащую образ текстовой метки. Алгоритм сегментации (АС) выделяет на зоне множество сегментов, предположительно являющихся образами символов метки. Алгоритм распознавания (АР) сопоставляет каждому сегменту код символа либо отклоняет сегмент. Алгоритм формирования решений (АФР) составляет из распознанных сегментов с учетом их взаимного расположения коды текстовых меток. Часто, чтобы не потерять истинное решение, между промежуточными этапами передаются списки вариантов решений с некоторыми эвристическими оценками их правдоподобия, а итоговое решение по изображению выбирает алгоритм принятия решений (АПР).
В ходе своей работы СРТМ приходится, как правило, анализировать видеоизображения как содержащие образ текстовой метки (информативные), так и не содержащие (неинформативные). При этом с учетом плохой формализации задачи анализа изображений, решаемой СРТМ, разработчики таких систем вынуждены использовать эвристические алгоритмы локализации, сегментации и распознавания. В связи с этим эффективность анализа информативных изображений характеризуется вероятностью правильного распознавания текстовой метки и вероятностью ошибки Регг, а
неинформативных - вероятностью ложного решения Р^аЫ. Четвертым
критерием является среднее время анализа отдельного изображения Г, влияющее на эффективность функционирования модуля в режиме реального времени. Таким образом, СРТМ характеризуется критериями:
б = Реп> (1)
Статистические оценки значений критериев Q характеризуют эффективность алгоритма А, осуществляющего полный цикл обработки
входного видеоизображения в СРТМ с параметрами и = {и,,н2.....ик} в
заданных условиях эксплуатации. Каждое место внедрения характеризуется аппаратным обеспечением СРТМ к и полученной по месту внедрения экзаменационной выборкой видеоизображений В. Таким образом, основным средством обеспечения заданной эффективности (2(А,В,и,1г) =(Рн^п Рггг, Р^е,
Т) является настройка параметров СРТМ.
Обычно множество настраиваемых параметров довольно велико (до нескольких десятков). Зависимость ()(и) носит сложный алгоритмический характер, что исключает применение аналитических методов вычисления оптимальной конфигурации и *. Кроме того, однократное вычисление оценки
Q обычно связано с существенными вычислительными затратами. Все это приводит к тому, что на современном этапе настройка параметров модуля распознавания, как правило, выполняется вручную самими разработчиками. Это не гарантирует нахождение оптимальной конфигурации и требует существенного объема трудозатрат при адаптации СРТМ, поэтому актуальной задачей является создание методов, позволяющих рассчитывать оптимальные в заданных условиях эксплуатации значения параметров СРТМ без привлечения разработчиков системы.
Кроме того, эффективность современных СРТМ далека от идеальной по причине несовершенства современных методов анализа изображений. Например, для современных российских систем распознавания государственных регистрационных знаков автомобилей вероятность правильного распознавания в благоприятных условиях, как правило, составляет 0.8-0.9. Это обуславливает необходимость применения в СРТМ так называемой «мягкой схемы» принятия решения, в которой на промежуточных этапах анализа данных формируется не единственное решение, а списки альтернативных решений с оценками их правдоподобия. Такой подход дает ' возможность «не потерять» истинное решение на промежуточных этапах, но при этом приводит к значительному увеличению времени полного цикла анализа входного изображения. Таким образом, актуальной является также задача совершенствования подсистемы принятия решений в составе СРТМ.
Вторая глава посвящена моделированию алгоритмической части СРТМ. Современные методы оптического распознавания текстовой информации достаточно подробно описаны в литературе, однако мало исследованной остается задача синтеза модуля распознавания с заданными характеристиками из базовых алгоритмов с учетом условий эксплуатации. В связи с этим выделен класс Ас иерархических эвристических алгоритмов распознавания текстовых меток, которому соответствует большинство описанных в литературе СРТМ: \) be {Inf, Empty},
Аф)еАс о 2)3Correct(A(b))e{true, false}, (2)
3) A = А, о A2 о ... о A„,3 Correcti(Ai(Ь,)) e {true, false), где b - вход алгоритма A; Inf - класс информативных входов, по которым алгоритм А должен возвращать некоторое непустое решение; Empty - класс неинформативных входов, по которым алгоритм А должен возвращать пустое решение; Correct - функция, определяющая, является ли решение алгоритма А по входу b правильным; А, - алгоритм-компонент алгоритма A, i = 1 ..п; Correctf - функция, определяющая, является ли решение алгоритма-компонента Aj по входу правильным. Важно, что значения функций Correct и Correctj могут быть определены экспертом практически на любом наборе данных. При этом в качестве эксперта при распознавании текстовых меток на видеоизображениях может выступать любой взрослый человек.
Разработана математическая модель СРТМ, отождествляемой с некоторым АеАс. Модель позволяет установить функциональную зависимость значений
критериев эффективности Q от значений критериев эффективности алгоритмов-компонентов. Кроме того, она задает способы композиции алгоритмов-компонентов, образующих А, из базовых (неделимых) алгоритмов-компонентов, в число которых входят АЛ, АС, АР, АФР, АПР. Два базовых алгоритма являются смежными, если выход одного из них (вышележащего) является входом другого (нижележащего). В работе предложены спецификации входных и выходных данных для базовых алгоритмов СРТМ в целях обеспечения возможности создания их композиций. Композиция смежных базовых алгоритмов образует алгоритм-компонент А1, алгоритмы-компоненты (далее алгоритмы) в свою очередь образуют А:
А^АькоАьмо...0А1;,А = АхоА2о...оАп, (3)
где а£,а£+„...,А1ь - смежные базовые алгоритмы, \ <к <1 <т. Таким образом, существуют различные варианты декомпозиции алгоритма А. Алгоритм Ai характеризуется критериями = (Р(С1),Р{Р1),Т1), где С =«выход алгоритма Л,- правильный», 7] - затраты времени на анализ единицы входных данных. Если алгоритм способен давать пустой ответ, то дополнительным критерием может выступать вероятность события ^=«выход алгоритма Ане пустой».
Статистические оценки Р(СДТ7,), 7] рассчитываются по массиву прецедентов, созданному экспертом, в котором экзаменационные примеры представляют собой решения композиции вышележащих относительно А1 алгоритмов по входам экзаменационной последовательности В алгоритма А.
Каждому исходу анализа видеоизображения соответствует множество последовательностей событий С1, С,, /*), ^, определяющих связь и :
Р^ = Р(С, I тс, 11С,)...Р(СП I /с,с2...с„_,л (4)
Реп =1-^-ртР»АтР» + + (5)
^ = I лте I I Ш^..^). (6)
Здесь события I и N указывают на различные (информативные и неинформативные) входы. Среднее время анализа входных данных Т рассчитывается с учетом вероятности пустого выхода каждого алгоритма-компонента:
Т = Г, + ГЛЛ) + №21 +...+Т„Р(Р„ I (7)
В третьей главе предложены методы параметрической и структурной адаптации СРТМ. Обычно разработчик СРТМ способен задать ограниченное множество допустимых значений каждого параметра Uj
используемых алгоритмов-компонентов, и все комбинации значений параметров образуют конечное множество конфигураций Соп/. Поскольку
критерии й носят статистический характер, то оптимальные в рамках Сои/ и В параметры в общем случае являются квазиоптимальными. Задача вычисления оптимальных параметров и* при. заданных А, В, И, Соп/
формулируется как задача максимизации Prighl с учетом ограничений на значения всех критериев:
u* = ngmM(Prigh,(u))Jrighl{u*)>P;;ght, Perr{u*)ZPe%, (8)
ueConf
Р^Ли*)<Р^е>Т{и*)<Т».
Иерархическая структура СРТМ позволяет производить раздельную настройку алгоритмов-компонентов. Способ композиции из базовых алгоритмов алгоритмов-компонентов, подлежащих раздельной настройке, предлагается выбирать с учетом затрат времени на составление массива прецедентов и на длительность процесса вычисления и*. При ограниченном количестве значений каждого параметра и заданной конфигурации вышележащих алгоритмов {и1,и2,...,и'"'} задачу адаптации алгоритма А,-можно свести к формированию подмножества Conf'filier:
Conf-fi"er ={и' IР(С,k)>Cf,ии()<ТП. (9)
где пороги С,", Т'г задаются с учетом (8). Множество Соп/^'"ег может быть довольно большим. Его сокращение до множества оптимальных по Парето конфигураций сопряжено с возможностью потерять оптимальную конфигурацию и* СРТМ. Это обусловлено тем, что выходы Д- образуют экзаменационную последовательность для Ам, состав которой влияет на эффективность АМ,А1+2,...,А„. Поэтому оптимальная по Р(С,) и 7) конфигурация А, не обязательно является составляющей оптимальной конфигурации и * алгоритма А (глобально оптимальной). Для выявления всех потенциально глобально оптимальных конфигураций алгоритма А1 предлагается использовать прецедентный критерий - вектор V = (V],V2,--,V;r7), Vrе{0,1}, Vj: = lo Ai(Inpj)~ Ej, иначе Fy = 0. Здесь £; - эталонный результат анализа экзаменационного входа Inpj, «~» - знак эквивалентности, sz - количество экзаменационных примеров. Необходимое условие глобальной оптимальности (НУГО) конфигурации и', которой соответствует прецедентный критерий V, следующее: конфигурация и' должна быть оптимальна по Парето пб векторному критерию q' на множестве Conf'. Тогда
результатом настройки алгоритма At является сформированное из Conf'r'"er множество удовлетворяющих НУГО конфигураций Conf'opl. Если Conf'/i"er не пусто, то формируется множество оптимальных по Парето конфигураций:
ConfLop' = {и11 и' 6 Conf''iu""",Paretou(q'{u')) = true}, 010)
где Paretou - функция, определяющая, является ли конфигурация и', характеризующаяся векторным критерием q'(u'), оптимальной по Парето на множестве Conf''filler.
Метод вычисления и* заключается в последовательном, то есть от вышележащих алгоритмов к нижележащим, вычислении множеств Соп/1,ор', образующих в результате множество потенциально оптимальных конфигураций Сои/0'" (если V; е 1 ..и => Соп/''ар1 * 0). Для элементов Соп[ор' вычисляются критерии эффективности, исходя из которых выбирается и *.
Настройка параметров представленного в работе модуля распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта предложенным методом заняла менее 16 часов. При тех же условиях настройка методом перебора потребовала бы несколько лет. Настройка модуля распознавания, входящего в состав оптоэлектронной системы «АКЗОБ», позволила повысить значение статистической оценки вероятности правильной идентификации ж/д вагонов по месту внедрения системы на станции Череповец на 3.4% по сравнению с ручной настройкой, произведенной разработчиками системы, без ухудшения значений остальных статистических критериев.
Как было отмечено выше, в целях повышения эффективности СРТМ применяется «мягкая схема» принятия решений. В работе предложен алгоритм усечения списков (АУС) вариантов решений, принимающий решения об усечении списков до приемлемого размера либо их отклонении. Параметр АУС К: ограничивает длину СВР алгоритма Л,-. Решение о принятии или отклонении СВР выполняется по результатам сравнения осредненной оценки правдоподобия элементов усеченного списка с порогом £,■.
Задачей настройки подсистемы принятия решений СРТМ является поиск оптимальных при заданных А, В, к и конечном Соп/АУС значений порогов иАУС = {К,Е}. Часто требуется производить настройку АУС отдельно от параметров алгоритмов-компонентов (при фиксированной конфигурации и), для решения этой задачи разработан следующий метод. Пусть Алус е Ас, при этом АЛУС - {А1,А2,...,А„}, где каждый А, возвращает СВР. Для. расчета оптимальных значений порогов иАУС параметры АУС устанавливаются в такие значения и £,шт, при которых СВР пропускаются и не усекаются. В итоге выходом А является полный список вариантов решений, сформированных по результатам анализа видеоизображения. Далее по множеству В статистически оцениваются Ргф{иАУС), Регг{иАУС), Р/аА»^)-
Каждое решение dj из полного списка решений с1 = {(¡¡,с12,...,с}к} алгоритма А образовано последовательностью промежуточных решений алгоритмов-компонентов: ¿¡=йпг Каждое промежуточное
решение с^ занимает определенную позицию р(сф в соответствующем СВР,
характеризующемся оценкой правдоподобия е(с^), а его корректность
устанавливается с использованием массива прецедентов. Характеристики решений Л]:
(И) (12)
позволяют установить исход анализа примера В, при любой конфигурации
АУС
и сформировать множество:
МУС
АУС
Соп/
АУС,0гг _ I ЛУС |
)>Р'Г
пе
>
(иАУС)<Р'1
(13)
е Соп/ (и
[ Регг (иАУС)< Р'еГп, Р{аШ (« ¡^ г{фе _ Из полученного множества удаляются конфигурации, не удовлетворяющие ограничению Т'г\
Соп/АУС•<** = {иАУС 1 иАУС еСоп/А№г
„АУС\
,Т(иАУС)<Т'г), (И)
где Т(и ) либо измеряется экспериментально, либо оценивается предложенным в работе способом, который основан на статистическом расчете среднего количества вызовов каждого алгоритма-компонента на одно видеоизображение при заданном иАУС. Экспериментальной базой для исследования метода послужил модуль распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта, описанный в гл. 4.
На рисунке 1 представлены графики зависимости времени анализа видеоизображения от порога на размер СВР АС =20..45. График с квадратными маркерами соответствует зависимости Т, вычисленной предложенным
методом, второй график отображает измеренное время Т. Рисунок показывает, что оценка Т достаточно близка к Т, что говорит о возможности использования
предложенного способа в процессе
Рис. 1. Оцененные и измеренные средние затраты времени на анализ видеоизображения
настройки алгоритмов А
АУС
В ходе эксперимента настройка предложенным методом параметров АУС указанной системы при | Соп/АУс ]= 40000 заняла около 20 минут. При аналогичных условиях непосредственное «переборное» вычисление значений критериев эффективности каждой конфигурации займет 31 сутки.
В главе 3 также предложен способ структурной адаптации СРТМ, функционирующих в режиме реального времени, направленный на снижение затрат времени Т. Для этого в состав СРТМ включается алгоритм, синтезированный из АС и АР, который производит классификацию локализованных зон на содержащие и не содержащие текстовую метку
посредством анализа их фрагментов. Обосновано, что отсев неинформативных зон позволяет сократить средние затраты времени на анализ последовательности видеоизображений, существенная доля которых не содержит текстовых меток.
В четвертой главе дано описание разработанных алгоритмов модуля распознавания системы идентификации объектов подвижного состава железнодорожного транспорта и результатов экспериментов по их адаптации с использованием предложенных в гл. 3 методов.
Алгоритм локализации на первом этапе производит наложение фильтра на исходное изображение /тх„, что дает матрицу Етх„, характеризующую уровень изменения яркости в окрестности каждого пикселя •. На втором этапе производится анализ ЕтУП с целью локализации зон Zhxw, характеризующихся повышенным средним значением элементов Еу относительно окружающих зону элементов E(J. Оценкой правдоподобия зоны является ее среднее значение Eir Зона анализируется алгоритмом сегментации, основанном на
применении гистограммы яркости. Алгоритм распознавания реализован в виде комплекса многослойных персептронов, производящих двухэтапную (класс символа, подтверждение) классификацию сегментов. Алгоритм формирования решений, основанный на поиске в глубину, формирует из распознанных сегментов с учетом их координат варианты текстовых меток. В качестве итогового выбирается решение с максимальной суммарной оценкой правдоподобия сегментов, образующих решение.
В работе приведен пример требований технического задания к разработанной СРТМ и дано подробное описание процесса параметрической адаптации системы, а также представлены результаты экспериментов по ее структурной адаптации. В состав разработанного модуля распознавания был включен алгоритм классификации зон (АКЗ), производящий сегментацию фрагментов зон, распознавание сегментов и принятие решения о классификации на основании количества распознанных сегментов (табл. 1). Экзаменационная последовательность состояла из 550 кадров с изображениями железнодорожных цистерн и вагонов с видимым идентификационным номером на борту, а также 688 изображений цистерн и вагонов без номера в кадре.
Таблица 1
Результаты экспериментов по сравнению эффективности типовой СРТМ и
ее версии с алгоритмом классификации зон
Критерии эффективности Без АКЗ АКЗ
Время анализа инф. кадра, сек. 0.60 0.63
Время анализа неинф. кадра, сек. 0.71 0.25
Среднее время анализа кадра (23% информативных кадров), сек. 0.68 0.34
Эксперименты показали, что статистические показатели эффективности СРТМ с АКЗ при подобной структурной адаптации идентичны показателям
исходной СРТМ. В то же время использование АКЗ позволило сократить среднее время анализа видеоизображения примерно на 50%, с учетом того, что в заданных условиях около 23% кадров содержат образ номера. Доверительный интервал для Pt¡ ht =0.65. при надежности оценки у = 0.95 равен (0.62, 0.68), оценка i = 0.60 характеризуется Р{\ t-t\< 0.02) = 0.923.
В заключении подводятся итоги работы, формулируются основные выводы.
ОБЩИЕ ВЫВОДЫ ПО РАБОТЕ
Установлено, что в настоящее время большинство описанных в литературе систем распознавания текстовых меток на видеоизображениях являются многопараметрическими системами и имеют однотипную структуру, представленную композицией алгоритмов локализации, сегментации, распознавания и принятия решений.
Такие системы могут быть описаны представленной в работе моделью СРТМ, и к ним применимы предложенные автором методы параметрической и структурной адаптации СРТМ с учетом заданных условий эксплуатации. Для большинства современных СРТМ данные методы позволяют:
- Находить за приемлемое время оптимальный (в рамках заданной экзаменационной последовательности видеоизображений и дискретизации значений параметров) набор значений параметров системы.
- Снизить трудозатраты на параметрическую адаптацию системы.
На практике это дает возможность повышать эффективность не только самих СРТМ, но и процессов их разработки и внедрения, поскольку предложенные методы позволяют производить внедрение и вторичную настройку СРТМ без привлечения алгоритмистов-разработчиков, снижая трудоемкость процесса внедрения и его длительность.
Предложенный в работе способ повышения эффективности функционирования СРТМ за счет их структурной адаптации позволяет существенно снизить среднее время анализа видеоизображений в тех условиях, когда значительная часть поступающих на вход СРТМ видеоизображений не содержит образ текстовой метки. При этом не требуется сопутствующая модификация базовых алгоритмов СРТМ.
СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
В изданиях, рекомендованных ВАК:
1. Воскресенский, Е. М. Метод декомпозиции и вычисления показателей эффективности систем распознавания текстовых меток на видеоизображениях [Текст] / Е. М. Воскресенский, В. А. Царев // Научно-технические ведомости СПбГПУ. - 2008. - №3. - С. 140-145.
2. Воскресенский, Е. М. Метод оценки эффективности систем распознавания текстовых меток на сложном фоне с использованием дерева вероятностных характеристик [Текст] / Е. М. Воскресенский, В. А. Царев // Компьютерная Оптика. - 2008. - Т.32. - №3. - С. 283-290.
3. Воскресенский, Е. M. Методы управления процессом распознавания текстовых меток на изображениях [Текст] / Е. М. Воскресенский, В. А. Царев // Компьютерная Оптика. - 2008. - Т.32. - №4. - С. 413-416.
4. Воскресенский, Е. М. Метод параметрической оптимизации процесса принятия решений в системах распознавания текстовых меток на видеоизображениях [Текст] / Е. М. Воскресенский, В. А. Царев // Компьютерная Оптика. - 2009. - Т. 33. - №2. - С. 202-209.
В иных изданиях:
5. Воскресенский, Е. М. Моделирование и адаптация систем распознавания текстовых меток на видеоизображениях [Текст] : монография / Е.М. Воскресенский, В.А. Царев. - Череповец: ИНЖЭКОН-Череповец, 2009. -154 с.-ISBN 978-5-902459-06-4.
6. Воскресенский, Е. М. Классификация фрагментов изображений в задаче поиска и локализации графических образов текстовых меток на сложном фоне [Текст] / Е. М. Воскресенский, В. Â. Царев // Образование, наука, бизнес: особенности регионального развития и интеграции: Сборник трудов Всероссийской научно-методической конференции. - Череповец: ИМИТ СПбГПУ, 2004. - С. 262-270.
7. Воскресенский, Е. М. Программная реализация нейронной сети прямого распространения на языке С# и ее применение в задачах классификации изображений [Текст] / Е.М. Воскресенский, В.А. Царев II Технологии Microsoft в теории и практике программирования: Материалы межвузовского конкурса-конференции студентов, аспирантов и молодых ученых Северо-Запада. - СПб.: Изд-во Политехи, ун-та, 2005. - С.19-20.
8. Воскресенский, Е.М. Распознавание буквенно-цифровых символов с использованием нейронных сетей на примере изображений цифр регистрационных номеров транспортных средств [Текст] / Е. М. Воскресенский, Е. Н. Веснин // Образование, наука, бизнес: особенности регионального развития и интеграции: Сборник трудов Всероссийской научно-практической конференции. - Череповец: ИМИТ СПбГПУ, 2005. -С. 246-250.
9. Воскресенский, Е. М. Исследование процедур сегментации цифровых изображений идентификационных номеров железнодорожных вагонов [Текст] / Е. М. Воскресенский // Образование, наука, бизнес: особенности регионального развития и интеграции: Сборник трудов Всероссийской научно-практической конференции. - Череповец: ИМИТ СПбГПУ, 2006. -С. 283-286.
Ю.Воскресенский, Е. М. Методы и средства автоматизации разработки систем распознавания [Текст]/ Е. М. Воскресенский, В. А. Царев // Технологии Microsoft в теории и практике программирования: Материалы межвузовского конкурса-конференции студентов, аспирантов и молодых ученых Северо-Запада. - СПб.: Изд-во Политехи, ун-та, 2007. - С. 156-157.
11.Voskresenskiy, Е.М. Design automation of text labels récognition systems [Text] / E. M. Voskresenskiy // Pattem Récognition and Information Processing (PRIP-2007): Proceedings of the Ninth International Conférence. - Minsk: United
16 X ?V
Institute of Informatics Problems of National Academy of Science of Belarus, 2007.-Vol. II.-P. 236-239.
12.Voskresenskiy, E. M. Text label recognition systems efficiency control using localization and segmentation algorithms output likelihood [Text] / E. M. Voskresenskiy, V. A. Tsarev // International Conference «Pattern Recognition and Image Analysis: New Information Technologies» (PRIA-8-2007): Conference Proceedings. - Yoshkar-Ola: Mari State Technical University, 2007. - Vol. 3. - P. 57-61.
П.Воскресенский, E. M. Метод оценки эффективности систем распознавания текстовых меток на сложном фоне с использованием дерева вероятностных характеристик [Текст] / Е. М. Воскресенский, В. А. Царев // Технологии Microsoft в теории и практике программирования: Материалы межвузовского конкурса-конференции студентов, аспирантов и молодых ученых Северо-Запада. - СПб.: Изд-во Политехи, ун-та, 2008. - С. 193-194.
14.Воскресенский, Е. М. Метод расчета эффективности систем распознавания текстовых меток на видеоизображениях [Текст] / Е. М. Воскресенский // Сборник трудов всероссийской научной конференции студентов и ■ аспирантов «Молодые исследователи - регионам». - Вологда: ВоГТУ, 2008.
- С. 47-48.
15.Voskresenskiy, Е. М. Methods of searching for quasioptimal configurations of text label recognition systems [Text] / E. M. Voskresenskiy // International Conference «Pattern Recognition and Image Analysis: New Information Technologies» (PRIA-9-2008): Conference Proceedings. - Nizhni Novgorod: N. I. Lobachevski State University of Nizhni Novgorod, 2008. - Vol. 2. - P. 307-311.
16.Воскресенский, E. M. Модель системы распознавания текстовых меток на видеоизображениях с использованием событийного представления процесса анализа видеокадров [Текст] / Е. М. Воскресенский // Материалы II (вторых) ежегодных смотров-сессий аспирантов и молодых ученых Вологодской области по отраслям наук. - Вологда: ВоГТУ, 2008. - Т. 1. - С. 13-20.
Зав. РИО М. А. Салкова Подписано в печать 04.06.2010. Формат 60x84 1/16. Уч.-изд.л. 1. Тираж 90. Заказ 69.
Рыбинская государственная авиационная технологическая академия имени П. А. Соловьева (РГАТА имени П. А. Соловьева) 152934, г. Рыбинск, ул. Пушкина, 53
Отпечатано в множительной лаборатории РГАТА имени П. А. Соловьева 152934, г. Рыбинск, ул. Пушкина, 53
Оглавление автор диссертации — кандидата технических наук Воскресенский, Евгений Михайлович
СПИСОК СОКРАЩЕНИИ.
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ СОВРЕМЕННЫХ ПОДХОДОВ К РАЗРАБОТКЕ И АДАПТАЦИИ СИСТЕМ РАСПОЗНАВАНИЯ ТЕКСТОВЫХ МЕТОК НА ВИДЕОИЗОБРАЖЕНИЯХ.
1.1 Общая характеристика систем распознавания текстовых меток.
1.1.1 Назначение и область применения систем распознавания текстовых меток.
1.1.2 Особенности алгоритмического обеспечения систем распознавания текстовых меток.
1.1.3 Критерии эффективности систем распознавания текстовых меток
1.2 Основные проблемы разработки и адаптации систем распознавания текстовых меток.
1.2.1 Современное состояние проблем разработки и адаптации систем распознавания текстовых меток.
1.2.2 Проблема параметрической адаптации систем распознавания текстовых меток.
1.2.3 Проблема моделирования систем распознавания текстовых меток.
1.2.4 Проблема недостаточной эффективности современных систем распознавания текстовых меток.
1.2.5 Постановка задачи повышения эффективности функционирования систем распознавания текстовых меток.
Выводы по первой главе.
ГЛАВА 2. МОДЕЛЬ СИСТЕМЫ РАСПОЗНАВАНИЯ ТЕКСТОВЫХ МЕТОК
2.1 Задача моделирования систем распознавания текстовых меток.
2.2 Класс иерархических эвристических алгоритмов.
2.3 Вероятностные критерии' эффективности систем распознавания текстовых меток.
2.4 Математическая модель системы распознавания текстовых меток.
2.5 Расчет среднего времени анализа видеоизображения.
Выводы по второй главе.
ГЛАВА 3. МЕТОДЫ АДАПТАЦИИ СИСТЕМ РАСПОЗНАВАНИЯ ТЕКСТОВЫХ МЕТОК К ЗАДАННЫМ УСЛОВИЯМ ЭКСПЛУАТАЦИИ.
3.1 Параметрическая адаптация алгоритмов системы распознавания текстовых меток.
3.1.1 Задача параметрической адаптации системы распознавания текстовых меток к заданным условиям эксплуатации.
3.1.2 Общий принцип параметрической адаптации систем распознавания текстовых меток.
3.1.3 Вероятностные и прецедентные критерии эффективности алгоритмов систем распознавания текстовых меток.
3.1.4 Метод параметрической адаптации системы распознавания текстовых меток.
3.1.5 Кластеризация выборки входных данных системы распознавания текстовых меток.
3.1.6 Выбор способа декомпозиции системы распознавания текстовых меток.
3.1.7 Особенности настройки композиции алгоритмов сегментации и распознавания.
3.2 Параметрическая адаптация подсистемы принятия решений системы распознавания текстовых меток.
3.2.1 Задача параметрической адаптации подсистемы принятия решений системы распознавания.
3.2.2 Подсистема принятия промежуточных решений в процессе распознавания текстовых меток.
3.2.3 Особенности совместной параметрической адаптации алгоритмов-компонентов и подсистемы принятия решений.
3.2.4 Метод параметрической адаптации подсистемы принятия решений системы распознавания текстовых меток.
3.2.5 Функциональная зависимость времени анализа видеоизображения от параметров подсистемы принятия решений.
3.3 Структурная адаптация системы распознавания текстовых меток.
Выводы по третьей главе.
ГЛАВА 4. РАЗРАБОТКА И АДАПТАЦИЯ-СИСТЕМЫ РАСПОЗНАВАНИЯ ИДЕНТИФИКАЦИОННЫХ НОМЕРОВ ОБЪЕКТОВ ПОДВИЖНОГО СОСТАВА ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА.
4.1 Разработка алгоритмов системы распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта
4.1.1 Предназначение оптоэлектронных систем идентификации объектов подвижного состава железнодорожного транспорта.
4.1.2 Алгоритм локализации идентификационных номеров.
4.1.3 Алгоритм сегментации локализованных идентификационных номеров.
4.1.4 Алгоритм распознавания символов идентификационных номеров
4.1.5 Алгоритм формирования решений.
4.2 Параметрическая адаптация системы распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта.
4.2.1 Задача параметрической адаптации системы распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта.
4.2.3 Описание процесса параметрической адаптации системы распознавания идентификационных номеров.
4.3 Структурная адаптация системы распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта
4.3.1 Реализация алгоритма классификации зон.
4.3.2 Практические исследования эффективности применения алгоритма классификации зон.
4.4 Общая последовательность действий при разработке и адаптации систем распознавания текстовых меток.
Выводы по четвертой главе.
Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Воскресенский, Евгений Михайлович
В настоящее время в связи с ростом производительности вычислительной техники значительно расширяется область применения систем технического зрения, в частности, систем распознавания текстовых меток (СРТМ), представляющих собой относительно короткие последовательности символов из некоторого априорно известного алфавита. СРТМ являются частным случаем OCR-систем (Optical Character Recognition), представленных системами распознавания текста различного происхождения (печатного, рукопечатного, рукописного), но имеют ряд отличительных особенностей.
Обычно СРТМ функционируют в составе оптоэлектронных систем контроля, что обуславливает следующие основные их отличия от OCR-систем распознавания текста: низкое разрешение анализируемых видеоизображений, сложный фон текстовых меток, наличие значительных, вносимых внешней средой искажений, , высокие требования к быстродействию. Другая особенность СРТМ заключается в том, что в составе оптоэлектронных систем контроля СРТМ используются для идентификации имеющих регистрационные надписи объектов, таких как маркированные промышленные изделия (стальные слябы, трубы и др.), наземные транспортные средства, грузовые контейнеры, печатные платы. и микросхемы, упакованные продукты, денежные купюры.
Использование СРТМ позволяет избавить человека от рутинных операций, а также решать задачи, с которыми он физически не способен справляться в режиме реального времени (конвейерная обработка изделий, поиск в базе данных и т.п.), однако требует от таких систем высокого качества распознавания без словаря. В связи с указанными особенностями алгоритмы СРТМ и методы их разработки во многом отличаются от алгоритмов и методов разработки ОСЫ-систем распознавания текста, что приводит к необходимости изучения СРТМ как отдельного класса ОСЫ-систем.
Разработка и внедрение СРТМ связаны с решением ряда задач научного и производственного характера. Особенности реализации аппаратной составляющей систем технического зрения, вопросы настройки оптических схем таких систем и программные средства ввода зрительных данных в ЭВМ в настоящее время широко освещены в литературе. Также достаточно подробно изучены вопросы, касающиеся математического обеспечения процессов анализа изображений и распознавания образов.
Проблематика разработки алгоритмов оптического распознавамиятекста представлена в работах таких российских и зарубежных ученых как Горский Н.Д., Анисимов В. А., Арлазаров В.Л., Ян Д.Е., МэЫск Н., Гтреёоуо Б. и др. Достаточно большое количество публикаций посвящено описанию алгоритмов различных прикладных СРТМ. Несмотря на разнообразие решаемых прикладных задач, в настоящее время сложился общепринятый подход к представлению алгоритмической части СРТМ в виде иерархического алгоритма, представляющего особой композицию алгоритмов локализации текстовой'метки на видеоизображении, сегментации текстовой метки на отдельные символы, распознавания изображений символов, формирования и принятия решений.
Вместе с тем в настоящее время не решенной остается задача синтеза СРТМ с заданными показателями эффективности. Эффективность СРТМ принято характеризовать рядом критериев. С одной стороны - это качество распознавания, которое включает в себя вероятностные критерии эффективности, с другой — время рабочего цикла анализа видеоизображения, часто ограниченное требованием распознавания в реальном времени. В настоящее время значения критериев эффективности большинства эксплуатируемых систем далеки от идеальных, что обусловлено не только несовершенством используемых алгоритмов. На практике повышение эффективности системы связано с настройкой параметров ее алгоритмов, что позволяет адаптировать систему к заданным условиям эксплуатации (оптической схеме, типу метки, освещению и пр.).
Зависимость значений критериев эффективности от значений настраиваемых параметров носит сложный алгоритмический характер, что исключает применение аналитических методов вычисления оптимальных параметров. Кроме того, как правило, количество параметров достаточно велико, а однократное вычисление значений критериев эффективности системы требует существенных вычислительных затрат и, соответственно, затрат времени, что затрудняет применение известных методов'оптимизации. В результате в настоящее время параметрическая адаптация» СРТМ к заданным условиям эксплуатации производится-^ в основном, вручную, что требует от исполнителя высокой квалификации, сравнимой с квалификацией, разработчика. При этом нахождение оптимальных параметров не гарантируется.
Таким образом, важной задачей является создание новых, методов параметрической» адаптации* СРТМ к заданным условиям эксплуатации. Потребность в таких методах приводит к необходимости моделирования СРТМ, в первую очередь ее алгоритмической подсистемы. В рамках теории распознавания образов известен ряд математических моделей систем распознавания (статистические модели, модели на основе метода потенциальных функций и др.), но большинство из них являются моделями алгоритмов распознавания (классификаторов). Это не позволяет использовать их для* моделирования СРТМ, которые являются иерархическими системами и включают алгоритм распознавания символов как составную часть. Поэтому актуальной задачей является создание модели системы распознавания текстовых меток на видеоизображениях, учитывающей иерархическую структуру СРТМ.
Другой актуальной проблемой является недостаточно высокая эффективность известных алгоритмов распознавания текстовых меток. Как показывают опубликованные исследования, даже такая известная задача, как распознавание государственных регистрационных знаков автомобилей, не решена окончательно, поскольку вероятность правильного распознавания в благоприятных условиях, как правило, не превышает 0.9. Неизбежность использования несовершенных алгоритмов ставит задачу разработки высокоэффективных систем принятия решений в составе СРТМ.
С учетом того факта, что количество внедрений отдельных видов СРТМ достигает по России сотен в год и непрерывно растет, задачи повышения! эффективности таких систем и процесса их адаптации к заданным условиям эксплуатации являются! весьма актуальными. Их актуальность обусловлена отсутствием1 моделей и недостаточной эффективностью алгоритмов СРТМ, а также отсутствием эффективных методов параметрической' и структурной адаптации СРТМ к заданным условиям эксплуатации.
Целью диссертационной работы является повышение эффективности функционирования систем распознавания текстовых меток на видеоизображениях путем* совершенствования процессов разработки и адаптации таких систем с учетом условий эксплуатации. Для достижения указанной цели в работе поставлены и решены следующие основные задачи:
- Разработка математической модели СРТМ, представляющей СРТМ в виде множественной композиции эвристических алгоритмов.
- Разработка на базе предложенной математической модели методов параметрической адаптации СРТМ к заданным условиям эксплуатации.
- Разработка способа повышения эффективности СРТМ за счет ее структурной адаптации, не требующей модификации ее алгоритмов.
- Апробация предложенных модели и методов на примере оптоэлектронной системы контроля объектов подвижного состава железнодорожного транспорта.
Для решения поставленных задач- использованы методы теории вероятностей и математической статистики, основы теории оптимизации и принятия решений, методы обработки изображений, математический аппарат теории распознавания образов.
В работе выделен и исследован класс иерархических эвристических алгоритмов анализа изображений и распознавания графических образов, лежащих в основе большинства современных СРТМ. Предложен набор моделей, методов и программных средств, обеспечивающих повышение эффективности- функционирования СРТМ за счет совершенствования процессов разработки и, внедрения таких систем. Научной новизной обладают:
1. Математическая» модель СРТМ, обеспечивающая описание и исследование СРТМ в виде множественной композиции базовых специализированных эвристических алгоритмов анализа видеоизображений. Модель включает в себя вероятностные критерии эффективности всей СРТМ и критерии эффективности отдельных составляющих алгоритмов, и устанавливает зависимость между такими критериями.
2. Метод параметрической адаптации СРТМ. Метод основан на модели п. 1 и заключается в декомпозиции СРТМ на алгоритмы-компоненты эвристического анализа изображений, статистической оценке значений вероятностных критериев эффективности системы и оценке затрат времени на анализ системой единицы входных данных. Он позволяет обеспечить практическую решаемость задачи вычисления квазиоптимальных (оптимальных в рамках заданных экзаменационной последовательности изображений и дискретизации значений параметров) значений параметров большинства существующих СРТМ по сравнению с известными способами их настройки.
3. Метод параметрической адаптации подсистемы принятия решений СРТМ. Метод основан на модели п. 1 и заключается в декомпозиции СРТМ- на алгоритмы-компоненты, формирующих списки альтернативных решений на промежуточных этапах анализа входного видеоизображения. Метод позволяет обеспечить практическую решаемость задачи вычисления квазиоптимальных (оптимальных в рамках заданных экзаменационной последовательности изображений и дискретизации значений параметров) значений параметров подсистемы принятия решений, управляющей размерами списков альтернативных решений.
4. Способ структурной адаптации СРТМ, обеспечивающий без сопутствующей модификации- образующих СРТМ' алгоритмов уменьшение среднего' времени анализа последовательности входных видеоизображений, как содержащих, так и не1 содержащих образы текстовые метки движущихся объектов контроля.
Практическая ценность работы заключается в следующем:
1. Предложена методика оценки затрат времени на подготовку экзаменационных данных и на вычисление оптимальных параметров алгоритмов» СРТМ, на основе которых производится целенаправленный выбор способа декомпозиции СРТМ.
2. Предложена методика кластеризации экзаменационной выборки видеоизображений, позволяющая сопоставить подмножествам видеоизображений подходящие квазиоптимальные наборы параметров.
3. Разработаны алгоритмы и произведена параметрическая адаптация модуля распознавания системы идентификации объектов подвижного' состава железнодорожного транспорта «АЯ8С18», разработка которой выполнялась в ИМИТ СПбГПУ и научно-производственной компании «Малленом» (г. Череповец) по заказам администрации станции Череповец Северной Железной Дороги, ОАО «Лукойл-Ухтанефтепереработка» и ОАО «Лукойл-Волгограднефтепереработка».
4. Разработаны программные инструментальные средства параметрической адаптации алгоритмов СРТМ, используемые в научно-производственной компании «Малленом» при разработке оптоэлектронных систем идентификации, среди которых семейство систем идентификации автотранспортных средств «Автомаршал», система управления городскими транспортными потоками «Интеллектуальный Светофор», системы контроля печатной продукции, системы распознавания текстовой маркировки на стальных слябах, трубах и др.
5. Результаты исследований используются в учебном процессе ИМИТ СПбГПУ в рамках дисциплины «Основы теории распознавания образов» для специальности 230105— Программное обеспечение вычислительной техники и автоматизированных,систем.
Основные положения! диссертации докладывались и обсуждались на 13 научно-технических конференциях, по материалам диссертации опубликованы 16 печатных работ, из них 4 в изданиях, рекомендованных ВАК, одна монография.
В структурном отношении работа состоит из введения, четырех глав, заключения, списка литературы и приложений.
В первой главе дается общая) характеристика систем распознавания текстовых меток на видеоизображениях, а также определяется круг проблем, связанный с их разработкой и адаптацией. Определены особенности, отличающие задачу распознавания текстовых меток на видеоизображениях от родственной задачи распознавания текста. Произведен анализ литературы и описана типовая иерархическая структура основной' алгоритмической оставляющей СРТМ — программного модуля распознавания. Указано, что в СРТМ, как правило, используются эвристические алгоритмы анализа видеоизображений, что обуславливает вероятностный характер критериев эффективности таких систем.
Выявлена проблема недостаточной эффективности СРТМ вследствие несовершенства как современных методов обработки и анализа изображений, так и применяемых на практике методов адаптации таких систем к заданным условиям эксплуатации. Часто алгоритмы СРТМ обладают большим количеством настраиваемых параметров, причем зависимость значений критериев эффективности СРТМ от значений настраиваемых параметров носит сложный алгоритмический характер, что исключает применение аналитических методов вычисления оптимальных параметров. При этом оценка значений критериев эффективности СРТМ требует существенных вычислительных затрат и, соответственно, времени, это осложняет применение известных универсальных методов оптимизации. По указанным причинам^ на практике настройка параметров осуществляется, вручную, что требует от исполнителя высокой квалификации и не гарантирует нахождение оптимальных параметров.
По результатам анализа проблем, связанных с разработкой и внедрением СРТМ, определена цель диссертационной работы, направленная на повышение эффективности функционирования систем распознавания текстовых меток на видеоизображениях путем совершенствования процессов разработки и адаптации таких систем с учетом условий эксплуатации.
Вторая глава посвящена разработке математической модели СРТМ. Для решения этой задачи выделен класс иерархических эвристических алгоритмов А , которому соответствует большинство современных описанных в литературе алгоритмов распознавания текстовых меток. В общем виде алгоритм А е А представлен в виде композиции составляющих его алгоритмов-компонентов.
Предложено проектировать программный модуль распознавания в виде алгоритма класса А . Определены критерии эффективности алгоритма А и составляющих его алгоритмов-компонентов. Разработана математическая модель алгоритма А, которая устанавливает функциональную связь между значениями критериев эффективности алгоритма А и значениями критериев эффективности алгоритмов-компонентов, образующих А.
Третья глава посвящена методам параметрической адаптации СРТМ к заданным условиям эксплуатации. Предложен метод расчета квазиоптимальных значений параметров алгоритмов СРТМ (оптимальных при условии ограниченного множества допустимых значений каждого из параметров и в рамках ограниченной экзаменационной последовательности видеоизображений). Метод позволяет посредством декомпозиции свести задачу параметрической адаптации СРТМ к нескольким подзадачам меньшей размерности, которые, как правило, могут быть решены за приемлемое время.
Предложена методика оценки затрат времени на подготовку экзаменационных данных и- на вычисление оптимальных параметров алгоритмов СРТМ, на основе которых производится целенаправленный выбор способа декомпозиции А е А для последующей параметрической адаптации предложенным методом.
Описана задача' настройки параметров системы принятия; решений А е Ас. Часто для повышения эффективности СРТМ применяется так называемая «мягкая» схема принятия решений, которая заключается в. формировании алгоритмами-компонентами списков вариантов решений. Это позволяет снизить вероятность потери истинного решения на промежуточных этапах анализа видеоизображения. Предложен алгоритм усечения списков и метод расчета оптимальных значений его параметров. Метод позволяет найти вероятностные критерии эффективности* каждой конфигурации алгоритма, для оценки затрат времени на анализ видеоизображения предложен способ оценки данных затрат с учетом параметров алгоритма усечения списков решений.
Предложен способ структурной адаптации СРТМ, не требующий сопутствующей модификации алгоритмов-компонентов, позволяющий сократить средние затраты времени на анализ видеоизображений, содержащих и не содержащих текстовые метки. Способ основан на статистическом расчете среднего количества вызовов каждого алгоритма-компонента на одно видеоизображение при заданных параметрах алгоритма усечения списков решений и статистическом расчете среднего времени анализа единицы входных данных соответствующих алгоритмов-компонентов.
В четвертой главе приведено описание разработанных алгоритмов системы распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта: алгоритма локализации образа текстовой метки на видеоизображении, алгоритма сегментации образа текстовой метки, алгоритма распознавания образов отдельных символов текстовой метки, алгоритма формирования решений и алгоритма принятия итогового решения. Описан процесс параметрической адаптации разработанной системы к заданным условиям эксплуатации с применением предложенных в гл. 3 методов. Приведены результаты' экспериментов по структурной адаптации системы распознавания идентификационных номеров подвижного состава железнодорожного транспорта, подтвердившие эффективность предложенного подхода.
По итогам практической части работы сформулированы общие рекомендации по разработке произвольных СРТМ и параметрической адаптации таких систем к заданным условиям эксплуатации с применением предложенных в работе методов и моделей.
В приложениях представлены:
1. Функциональная зависимость вероятности идентификации объектов контроля от времени анализа видеоизображения.
2. Исследование зависимости вероятности правильного и неправильного распознавания текстовой метки от параметров алгоритма усечения списков вариантов решений.
3. Исследование эффективности способа оценки среднего времени анализа видеоизображения с учетом параметров алгоритмов усечения списков вариантов решений.
4. Выбор структуры нейросетевого классификатора сегментов.
5. Выбор способа декомпозиции системы распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта.
На защиту выносятся следующие положения:
1. Математическая модель СРТМ.
2. Метод параметрической адаптации СРТМ.
3. Метод параметрической адаптации подсистемы принятия решений СРТМ.
4. Способ структурной адаптации СРТМ.
Заключение диссертация на тему "Параметрическая и структурная адаптация систем распознавания текстовых меток на видеоизображениях"
Выводы по четвертой главе
1. Разработаны алгоритмы системы распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта: алгоритм локализации образа текстовой метки на видеоизображении, алгоритм сегментации образа текстовой метки, алгоритм распознавания образов отдельных символов текстовой метки, алгоритм формирования решений и алгоритм принятия итогового решения.
2. Произведена адаптация разработанной системы распознавания к заданным условиям эксплуатации, результаты которой подтвердили целесообразность применения на практике предложенных методов параметрической адаптации СРТМ.
3. Приведены результаты экспериментов по применению структурной адаптации системы распознавания идентификационных номеров подвижного состава железнодорожного транспорта, подтвердившие эффективность предложенного подхода.
4. Описана общая последовательность действий по разработке и адаптации алгоритмического обеспечения СРТМ с применением предложенных в работе методов.
ЗАКЛЮЧЕНИЕ
Установлено, что в настоящее время большинство описанных в литературе систем распознавания текстовых меток на видеоизображениях являются многопараметрическими системами и имеют однотипную структуру, представленную композицией алгоритмов локализации, сегментации, распознавания и принятия решений. Выделен и исследован класс иерархических эвристических алгоритмов анализа изображений, лежащих в основе большинства современных СРТМ. Такие системы могут быть описаны представленной в работе моделью СРТМ, и к ним применимы предложенные автором методы» параметрической и структурной адаптации СРТМ с учетом заданных условий эксплуатации. Для большинства современных СРТМ данные методы позволяют:
- Находить за приемлемое время оптимальный (в рамках заданной экзаменационной последовательности видеоизображений и дискретизации значений параметров) набор значений параметров системы.
- Снизить трудозатраты на параметрическую адаптацию системы.
На практике это дает возможность повышать эффективность не только самих СРТМ, но и процессов их разработки и внедрения, поскольку предложенные методы позволяют производить внедрение и вторичную настройку СРТМ без привлечения алгоритмистов-разработчиков, снижая трудоемкость процесса внедрения и его длительность.
Предложенный в работе способ повышения эффективности функционирования СРТМ за счет их структурной адаптации позволяет существенно снизить среднее время анализа видеоизображений в тех условиях, когда значительная часть поступающих на вход СРТМ видеоизображений не содержит образ текстовой метки. При этом не требуется сопутствующая модификация базовых алгоритмов СРТМ.
Библиография Воскресенский, Евгений Михайлович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Система распознавания автомобильных номеров Автоураган-М (мобильная версия) Электронный ресурс. / Технологии распознавания. — Электрон, дан. М., 2009. — Режим доступа : http://www.recognize.ru/node/17. — Загл. с экрана.
2. Горелик, А. Л. Современное состояние проблемы распознавания: Некоторые аспекты Текст. / А.Л. Горелик, И.Б. Гуревич, И.А. Скрипкин. — М.: Радио и связь, 1985. 160 с.
3. Царев, В. А. Проектирование и оптимизация оптоэлектронных приборов контроля передвижения наземных транспортных средств Текст. / В. А. Царев // Приборы и системы. Управление, контроль, диагностика. -2008.-№7.-С. 16-23.
4. Tsarev, V. A. Basic principles of vehicles optoelectronic identification system development Text. / V. A. Tsarev // Pattern Recognition and Image Analysis. 2005. - Vol. 15. - № 2. - P. 454-457.
5. Балыков, Е. А. Разработка> и обеспечение качества программных средств обработки и анализа изображений Текст. : монография / Е.А. Балыков, В.А. Царев. — М.: Компания Спутник+, 2006. 178 с.
6. Балыков, Е. А. Оптико-электронные системы идентификации движущихся транспортных средств: назначение, состав, особенности проектирования и программной реализации Текст. / Е. А. Балыков,
7. А.Е. Михайлов, В. А. Царёв // Научно-технические ведомости СПбГПУ. — 2005. -№3.- С. 40-48.
8. Давыдов, В. О. Архитектура системы распознавания автомобильных номеров Текст. / В. О. Давыдов, С. Г. Антощук, А. А. Нутович // Труды одесского политехнического университета. — № 1. — 2002. — С. 157—159.
9. Давыдов, В. О. Автоматизированная система распознавания автомобильных номеров Текст. / В. О. Давыдов, В. Н. Крылов, М. В. Максимов // Искусственный интеллект. — 2002. № 4. - С. 462-469.
10. Barroso, J. Number plate reading using computer vision. Text. / J. Barroso, E. L. Dagless, A. Rafael // International Symposium on Industrial Electronics (ISIE-97). Portugal: University of Minho, 1997. - № 3. - P. 761-766.
11. Anagnostopoulos, C. Digital image processing and neural networks for vehicle license plate identification Text. / C. Anagnostopoulos, E. Kayafas, V. Loumos // Journal of Electrical Engineering. 2000. - Vol. 1. - № 2. - P. 2-7.
12. Zheng, D. An efficient method of license plate location Text. / D. Zheng, Y. Zhao, J. Wang// Pattern Recognition Letters. 2005. - Vol. 26. - № 15. - P. 2431-2438.
13. Wang S. Detection and Recognition of License Plate Characters with Different Appearences Text. / S. Wang, H. Lee // Intelligent Transportation Systems Conference Proceedings. Shanghai: Tongji University, 2003. - Vol. 2. -P. 979-984.
14. Wang, T. Robust License Plate Recognition based on Dynamic Projection Warping Text. / T. Wang, F. Ni, K. Li // IEEE International Conference on-Networking, Sensing and Control Proceedings. Taiwan: National Chiao-Tung University, 2004. - P. 784-788.
15. Yan, D. A High Performance License Plate Recognition System Based on the Web Technique» Text. / D. Yan, M. Hongqing, L. Jilin // Intelligent Transportation Systems Conference Proceedings. USA: University of California, 2001.-P. 325-329.
16. Comelli, P. Optical recognition of motor vehicle license plates Text. / P.Comelli, P. Ferragina, M. N. Granieri // IEEE Transactions On Vehicular Technology. 1995. - Vol. 44. - № 4. - P. 790-799.
17. Zhang, Y. A new algorithm for character segmentation of license plate Text. / Y. Zhang, C. Zhang // Proceedings of Intelligent Vehicles Symposium. -USA: Ohio State University, 2003. P. 106-109.
18. Chang, S. Automatic License Plate Recognition Text. / S. Chang, L. Chen, Y. Chung [and others] // IEEE Transactions on Intelligent Transportation Systems. 2004. - Vol. 5.-№ l.-P. 42-53.
19. Система считывания автомобильных номеров! Электронный ресурс. / М. В. Руцков; Мегапиксел. Электрон, дан. - М., 2003. - Режим доступа,: http:// homepage.corbina.net/~ksi/rout/strouz.htm. - Загл. с экрана:
20. Горский; Н. Д. Распознавание рукописного текста: от теории к практике Текст. / Н. Д. Горский, В. А. Анисимов, JI. А. Горская. СПб. : Политехника, 1997. — 126 с.
21. ABBYY FineReader White Paper Электронный ресурс. / Информационный портал DOCFLOW.ru. Электрон, дан. - М., 2005. -Режим доступа : http://www.docflow.ru/analitics/detail.php?ID= 15206. - Загл. с экрана.
22. Распознавание строк печатных текстов Электронный ресурс. / В. JI. Арлазаров, П. А. Куратов, О. А. Славин; Cognitive Technologies. -Электрон. дан. М., 2000: - Режим доступа: http://www.cognitive.ru/innovation/sbornic2/. - Загл. с экрана.
23. Арлазаров, В. JI. Алгоритмы распознавания и технологии^ ввода текстов в ЭВМ. Текст. / В. JI. Арлазаров, О. А. Славин // Информационные технологии и вычислительные системы. 1996. — № 1. — С. 48—54.
24. Арлазаров, В. JL Адаптивное распознавание символов. Текст. / В1 JI. Арлазаров, А. Д. Астахов, В. В. Троянкер, [и др.] // Интеллектуальные технологии ввода и обработки информации. Сборник трудов. — М.: Институт системного анализа РАН, 1998. — С. 39-56.
25. Славин, О. А. Древовидное распознавание нормализованных символов. Текст. / О. А. Славин, А. А. Подрабинович // Интеллектуальные технологии ввода и обработки информации. Сборник трудов. М.: Институт системного анализа РАН, 1998. — С. 137—157.
26. Абрамов, Е. С. Моделирование систем распознавания изображений на примере печатных текстов Текст. : дис. . канд. техн. наук : 05.13.01 / Е. С. Абрамов. Санкт-Петербург, 2006. - 140 с.
27. Салюм, С. С. Разработка и исследование методов распознавания рукописных арабских текстов Текст. : дис. . канд. техн. наук : 05.13.01 / С. С. Салюм. Ижевск, 2003. - 127 с.
28. Nisliida, H. An approach to integration of off-line and; on-line recognition, of handwriting. Text.? / H: Nishida // Pattern Recognition betters. 1995: - Vol. 16.-№ 11. -P. 2431-2438.
29. Impedovo, S. Frontiers in handwriting recognition Text. / S. Impedovo // Fundamentals in handwriting recognition. 1994. - Vol. 124. - P. 7-39.
30. Kim, G. An architecture for handwritten text recognition systems Text. / G. Kim, V. Govindaraju, S. N. Srihari // International! Journal on Document Analysis and Recognition. 1999; - Vol: 2. - № 1. - P. 37-44. .
31. Яи, Д. E. Исследование, развитие и реализация; методов автоматического,; распознавания» рукописных текстов в компьютерныхсистемах Текст. : дис.канд. физ.-мат. наук : 05.13.18 / Д. Е. Ян. -М., 2003-179 с.
32. Еремин, С. Н. Алгоритмическое и программное обеспечение автоматизированной системы контроля параметров автотранспортных потоков Текст. : дис. . канд. техн. наук : 05.13.01 / С. Н. Еремин. -Череповец, 2000.- 185 с.
33. Ересько, Ю. Н. Методы автоматической? локализации объектов в.потоках изображений?;динамических сцен? Текст.;: дисдокт. техн. наук :0513.01 / Ю. Н. Ересько. Тула, 2007. - 230 с.
34. Богуславский, А., А. Методы, программирования систем технического зрения Текст. : дис. . докт. техн. наук : 05.13.11 : защищена 14.11.2006 / А. А. Богуславский. М., 2006. - 334 с.
35. Otsu, N. A Threshold, Selection Method from Gray-Level Histograms Text. / N. Otsu // IEEE Transactions on Systems, Man, and Cybernetics. -1979: -Vol. 9. -Ж1.- P. 62-66.
36. Месарович М. Теория иерархических многоуровневых CHCTeMv Текст. / М. Месарович, Д. Мако, Я. Такахара. — М.: Мир, 1973. 344 с.
37. Месарович М. Общая теория систем Текст. / М. Месарович, Я. Такахара М.: Мир. - 1978. - 364 с.
38. Фомин, Я. А. Оптимизация распознающих систем Текст. / Я. А. Фомин, А. В. Савич М.: Машиностроение, 1993. - 288 с.
39. Ковалевский, В. А. Методы оптимальных решений в распознавании изображений Текст. / В. А. Ковалевский. — М.: Наука, 1976. 328 с.
40. Савчинский, Б. Д. Настройка алгоритма распознавания текста Текст. / Б. Д. Савчинский, О. В. Камоцький* // Управляющие системы и машины. 2005. - № 2. - С. 17-24.
41. Белозерский, JI. А. Основы построения систем распознавания образов Текст. / JI. А. Белозерский. Донецк.: ДГИИИ, 1997. - 103 с.
42. Белозерский, JT. А. Введение в системы автоматического распознавания Текст. / JI. А. Белозерский. К.: Наукова*думка, 2006. - 434 с.
43. Потапов, А. С. Распознавание образов и машинное восприятие : Общий подход на основе минимальной длины описания Текст. / А. С. Потапов. СПб.: Политехника, 2007. - 548 с.
44. Журавлёв, Ю; И. Распознавание. Математические методы. Программная система. Практические применения Текст. : монография / Ю.И.Журавлёв, В.В.Рязанов, О. В. Сенько. М.: ФАЗИС, 2006. -176 с.
45. Комплект для разработчика системы распознавания номеров вагонов RailwayDisp Электронный ресурс. / Intlab. Электрон, дан. - Ярославль,2007. Режим доступа: http://www.intlab.ru/page.php?ipage= railwaydispsdkinfo. - Загл. с экрана.
46. Поздняков, С. Тестирование систем распознавания автомобильных номеров Текст. / С. Поздняков, Е. Шарапов // CCTV Focus. М., 2006. -№6.-С. 16-46.
47. Капустин, Б. Е. Способы построения оптимальной вероятностной модели систем распознавания Текст. / Б. Е. Капустий, Б. П. Русын,
48. B. А. Таянов // Математические методы распознавания образов. 13-я Всероссийская конференция. Сборник докладов. — М.: МАКС Пресс, 2007.1. C. 37-39.
49. Kolak, О. A Generative Probabilistic OCR Model for NLP Applications Text. / O. Kolak, W. Byrne, P. Resnik // Proceedings of North American Chapter of the Association for Computational Linguistics. Canada: University of Alberta, 2003.-P. 55-62.
50. Aiello, M. Document Image Analysis via Model Checking Electronic resource. / M. Aiello // University of Groningen. Electronic data. - Netherlands, 2001. - Mode of access: http://www.cs.rug.nl/~aiellom/publications/ aiia01Vision.pdf. - Title on screen.
51. Aiello, M. Combining-Linguistic and Spatial Information for Document Analysis. Text. / M. Aiello, C. Monz, L. Todoran // Proceedings of RIAO'2000 Content-Based Multimedia Information Access. Paris: University of Paris, 2000.-P. 266-275.
52. Casey, R. G. Document Image Analysis Electronic resource. / R. G. Casey // Oregon Graduate Institute of Science and Technology Research Center.
53. Electronic data. USA, 2004. - Mode of access: http:// cslu.cse.ogi.edu/HLTsurvey/ch2node4.html. — Title on screen.
54. Haralick, R. M. Document image understanding: Geometric and logical layout Text. / R. M. Haralick // Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Seattle: University of Washington, 1994.- P. 385-390.
55. Jain, A. K. Document representation and its application to page decomposition Text. / A. K. Jain, B. Yu // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1998. - P. 294-308.
56. Тестирование систем распознавания автомобильных номеров Электронный ресурс. / CCTV Focus. Электрон, дан. — М., 2006. - Режим» доступа : http://www.procctv.ru/page.php?id=469. - Загл. с экрана.
57. Тестирование систем распознавания автомобильных номеров Электронный ресурс. / Технологии Распознавания. — Электрон, дан. — М., 2007. Режим доступа*: http://www.recognize.ru/node/30. - Загл. с экрана.
58. Рылов, А. С. Анализ речи в распознающих системах Текст. / А. С. Рылов. Минск: Бестпринт, 2003. -263 с.
59. Delac, К. Face recognition Text. / К. Delac, М. Grgic. Vienna: Г-TECH Education and Publishing, 2007. - 570 p.
60. Zhao, W. Face Recognition: A Literature Survey Text. / W. Zhao, R. Chellappa, A. Rosenfeld // ACM Computing Surveys. 2003. - Vol. 35. - №4. P. 399-458.
61. Растригин, JI. А. Адаптация сложных систем Текст. : монография / Л. А. Растригин Рига: Зинатне, 1981. - 375 с.
62. Черноруцкий И. Г. Методы принятия решений Текст. / И. Г. Черноруцкий. — СПб.: БХВ-Петербург, 2005. 416 с.
63. Назаров, А. В. Нейросетевые алгоритмы прогнозирования и оптимизации систем Текст. / А. В. Назаров, А. И. Лоскутов. СПб.: Наука и Техника, 2003.-384 с.
64. Шапиро, JI. Компьютерное зрение Текст. / JI. Шапиро, Дж. Стокман М.: Бином, 2006. - 752 с.
65. Vesnin, Е. N. Segmentation of Images of License Plates. Text. / E. N. Vesnin, V. A. Tsarev // Pattern Recognition and Image Analysis. 2006. - Vol. 16. - №. 1. - P. 108-110.
66. Lu, Y. Machine printed character segmentation Text. / Y. Lu // Pattern Recognition. 1995. - Vol. 28. - P. 67-80.
67. Круглое, В. В. Искусственные нейронные сети. Теория и практика Текст. / В. В. Круглов, В. В. Борисов. М.: Горячая линия-Телеком, 2002. -382 с.
68. Кремер, Н. Ш. Теория вероятностей и математическая статистика Текст. / Н. Ш. Кремер. М.: ЮНИТА-ДАНА, 2002. - 543 с.
69. Знаки и надписи на вагонах грузового парка колеи 1520 мм Текст.: альбом-справочник. М.: ПКБ ЦВ, 2001. - 60 с.
-
Похожие работы
- Методы, алгоритмы и средства автоматического управления процессом формирования изображений в системах распознавания текстовых меток реального времени
- Быстродействующее устройство ввода и предварительной обработки изображений в системе распознавания видеоинформации
- Распознавание видеоизображений объектов заданной формы на основе анализа их контуров
- Разработка математического и программного обеспечения автоматизированной системы поиска оптимального набора признаков при параметрическом подходе в задачах распознавания
- Метод и вычислительное устройство автоматического обнаружения топологических аномалий на земной поверхности по космическим видеоизображениям
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность