автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Представление предметной области "Анализ изображений" в виде специализированного тезауруса

кандидата технических наук
Трусова, Юлия Олеговна
город
Москва
год
2009
специальность ВАК РФ
05.13.17
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Представление предметной области "Анализ изображений" в виде специализированного тезауруса»

Автореферат диссертации по теме "Представление предметной области "Анализ изображений" в виде специализированного тезауруса"

003467ЬЬо

На правах рукописи

Трусова Юлия Олеговна

Представление предметной области «Анализ изображений» в виде специализированного тезауруса

Специальность 05.13.17 - «Теоретические основы информатики»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Москва 2009 ^"'^РГГ^

003467653

Работа выполнена в Учреждении Российской академии наук Вычислительный центр им. A.A. Дородницына РАН

Научный руководитель:

кандидат физико-математических наук, с.н.с. И.Б. Гуревич

Официальные оппоненты:

доктор технических наук, профессор Ю.Г. Васин

кандидат физико-математических наук, с.н.с. К.В. Воронцов

Ведущая организация:

Институт математики им. С.Л. Соболева Сибирского отделения Российской академии наук

Защита состоится 14 мая 2009 г. в 15 часов на заседании диссертационного совета Д002.017.02 Учреждения Российской академии наук Вычислительный центр им. A.A. Дородницына РАН по адресу: 119333, Москва, ул. Вавилова, 40.

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Вычислительный центр им. A.A. Дородницына РАН.

Автореферат разослан 13 апреля 2009г.

Ученый секретарь диссертационного совета доктор физико-математических наук

профессор В.В. Рязанов

«

Общая характеристика работы

Актуальность темы

Одной из фундаментальных проблем информатики является проблема обработки, анализа, оценивания и понимания информации, представленной в виде изображений. Изображения являются одним из основных средств представления информации в научных исследованиях, медицине, экологии и технике.

Важным направлением ориентированных фундаментальных и прикладных исследований является разработка автоматизированных систем обработки, анализа, оценивания и понимания изображений. Необходимыми предпосылками создания таких систем являются автоматизация: а) выбора метода решения предъявленной задачи; б) выдачи рекомендаций по выбору метода решения для класса задач, к которому относится предъявленная задача; в) синтеза алгоритмических процедур решения предъявленной задачи; г) выдачи рекомендаций по синтезу алгоритмических процедур решения предъявленной задачи.

Необходимым условием достижения указанных целей является систематизация, структуризация и, в некотором смысле, формализация знаний в области обработки, анализа и распознавания изображений. Известно, что одним их эффективных способов представления знаний являются онтологии предметных областей. Онтологии служат для явного формального машинно-интерпретируемого описания семантики данных некоторой области знания и являются подходящим инструментом для представления знаний, используемых для извлечения информации из изображений. Необходимым начальным шагом на пути к созданию онтологии является разработка тезауруса предметной области как логико-понятийной основы этой онтологии. В этом смысле тезаурус должен быть специализированным, т.е. являться средством представления современного состояния рассматриваемой области знания, включать все основные понятия и фиксировать существующие связи между этими понятиями - представлять знания и понятийную структуру соответствующей предметной области.

Диссертационная работа посвящена построению формализованного представления предметной области «Анализ и оценивание информации,

представленной в виде изображений». В качестве основных разделов данной предметной области обычно выделяют обработку, анализ, распознавание и понимание изображений, причем для ее определения обычно используется обобщенный термин «Анализ изображений». В качестве способа формализации выбрано построение тезаурусного представления онтологии предметной области, т.е. создание специализированного тезауруса по анализу изображений.

Анализ изображений является чрезвычайно быстро развивающимся разделом информатики, в связи с чем его понятийная структура динамично изменяется. С другой стороны, эффективность исследований в области анализа изображений и решения прикладных задач анализа изображений в существенной степени зависят от стандартизации и формализации используемых описаний как собственно изображений, так и описаний методов их обработки, анализа и распознавания. Тезаурусное представление области анализа изображений можно использовать в качестве инструмента указанных стандартизации и формализации, а также обеспечения доступа квалифицированных и неквалифицированных пользователей, решающих задачи анализа изображений, к знаниям по анализу изображений, в том числе, например, с помощью создания соответствующих интернет-ресурсов. Существенным при этом является то обстоятельство, что тезаурус по анализу изображений и построенная на его основе онтология позволят использовать удобные и эффективные процедуры доступа к стандартизированным и структурированным представлениям этих знаний.

Таким образом, актуальной задачей является построение тезауруса по анализу изображений, необходимого для логической формализации данной предметной области, стандартизации понятийного аппарата, построения общих и частных онтологий предметной области и на этой основе автоматизации обработки, анализа, оценивания и распознавания изображений; для построения баз знаний по анализу изображений; для организации эффективного поиска и навигации в базах знаний по анализу изображений и для построения баз данных изображений.

Анапиз литературы и личный опыт участия в ведущих международных конференциях по данной тематике показал, что специализированный тезаурус в области обработки, анализа, понимания и распознавания изображений в настоящее время отсутствует.

Цели н задачи диссертационной работы

Целью диссертационной работы является построение формализованного представления предметной области «Анализ изображений» в виде специализированного тезауруса по анализу изображений и на его основе экспериментальной версии онтологии по анализу изображений, которые: 1) позволят систематизировать плохо структурированный и продолжающий развиваться понятийный аппарат предметной области; 2) будут служить терминологической и понятийной основой для классификации и описания задач и методов обработки, анализа и распознавания изображений в базах знаний для работы с изображениями; 3) обеспечат автоматизацию информационного поиска в базах знаний по обработке, анализу и распознаванию изображений и базах данных изображений. Кроме того, тезаурус будет являться самостоятельным словарем-справочником, который поможет ориентироваться в данной предметной области, и обеспечит возможность создания на его основе информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

Для достижения заявленной цели поставлены и решены следующие задачи: 1) исследование системы и логики знаний в области обработки, анализа, оценивания и понимания изображений; 2) разработка и обоснование структуры тезауруса по анализу изображений на основе оригинальной классификации задач и методов обработки, анализа и распознавания изображений; 3) отбор терминологии и разработка словника тезауруса по анализу изображений; 4) построение классификации задач обработки, анализа и распознавания изображений; 5) построение классификации методов обработки, анализа и распознавания изображений; 6) разработка базовой версии специализированного тезауруса по анализу изображений; 7) разработка экспериментальной версии онтологии анализа изображений на основе тезауруса по анализу изображений; 8) разработка концепции, архитектуры, функциональной схемы и требований к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений на основе тезауруса по анализу изображений; 9) разработка метода использования тезаурусов и онтологий при решении задач анализа изображений.

Методы исследования

В диссертационной работе используются математические методы распознавания образов, методы обработки, анализа и распознавания изображений, методы дескриптивной теории анализа изображений, методы структурной лингвистики.

Результаты, выносимые на защиту

1. Базовая версия тезауруса по анализу изображений.

2. Экспериментальная версия онтологии анализа изображений на языке OWL.

3. Концепция, архитектура, функциональная схема и требования к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

4. Классификация задач обработки, анализа и распознавания изображений.

5. Метод использования тезаурусов и онтологии при решении задач анализа изображений.

Научная новизна

Основные результаты работы являются новыми и оригинальными. Научная новизна результатов определяется актуальностью работы, поскольку, как уже отмечалось выше, такой инструмент как тезаурус, необходимый для автоматизации анализа изображений, отсутствует. Задача разработки представления предметной области «Анализ изображений» в виде специализированного тезауруса и основанной на нем онтологии поставлена и решена впервые в мировой практике. Предложенный метод использования тезаурусов и онтологии при решении задач анализа изображений иллюстрирует прикладное значение разработанных тезауруса и онтологии. Информационно-справочный интернет-ресурс по обработке, анализу и распознаванию изображений в настоящее время также отсутствует.

Практическая ценность

Основными результатами работы являются специализированный тезаурус по анализу изображений и построенная на его основе экспериментальная версия онтологии рассматриваемой предметной области. Разработанные средства предназначены для использования в системах автоматизации обработки и анализа изображений, системах автоматизации научных исследований,

6

системах автоматизации медицинской диагностики, для лингвистической поддержки мультимедийных баз данных и специализированных баз знаний, коммерческих хранилищ изображений, а также для решения других задач интеллектуализации и автоматизации принятия интеллектуальных решений на основе анализа и оценивания информации, представленной в виде изображений.

Практическая ценность диссертационной работы подтверждается полученными на основании ее результатов 2 патентами Российской Федерации (патент на изобретение и патент на полезную модель) и регистрацией разработок в Государственном регистре баз данных ФГУП НТЦ "Информрегистр"(3 регистрационных свидетельства) и в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам (Роспатент) (2 свидетельства о государственной регистрации баз данных).

Результаты диссертационной работы используются в составе лингвистического обеспечения Государственной системы научно-технической информации (ГСНТИ), в т.ч. следующие средства представления онтологии предметной области информационных систем, разработанные при участии автора в ходе выполнения плановых НИР и зарегистрированные в аналитической службе ведения информационных языков ГСНТИ: 1) Информационно-поисковый тезаурус по анализу изображений (авторы: И.Б.Гуревич, Ю.О. Трусова, Д.М. Мурашов, В.Н. Белоозеров), per. № 131.06, 31.10.2006; 2) Рубрикатор «Распознавание образов. Анализ изображений» (авторы: И.Б.Гуревич, Ю.О.Трусова, В.Н.Белозеров), per. № 831.06, 31.10.2006. (на основе данной разработки внесены изменения и дополнения в соответствующий раздел Рубрикатора ВИНИТИ РАН); 3) Тезаурус цитогематологических терминов для системы анализа изображений клеток крови (авторы: И.Б.Гуревич, Ю.О.Трусова, Н.Е.Шкловский-Корди, В.Н.Белоозеров), per. № 131.06,31.10.2006.

Полученные теоретические результаты и фактические сведения, содержащиеся в диссертационной работе, используются в ВИНИТИ РАН для систематизации научной и технической литературы по проблеме обработки и анализа изображений.

Апробация полученных результатов

В основу диссертационной работы положены результаты, полученные автором в ходе исследований, проводимых в рамках НИР по проектам ФЦП «Интеграция» (2001-2004гг.), по проектам ФЦНТП "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 гг. (проекты №№ 37.011.11.0015, 37.011.11.0016), по проектам Программы фундаментальных исследований Президиума РАН «Математическое моделирование и интеллектуальные системы» (проект № 2.14, 2001-2005 гг.), по проектам Программы Президиума РАН П-14 «Фундаментальные проблемы информатики и информационных технологий» (проект №214, 2006-2008гг.); по проектам Международной Ассоциации содействия сотрудничеству с учеными из новых независимых государств бывшего Советского Союза (проект № 04-777067, 2005-2006гг.); по проектам Программы российско-итальянского сотрудничества по Соглашению РАН-НСИ (2005-2007гг.) и по проектам Российского фонда фундаментальных исследований (проекты №№ 01-07-90016, 01-07-90017, 02-01-00182, 03-07-90392, 03-07-06057, 04-07-90187, 04-07-90202, 05-07-08000, 05-01-00784, 06-01-81009, 06-07-89203, 07-07-13545, 08-01-00469, 08-01-90022).

Результаты диссертационной работы докладывались и обсуждались на Всероссийских с участием стран СНГ конференциях «Методы и средства обработки сложной графической информации» (Нижний Новгород, РФ, 2001г.; Нижний Новгород, РФ, 2003г.); на международных конференция «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-6-2002, Великий Новгород, РФ, 2002г.; РОАИ-7-2004, Санкт-Петербург, 2004г.; РОАИ-8-2007, Йошкар-Ола, РФ, 2007г.; РОАИ-9-2008, Нижний Новгород, РФ, 2009г.); на 5-ой международной конференции «Распознавание-2001» (Курск, РФ, 2001г.); на открытых российско-немецких семинарах «Распознавание образов и понимание изображений» (001^-6-2003, Катунь, РФ, 2003г.; ОСЯ\У-7-2007, Эттлинген, Германия, 2007г.); на международной конференции Диалог'2004 (Верхневолжский, РФ, 2004г.); на международных конференциях "Информационное общество. Интеллектуальная обработка информации. Информационные технологии" (Москва, РФ, 2002г.; Москва, Российская конференция, 2007г.); на 9-ой международной конференции «Распознавание образов и обработка информации» (РШР'2007)

8

(Минск, Республика Беларусь, 2007г.); на 2-ой международной конференции «Семантика и цифровые медиа технологии» (SAMT2007) (Генуя, Италия, 2007г.); на 2-ой международной конференции «Машинное зрение: теория и приложения» (VISAPP 2007) (Барселона, Испания, 2007г.); на международных семинарах «Извлечение информации из изображений. Теория и приложения» в рамках международных конференций «Машинное зрение. Теория и приложения» (IMTA-1-2008, Фуншап, Мадейра, Португалия, 2008г.; IMTA-2-2009, Лиссабон, Португалия, 2009г.)

Структура и объем работы

Диссертация состоит из введения, четырех глав, заключения, библиографического списка использованной литературы и трех приложений. Объем основного текста работы - 111 страниц, список литературы включает 108 наименований.

Содержание работы

Во Введении обосновывается актуальность выбранной темы; формулируются цель и задачи исследования, показана научная новизна, теоретическая значимость и прикладная ценность результатов. Кратко излагается содержание диссертации по главам.

Первая глава посвящена решению задач 1-3 диссертационной работы.

В разделе 1.1 вводится понятие онтологии предметной области: существующие определения, виды онтологий, способы представления, области применения. Обсуждается роль тезаурусов и онтологий в автоматизации обработки, анализа, оценивания и распознавания изображений. Показывается, что необходимым условием указанной автоматизации является построение тезаурусного представления области анализа изображений. Тезаурус должен быть специализированным, т.е. являться средством представления современного состояния рассматриваемой области знания, включать все основные понятия и фиксировать существующие связи между этими понятиями - представлять знания и понятийную структуру соответствующей предметной области. В разделе 1.2. описана общая методология построения тезаурусов предметных областей: основные источники терминологии и методы отбора терминов при составлении словника, принципы построения

классификационных схем. В разделе 1.3 перечислены основные источники терминологии, использованные при составлении словника Тезауруса по анализу изображений (ТАИ).

Раздел 1.4. посвящен описанию структуры ТАИ. Структура ТАИ определяется современным состоянием теории анализа и распознавания изображений, накопленным опытом решения прикладных задач, функциональными требованиями и спецификой лексического наполнения языка предметной области. Она включает следующие базовые элементы: тематические разделы дескрипторов, функциональные категории дескрипторов, набор связей между дескрипторами, схема словарной статьи.

Выделены следующие направления, в соответствие с которыми в ТАИ формируются тематические разделы: лексика, описывающая само изображение; обработка изображений; анализ изображений; распознавание изображений; распознавание образов; прикладные задачи; общематематическая лексика.

Исходя из специфики предметной области «Анализ изображений», в ТАИ включены следующие категории терминов: 1) категория "Объекты", в которую входят: наименования видов изображений; наименования элементов изображений; 2) категория "Задачи", в которую входят: наименования задач обработки изображений; наименования задач анализа изображений; наименования задач распознавания образов, в т.ч. наименования задач распознавания изображений; 3) категория "Подходы", в которую входят: наименования подходов к обработке изображений; наименования подходов к анализу изображений; наименования подходов к распознаванию образов, т.ч. подходов к распознаванию изображений; 4) категория "Методы", в которую входят: наименования методов обработки изображений; наименования методов анализа изображений; наименования методов распознавания образов, в т.ч. наименования методов распознавания изображений; 5) категория "Инструменты", в которую входят: наименования инструментов (операторов, преобразований, фильтров) обработки изображений; наименования инструментов анализа изображений; наименования инструментов распознавания образов, в т.ч. наименования инструментов распознавания изображений; 6) категория "Характеристики", в которую входят: наименования характеристик инструментов; наименования характеристик (элементов описания) изображений.

Исходя из специфики предметной области была выявлена необходимость фиксировать в ТАИ помимо эквивалентной и иерархической связей следующие основные связи между дескрипторами, характерные для рассматриваемой предметной области: "задача - метод", "метод - инструмент", "инструмент -результат", "инструмент - характеристика инструмента" и др.

Элементы данных одного дескриптора объединены в словарную статью. Примеры словарных статей дескрипторов ТАИ приведены на рис. 1.

global operator

RUS глобальный оператор (изображений) global image operator global image transform operator global transform global transfonn operator IMAGE PROCESSING Global operators are a class of image processing operators, defined by [Klette, 1996]

image processing operator cosine transform Fourier transfonn Haar transform Hadamard transfonn Hartley transfonn Hough transfonn Karhunen-Loeve transfonn local operator . point operator

(а) Словарная статья дескриптора «global operator»

UF

SEC DEF

BTG RT

глобальный оператор

англ. global operator синонимы глобальный оператор изображений глобальный оператор обработки изображений

глобальное преобразование раздел ОБРАБОТКА ИЗОБРАЖЕНИЙ

опр. Глобальные операторы - класс операторов обработки изображений ...[Klette, 1996) \ выше-род оператор обработки изображений ассоц. косинусное преобразование преобразование Фурье преобразованиеХаара ?

преобразование Адамара преобразование Хартли преобразование Хафа "■'.. ■ преобразованиеКарунена-Лоова локальный оператор точечный оператор

(б) Словарная статья дескриптора «глобальный оператор»

Рис. 1. Примеры словарных статей дескрипторов.

Вторая глава посвящена решению задач 4-7 диссертационной работы.

В разделе 2.1 рассматриваются и обосновываются принципы построения классификации методов и задач обработки, анализа и распознавания изображений.

В ходе выполнения работы был составлен перечень задач, возникающих в процессе работы с изображениями. Выделенные задачи далее были разбиты на три функциональные группы: задачи обработки изображений, задачи анализа изображений и задачи распознавания изображений. Для разбиения задач на группы внутри каждой из трех выделенных категорий были использованы тематическая и техническая классификация. К тематическим задачам относятся задачи, определяющие цель преобразований изображения, а также задачи, которые соответствуют основным видам решений, которые принимаются по

информации, представленной в виде изображений. Технические задачи - это элементарные задачи, необходимые для решения тематических задач.

Целью обработки изображений, как правило, является повышение качества изображений для улучшения его визуального восприятия человеком, обработка изображений для их хранения, представления и передачи в системах машинного зрения или преобразование изображений таким образом, чтобы повысить эффективность их дальнейшего анализа и распознавания.

В данной работе к тематическим задачам обработки изображений были отнесены следующие: 1) сжатие изображений; 2) улучшение качества изображений; 3) восстановление изображений.

К техническим задачам обработки изображений относятся следующие: 1) преобразования, заключающиеся в применении к изображениям арифметических операций; 2) геометрические преобразования изображений; 3) яркостная и цветовая коррекция изображений; 4) преобразование контраста изображений; 5) преобразование гистограммы изображений; 6) усиление яркостных переходов на изображении; 7) удаление (подавление) шума на изображении; 8) фильтрация изображений; 9) сглаживание изображений; 10) повышение резкости изображений; 11) бинаризация тоновых изображений; 12) кодирование изображений; 13) дискретизация и квантование изображений.

Под анализом изображения понимается применение к нему системы преобразований, обеспечивающей извлечение из изображения полезной информации о свойствах изображаемого объекта или процесса. Результатом анализа изображений является приведение изображения к виду, удобному для распознавания, т.е. построение формального описания - модели изображения.

К тематическим задачам анализа изображений были отнесены следующие задачи: 1) выделение непроизводных элементов, групп пикселов - обнаружение углов, яркостных переходов, границ областей, локальных окрестностей, областей, кривых и т.д.; 2) сегментация изображений - разбиение изображения на однородные области или выделение областей с заданными свойствами; 3) описание выделенных непроизводных элементов, групп пикселов; 4) выбор, выделение и вычисление признаков изображений, признаков фрагментов изображений или признаков групп пикселов, используемых при построении моделей изображений; 5) построение и описание моделей изображений; 6) описание двухмерных объектов на изображении; 7) реконструкция

изображений - восстановление изображений в целом по их фрагментам; восстановление фрагментов изображения (и объектов) на основе непроизводных элементов и признаков, восстановление пропущенных кадров в последовательности изображений.

К техническим задачам анализа изображений относятся следующие: 1) связывание и классификация яркостных переходов; 2) прослеживание, группировка и представление границ областей; 3) построение остова области; 4) выделение, заполнение и анализ контуров; 5) сегментация кривых; 6) разбиение, заполнение, классификация и представление областей.

Задачей распознавания изображений является отнесение изображения, его фрагментов или представленных на нем объектов к некоторому классу, либо разбиение множества изображений, его фрагментов или представленных на нем объектов на несколько классов. Иногда в состав задачи распознавания включают приведение изображения к виду, удобному для распознавания, причем на этапе собственно распознавания в качестве исходной информации выступают модели изображения, его фрагментов или представленных на нем объектов.

В качестве тематических задач распознавания, возникающих при работе с исходной информацией, представленной в виде изображений, могут быть выделены следующие: 1) преобразование и оценивание моделей изображений; 2) сопоставление двух изображений в целом для установления их принадлежности к одному классу; 3) сопоставление изображения в целом с набором или серией последовательных изображений, представляющих некоторый класс изображений (цель - та же, что и в задаче 2); 4) задачи 2 и 3 для случая нескольких классов; 5) поиск на предъявленном на распознавание изображении некоторой регулярности / нерегулярности (объекта, ситуации), на которую следует обратить внимание, хотя она и не задавалась в априорном перечне эталонов; 6) поиск на предъявленном на распознавание изображении регулярности / нерегулярности / фрагмента заданного вида; 7) разбиение множества изображений на непересекающиеся подмножества (задача автоматической классификации); 8) выбор и формирование траектории задачи распознавания изображений (в смысле задачи распознавания со стандартной обучающей информацией); 9) решение задач 2-8 в случаях наличия на

изображениях динамических объектов, сложной фоновой обстановки и с учетом способа получения, формирования и представления изображений.

К техническим задачам распознавания изображений можно отнести: 1) приведение изображения к виду, удобному для распознавания: 1а) оценка информативности и адекватности признаков, использованных при построении модели изображения, фрагментов изображения или представленных на нем объектов; 16) определение и оценивание статистических характеристик признаков изображения, фрагментов изображения или представленных на нем объектов; 1в) оценка адекватности модели изображения, фрагментов изображения или представленных на нем объектов; 2) выбор модели алгоритмов распознавания для использования при решении предъявленной задачи распознавания; 3) выбор алгоритма в выбранной модели алгоритмов; 4) адаптация, обучение и модификация выбранного алгоритма применительно к предъявленной задаче распознавания; 5) комбинирование алгоритмов с целью решения предъявленной задачи распознавания и построение алгоритмической схемы, обеспечивающей решение задачи.

Описанную выше классификацию задач обработки, анализа и распознавания изображений можно использовать в качестве основы для построения базовой непротиворечивой классификации методов, т.е. каждой выделенной задаче необходимо поставить в соответствие группу методов, используемых для ее решения, например, методы фильтрации изображений, методы обнаружения яркостньгх переходов и т.д. Верхние уровни такой классификации методов зафиксированы в ТАИ. Далее каждый из выделенных классов методов можно разбивать на подклассы, исходя уже из индивидуальных особенностей каждого класса. Такая классификация требует глубокого изучения и детального исследования соответствующих подразделов предметной области и будет проведена в рамках дальнейших исследований.

В разделе 2.2 приводится общая характеристика базовой версии ТАИ.

Базовая версия ТАИ представляет собой тезаурус предметной области «Анализ изображений», содержащий 939 словарных статей. ТАИ обладает следующими характеристиками:

• Дескрипторы базовой версии ТАИ представлены на английском языке с

указанием русскоязычных эквивалентов. Большая часть дескрипторов

снабжена определениями понятий (на английском языке) со ссылкой на источник.

Базовая версия ТАИ включает 7 тематических разделов: раздел «IMAGE» («Изображение»); раздел «IMAGE PROCESSING» («Обработка изображений»), раздел «IMAGE ANALYSIS» («Анализ изображений»), раздел «IMAGE RECOGNITION» («Распознавание изображений»); раздел «PATTERN RECOGNITION» («Распознавание образов»), раздел «APPLIED PROBLEMS» («Прикладные задачи»); раздел «MATHEMATICS» («Математический аппарат»).

В базовой версии ТАИ зафиксированы следующие виды связей между терминами: эквивалентная связь (аббревиатуры и общепринятые сокращения, английские и американские варианты написания терминов, краткие формы терминов), иерархическая связь (отношения типа «род-вид» и «часть-целое») и ассоциативная связь.

Количественные характеристики базовой версии ТАИ: общее число словарных статей - 939, в том числе: общее число словарных статей дескрипторов - 468, общее число словарных статей аскрипторов - 471. Общее число словарных статей с определениями - 425. Максимальная глубина иерархии - 6.

ТАИ разработан в соответствии с существующими российскими и международными стандартами и реализован в печатном и электронном виде. Печатный вариант ТАИ состоит из 2-х частей: алфавитного перечня всех терминов, включенных в ТАИ, и лексико-семантического указателя -перечня словарных статей, расположенных в алфавитном порядке заглавных дескрипторов. Печатный вариант базовой версии ТАИ приведен в приложениях 1 и 2 к диссертационной работе. Электронный вариант ТАИ представляет собой программный модуль, который может быть использован как в составе баз знаний для работы с изображениями, так и отдельно в качестве самостоятельного словаря-справочника.

ТАИ предназначен для решения следующих задач: 1) классификация и унификация понятий предметной области; 2) классификация методов и задач обработки, анализа, понимания и распознавания изображений; 3) построение описаний методов и задач обработки, анализа, понимания и распознавания изображений в базах знаний для поддержки анализа

15

изображений; 4) автоматизация информационного поиска в базах знаний для поддержки анализа изображений; 5) классификация, индексирование и поиск библиографической и справочной информации по данной тематике; 6) автоматизация обучения в области обработки, анализа и распознавания изображений.

В разделе 2.3 описан подход и основные этапы создания онтологии предметной области «Анализ изображений» (ОАИ) на основе разработанного тезауруса.

Введем определения основных понятий, которые будут использоваться далее.

Задачи, связанные с обработкой и анализом изображений, как правило, характеризуются конечной целью, которую необходимо достичь, входными данными и требованиями к результату. Формально определение понятия «задача» выглядит следующим образом.

Определение 1. Задача Т(Ст, 1т, Кг, Сг,) определяется целью Сг, входными данными 1 у , набором требований Яг и контекстом Сг , где цель Сгу - искомый результат решения задачи; 1Т - описание входных данных; Яг - требования к конечному результату; контекст Сг - любая информация полезная для решения задачи.

Как правило, для решения одной и той же задачи могут быть использованы разные методы.

Определение 2. Метод - алгоритмическая процедура, набор алгоритмических процедур или алгоритмическая схема, обладающие следующими свойствами: областью применимости - перечнем задач, которые данный метод, позволяет решить; входными и выходными данными; набором подзадач, решение которых необходимо для реализации данного метода (составной метод), или некоторым оператором (простым или составным) (простой метод).

Множество {М,) - множество методов решения задачи Т(С1Г,1ЪКЪСТ,), если М/. {1гЛ,Сг)~>Ст, где г/ель Сг - искомый результат решения задачи; 1Т -описание входных данных; - требования к конечному результату; контекст СТ - любая информация полезная для решения задачи.

Для представления ОАИ был выбран язык описания онтологии OWL (Ontology Web Language). OWL-онтология состоит из следующих компонентов: классы, свойства классов и индивиды (представители классов или свойств).

В соответствии с определением 1 был введен один из основных классов ОАИ - класс Task (Задача), который описывает задачи, возникающие при работе с изображениями. Данный класс имеет следующие свойства: 1) свойство goal (цель), значением которого является символьная строка, например, «улучшение контраста изображения»', 2) свойство hasSubtask (подзадача), значением которого являются один или несколько элементов класса Task (задача); 3) свойство haslnput (входные данные), значением которого являются элементы класса Data (Данные); 4) свойство hasContext (контекст), значением которого являются элементы класса Context (Контекст); 5) свойство hasRequirements (требования), значением которого являются элементы класса Requirements); 6) свойство isSovedBy (решается с помощью), значением которого являются элементы класса Method.

Экспериментальная версия ОАИ включает следующие подклассы класса Task: класс CompressionTask (задача сжатия), класс DetectionTask (задача выделения), класс EnhancementTask (задача улучшения качества), класс RestorationTask (задача восстановления), класс SegmentationTask (задача сегментации).

Аналогично в соответствии с определением 2 был введен класс Method (Метод) ОАИ, который описывает существующие алгоритмы обработки, анализа и распознавания изображений. Данный класс имеет следующие основные свойства: 1) свойство solves (решает), значением которого являются один или несколько элементов класса Task (Задача); 2) свойство useContext (контекст), значением которого являются элементы класса Context (Контекст); 3) свойство haslnput (входные данные), значением которого являются элементы класса Data (Данные); 4) свойство hasResult (результат), значением которого являются элементы класса Data (Данные); 5) свойство isPerformedBy (реализуется с помощью), значением которого являются один или несколько элементов класса Operator (Оператор).

Класс Operator (Оператор) описывает известные операторы изображений.

Иерархия подклассов класса Method (Метод) построена в соответствии с иерархией подклассов класса Task (Задача), например, для класса SegmentationTask (задача сегментации) существует соответствующий класс SegmentationMethod (метод сегментации), содержащий описания существующих методов, используемых для решения задач сегментации изображений. На рис. 2 показана связь между основными классами ОАИ.

вхооные

~ /результат ДАННЫЕ >..........вхо0нш —Т-

i

/результат реализуется с . помощью

-I---у----------

,..........................JL_...... " .

й?5=-..........метод "V

( требования >—---------""от ______________

4 ______ ______'^входные у'''

данные (

4 имеет\ I решается с

\[ помощью

......I

ЗАДАЧА У<

1 "^"-'Т

'■■. имеет У пола да чу

Рис.2. Связь между основными классами ОАИ.

Следует отметить, что к настоящему моменту разработана экспериментальная версия онтологии, которая базируется на результатах и подходе к обработке, анализу и распознаванию изображений научной школы академика Ю.И.Журавлева, отражает представление автора о концептуальной основе предметной области и существенно использует структуру и наполнение базовой версии ТАИ. Естественно, что в дальнейшем данная версия онтологии должна послужить основой для разработки более полных, а также специализированных онтологии по обработке, анализу и распознаванию изображений, с учетом точек зрения и экспертной оценки широкого круга ученых и специалистов в данной предметной области.

Третья глава посвящена решению задачи 8 диссертационной работы, связанной с созданием информационно-справочного интернет-ресурса (ИСИР) по обработке, анализу и распознаванию изображений.

Предложенный в рамках данной работы ИСИР на основе тезауруса предметной области обеспечит интеграцию и систематизацию существующих источников информации по рассматриваемой тематике, позволит производить

семантически - и тематически-ориентированный поиск необходимых данных в терминах предметной области портала (на русском и английском языках) и обеспечит удобную навигацию.

Предлагаемый ИСИР будет размещаться на сервере в сети Интернет и представлять собой научно-информационный портал знаний, содержащий: 1) специализированный тезаурус' по анализу изображений (ТАИ); 2) документально-библиографическую БД с информацией о публикациях и изданиях (статьях, монографиях, журналах, сборниках трудов конференций, диссертациях, научных отчетах), посвященных проблеме обработки, анализа, распознавания и понимания изображений; 3) упорядоченный каталог информационных ресурсов по рассматриваемой тематике (адресно-справочная БД), содержащий информацию по следующим разделам: научные и образовательные интернет-ресурсы; словари и глоссарии; электронные библиотеки; библиографические базы данных; научные семинары и конференции; научные ассоциации и сообщества; научно-исследовательские организации, коллективы и персоналии; научное ПО и научные поисковые системы; 4) средства поиска информации в сети Интернет, обеспечивающие: формирование, уточнение и расширение запроса пользователя на основе и с помощью тезауруса; передачу сформированного запроса на известные поисковые системы; отображение результатов поиска.

ТАИ является не только самостоятельным информационным ресурсом, но и будет выполнять структурообразующую функцию ИСИР. ТАИ является инструментом для классификации, описания и поиска информации, содержащейся в ИСИР. Следует отметить, что в ИСИР будет использоваться расширенная версия ТАИ. Помимо информации, зафиксированной в базовой версии, словарные статьи ТАИ ИСИР будут содержать ссылки на соответствующие публикации и издания из документально-библиографической БД, а также ссылки на другие материалы ИСИР, связанные с тем или иным понятием, описанным в ТАИ. Поиск ресурсов может вестись двумя способами: 1) поиск по ключевым словам; 2) навигация по ТАИ, то есть поиск сначала нужного понятия в ТАИ с последующим запросом ресурсов, соответствующих этому понятию. При поиске ресурсов по ключевым словам поисковая система может, используя ТАИ, расширять результаты поиска и выдавать пользователю

не только ресурсы, соответствующие введенным пользователем ключевым словам, но и ресурсы, соответствующие связанным с ними понятиям.

В соответствии с общей концепцией разработаны архитектура и функциональная схема ИСИР. Предложенная архитектура включает 2 основные части: 1) программный комплекс разработки и сопровождения ИСИР; 2) серверная часть.

Программный комплекс разработки и сопровождения ИСИР предназначен для формирования проблемно-ориентированного наполнения БД ИСИР. Основные функции комплекса: 1) наполнение документально-библиографической БД; 2) наполнение адресно-справочной БД; 3) наполнение БД ТАИ. В состав комплекса входят: 1) БД ИСИР, содержащая БД ТАИ, документально-библиографическую и адресно-справочную БД; 2) оконные интерфейсы ввода и редактирования записей БД; 3) интерфейс для экспорта данных в серверную часть; 4) управляющая подсистема, которая обеспечивает взаимодействие и обмен информацией между всеми функциональными модулями комплекса.

Серверная часть ИСИР включает: a) HTML страницы ресурса; б) скрипты функций, программно-генерируемых запросов и страниц-интерфейсов ИСИР; в) БД сервера.

БД серверной части имеет структуру, аналогичную структуре БД ИСИР. Кроме того, в состав БД сервера входят служебные таблицы, предназначенные для администрирования БД ресурса (таблицы содержат перечень пользователей и их права, а также набор стандартных запросов к БД).

Предложенная архитектура ИСИР позволяет модифицировать отдельные компоненты независимо от других элементов ИСИР и в дальнейшем пополнять ресурс новыми функциональными элементами.

Глава четыре посвящена решению задачи 9 диссертационной работы.

В разделе 4.1 описан оригинальный метод использования тезаурусов и онтологий при решении задач анализа изображений, включающий набор условий, необходимых для его применения, и собственно описание итерационных шагов метода.

Предложенный знание-ориентированный метод основан на использовании тезаурусов и онтологий в качестве инструментов представления знаний,

необходимых для принятия интеллектуальных решений по информации, извлекаемой из изображений. В данном случае тезаурусы и онтологии необходимы для решения следующих задач: 1) формирование единообразного способа описания и представления задач анализа изображений и методов их решения; 2) автоматизация комбинирования методов и синтеза алгоритмических схем анализа* изображений на основе семантической интеграции; 3) лингвистическая поддержка баз знаний для автоматизации обработки и анализа изображений (формирование, обработка и расширение запросов; навигация; структуризация и оптимизация представления знаний; организация хранения знаний; пополнение знаний).

Для поддержки принятия решений в области анализа и понимания изображений необходимы следующие онтологии: 1) онтология анализа изображений (ОАИ), которая функционально состоит из двух частей: онтологии задач, возникающих при работе с изображениями, и онтологии существующих методов обработки, анализа, распознавания и понимания изображений; 2) онтология или набор онтологии прикладных предметных областей, описывающие область знания, к которой относится решаемая задача.

ОАИ является понятийной основой баз знаний для поддержки автоматизации анализа изображений и в некотором смысле сама по себе может рассматриваться как база знаний. Тезаурусы же обеспечивают терминологическую поддержку и помогают пользователям сформулировать запрос к системе, в том числе, подобрать правильные ключевые слова для описания цели, имеющихся исходных данных, искомого результата и контекстной информации. Тезаурус также необходим для навигации в базе знаний, а также для автоматического уточнения и расширения запроса, введенного пользователем, посредством использования зафиксированных в тезаурусе связей между терминами.

Кроме того, для решения прикладных задач необходимо также включение в систему специализированных тезаурусов и онтологий прикладных предметных областей. Онтологии прикладных предметных областей должны быть объединены с онтологией анализа изображений с тем, чтобы установить связь между понятиями прикладной области знания, к которой относится решаемая задача, и понятиями, связанными с обработкой и анализом изображений, например, важно зафиксировать отношения между объектами на изображениях,

описываемыми в терминах прикладной предметной области, и соответствующими признаками изображений, описанными в онтологии анализа изображений. В результате такого объединения будет получена проблемно-ориентированная онтология анализа изображений, описывающая прикладные задачи и методы решения этих задач.

Таким образом, необходимыми условиями для реализации метода использования тезаурусов и онтологий при решении задач анализа изображений являются следующие: 1) постановка задачи в виде, соответствующем определению 1, т.е. задание цели, описание входных данных, требований к результату и контекстной информации; 2) наличие следующего набора алгоритмическо-программных средств, которые, как правило, включаются в некоторую автоматизированную систему анализа изображений: а) база знаний по анализу изображений; б) библиотека алгоритмов обработки, анализа и распознавания изображений; в) специализированный тезаурус по анализу изображений; г) онтология анализа изображений; д) специализированные тезаурусы прикладной предметной области; е) специализированные онтологии прикладной предметной области; ж) проблемно-ориентированная онтология анализа изображений.

Предлагаемый метод использования тезаурусов и онтологий при решении задач анализа изображений предусматривает выполнение следующих шагов: Шаг 1: Постановка задачи. Пользователь с помощью ключевых слов, включенных в тезаурусы, описывает цель, входные данные, требования к результату и всю полезную информацию о решаемой задаче. Шаг 2: На основе введенной пользователем информации формируется запрос к базе знаний.

Шаг 3: Результатом запроса является множество задач, описания которых включают ссылки на соответствующие методы (алгоритмы) решения этих задач. Данное множество формируется на основе знаний, представленных в онтологии. Выбранные задачи ранжируются в соответствии с введенной мерой близости. Если ни одного описания задачи в базе знаний найдено не было, то происходит автоматическое расширение запроса посредством использования отношений между понятиями, зафиксированных в онтологиях.

Шаг 4: На исполнение отправляется метод, соответствующий первому из ранжированных описаний. Если полученный результат не удовлетворяет пользователя, то на исполнение отправляется следующий метод и т.д. Шаг 5: Если искомый результат так и не был достигнут, то строится алгоритмическая схема из двух методов с наивысшими приоритетами. Если полученный результат не удовлетворяет пользователя, то строится алгоритмическая схема из двух других методов и т.д.

Шаг б: Если искомый результат так и не был достигнут, то интерактивно с пользователем уточняется введенный ранее запрос, либо формируется новый. Далее шаги 2-6 повторяются до тех пор, пока желаемый результат не будет получен.

В разделе 4.2 описываются специализированные (ЖЬ-онтологии, разработанные для выполнения необходимых условий применимости предложенного в рамках диссертационной работы метода использования тезаурусов и онтологий при решении задач анализа изображений, для решения задач автоматизации анализа микроскопических изображений клеток крови.

Для дифференциальной диагностики опухолей системы крови и исследования закономерностей опухолевой прогрессии фундаментальной является проблема морфологического анализа клеток крови. На морфологии клеток, определяемой в цитологических и гистологических препаратах, базируется большинство современных классификаций опухолей системы крови.

Проблема автоматизации анализа изображений клеток крови находится на стыке следующих предметных областей: молекулярная биология, медицина, микроскопия и обработка и анализ изображений. В рамках проведенных исследований были разработаны следующие (ЖЬ-онтологии, необходимые для поддержки анализа микроскопических изображений клеток: онтология клеточной биологии; онтология микроскопии; онтология микроскопических изображений клеток; онтология признаков изображений клеток.

Для экспериментального исследования эффективности использования разработанных онтологий было разработано ПО, включающее библиотеку алгоритмов сегментации микроскопических изображений клеток и позволяющее извлекать различные группы признаков из изображений. Разработанное программное инструментальное средство предоставляет

следующие возможности: 1) помогает сформулировать задачу, связанную с анализом изображений клеток различного типа; 2) автоматически выбирает алгоритм сегментации; 3) предлагает пользователю набор признаков, которые необходимо вычислить, в соответствии с конкретной задачей. Результаты использования разработанной экспериментальной версии ОАИ выявили необходимость в ее дальнейшем развитии и модификации с целью повышения точности, расширения возможности использования и стандартизации описания знаний, используемых при решении задач анализа изображений и извлечения из них информации, необходимой для принятия интеллектуальных решений.

В Заключении сформулированы основные научные и практические результаты работы, обсуждаются перспективные направления дальнейших исследований.

Список основных публикаций по теме диссертации

По результатам диссертации в реферируемых изданиях опубликовано 28 работ, в том числе 6 работ опубликовано в изданиях, входящих в перечень ведущих рецензируемых журналов и изданий, рекомендованных ВАК для публикации основных результатов диссертации на соискание ученой степени доктора и кандидата наук. Основные результаты опубликованы в следующих работах:

1. Белоозеров В.Н., Гуревич И.Б., Мурашов Д.М., Трусова Ю.О. Концепция создания интернет-ресурса по обработке, анализу и распознаванию изображений // Тезисы докладов 7-ой Всероссийской с участием стран СНГ конференции «Методы и средства обработки сложной графической информации», Нижний Новгород, 15-18 сентября, 2003. - С. 11-12.

2. Белоозеров В.Н., Гуревич И.Б., Мурашов Д.М., Трусова Ю.О. Об основных особенностях построения и применения тезауруса предметной области "Обработка и анализ изображений"//Труды 6-ой Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии", Великий Новгород, 21-26 октября, 2002: В 2-х т. - Великий Новгород, 2002. - Т.1. - С.56-60.

3. Трусова Ю.О., Белоозеров В.Н., Гуревич И.Б. Тезаурусное представление онтологии предметной области анализа изображений // Компьютерная лингвистика и интеллектуальные технологии: Труды международной

конференции Диалог'2004 ("Верхневолжский", 2-7 июня 2004 г.). - М.: Наука, 2004.-С. 616-621.

4. Asirelli P., Colantonio S., Gurevich I., Martinelli M., Salvetti О. Trusova Yu. Ontology Driven Approach to Image Understanding // 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies (PRIA-8-2007). Conference proceedings. In 3 volumes. - Yoshkar-Ola, 2007.-Vol.1.-P. 67-71.

5. Beloozerov V.N., Gurevich I.В., Gurevich N.G., Murashov D.M., Trusova Yu.O. Thesaurus for Image Analysis: Basic Version // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2003. - Vol. 13, No.4. - P. 556-569.

6. Beloozerov V.N., Gurevich I.В., Murashov D.M., Trusova Yu.O. Construction and Use of a Thesaurus in Image Analysis and Processing // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2003. -Vol. 13, No.l. - P. 67-69.

7. Beloozerov V.N., Gurevich I.В., Trusova Yu.O. Representation of the Ontology of an Image Analysis Domain for Optimization of Information Retrieval // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2005. - Vol. 15, No.2. - P. 358-360.

8. Beloozerov V.N., Murashov D.M., Trusova Yu.O., Yanchenko D.A. Searching for Solutions in the Image Analysis and Processing Knowledge Base // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2005. - Vol. 15, No.2. - P. 361-364.

9. Colantonio S., Gurevich I., Martinelli M., Salvetti O., Trusova Yu. Thesaurus-based Ontology on Image Analysis // Semantic Multimedia. Second International Conference on Semantics and Digital Media Technologies, SAMT 2007, Genoa, Italy, December 5-7, 2007, Proceedings /B.Falcidieno et al. (Eds.): SAMT 2007, LNCS 4816. - Springer-Verlag Berlin Heidelberg, 2007. - P. 113-116.

10.Colantonio S., Gurevich I., Martinelli M., Salvetti O., Trusova Y. Cell Image Analysis Ontology //'Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - Pleiades Publishing, Ltd., 2008. -Vol.18, No.2.-P.332-341.

11.Colantonio S., Gurevich I., Pieri G., Salvetti O., Trusova Yu. Ontology-Based Framework to Image Mining // Image Mining Theory and Applications:

25

Proceedings of the 2nd International Workshop on Image Mining Theory and Applications - IMTA 2009 (in conjunction with VISIGRAPP 2009), Lisboa, Portugal, February 2009,-Portugal: INSTICC PRESS, 2009. - P.l 1-19.

12.Gurevich I.B., Khilkov A.V., Koryabkina I.V., Murashov D.M., Trusova Yu.O. An Open General-Purposes Research System for Automating the Development and Application of Information Technologies in the Area of Image Processing, Analysis, and Evaluation // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - MAIK "Nauka/Interperiodica"/Pleiades Publishing, Inc., 2006. - Vol.16, No.4. - P.530-563.

13.Trusova Yu. Image analysis thesaurus. Version 1.0 // Pattern Recognition and Information Processing (PRIP'2007): Proceedings of the 9th International Conference (Minsk, Republic of Belarus, May 2007): In 2 volumes. - Minsk, 2007.-Vol.2.-P.210-214.

14.Trusova Yu. Main Concepts and Elements of the Ontology on Image Processing and Analysis // 9th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008): Conference Proceedings. In 2 volumes. - Nizhni Novgorod: N.I.Lobachevsky State University of Nizhni Novgorod, 2008. - Vol.2. -P.228-231.

15.Trusova Yu., Gurevich I., Beloozerov V., Murashov D. Linguistic support of the knowledge base for image analysis and understanding system // Proceedings of VISAPP 2007 - 2nd International Conference on Computer Vision Theory and Applications, Barcelona, Spain, March 8-11, 2007. Volume Special Sessions. -Portugal: INSTICC Press, 2007. - P. 194-199.

Подписано к печати 10.04.2009г. Тираж 100 экз. Печ. лист. 1. Заказ Л'» 75. УОП Института этнологии и антропологии РАН Ленинский проспект, 32А

Оглавление автор диссертации — кандидата технических наук Трусова, Юлия Олеговна

ВВЕДЕНИЕ.

ГЛАВА 1. ПОСТРОЕНИЕ ТЕЗАУРУСА ПО АНАЛИЗУ ИЗОБРАЖЕНИЙ.

1.1 Лингвистические средства описания предметных областей. Тезаурусы и онтологии.

1.2 Общая методология построения тезауруса предметной области.

1.3 Разработка словника Тезауруса по анализу изображений.

1.4 Разработка структуры Тезауруса по анализу изображений.

ГЛАВА 2. ТЕЗАУРУС ПО АНАЛИЗУ ИЗОБРАЖЕНИЙ. БАЗОВАЯ ВЕРСИЯ.

2.1 Построение классификации методов и задач обработки, анализа и распознавания изображений.

2.2 Общая характеристика базовой версии Тезауруса по анализу изображений.

2.3 Разработка структуры онтологии анализа изображений на основе Тезауруса по анализу изображений.

ГЛАВА 3. ИНФОРМАЦИОННО-СПРАВОЧНЫЙ ИНТЕРНЕТ-РЕСУРС (ИСИР) ПО ОБРАБОТКЕ, АНАЛИЗУ И РАСПОЗНАВАНИЮ ИЗОБРАЖЕНИЙ.

3.1 Общая концепция ИСИР.

3.2 Архитектура и функциональная схема ИСИР.

3.3 Информационное наполнение ИСИР.

ГЛАВА 4. ИСПОЛЬЗОВАНИЕ ТЕЗАУРУСОВ И ОНТОЛОГИЙ ПРИ РЕШЕНИИ ПРИКЛАДНЫХ ЗАДАЧ АНАЛИЗА ИЗОБРАЖЕНИЙ.

4.1 Метод использования тезаурусов и онтологий при решении задач анализа изображений.

4.2 Специализированные онтологии для задач автоматизации диагностического анализа изображений цитологических препаратов.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Трусова, Юлия Олеговна

Одной из фундаментальных проблем информатики является проблема обработки, анализа, оценивания и понимания информации, представленной в виде изображений. Изображения обладают информационной емкостью, компактностью и наглядностью и являются одним из основных средств представления информации в научных исследованиях, медицине, экологии и технике.

Целью диссертационной работы является построение формализованного представления предметной области «Анализ изображений» в виде специализированного тезауруса по анализу изображений и на его основе экспериментальной версии онтологии по анализу изображений, которые: 1) позволят систематизировать плохо структурированный и продолжающий развиваться понятийный аппарат предметной области; 2) будут служить терминологической и понятийной основой для классификации и описания задач и методов обработки, анализа и распознавания изображений в базах знаний для работы с изображениями; 3) обеспечат автоматизацию информационного поиска в базах знаний по обработке, анализу и распознаванию изображений и базах данных изображений. Кроме того, тезаурус будет являться самостоятельным словарем-справочником, который поможет ориентироваться в данной предметной области, и обеспечит возможность создания на его основе информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

Важным направлением ориентированных фундаментальных и прикладных исследований является разработка автоматизированных систем обработки, анализа, оценивания и понимания изображений. Необходимыми предпосылками создания таких систем являются автоматизация: а) выбора метода решения предъявленной задачи; б) выдачи рекомендаций по выбору метода решения для класса задач, к которому относится предъявленная задача; в) синтеза алгоритмических процедур решения предъявленной задачи; г) выдачи рекомендаций по синтезу алгоритмических процедур решения предъявленной задачи.

Необходимым условием достижения указанных целей является систематизация, структуризация и, в некотором смысле, формализация знаний в области обработки, анализа и распознавания изображений. Известно, что одним их эффективных способов представления знаний являются онтологии предметных областей. Онтологии служат для явного формального машинно-интерпретируемого описания семантики данных некоторой области знания и являются подходящим инструментом для представления знаний, используемых для извлечения информации из изображений. Необходимым начальным шагом на пути к созданию онтологии является разработка тезауруса предметной области как логико-понятийной основы этой онтологии. В этом смысле тезаурус должен быть специализированным, т.е. являться средством представления современного состояния рассматриваемой области знания, включать все основные понятия и фиксировать существующие связи между этими понятиями - представлять знания и понятийную структуру соответствующей предметной области.

Диссертационная работа посвящена построению формализованного представления предметной области «Анализ и оценивание информации, представленной в виде изображений». В качестве основных разделов данной предметной области обычно выделяют обработку, анализ, распознавание и понимание изображений, причем для ее определения обычно используется обобщенный термин «Анализ изображений». В качестве способа формализации выбрано построение тезаурусного представления онтологии предметной области, т.е. создание специализированного тезауруса по анализу изображений.

Анализ изображений является чрезвычайно быстро развивающимся разделом информатики, в связи с чем его понятийная структура динамично изменяется. С другой стороны, эффективность исследований в области анализа изображений и решения прикладных задач анализа изображений в существенной степени зависят от стандартизации и формализации используемых описаний как собственно изображений, так и описаний методов их обработки, анализа и распознавания. Тезаурусное представление области анализа изображений можно использовать в качестве инструмента указанных стандартизации и формализации, а также обеспечения доступа квалифицированных и неквалифицированных пользователей, решающих задачи анализа изображений, к знаниям по анализу изображений, в том числе, например, с помощью создания соответствующих интернет-ресурсов. Существенным при этом является то обстоятельство, что тезаурус по анализу изображений и построенная на его основе онтология позволят использовать удобные и эффективные процедуры доступа к стандартизированным и структурированным представлениям этих знаний.

Таким образом, актуальной задачей является построение тезауруса по анализу изображений, необходимого для логической формализации данной предметной области, стандартизации понятийного аппарата, построения общих и частных онтологий предметной области и на этой основе автоматизации обработки, анализа, оценивания и распознавания изображений; для построения баз знаний по анализу изображений; для организации эффективного поиска и навигации в базах знаний по анализу изображений и для построения баз данных изображений.

Анализ литературы и личный опыт участия в ведущих международных конференциях по данной тематике показал, что специализированный тезаурус в области обработки, анализа, понимания и распознавания изображений в настоящее время отсутствует.

Для достижения заявленной цели диссертационной работы поставлены и решены следующие задачи:

1. исследование системы и логики знаний в области обработки, анализа, оценивания и понимания изображений;

2. разработка и обоснование структуры тезауруса по анализу изображений на основе оригинальной классификации задач и методов обработки, анализа и распознавания изображений;

3. отбор терминологии и разработка словника тезауруса по анализу изображений;

4. построение классификации задач обработки, анализа и распознавания изображений;

5. построение классификации методов обработки, анализа и распознавания изображений;

6. разработка базовой версии специализированного тезауруса по анализу изображений;

7. разработка экспериментальной версии онтологии анализа изображений на основе тезауруса по анализу изображений;

8. разработка концепции, архитектуры, функциональной схемы и требований к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений на основе тезауруса по анализу изображений;

9. разработка метода использования тезаурусов и онтологий при решении задач анализа изображений.

Основными результатами работы, выносимыми на защиту, являются:

Базовая версия тезауруса по анализу изображений.

Экспериментальная версия онтологии анализа изображений на языке OWL.

Концепция, архитектура, функциональная схема и требования к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

Классификация задач обработки, анализа и распознавания изображений.

Метод использования тезаурусов и онтологий при решении задач анализа изображений.

Основные результаты работы являются новыми и оригинальными. Научная новизна результатов определяется актуальностью работы, поскольку, как уже отмечалось выше, такой инструмент как тезаурус, необходимый для автоматизации анализа изображений, отсутствует. Задача разработки представления предметной области «Анализ изображений» в виде специализированного тезауруса и основанной на нем онтологии поставлена и решена впервые в мировой практике. Предложенный метод использования тезаурусов и онтологий при решении задач анализа изображений иллюстрирует прикладное значение разработанных тезауруса и онтологии. Информационно-справочный интернет-ресурс по обработке, анализу и распознаванию изображений в настоящее время также отсутствует.

Практическая ценность диссертационной работы подтверждается полученными на основании ее результатов 2 патентами Российской Федерации (патент на изобретение и патент на полезную модель) и регистрацией разработок в Государственном регистре баз данных ФГУП НТЦ "Информрегистр"(3 регистрационных свидетельства) и в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам (Роспатент) (2 свидетельства о государственной регистрации баз данных).

Материалы, изложенные в диссертационной работе, были доложены на 17 ведущих международных конференциях и семинарах в области анализа и распознавания изображений и компьютерной лингвистики. По теме диссертации опубликовано 28 работ, в том числе 6 работ опубликовано в изданиях, входящих в перечень ведущих рецензируемых журналов и изданий, рекомендованных ВАК для публикации основных результатов диссертации на соискание ученой степени доктора и кандидата наук.

Представленная работа состоит из четырех глав, введения, заключения, библиографического списка использованной литературы и трех приложений. Объем основного текста работы - 111 страниц, список литературы содержит 108 источников.

Первая глава диссертационной работы посвящена решению задач 1-3 диссертационной работы. Вводится понятие онтологии предметной области: существующие определения, виды онтологий, области применения. Обсуждается роль тезаурусов и онтологий в автоматизации обработки, анализа, оценивания и распознавание изображений. Показывается, что необходимым условием указанной автоматизации является построение тезаурусного представления области анализа изображений. Описывается общая методология построения тезаурусов: основные методы отбора терминов, построение классификационных схем. Приводится перечень и анализ основных источников терминологии, используемых при составлении словника Тезауруса по анализу изображений. Обосновывается структура разработанного тезауруса. Описываются основные элементы словарной статьи тезауруса, категории понятий, виды связей между терминами, источники определений терминов.

Вторая глава посвящена решению задач 4-7 диссертационной работы. Приводится описание и анализ существующих классификаторов и рубрикаторов по рассматриваемой и смежным тематикам. Рассматриваются и обосновываются принципы построения классификации методов и задач обработки, анализа и распознавания изображений. Приводится общая характеристика базовой версии разработанного тезауруса по анализу изображений - количественные характеристики, виды представления, основные функции. Описываются подход и основные этапы создания онтологии предметной области «Обработка, анализ и распознавание изображений» на основе разработанного тезауруса. Рассматривается и обосновывается структура экспериментальной версии онтологии.

Третья глава посвящена решению задачи 8, связанной с созданием информационно-справочного интернет-ресурса (ИСИР) по обработке, анализу и распознаванию изображений. Приводится обзор существующих интернет-ресурсов по рассматриваемой и смежным тематикам. Обосновывается необходимость создания ИСИР. Описываются общая концепция, архитектура, функциональная схема и требования к информационному наполнению ИСИР.

Четвертая глава посвящена решению задачи 9. Предложен оригинальный метод использования тезаурусов и онтологий при решении задач анализа изображений, включающий набор условий, необходимых для его применения, и собственно описание итерационных шагов метода. Приводится описание специализированных (>№Ь-онтологии, разработанных для выполнения необходимых условий применимости предложенного метода для решения задач автоматизации морфологического анализа изображений клеток крови.

В Заключении сформулированы основные научные и практические результаты работы, обсуждаются перспективные направления дальнейших исследований.

Заключение диссертация на тему "Представление предметной области "Анализ изображений" в виде специализированного тезауруса"

Основные результаты опубликованы в следующих работах:

1. Белоозеров В.Н., Гуревич И.Б., Мурашов Д.М., Трусова Ю.О. Информационно-поисковый тезаурус по автоматизации обработки и распознавания изображений // Материалы 6-ой Международной конференции "Информационное общество. Интеллектуальная обработка информации. Информационные технологии", Москва, 16-18 октября 2002 г. - М.: ВИНИТИ, 2002. - С.49-52.

2. Белоозеров В.Н., Гуревич И.Б., Мурашов Д.М., Трусова Ю.О. Концепция создания интернет-ресурса по обработке, анализу и распознаванию изображений // Тезисы докладов 7-ой Всероссийской с участием стран СНГ конференции «Методы и средства обработки сложной графической информации», Нижний Новгород, 15-18 сентября, 2003. - С. 11-12.

3. Белоозеров В.Н., Гуревич И.Б., Мурашов Д.М., Трусова Ю.О. Об основных особенностях построения и применения тезауруса предметной области "Обработка и анализ изображений" // Труды 6-ой Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии", Великий Новгород, 21-26 октября, 2002: В 2-х т. - НовГУ им. Ярослава Мудрого, Великий Новгород, 2002. - Т.1. - С.56-60.

4. Белоозеров В.Н., Гуревич И.Б., Трусова Ю.О. Лингвистическое обеспечение системы автоматизации анализа изображений // Информационное общество. Интеллектуальная обработка информации. Информационные технологии. Материалы 7-ой международной конференции Москва, 24-26 октября 2007 г. -М.: ВИНИТИ, 2007. - С. 42-43.

5. Трусова Ю.О., Белоозеров В.Н., Гуревич И.Б. Тезаурусное представление онтологии предметной области анализа изображений // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции Диалог'2004 ("Верхневолжский", 2-7 июня 2004 г.)/Под ред. И.М. Кобозевой, А.С. Нариньяни, В.П. Селегея. - М.: Наука, 2004. - С. 616 - 621.

6. Asirelli P., Colantonio S., Gurevich I., Martinelli M., Salvetti О. Trusova Yu. Ontology Driven Approach to Image Understanding // 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies (PRIA-8-2007). Conference proceedings. In three volumes. - Yoshkar-Ola, 2007. - Vol.l. - P. 67-71.

7. Beloozerov V.N., Gurevich I.B., Gurevich N.G., Murashov D.M., Trusova Yu.O. Thesaurus for Image Analysis: Basic Version // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2003. - Vol. 13, No.4.

- P. 556-569.

8. Beloozerov V.N., Gurevich I.B., Murashov D.M., Trusova Yu.O. Construction and Use of a Thesaurus in Image Analysis and Processing // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2003. - Vol. 13, No.l.

- P. 67-69.

9. Beloozerov V.N., Gurevich I.B., Murashov D.M., Trusova Yu.O. Image Analysis Thesaurus. General Outline and Prospects // Proceedings of the 6th German-Russian Workshop "Pattern Recognition and Image Understanding" (OGRW-6-2003), Katun Village, Altai region, Russian Federation, August, 25-30, 2003. - Novosibirsk, 2003. -P. 70-73.

10.Beloozerov V.N., Gurevich I.B., Trusova Yu.O. Representation of the Ontology of an Image Analysis Domain for Optimization of Information Retrieval // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2005. - Vol. 15, No.2. - P. 358-360.

11 .Beloozerov V.N., Murashov D.M., Trusova Yu.O., Yanchenko D.A. Searching for Solutions in the Image Analysis and Processing Knowledge Base // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - 2005. - Vol. 15, No.2.- P. 361-364.

12.Colantonio S., Gurevich I., Martinelli M., Salvetti O., Trusova Yu. Thesaurus-based Ontology on Image Analysis // Semantic Multimedia. Second International Conference on Semantics and Digital Media Technologies, SAMT 2007, Genoa, Italy, December 57, 2007, Proceedings /B.Falcidieno et al. (Eds.): SAMT 2007, LNCS 4816. - SpringerVerlag Berlin Heidelberg, 2007. -P.l 13-116.

13.Colantonio S., Gurevich I., Martinelli M., Salvetti O., Trusova Y. Cell Image Analysis Ontology //Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - Pleiades Publishing, Ltd., 2008. - Vol.18, No.2. -P.332-341.

14.Colantonio S., Gurevich I., Pieri G., Salvetti O., Trusova Yu. Ontology-Based Framework to Image Mining // Image Mining Theory and Applications: Proceedings of the 2nd International Workshop on Image Mining Theory and Applications - IMTA 2009 (in conjunction with VISIGRAPP 2009), Lisboa, Portugal, February 2009 / Edited by I.Gurevich, H.Niemann, O.Salvetti.-Portugal: INSTICC PRESS, 2009. - P.l 1-19.

15.Colantonio S., Gurevich I., Salvetti O., Trusova Yu. An Image Mining Medical Warehouse // Image Mining Theory and Applications: Proceedings of the 1st

International Workshop on Image Mining Theory and Applications -IMTA 2008 (in conjunction with VISIGRAPP 2008), Funchal, Madeira, Portugal, January 2008 / Edited by I.Gurevich, H.Niemann, O.Salvetti. - INSTICC PRESS, 2008. - P. 83-92.

16.Gurevich I.B., Khilkov A.V., Koryabkina I.V., Murashov D.M., Trusova Yu.O. An Open General-Purposes Research System for Automating the Development and Application of Information Technologies in the Area of Image Processing, Analysis, and Evaluation // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. - MAIK "Nauka/Interperiodica"/Pleiades Publishing, Inc., 2006. - Vol.16, No.4. - P.530-563.

17.Trusova Yu. Image analysis thesaurus. Version 1.0 // Pattern Recognition and Information Processing (PRIP'2007): Proceedings of the Ninth International Conference (22-24 May 2007, Minsk, Republic of Belarus). In two volumes. - Minsk: United Institute of Informatics Problems of National Academy of Sciences of Belarus, 2007. -Vol.2.-P.210-214.

18.Trusova Yu. Main Concepts and Elements of the Ontology on Image Processing and Analysis // 9th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008): Conference Proceedings. In two volumes. — Nizhni Novgorod: N.I.Lobachevsky State University of Nizhni Novgorod, 2008. -Vol.2. -P.228-231.

19.Trusova Yu., Gurevich I., Beloozerov V., Murashov D. Linguistic support of the knowledge base for image analysis and understanding system // Proceedings of VISAPP 2007 - Second International Conference on Computer Vision Theory and Applications, Barcelona, Spain, March 8-11, 2007. Volume Special Sessions /Edited by A.Ranchordas, H.Araujo, and J.Vitria. - INSTICC Press, 2007. - P.194-199.

Перспективные направления дальнейших исследований

Полученные в рамках диссертационной работы результаты, а также возникшие в ходе ее выполнения новые задачи, выявили необходимость продолжения начатых исследований. Выделены следующие основные направления дальнейшей работы:

• Поддержка и усовершенствование разработанного тезауруса по анализу изображений. Планируется регулярное обновление тезауруса — добавление новых и редактирование введенных ранее словарных статей, усовершенствование системы связей между терминами. Предусматривается разработка русскоязычной версии тезауруса.

• Модификация и развитие разработанной экспериментальной версии онтологии анализа изображений с целью повышения точности, расширения возможности использования и стандартизации описания знаний, используемых при решении задач анализа изображений и извлечения из них информации, необходимой для принятия интеллектуальных решений. Тестирование экспериментальной версии выявило необходимость более детального исследования предметной области «Анализ изображений», наполнения онтологии новыми классами понятий, усовершенствования иерархии классов и уточнения свойств отдельных классов. Планируется разработка базовой версии онтологии, которая послужит основой для создания специализированных баз знаний для поддержки автоматизации анализа изображений и обеспечит эффективное использование методов и средств, соответствующих современному состоянию математической теории анализа изображений и распознавания образов.

• Программная реализация, размещение в сети Интернет и поддержка информационного-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

Заключение

Результаты диссертационной работы предназначены для использования в системах автоматизации обработки и анализа изображений, системах автоматизации научных исследований, системах автоматизации медицинской диагностики, для лингвистической поддержки мультимедийных баз данных и специализированных баз знаний, коммерческих хранилищ изображений, а также для решения других задач интеллектуализации и автоматизации принятия интеллектуальных решений на основе анализа и оценивания информации, представленной в виде изображений.

Разработанный в рамках данной работы Тезаурус по анализу изображений (ТАИ) может быть использован при решении большого числа теоретических и практических задач, связанных с представлением, хранением и поиском информации, необходимой для интеллектуальной обработки, анализа и распознавания изображений, в том числе:

• В качестве понятийной а терминологической основы для разработки автоматизированных систем анализа изображений, основанных на знаниях: о классификация методов и задач в базах знаний для поддержки анализа и понимания изображений; о описание методов и задач в базах знаний для поддержки анализа и понимания изображений; о создание дружественных интерфейсов на естественном языке.

• Для поддержки автоматизации информационного поиска, в том числе: о помощь пользователю в выборе терминов для формулировки запроса к информационной системе; о поддержка расширения и уточнения запроса пользователя посредством использования связей между терминами, зафиксированных в тезаурусе; о поддержка структурированного отображения результатов поиска.

• Для поддержки автоматического рубрицирования, аннотирования и реферирования информационных ресурсов по рассматриваемой тематике.

• В качестве словаря-справочника по рассматриваемой тематике.

• Для выбора тематических рубрик при проведении научных конференций и семинаров по рассматриваемой тематике

• Для выбора ключевых слов авторами и редакторами научных публикаций.

Потенциальные пользователи разработанного ТАИ: ученые и специалисты, занимающиеся разработкой, исследованием и реализацией математических и вычислительных методов и средств анализа, оценивания и понимания информации, представленной в виде изображений; исследователи из разных областей знаний, нуждающиеся в автоматизации и повышении вычислительной эффективности обработки и анализа изображений; ученые и специалисты в области автоматизации научных исследований; ученые и специалисты в области разработки баз данных и баз знаний; аспиранты и студенты соответствующих специальностей.

В основу диссертационной работы положены результаты, полученные автором в ходе исследований, проводимых в рамках плановых НИР по проектам ФЦП «Интеграция» (2001-2004гг.), по проектам ФЦНТП "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 гг. (проекты №№ 37.011.11.0015, 37.011.11.0016), по проектам Программы фундаментальных исследований Президиума РАН «Математическое моделирование и интеллектуальные системы» (проект № 2.14, 2001-2005 гг.), по проектам Программы Президиума РАН П-14 «Фундаментальные проблемы информатики и информационных технологий» (проект №214, 2006-2008гг.); по проектам Международной Ассоциации содействия сотрудничеству с учеными из новых независимых государств бывшего Советского Союза (проект № 04-77-7067, 20052006гг.); по проектам Программы российско-итальянского сотрудничества по Соглашению РАН-НСИ (2005-2007гг.) и по проектам Российского фонда фундаментальных исследований (проекты №№ 01-07-90016, 01-07-90017, 02-0100182, 03-07-90392, 03-07-06057, 04-07-90187, 04-07-90202, 05-07-08000, 05-0100784, 06-01-81009, 06-07-89203, 07-07-13545, 08-01-00469, 08-01-90022).

На защиту выносятся следующие основные положения и результаты:

• Базовая версия тезауруса по анализу изображений.

• Экспериментальная версия онтологии анализа изображений на языке OWL.

• Концепция, архитектура, функциональная схема и требования к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

• Классификация задач обработки, анализа и распознавания изображений.

• Метод использования тезаурусов и онтологий при решении задач анализа изображений.

Научная и практическая ценность работы

Практическая ценность диссертационной работы подтверждается полученными на основании ее результатов следующими патентами:

1. Патент № 36.907 на полезную модель «Автоматизированная система базы знаний по обработке, анализу и распознаванию изображений». Авторы: И.Б. Гуревич, Н.Г. Гуревич, Д.М. Мурашов, Ю.О. Трусова (Патент зарегистрирован в Государственном реестре полезных моделей Российской Федерации 27.03.2004г.).

2. Патент № 2256224 на изобретение «База знаний по обработке, анализу и распознаванию изображений». Авторы: И.Б. Гуревич, Н.Г. Гуревич, Д.М. Мурашов, Ю.О. Трусова. (Патент зарегистрирован в Государственном реестре изобретений Российской Федерации 10.07.2005г).

По результатам диссертационной работы получены следующие регистрационные свидетельства:

1. «Тезаурус по анализу и распознаванию изображений». Авторы: И.Б. Гуревич, В.Н. Белоозеров, Ю.О. Трусова. Тезаурус зарегистрирован за № 0220812627 в Государственном регистре баз данных ФГУП НТЦ "Информрегистр" (регистрационное свидетельство № 11700 от 11.02.2008г.).

2. «Тезаурус по анализу и распознаванию изображений. Версия 1.0». Авторы: И.Б. Гуревич, В.Н. Белоозеров, Ю.О. Трусова (свидетельство о государственной регистрации базы данных № 2008620320 от 21.08.2008, заявка № 2008620205 от 26.06.2008)

3. Рубрикатор «"Распознавание образов. Анализ изображений". Версия 1.0». Авторы: И.Б.Гуревич, В.Н.Белоозеров, Ю.О.Трусова. Рубрикатор зарегистрирован за №0220812629 в Государственном регистре баз данных ФГУП НТЦ "Информрегистр" (регистрационное свидетельство № 11702 от 11.02.2008г.)

4. «Тезаурус цитогематологических терминов для системы анализа изображений клеток крови». Авторы: И.Б.Гуревич, Ю.О. Трусова, Н.Е. Шкловский-Корди, В.Н. Белоозеров. Тезаурус зарегистрирован за № 0220812628 в Государственном регистре баз данных ФГУП НТЦ "Информрегистр" (регистрационное свидетельство № 11701 от 11.02.2008г.)

5. «Тезаурус цитогематологических терминов для системы автоматизации анализа изображений клеток крови. Версия 1.0». Авторы: И.Б. Гуревич, В.Н. Белоозеров, Н.Е. Шкловский-Корди, Ю.О. Трусова (свидетельство о государственной регистрации базы данных № 2008620318 от 21.08.2008, заявка № 2008620203 от 26.06.2008)

Результаты диссертационной работы используются в составе лингвистического обеспечения Государственной системы научно-технической информации (ГСНТИ), в том числе следующие средства представления онтологии предметной области информационных систем, разработанные при участии автора в ходе выполнения плановых НИР и зарегистрированные в аналитической службе ведения информационных языков ГСНТИ:

• Информационно-поисковый тезаурус по анализу изображений (авторы: И.Б.Гуревич, Ю.О. Трусова, Д.М. Мурашов, В.Н. Белоозеров). Тезаурус включен в фонд языковых средств ГСНТИ за № 131.06, 31.10.2006г.

• Рубрикатор «Распознавание образов. Анализ изображений» (авторы: И.Б.Гуревич, Ю.О.Трусова, В.Н.Белозеров). Рубрикатор включен в фонд языковых средств ГСНТИ за № 831.06, 31.10.2006г. На основе данной разработки внесены изменения и дополнения в соответствующий раздел Рубрикатора ВИНИТИ РАН.

• Тезаурус цитогематологических терминов для системы анализа изображений клеток крови (авторы: И.Б.Гуревич, Ю.О.Трусова, Н.Е.Шкловский-Корди, В.Н. Белоозеров). Тезаурус включен в фонд языковых средств ГСНТИ за № 131.06, 31.10.2006г.

Полученные теоретические результаты и фактические сведения, содержащиеся в диссертационной работе, используются в ВИНИТИ РАН для систематизации научной и технической литературы по проблеме обработки и анализа изображений.

Материалы, изложенные в диссертации, были доложены и обсуждались на:

• 6-ой Всероссийской с участием стран СНГ конференции «Методы и средства обработки сложной графической информации» (Нижний Новгород, Российская Федерация, сентябрь 2001г.)

• 5-ой Международной конференции «Распознавание-2001» (Курск, Российская Федерация, 2001г.)

• 6-ой Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-6-2002) (Великий Новгород, Российская Федерация, октябрь 2002г.)

6-ой Международной конференции "Информационное общество. Интеллектуальная обработка информации. Информационные технологии" (Москва, Российская Федерация, октябрь 2002г.)

6-м Открытом российско-немецком семинаре «Распознавание образов и понимание изображений» (0011\¥-6-2003) (Катунь, Российская Федерация, август 2003г.)

7-ой Всероссийской с участием стран СНГ конференции «Методы и средства обработки сложной графической информации» (Нижний Новгород, Российская Федерация, сентябрь 2003г.)

Международной конференции Диалог'2004 (Верхневолжский, Российская Федерация, июнь 2004г.)

7-ой Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-7-2004)(Санкт-Петербург, Российская Федерация, октябрь 2004г.)

2-ой Международной конференции «Машинное зрение: теория и приложения» (У18АРР 2007) (Барселона, Испания, март 2007г.)

9-ой Международной конференции «Распознавание образов и обработка информации» (РШР'2007) (Минск, Республика Беларусь, май 2007г.)

7-ом Открытом немецко-российском семинаре «Распознавание образов и понимание изображений» (001^^-7-2007) (Эттлинген, Германия, август 2007г.)

8-ой Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-8-2007) (Йошкар-Ола, Российская Федерация, октябрь 2007г.)

7-ой международной конференции "Информационное общество. Интеллектуальная обработка информации. Информационные технологии" (Москва, Российская конференция, октябрь 2007г.)

• 2-ой Международной конференции «Семантика и цифровые медиа технологии» (SAMT 2007) (Генуя, Италия, декабрь 2007г.)

• 1-ом Международном семинаре «Извлечение информации из изображений. Теория и приложения» в рамках 3-й Международной конференции «Машинное зрение. Теория и приложения» (Фуншал, Мадейра, Португалия, январь 2008г.).

• 9-ой Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-9-2008) (Нижний Новгород, Российская Федерация, сентябрь 2008г.)

• 2-ом Международном семинаре «Извлечение информации из изображений. Теория и приложения» в рамках 4-й Международной конференции «Машинное зрение. Теория и приложения» (Лиссабон, Португалия, февраль 2009г.)

По результатам диссертации в реферируемых изданиях опубликовано 28 работ, в включая 6 публикаций в изданиях, входящих в перечень ведущих рецензируемых журналов и изданий, рекомендованных ВАК для публикации основных результатов диссертации на соискание ученой степени доктора и кандидата наук, в том числе [28, 13, 16, 24, 31, 34-41, 46-49, 51, 68, 104-106].

Библиография Трусова, Юлия Олеговна, диссертация по теме Теоретические основы информатики

1. Англо-русские термины по машинной графике. Тетради новых терминов №153 / Составитель: к.т.н. Ю.С.Петров. -М.: Всесоюзный центр переводов, 1990.

2. Белоозеров В.Н., Гуревич И.Б., Кравцов Б.В., Мурашов Д.М., Трусова Ю.О. Структура тезауруса базы знаний по анализу изображений // Сборник материалов 5-ой Международной конференции «Распознавание-2001», Курск, 2001.- ч.1. С.77-79.

3. Новгород, 21-26 октября, 2002: В 2-х т. НовГУ им. Ярослава Мудрого, Великий Новгород, 2002. - Т.1. - С.56-60.

4. Борковский А.Б. Англо-русский словарь по программированию и информатике (с толкованиями). М.: Рус.яз., 1989. - 335с.

5. Гонсалес Р., Вудс Р. Цифровая обработка изображений: Пер. с англ. под ред. П.А.Чочиа. -М.: Техносфера, 2005. 1072с.

6. Государственный рубрикатор научно-технической информации. 5 изд. М.: ВИНИТИ, 2001.-392 с.

7. Гуревич И.Б. Изображений анализ / Большая российская энциклопедия. -Научное издательство "Большая российская энциклопедия", 2008. Т.Н. - С.19-20.

8. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и распознавание изображений / Ежегодник «Распознавание. Классификация. Прогноз»: Математические методы и их применение. -Вып.2. — М.: Наука, 1989. С.5-72.

9. Портал искусственного интеллекта: сайт.URL: http://www.itfru.ru/.

10. Прэтт У. Цифровая обработка изображений / Пер. с англ. под ред. Д.С.Лебедева: в 2-х книгах. -М.: «Мир», 1982. Кн. 2. - 480 с. ил.

11. Россеева О.И., Загорулько Ю.А. Организация эффективного поиска на основе онтологий // Труды международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. Т.2. -Аксаково, 2001. -С.333-342.

12. Сайт Российской ассоциации искусственного интеллекта: сайт. URL: http ://www. raai. org/.

13. Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению: ГОСТ 7.24-2007. Введ.01.07.2008- М.: Стандартинформ, 2007. — (система стандартов по информ., библ. и изд. делу).

14. Трусова Ю.О., Белоозеров В.Н., Гуревич И.Б. Тезаурусное представление онтологии предметной области анализа изображений // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции Диалог'2004

15. Верхневолжский", 2-7 июня 2004 г.)/Под ред. И.М. Кобозевой, А.С. Нариньяни, В.П. Селегея. М.: Наука, 2004. - С. 616 - 621.

16. Шемакин Ю.И. Тезаурус в автоматизированных системах управления и обработки информации. М.: Воениздат, 1974. - 192с.

17. Ablameyko S., Di Bona S., Gurevich I. et al. Towards automated analysis of cytological and histological specimen images // Proceedings of the AITTH'2005, Minsk -2005.-Vol. 1. P.27-31.

18. ACM Computing Classification System: сайт. / Maintained by The Association for Computing Machinery, Inc. URL: http://www.acm.org/about/class/.

19. Aitchison J., Gilchrist A., Bawden D. Thesaurus construction and use: a practical manual. 4th ed. - London: Aslib, 2002. - 218 p.

20. Annotated Computer Vision Bibliography: сайт. / Maintained by Keith Price. Institute for Robotics and Intelligent Systems, University of Southern California. URL: http://iris.usc.edu/Vision-Notes/bibliography/contents.html.

21. Ashburner M., Ball C.A., Blake J.A. et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium // Nature Genetics. 2000. - Vol. 25, No. 1. - P. 25-9.

22. Ballard D.H., Brown C.M. Computer Vision. Prentice Hall, Inc., 1982.

23. Bechhofer S., Goble C. Thesaurus construction through knowledge representation // Data & Knowledge Engineering. 2001. - Vol.37. - P.25-45.

24. Beloozerov V.N., Gurevich I.B., Gurevich N.G., Murashov D.M., Trusova Yu.O. Thesaurus for Image Analysis: Basic Version // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. 2003. - Vol. 13, No.4. - P. 556-569.

25. Bittner T. and Winter S. On Ontology in Image Analysis // P. Agouris and A. Stefanidis (Eds.): ISD'99, LNCS 1737. Springer-Verlag Berlin Heidelberg, 1999. - P. 168-191.

26. Borst W.N. Construction of Engineering Ontologies: PhD Thesis, University of Tweenty, Enschede, NL—Centre for Telematica and Information Technology, 1997.

27. Carpenter A.E., Jones T.R., Lamprecht M.R. et al. CellProfiler: image analysis software for identifying and quantifying cell phenotypes // Genome Biology. 2006. -Vol. 7:R100. - P. 1-11.

28. Colantonio S., Gurevich I., Martinelli M., Salvetti O., Trusova Yu. Cell Image Analysis Ontology // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. Pleiades Publishing, Ltd., 2008. - Vol.18, No.2. - P.332-341.

29. Computer Vision Wikia: сайт. Wikia, Inc. - URL: http://computervision.wikia.com/wiki/MainPage.

30. Corcho O., Fernandez-Lopez M., Gomez-Perez A. Methodologies, tools and languages for building ontologies. Where is their meeting point? // Data and Knowledge Engineering. 2003. - Vol. 46. - P.41-64.

31. CVonline: The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision: сайт. / Editor: Robert B. Fisher, School of Informatics, University of Edinburgh. URL: http://homepages.inf.ed.ac.uk/rbf/CVonline/.

32. Davies A. The Focal Digital Imaging A-Z. Focal Press, 2005.

33. Doudkine A., Macaulay C., Poulin N., Palcic B. Nuclear texture measurements in image cytometry // Pathologica. 1995. - Vol. 87. - P. 286-299.

34. Fisher R., Dawson-Howe K., Fitzgibbon A., Robertson C., Trucco E. Dictionary of Computer Vision and Image Processing. — John Wiley & Sons, Ltd., 2005. 364 p.

35. Furht В. (Ed.). Encyclopedia of Multimedia. NY: Springer Science+Business Media, Inc., 2006. - 989 p.

36. Gil J., Wu H., Wang B.Y. Image analysis and morphometry in the diagnosis of breast cancer // Microscopy. Research and Techniques. 2002. - Vol. 59. - P. 109-118.

37. Glossary of Imaging Terms: сайт. / Northern Micrographics Resources and Information. URL: http://www.normicro.com/glossary.htm

38. Gonzalez R.C., Woods R.E. Digital Image Processing. 2nd ed. Prentice-Hall, Inc., 2002.

39. Graphics & Media Lab: сайт. / Сайт лаборатории компьютерной графики и мультимедиа при факультете ВМиК МГУ. URL: http://graphics.cs.msu.ru/.

40. Gruber T.R. A translation approach to portable ontology specification // Knowledge Acquisition. 1993. - Vol. 5. - P. 199-220.

41. Guidelines for the construction, format, and management of monolingual thesauri: ANSI/NISO Z39.19-2003. Введ. 28.08.2003. - National Information Standards Organization. - USA: NISO Press, 2003.- (National information standards series, ISSN 1041-5653).

42. Guidelines for the establishment and development of monolingual thesauri: ISO 27881986. International Organization for Standardization.

43. Guidelines for the establishment and development of multilingual thesauri: ISO 59641985. International Organization for Standardization.

44. Gurevich I.B., Khilkov A.V., Koryabkina I.V., Murashov D.M., and Trusova Yu.O. An Open General-Purposes Research System for Automating the Development and Application of Information Technologies in the Area of Image Processing, Analysis, and

45. Evaluation // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications. MAIK "Nauka/Interperiodica"/Pleiades Publishing, Inc., 2006. -Vol.16, No.4. - P.530-563.

46. Haralick R.M., Shapiro L.G. Glossary of computer vision terms // Pattern recognition. Great Britain, 1991.-Vol. 24. No.l. - P.69-93.

47. Hunter J. Adding Multimedia to the Semantic Web Building an MPEG-7 Ontology // Proceedings of International Semantic Web Working Symposium (SWWS) Stanford, July 30-August 1,2001.

48. IEEE Standard Glossary of Image Processing and Pattern Recognition Terminology: IEEE Std. 610.4-1990. The Institute of Electrical and Electronics Engineers, Inc., 1990.

49. Jahne B. Practical Handbook on Image Processing for Scientific and Technical Applications. 2nd ed. - CRC Press, 2004.

50. Klette R., Zamperoni P. Handbook of Image Processing Operators. John Wiley & Sons Ltd., 1996.

51. Laplante Ph. (Ed.). Dictionary of computer science, engineering, and technology. -CRC Press LLC, 2000.

52. Little S., Hunter J. Open Microscopy Environment (ОМЕ) Ontology: сайт. URL: http://metadata.net/ome/ome.html.

53. MachineLearning.Ru. Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных: сайт. URL: http://www.machinelearning.ru/.

54. Maillot N., Thonnat М., Boucher A. Towards ontology-based cognitive vision // J.L. Crowley et al. (Eds.): ICVS 2003, LNCS2626. Springer, 2003. - P. 44-53.

55. Medical Subject Headings: сайт. URL: http://www.nlm.nih.gov/mesh/

56. Miller G., Beckwith R., Fellbaum C., Gross D., Miller K. Introduction to WordNet: an on-line lexical database // International Journal of Lexicography. 1990. - Vol.3, No.4. -P.235-312.

57. Miller U. Thesaurus construction: problems and their roots // Information Processing and Management. 1997. - Vol.33, No.4. -P.481-493.

58. Neches R., Fikes R.E., Finin T., Gruber T.R., Senator T., Swartout W.R. Enabling ontology for knowledge sharing // AI Magazine. 1991. - Vol.12, No.3. - P.36-56.

59. Orna E. Build Yourself a Thesaurus: A Step-By-Step Guide. Norwich: Running Angel, 1983.-32 p.

60. OWL Web Ontology Language Overview: Электронный ресурс. / M.K.Smith, Ch.Welty, D.L.McGuinness, Editors, W3C Reccomendation, 10 February 2004. URL: http://www.w3 .org/TR/owl-guide/

61. Protégé Ontology Editor: Электронный ресурс. URL: http://protege.stanford.edu/.

62. Renouf A., Clouard R., Revenu M. A platform dedicated to knowledge engineering for the development of image processing applications // Proceeding of the ICEIS 2007, Funchal, Portugal, June 2007. Vol. AIDSS. - P. 271-276.

63. Rodenacker K., Bengtsson E. A feature set for cytometry on digitized microscopic images // Analytical Cellular Pathology, 2003. Vol. 25. - P. 1-36.

64. Rosenfeld A. Classifying the Literature Related to Computer Vision and Image Analysis // Computer Vision and Image Understanding. USA: Academic Press, 2000. -Vol. 79. -P.308-323.

65. Rosenfeld A. From Image Analysis to Computer Vision: An Annotated Bibliography, 1955-1979 // Computer Vision and Image Understanding. USA: Elsevier Science, 2001. -Vol. 84. - P.298—324.

66. Rosenfeld A. Survey. Image Analysis and Computer Vision: 1995 // Computer Vision and Image Understanding. USA: Academic Press, Ltd., 1996. - Vol. 63, No. 3. - P.568-612.

67. Rosenfeld A. Survey. Image Analysis and Computer Vision: 1996 // Computer Vision and Image Understanding. USA: Academic Press, Ltd., 1997. - Vol. 66, No. 1. - P.33-93.

68. Rosenfeld A. Survey. Image Analysis and Computer Vision: 1997 // Computer Vision and Image Understanding. USA: Academic Press, Ltd., 1998.-Vol. 70, No. 2.-P.239-284.

69. Rosenfeld A. Survey. Image Analysis and Computer Vision: 1998 // Computer Vision and Image Understanding. USA: Academic Press, Ltd., 1999. - Vol. 74, No. 1. - P.36-95.

70. Rosenfeld A. Survey. Image Analysis and Computer Vision: 1999 // Computer Vision and Image Understanding. USA: Academic Press, Ltd., 2000. - Vol. 78. - P.222-302.

71. Smith S.W. Glossary/The Scientist and Engineer's Guide to Digital Signal Processing. 2nd ed. - USA: California Technical Publishing, 1999.

72. Soergel D. Indexing Languages and Thesauri: Construction and Maintenance. Los Angeles: Melville, 1974. - 632 p.

73. Soergel D. Large multilingual vocabularies: structure and software requirements. Proceedings of the 61st Annual Meeting of the American Society for Information Science, Pittsburgh, PA, October 25-29, 1998. P. 572.

74. Sorger, P., D.Rines, I.Goldberg et al. The Open Microscopy Environment Электронный ресурс. URL: http://www.openmicroscopy.org/site.

75. Studer R., Benjamins V.R., Fensel D. Knowledge engineering: principles and methods //Data and Knowledge Engineering. 1998. - Vol. 25. -P.161-197.

76. The Computer Vision Homepage: сайт. URL: http://www-cgi.cs.cmu.edu/afs/cs/project/cil/ftp/html/vision.html

77. Thiran J.-P., Macq B. Morphological Feature Extraction for the Classification of Digital Images of Cancerous Tissues // IEEE Transactions on Biomedical Engineering. -1996.-Vol. 43, No. 10.-P. 1011-1020.

78. Town C. Ontological inference for image and video analysis // Machine Vision and Applications. Springer-Verlag, 2006. - Published online: 14 March 2006. - Vol.17, No. 2. -P. 94-115.

79. Townley H. M., R.D. Gee. Thesaurus-Making: Grow Your Own Word-Stock. London: Andre Deutsch, 1980. 206 pp.

80. Uschold M., Jasper R. A Framework for Understanding and Classifying Ontology Applications // Proceedings of the IJCAI99 Workshop on Ontologies and Problem-Solving Methods, Stockholm, 1999.

81. Zhou X., Cao X., Perlman Z., Wong S.T. A computerized cellular imaging system for high content analysis in Monastrol suppressor screens // Journal of Biomedical Informatics, 2006. Vol. 39. - P. 115-125.

82. Учреждение Российской академии наук Вычислительный центр имени A.A. Дородницына РАН1. На правах рукописи1. ТРУСОВА ЮЛИЯ ОЛЕГОВНА