автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка метода временной синхронизации данных обучающей выборки и распознаваемых объектов в задаче классификации в интересах интерпретации результатов космических съемок земной поверхности

кандидата технических наук
Ким, Роман Валерьевич
город
Москва
год
2008
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка метода временной синхронизации данных обучающей выборки и распознаваемых объектов в задаче классификации в интересах интерпретации результатов космических съемок земной поверхности»

Автореферат диссертации по теме "Разработка метода временной синхронизации данных обучающей выборки и распознаваемых объектов в задаче классификации в интересах интерпретации результатов космических съемок земной поверхности"

На правах рукописи

Ким Роман Валерьевич

РАЗРАБОТКА МЕТОДА ВРЕМЕННОЙ СИНХРОНИЗАЦИИ ДАННЫХ ОБУЧАЮЩЕЙ ВЫБОРКИ И РАСПОЗНАВАЕМЫХ ОБЪЕКТОВ В ЗАДАЧЕ КЛАССИФИКАЦИИ В ИНТЕРЕСАХ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ КОСМИЧЕСКИХ СЪЕМОК ЗЕМНОЙ ПОВЕРХНОСТИ

Специальность 05.13.01 Системный анализ, управление и обработка информации (Авиационная и ракетно-космическая техника)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 2008 г.

003456322

Работа выполнена в Московском авиационном инстит (государственном техническом университете, МАИ).

Научный руководитель: доктор технических наук, доцент

Евдокименков Вениамин Николаевич

Официальные оппоненты: доктор технических наук, профессор

Бобронников Владимир Тимофеевич

кандидат технических наук Лапин Валерий Юрьевич

Ведущая организация: Государственный научно-

исследовательский институт авиационн систем (ГосНИИАС)

Защита состоится «_» _2008 г. в _часов на заседан

диссертационного совета Д 212.125.12 в Московском авиационн институте (государственно техническом университете, МАИ) по адре 125993, г.Москва, А-80, ГСП-3, Волоколамское шоссе, д. 4.

С диссертацией можно ознакомиться в библиотеке Московскс авиационного института (государственного технического унииерситс МАИ).

Автореферат разослан « /7-» JiífJb^S^ 2008 г.

Отзывы, заверенные печатью, просим направлять по адресу: 1259' г.Москва, А-80, ГСП-3, Волоколамское шоссе, д.4, МАИ, Ученый совет МАИ.

Ученый секретарь диссертационного совета Д 212.125.12 к.т.н. ,доц. А/

.Дарнопых

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Диссертационная работа посвящена решению актуальной технической задачи повышения достоверности результатов интерпретации данных авиационных и космических съемок земной поверхности в интересах оценки перспектив нефтегазоносности предполагаемых месторождений углеводородов.

В настоящее время результаты аэро- и космических съемок используются в различных областях для решения разнообразных народнохозяйственных задач. Одним из перспективных направлений, активно развиваемым в последние годы, является использование космических снимков в интересах прогноза нефтегазоносности геологических структур. Преимуществами дистанционных методов исследования земной поверхности по сравнению с традиционными методами разведки месторождений углеводородов являются более высокая плотность получаемых данных, масштабность обзора, возможность получения глобальной и локальной информации о природных объектах, а также контроля динамики процессов в реальном масштабе времени. Данные преимущества в свою очередь позволяют снизить временные и материальные затраты при решении многих прикладных задач в области поиска и освоения полезных ископаемых.

Ключевым этапом технологии обработки космических снимков исследуемой территории при их использовании в целях разведки месторождений нефти и газа является этап интерпретации результатов космических съемок, в процессе которого производится непосредственная оценка перспектив нефтегазоносности прогнозируемых структур, предварительно выделенных экспертами-геологами на основе анализа ландшафтных, геологических, топографических особенностей. В достаточно распространенной ситуации, когда для исследуемого района известны результаты ранее проведенных геологоразведочных работ, задача интерпретации снимков может быть сформулирована как задача классификации с обучением, целью которой является обоснованное отнесение прогнозируемой геологической структуры к одному из двух эталонных классов (классу нефтегазоносных или пустых структур). Признаками распознавания в подобной задаче выступают значения спектральных яркостей (радиационных температур), получаемые в процессе дешифрирования космических снимков. Объектами обучающей выборки выступают ранее разведанные геологические структуры, нефтегазоносный потенциал которых достоверно установлен.

Однако, решение задачи классификации в процессе анализа космических снимков обладает существенной особенностью, обусловленной тем, что распознаваемые объекты и объекты, образующие обучающую выборку, могут присутствовать на снимках, полученных в

различные моменты времени. Причинами этого являются следующие обстоятельства, объективно порождаемые самой технологией космической съемки:

•большая протяженность исследуемого района, которая в сочетании с ограниченностью полосы обзора целевой аппаратуры спутника делает невозможным одномоментную съемку всей совокупности распознаваемых объектов и объектов обучающей выборки;

•атмосферные условия, например, наличие облачности в границах исследуемого района, приводящее к тому, что часть объектов обучающей выборки и распознаваемых объектов может быть не видна на текущем снимке.

Указанные обстоятельства порождают новую постановку задачи классификации, специфическая особенность которой состоит в том, что данные об объектах обучающей выборки и о распознаваемых объектах могут соответствовать различным моментам времени. Существующие на сегодняшний день методы классификации с обучением не учитывают данное обстоятельство, что приводит к получению неудовлетворительных результатов и ограничивает возможность их использования в процессе анализа космических снимков. Следовательно, разработка методов решения задачи классификации, адаптированных к условиям временной несогласованности данных обучающей выборки и распознаваемого объекта становится актуальной и практически важной задачей, решение которой позволит повысить достоверность интерпретации космических снимков, в том числе и в интересах оценки нефтегазоносного потенциала прогнозируемых геологических структур.

Цель работы. Целью работы является повышение достоверности результатов интерпретации космических снимков исследуемых районов земной поверхности в интересах оценки перспектив нефтегазоносности прогнозируемых геологических структур путем разработки методов и алгоритмов решения задачи классификации в условиях временной несогласованности данных обучающей выборки (ОВ) и распознаваемых объектов (РО). В результате исследований предполагается решение следующих задач:

-анализ традиционной схемы решения задач классификации с обучением и возможности ее использования в условиях временной несогласованности данных ОВ и РО;

-разработка структуры модифицированной схемы решения задачи классификации, адаптированной для ситуации, когда наблюдается несинхронизированность данных ОВ и РО;

-разработка метода временной синхронизации данных объектов ОВ и РО и его интеграция с традиционными методами классификации;

-оценка качества решения задач классификации в условиях временной несогласованности данных ОВ и РО с использованием предложенной модифицированной схемы.

Объектом исследования является процесс подготовки и принятия решений относительно нефтегазоносного потенциала геологических структур, вырабатываемых на основе анализа космических снимков исследуемых участков земной поверхности, получаемых с помощью аппаратуры ЕТМ+ (Enchanced Thermatic Mapper Plus), установленной на борту ИСЗ Landsat-7.

Предметом исследования выступает модифицированная схема решения задачи классификации с обучением в условиях временной несогласованности данных обучающей выборки и распознаваемого объекта, объективно порождаемой технологией космических съемок участков земной поверхности, объединяющая традиционные методы классификации в комбинации с разработанным методом временной синхронизации данных ОВ и РО.

Методы исследования. В работе использованы методы теории вероятностей, математической статистики, случайных процессов, оптимизации, методы математического моделирования, объектно-ориентированного программирования.

Научная новизна работы. Научную новизну работы обуславливают следующие результаты:

1) модификация традиционной схемы решения задач классификации с обучением, адаптированная к особенностям процесса интерпретации космических снимков, путем включения в нее дополнительного этапа, целью которого является временная синхронизация данных ОВ и РО;

2) метод временной синхронизации данных обучающей выборки и распознаваемых объектов, базирующийся на положениях теории случайных процессов и оптимального статистического оценивания;

3) комплекс алгоритмов, обеспечивающих получение оптимальных (в смысле максимума частоты правильной классификации) оценок признаков распознавания в процессе синхронизации путем:

-изолированной оптимизации параметров функций математических ожиданий случайных процессов, описывающих изменение признаков распознавания во времени;

-совместной оптимизации параметров функций математических ожиданий и ковариационных функций случайных процессов, описывающих временную динамику признаков распознавания.

4)объектно-ориентированный программный комплекс,

реализующий перечисленные выше алгоритмы и позволяющий проводить оценку перспектив нефтегазоносности предполагаемых месторождений углеводородов на основании снимков, полученных с помощью аппаратуры

ЕТМ+ (Enchanced Thermatic Mapper Plus), установленной на борту ИСЗ Landsat-7.

Достоверность результатов, полученных в работе, подтверждается: -математической обоснованностью и адекватностью моделей, применяемых в методе синхронизации данных ОВ и РО;

-использованием большого объема тестовых примеров, имитирующих процесс обработки космических снимков;

-результатами обработки реальных космических снимков района Тимано-Печорского нефтегазоносного бассейна в процессе оценки перспектив нефтегазоносности геологических структур и их сопоставлением с данными по ранее разведанным месторождением.

Практическая значимость результатов работы заключается в том, что разработанный метод синхронизации данных обучающей выборки и распознаваемых объектов позволяет существенно (в 1.5 раза) повысить достоверность оценок перспектив нефтегазоносности геологических структур в процессе интерпретации результатов космических съемок на основе использования аппарата классификации с обучением.

Результаты, представленные в работе, использованы в работах ЗАО «Геокосмос», проводимых в рамках контрактов с ОАО Газпром и его филиалами, а также в учебном процессе кафедры 704 Московского авиационного института, что подтверждается соответствующими актами о внедрении.

Апробация работы и публикации. Основные результаты диссертационной работы доложены и обсуждены на:

-11-ой Международной конференции «Системный анализ, управление и навигация». Крым, Евпатория, 2006 г.;

-Юбилейной научно-технической конференции «Информационно-управляющие системы - 2006» г. Королев, ФГУП «НПО ИТ», 2006г.;

-12-ой Международной конференции «Системный анализ, управление и навигация». Крым, Евпатория, 2007 г.;

-Научном семинаре кафедры «Информационно-управляющие комплексы» Московского Авиационного института, 2008 г.

Результаты работы опубликованы в 6-ти печатных изданиях, в том числе в 2-х изданиях из перечня, рекомендованного ВАКом Минобрнауки России.

На защиту выносятся следующие основные положения: 1) модифицированная с учетом особенностей процесса интерпретации космических снимков схема решения задачи классификации с обучением, адаптированная к условиям временной несогласованности данных обучающей выборки и распознаваемого объекта путем включения в традиционную схему дополнительного этапа синхронизации данных;

2) метод временной синхронизации данных обучающей выборки и распознаваемых объектов, основу которого составляет процедура оптимального оценивания параметров гауссовского случайного процесса;

3) методы оптимизации параметров гауссовского случайного процесса в процессе синхронизации данных, обеспечивающие минимизацию частоты ошибочной классификации;

4) комплекс алгоритмов решения задач классификации в условиях временной несогласованности данных обучающей выборки и распознаваемых объектов, объединяющих традиционные методы классификации с предварительной процедурой синхронизации данных;

5) программно-математическое обеспечение на основе объектно-ориентированного подхода, реализующее комплекс разработанных алгоритмов, разработанное;

6) результаты решения задачи оценки перспектив нефтегазоносности геологических структур Тимано-Печорского бассейна по результатам космических съемок, проведенных в различные периоды времени, подтверждающие эффективность предложенных алгоритмов.

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, списка литературы из 51 наименования. Работа изложена на 168 страницах машинописного текста, содержит 65 рисунков и 29 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы, проводится обзор монографических и периодических источников, связанных с технологией и средствами получения космических снимков, проблемами и перспективами развития методов классификации, дается общая характеристика работы, обзор основных разделов, краткий анализ основных результатов с оценкой степени их научной новизны и практической значимости.

В первой главе диссертации обсуждаются физико-технические основы использования космических снимков для целей прогноза нефтегазоносности предполагаемых месторождений углеводородов, рассматриваются особенности современной технологии получения, обработки и интерпретации космических снимков земной поверхности, формулируется математическая постановка задачи классификации в условиях временной несогласованности данных ОВ и РО, объективно порождаемой самой технологией проведения космических съемок.

Использование, наряду с традиционными методами разведки месторождений, космических снимков для целей прогноза нефтегазоносности является активно развиваемой областью исследований, базирующейся на том факте, что залежи углеводородов проявляются в тепловых полях. Таким образом, проводя со спутника съемку

исследуемого района в видимой или инфракрасной (ИК) области спектра, можно проводить оценку перспектив нефтегазоносности локальных геологических структур, на основе выявления присущих им яркостных (тепловых) аномалий .

Для этих целей на боту ИСЗ используется специальная целевая аппаратура, например прибор ЕТМ+ (Enhanced Thematic Mapper Plus) -мультиспектральный сканирующий радиометр, установленный на борту спутника Landsat-7. Аппаратура ЕТМ+ обеспечивает съемку земной поверхности 7-ми спектральных каналах (Таблица 1).

№ канала Длина волны, Разрешени

мкм е, м

1 0,45-0,52 30

2 0,52-0,60 30

3 0,63-0,69 30

4 0,76-0,90 30

5 1,55-1,75 30

6 2,08-2,35 60

7 11,35-12,50 30

Landsat - это общее наименование серии американских искусственных спутников Земли, предназначенных для съемки ее поверхности. Данные, полученные с этого аппарата, в настоящее время наиболее широко применяются при решении задач поиска и прогнозирования полезных ископаемых.

Параметры орбиты ИСЗ Landsat-7

Орбита Гелиосинхронная

Высота 705 км

Наклонение 98,2 0

Период обращения 98,9 минут

Повтор орбитального 16 дней (233 витка)

Размер сцены 185 х 170 км

Полный орбитальный цикл 57784 сцены

Существенной особенностью технологии получения космических снимков, значительно осложняющей процесс их дальнейшей интерпретации, является смещение трассы спутника от витка к витку. В этих условиях, учитывая ограниченность полосы обзора целевой аппаратуры спутника, а также то, что исследуемый район может быть

достаточно протяженным, достаточно распространенной является ситуация, при которой различные его области отражены на снимках, полученным в различные моменты времени. Кроме того, в момент съемки исследуемая территория может быть полностью или частично закрыта облачностью, что приводит к получению снимков неудовлетворительного качества. При этом повторная съемка одного и того же участка возможна только после завершения полного орбитального цикла, который для спутника Ьапс15а1-7 составляет 16 суток. Именно эти обстоятельства в значительной степени затрудняют последующую интерпретацию космических снимков исследуемого района, информация об объектах которого может содержаться на снимках, полученных в различные, не совпадающие временные периоды.

Современная технология обработки космических снимков предполагает выполнение 2-х этапов. Первым этапом является дешифрирование снимка. На данном этапе проводится:

-предварительная обработка снимка с целью устранения геометрических искажений, подавления аддитивных и импульсных шумов;

-экспертная оценка на основе анализа ландшафтных и геологических особенностей потенциально нефтегазоносных геологических структур;

-расчет значений спектральных яркостей (радиационных температур) в границах выделенных экспертами прогнозируемых геологических структур.

В диссертационной работе предполагается, что дешифрирование проведено с необходимым качеством, а объектом исследования является следующий этап. Вторым этапом обработки космического снимка является этап интерпретации результатов съемок. Целью данного этапа является оценка перспектив нефтегазоносности прогнозируемых структур, выделенных на первом этапе экспертами-геологами, на основе анализа значений спектральных яркостей. В распространенной ситуации, когда объектом интерпретации являются снимки хорошо исследованного в геологическом отношении района, содержащего ранее разведанные месторождения, задача интерпретации может быть сформулирована как задача классификации с обучением. В этом случае в качестве объектов обучающей выборки (эталонных объектов) выступают ранее разведанные геологические структуры, нефтегазоносный потенциал которых достоверно установлен. Эти эталонные объекты образуют в совокупности два эталонных класса - нефтегазоносных и пустых структур. Вектор признаков распознавания представляет собой 7-мерный вектор, компонентами которого выступают средние по площади структуры значения спектральных яркостей, соответствующие различным каналам (табл. 1).

Специфической особенностью задачи классификации, возникающей в процессе интерпретации космических снимков является то обстоятельство, что в силу ранее указанных особенностей процесса получения космических снимков, данные по распознаваемым объектам и по объектам обучающей выборки могут соответствовать различным моментам времени. То есть имеет место специфическая задача классификации, когда данные обучающей выборки и распознаваемых объектов не синхронизированы во времени

На основе проведенного в первой главе анализа особенностей процесса интерпретации космических снимков сформулирована математическая постановка задачи классификации с обучением в условиях временной несогласованности данных ОВ и РО, опирающаяся на следующие общие предположения. Имеется набор эталонных классов (ЭК) образованных совокупностью эталонных объектов. Свойства каждого из эталонных объектов, описываются реализациями векторов признаков 1^2,... ^п) т, к=1,...,т, у-/,.к=1,...,т, полученными в различные моменты времени (¡, В дальнейшем предполагается, что случайные процессы Xй10), описывающие изменение векторов признаков объектов ОВ во времени, - гауссовские.

Имеется реализация вектора признаков У0*)=(}'1(1*)>У2(1*)>--->Уп((*))Гу рассчитанного на основе обработки измерений, проведенных в момент времени /*, характеризующего свойства РО. Предполагается, что свойства РО и ЭК описываются одним и тем же набором признаков. Считаем, что момент наблюдения в общем случае не совпадает с моментами времени Для которых получены элементы обучающей выборки (реализации случайных процессов Х*(0). Необходимо в рассматриваемых условиях решить задачу классификации, целью которой является обоснованное отнесение РО к одному из ЭК.

Во второй главе проведен анализ традиционной схемы решения задачи классификации с обучением и возможности ее использования в условиях временной несогласованности данных ОВ и РО. Традиционная схема включает ряд последовательных этапов (рис 1):

-формирование обучающей выборки, объединяющей объекты, принадлежность которых к эталонным классам достоверно известна;

-выбор метода классификации. В настоящее время разработано большое количество методов классификации, в числе которых методы статистической классификации, методы, основанные на известном классе решающих функций, методы нечеткой классификации, экстенсиональные методы. Решение о выборе того или иного метода принимается в зависимости от того, какой объем информации доступен для анализа, от того, в каком виде должно быть получено решение задачи;

-оптимизация параметров решающего правила на основании процедуры обучения;

-непосредственная классификация распознаваемого объекта на основании сформированного решающего правила.

Видим, что традиционная схема решения задачи классификации не учитывает факт временной несогласованности данных ОВ и РО. Это обстоятельство, как показано в главе 3 диссертационной работы на основе интерпретации космических снимков района Тимано-Печорского нефтегазоносного бассейна, приводит к неудовлетворительным результатам классификации и неверным выводам в оценках нефтегазоносного потенциала геологических структур.

Результаты измерений после _1 г предварительной обработки

Формирование обучающей выборки

Совокупность векторов признаков ,, объектов обучающей выборки

Выбор метода классификации и его адаптация к условиям распознавания

Конкретизация используемого метода классификации

Формирование решающего правила

Вектор признаков распознаваемого объекта

Структура и параметры решающего правила

Принятие решения об отнесении распознаваемого объекта к одному из эталонных классов

Решение об отнесении распознаваемого объекта к одному из эталонных классов

Рис 1.

Учитывая это обстоятельство, в работе предложена адаптация традиционной схемы решения задачи классификации (рис 2) к условиям временной несогласованности данных ОВ и РО, в основе которой лежит ее

дополнение еще одним этапом - этапом временной синхронизации данных. Данный этап включается в традиционную схему, в случае наличия космических снимков, полученных в разные моменты времени. Его целью является привязка всех данных, полученных в различные моменты периоды, к одному моменту времени и формирование на основе пересчитанных значений объединенной синхронизированной обучающей выборки, которая в дальнейшем будет использоваться для настройки алгоритма классификации.

Рис 2.

В основе предлагаемого метода синхронизации лежит предположение о том, что векторы признаков объектов обучающей выборки представляют собой результаты измерения гауссовского случайного процесса в определенные моменты времени. Заметим, что предположение о гауссовском характере случайного процесса в случае распознавания геологических структур вполне обосновано, так как в качестве признаков распознавания используются средние по площади структур значения яркостей, имеющие асимптотически нормальное распределение. В рамках такого представления в качестве оптимальных оценок векторов признаков объектов обучающей выборки в некоторый момент времени предлагается использовать их условные математические ожидания, которые могут быть получены с помощью следующего соотношения:

где

М X1 - условное математическое ожидание вектора

признаков Х*(1*) в прогнозируемый момент времени /*, полученное при условии, что известна его реализациям*^ в момент времени /,;

М' векторное математическое ожидание размерности ах/

случайного процесса Х(1) для прогнозируемого момента времени (*'

ковариационные матрицы размерности пхп, описывающие статистическую взаимосвязь между компонентами векторов признаков Х(1$ в момент времени <,;

(3)

- взаимные ковариационные матрицы, характеризующие статистическую взаимосвязь между векторами признаков, соответствующими прогнозируемому моменту времени /* и моменту

Особенность предлагаемого метода состоит в том, что входящее в соотношение для условных математических ожиданий (1) математическое ожидание М^Л"'^*^ и ковариационные матрицы случайного процесса

заранее не известны, а значит, возникает необходимость получения их оптимальных оценок. В качестве критерия оптимальности в работе предлагается использовать частоту правильной классификации эталонных объектов, рассчитанную на основе данных после их пересчета и привязки к единому моменту времени. Поскольку определение параметров решающего правила в прогнозируемый момент времени проводится

на основании процедуры обучения, определяемые параметры зависят от оценок векторов признаков ОВ в прогнозируемый момент времени.

xV(t*) = V(X'!>(t*)) (4)

В свою очередь, вероятность правильного распознавания объектов ОВ зависит от параметров полученного решающего правила, и, следовательно, также является функцией векторов признаков объектов ОВ.

P„PP,,J'*) = PpiwJXi>(!*)) (5)

В соответствии с введенным критерием оптимальными прогнозируемыми оценками реализаций векторов признаков Л*-' эталонных объектов в момент времени /*, будем считать такие, при которых достигается максимальная точность их отнесения к тем эталонным классам, к которым они объективно принадлежат.

= ЄРРаЛХЧП) -> шах Р„р рас„(ХЧП) <6)

X"

Поскольку оптимальные прогнозируемые оценки реализаций векторов признаков в прогнозируемый момент времени зависят от оценок параметров случайного процесса, критерий (6) может быть записан в виде:

«Км)

(7)

Таким образом, вероятность правильной классификации объектов обучающей выборки является функцией оценок неизвестных параметров случайного процесса, описывающего изменение компонент векторов состояния объектов ОВ во времени.

В работе предлагается 2 подхода к получению оптимальных прогнозируемых оценок реализаций векторов признаков:

•с оптимизацией в (7) только функций математических ожиданий;

•с совместной оптимизацией в (7) функций математических ожиданий и элементов корреляционных матриц.

Первый из упомянутых подходов предполагает оптимизацию только функций математических ожиданий. При этом функция математического ожидания представляется в виде регрессионного полинома

j=o

Задача оптимизации в рамках такого представления заключается в нахождении оптимальной степени А аппроксимирующего полинома.

Оптимизация степени аппроксимирующего полинома достигается ее последовательным увеличением до значения, при котором не наблюдается статистически значимого увеличения частоты правильной классификации объектов обучающей выборки. Структурная схема данного алгоритма приведена на рис 3.

Рис. 3

Вторым предлагаемым подходом к оптимизации является подход с совместной оптимизацией функций математических ожиданий и коэффициентов ковариационных матриц, определяемых соотношениями (2),(3). Функциональная схема данного алгоритма приведена на рис. 4

Рис 4.

В силу того, что в практических задачах объем обучающей выборки ограничен, выборочные оценки коэффициентов корреляции не совпадают с их истинным значением. Методика оптимизации коэффициентов корреляции предполагает получение их интервальных оценок и последующую оптимизацию в пределах доверительного интервала. В соответствии вначале работы алгоритма определяются доверительные интервалы для каждого из коэффициентов корреляции, входящих в матрицы (2),(3).

^¡1.™ -^ЙпжЛзтп -^2пж <>"">Ктт ~К> -Клпх'-Жтпа ~К> После этого на каждом приближении степени регрессионного полинома математических ожиданий с использованием метода покоординатного

спуска находится такой набор значений коэффициентов корреляций, при которых обеспечивается максимальная частота классификации при заданной степени аппроксимирующего полинома. Таким образом, каждой степени регрессионного полинома соответствует свой оптимальный набор коэффициентов корреляций. Увеличивая степень регрессионного полинома и всякий раз рассчитывая оптимальные оценки элементов ковариационных матриц приходим к такому виду модели (1), дальнейшее уточнение которой не сопровождается статистически значимым увеличением частоты правильной классификации эталонных объектов

Для оценки возможности использования предложенных алгоритмов предварительно было проведено моделирование процесса классификации на тестовых примерах. Использование тестовых примеров позволило провести анализ разработанных алгоритмов без ограничений на объем обучающей выборки. В табл. 3 приведены результаты классификации при использовании традиционной схемы, схемы с оптимизацией только функций математических ожиданий и с совместной оптимизацией функций математических ожиданий и элементов ковариационных матриц. Во всех случаях классификация проводилась на основе традиционного метода дискриминантного анализа.

Таблица 3.

Алгоритм Частота правильной классификации

Традиционная схема 0,54

Модифицированная схема с оптимизацией функций математических ожиданий 0,64

Модифицированная схема с совместной оптимизацией функций математических ожиданий и элементов корреляционных матриц 0,70

На основании приведенных результатов можно сделать вывод, что модифицированная схема, основанная на предварительной синхронизации данных с использованием изолированной оптимизации функций математических ожиданий, позволяет повысить достоверность результатов правильной классификации в 1,2 раза по сравнению с традиционной схемой. Процедура синхронизации с совместной оптимизацией функций мат. ожиданий и элементов корреляционных матриц позволяет повесить достоверность правильной классификации в 1,4 раза. Заметим, что использование метода байесовской классификации и метода, основанного на оценках близости к прототипу, приводит к аналогичным результатам.

В третьей главе рассматривается применение разработанных алгоритмов в задаче оценки перспектив нефтегазоносности месторождений на реальном примере анализа снимков района Тимано-Печорского нефтегазоносного бассейна. В качестве исходных данных привлекалась информация по 37 эталонным структурам, находящимся в пределах данного района, с достоверно подтвержденным содержанием углеводородов (рис. 5). Для анализа использовались 4 снимка, полученные аппаратурой ИСЗ «иапсБаЬ?» в периоды 24.04 (апрель), 18.05 (май), 26.06 (июнь), 17.09 (сентябрь). Из-за неблагоприятных атмосферных условий (наличия облачности) на снимках, полученных в различные периоды времени, отсутствовали данные по следующим структурам:

25.04 -№4,6,7,8,9,10,11,12,13,15,16,17,18,19;

18.05-№4,6,7,20,21,22,23.

26.06-№20, 21, 28,29;

17.09-№20,21,28,29.

Информация по каждому из эталонных объектов после дешифрирования снимков включала поточечные (по пиксельные) распределения значений спектральных яркостей в границах структуры, рассчитанные по каждому из семи спектральных каналов съемки (табл. 1), на основе которых были получены средние по площади значения спектральных яркостей. Эти средние значения спектральных яркостей, рассчитанные для каждого из семи спектральных диапазонов, образуют вектор признаков, характеризующих тепловые свойства геологической структуры. Заметим, что переход от поточечного распределения значений яркостей к их средним по площади значениям обеспечивает выполнение предположения о гауссовском характере случайного процесса, описывающего временные эволюции яркостей, положенного в основу разработанного метода синхронизации.

С целью подтверждения возможности использования средних по площади значений яркости в качестве компонент вектора признаков геологических структур для целей прогнозирования перспектив нефтегазоносности был проведен анализ их дифференцирующих свойств. В результате анализа на основе сопоставления доверительных интервалов (для вероятности 0.95), характеризующих разброс средних значений спектральных яркостей пол классам нефтегазоносных и пустых структур было подтверждено, что средние по площади значения спектральных яркостей обеспечивают дифференциацию объектов эталонных классов.

Предложенный в главе 2 алгоритм синхронизации данных ОВ и РО базируется на наличии корреляционной связи между случайными значениями спектральных яркостей, соответствующими различным моментам времени. С целью подтверждения наличия этой связи проведен анализ статистической связи данных, полученных в различные моменты времени, подтвердивший возможность применения разработанного метода временной синхронизации данных.

Таким образом, выполнены все предпосылки, положенные в основу разработанного метода синхронизации данных.

Дальнейшие исследования были посвящены получению

количественных оценок

эффективности предложенного метода синхронизации в задаче классификации геологических структур.

В табл. 4 приведены результаты классификации упомянутых выше эталонных объектов Тимано-Печорского бассейна, представленных на

разновременных снимках, в рис 5

рамках традиционной схемы, использующей в качестве основы метод дискриминантного анализа без предварительной синхронизации. При этом фиксировалась дата съемки, которая рассматривалась как текущий момент времени наблюдения, а обучение алгоритма классификации проводилось на всей совокупности данных, полученных в моменты, не совпадающие с текущей датой. В каждом случае оценивалась процентная доля правильной классификации эталонных геологических объектов.

Период съемки, рассматриваемый в качестве текущего момента наблюдения Частота правильной классификации эталонных объектов

25.04 0.35

18.05 0.60

26.06 0.40

17.09 0.40

Среднее значение частоты правильной классификации эталонных объектов 0.44

В табл. 5 приведены результаты, когда для получения оценок векторов признаков обучающей выборки использовались все доступные снимки, то есть для геологических структур, составляющих обучающую выборку и присутствующих на снимках от 18.05, 26.06 и 17.09 на основе разработанного метода синхронизации с использованием изолированной оптимизации функций математических ожиданий рассчитывались оценки средних значений спектральных яркостей в каждом из каналов съемки для 25.04. Таким образом, удается увеличить объем обучающей выборки за счет того, что она объединяет синхронизированные данные по трем снимкам.

Таблица 5

Период съемки, рассматриваемый в качестве текущего момента наблюдения Частота правильной классификации эталонных объектов

25.04 0.60

18.05 0.72

26.06 0.60

17.09 0.65

Среднее значение частоты правильной классификации эталонных объектов 0.64

Табл. 6 содержит аналогичные результаты классификации с использованием метода синхронизации данных на основе совместной оптимизации оценок функций математических ожиданий и элементов корреляционных матриц. Во всех случаях классификация проводилась на основе линейных дискриминантных функций, коэффициенты которых уточнялись в процессе обучения. ■

Период съемки, рассматриваемый в качестве текущего момента наблюдения Частота правильной классификации эталонных объектов

25.04 0.79

18.05 0.76

26.06 0.63

17.09 0.70

Среднее значение частоты правильной классификации эталонных объектов 0.72

Из приведенных результатов видно, что применение модифицированной схемы позволяет повысить достоверность классификации эталонных объектов в 1,45 раза по сравнению с традиционной схемой. При использовании модифицированной схемы с совместной оптимизацией функций математических ожиданий и элементов корреляционных матриц удается повысить достоверность правильной классификации в 1,6 раза по сравнению с традиционной схемой, ив 1,16 раза по сравнению со схемой с оптимизацией только функций математических ожиданий.

ОСНОВНЫЕ ВЫВОДЫ ПО РАБОТЕ

На основании проведенных исследований получены следующие результаты:

1. Проведен анализ процесса обработки и интерпретации космических снимков земной поверхности в целях оценки углеводородного потенциала перспективных геологических структур. Показано, что реализация этого процесса приводит к необходимости решения задачи классификации, осложненной временной несогласованностью данных обучающей выборки и распознаваемого объекта. [1,2,5]

2. Рассмотрены существующие методы решения задач классификации, которые не учитывают факт временной несогласованности данных. На основании обработки реальных результатов космических съемок показано, что применение традиционных методов в условиях несинхронизированности данных приводит к недопустимым ошибкам классификации. [3,4,6]

3. Предложен подход к решению задачи классификации для условий, когда данные по объектам обучающей выборки и о распознаваемом объекте не синхронизированы во времени. В его основе лежит дополнение традиционной схемы этапом временной синхронизации. [1,2,5]

4. Предложен метод синхронизации данных обучающей выборки и распознаваемого объекта, базирующийся на гауссовской аппроксимации процессов, описывающих временную динамику признаков распознавания. В рамках такого представления привязка данных обучающей выборки и распознаваемого объекта к единому (прогнозируемому) моменту времени достигается путем вычисления оценок их условных математических ожиданий. [2]

5. Разработаны алгоритмы синхронизации данных, обеспечивающие максимум частоты правильной классификации на основе изолированной оптимизации функции математического ожидания и на основе совместной оптимизации функции математического ожидания и матричной корреляционной функции случайного процесса, описывающего изменение вектора признаков объектов во времени [5]

7. Создан специализированный программный комплекс, реализующий предложенный метод синхронизации данных и разработанные алгоритмы, предназначенный для проведения классификации в условиях временной несогласованности данных обучающей выборки и распознаваемых объектов.

8. На серии тестовых примеров, имитирующих решение задачи прогнозирования перспектив нефтегазоносности геологических структур с использованием разновременных космических снимков проведен анализ возможности использования разработанного метода классификации для решения поставленной технической задачи. При этом показана

возможность повышения достоверности результатов классификации как за счет изолированной оптимизации функции математических ожиданий, так и за счет совместной оптимизации функций математических ожиданий и матричной корреляционной функции вектора признаков. [1,2,5]

9. На примере обработки космических снимков геологических объектов Тимано-Печорского бассейна показано, что использование разработанного метода классификации с синхронизацией данных обучающей выборки и распознаваемого объекта статистически достоверно увеличивает частоту правильной оценки углеводородного потенциала в 1,6 раза. Причем основное увеличение величины частоты правильной классификации достигается за счет изолированной оптимизации функции математических ожиданий, и в меньшей степени эффект проявляется за счет оптимизации элементов корреляционной матрицы. [1,2,5]

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Все результаты, представленные в работе, получены лично автором. Результаты работы опубликованы:

1. Ким Р.В., Евдокименков В.Н. Развитие методов классификации в условиях временной несогласованности данных обучающей выборки и распознаваемого объекта и их применение для анализа результатов космических съемок земной поверхности / Вестник компьютерных и информационных технологий. - М.: Машиностроение - 2008, №10. - с.21-30.

2. Ким Р.В., Евдокименков В.Н. Временная синхронизация данных обучающей выборки и распознаваемых объектов в задачах классификации в процессе интерпретации космических снимков земной поверхности. /Известия РАН. Теория и системы управления. - М.:Наука - 2009, №1. В печати.

3. Малышев В.В, Евдокименков В.Н., Ким Р.В., Трофимов Д.М. Оценка вероятности прогноза локальных структур и их нефтегазоносности на основе комплексной интерпретации космических и геолого-геофизических данных. //11-я Международная конференция "Системный анализ, управление и навигация, Евпатория, Украина. 2007: Тез. докл. - М.: МАИ, 2007.-с.156-157.

4. Евдокименков В.Н., Ким Р.В. Применение метода кластерного анализа для прогноза перспектив нефтегазоносности прогнозируемых структур на участках «Норасский» и «Карпогорский» по результатам авиа-и космических съемок. // Юбилейная научно-техническая конференция «Информационно-управляющие системы-2006» г. Королев, ФГУП «НПО ИТ» 12-13 октября 2006 г. Тезисы доклада, с. 24.

5. Евдокименков В.Н., Кгш Р.В. Развитие методов классификации в условиях временной несогласованности данных обучающей выборки и

дГ

распознаваемого объекта // 12-я Международная конференция "Системн анализ, управление и навигация, Евпатория, Украина. 2007: Тез. докл. -МАИ, 2007.- с. 105-106.

6. Малышев В.В., Евдокименков В.Н., Ким Р.В., Трофимов Д. Анализ статистической значимости космических и геолого-геофизическ факторов прогноза нефтегазоносное™ локальных структур на приме Жигулевского Вала и Жигулевско-Пугачевского свода // 1 Международная конференция "Системный анализ, управление навигация, Евпатория, Украина. 2007: Тез. докл. - М.: МАИ, 2007. - с. 102

Множительный центр МАИ (ГТУ) Заказ от/2.// 200$ г. Тираж ¿О экз.

Оглавление автор диссертации — кандидата технических наук Ким, Роман Валерьевич

Введение.

1. Современная технология обработки результатов космических съемок для целей прогноза перспектив нетегазоносности месторождений углеводородов. Постановка технической задачи.

1.1. Физико-техничекие'основы использования космических снимков для целей прогноза нефтегазоносности геологических структур.

1.2. Космические средства дистанционного зондирования теплового излучения поверхности Земли.

1.3. Содержание и специфика процесса обработки и интерпретации космических снимков.

1.4. Математическая постановка задачи классификации с обучением в условиях временной несогласованности данных обучающей выборки и распознаваемого объекта.

2. Разработка методики классификации с обучением в условиях временной несогласованности данных об эталонных и распознаваемых объектах.

2.1. Обзор современных методов классификации. Традиционная схема решения задач классификации с обучением.

2.2. Разработка модифицированной схемы решения задачи классификации с обучением в условиях временной несогласованности данных об эталонных и распознаваемых объектах.

2.3. Формирование синхронизированной во времени обучающей выборки с использованием методов теории случайных процессов.

2.3.1. Алгоритм синхронизации данных обучающей выборки на основе изолированной оптимизации векторной функции математического ожидания признаков распознавания.

2.3.2. Алгоритм синхронизации данных обучающей выборки на основе совместной оптимизации параметров функции математического ожидания и элементов матричной корреляционной функции.

2.4. Оценка эффективности разработанного метода с использованием тестовых примеров, имитирующих процесс обработки и анализа космических снимков.

2.4.1. Методика тестовой оценки.

2.4.2. Моделирование в условиях стационарности случайных процессов, описывающих временную динамику векторов признаков.

2.4.3. Влияние нестационарности случайных процессов, описывающих динамику векторов признаков, на достоверность результатов классификации.

3. Оценка эффективности разработанного метода классификации на примере прогноза перспектив нефтегазоносности геологических структур Тимано-Печорского бассейна на основе результатов космических съемок.

3.1.Результатыпредварительной обработки снимков участка Тимано-Печерского бассейна, полученных аппаратурой ИСЗ «LandSat-7».

3.2. Анализ информативности -данных ИК съемки для целей оценки перспектив нефтегазоносности локальных структур.

3.3. Результаты применения модифицированного метода классификации для прогноза локальных структур Тимано-Печорского бассейна.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Ким, Роман Валерьевич

Диссертационная работа затрагивает одно из актуальных направлений современных исследований, связанных с возможностью оценки углеводородного потенциала геологических структур на основе автоматизированной обработки результатов космических съемок. Использование аэро- и космических съемок сегодня является ключевым фактором повышения эффективности и снижения стоимости работ по поиску и прогнозированию месторождений нефти и газа, особенно для малоисследованных геологическими и геофизическими методами районов.

Преимуществами дистанционных методов исследования Земной поверхности по сравнению с традиционными являются более высокая плотность получаемых данных, масштабность обзора, возможность получения глобальной и локальной информации о природных объектах, а также контроля динамики процессов в реальном масштабе времени. Космические снимки, являясь самым новейшим и совершенным материалом, позволяют в более короткие сроки составлять и обновлять различные тематические карты Земной поверхности, картографировать слабоизученные и труднодоступные территории [1,11,17,18,21,22,39]. Данные обстоятельства в свою очередь позволяют повысить эффективность и достоверность, а также снизить временные и материальные затраты при решении многих прикладных задач в области поиска и освоения полезных ископаемых.

Прогнозирование степени нефтегазоносности предполагаемых месторождений углеводородов с использованием данных авиационного и космического зондирования Земной поверхности является в настоящее время одним из наиболее перспективных направлений в области проведения нефтегазопоисковых работ. Полный комплекс работ, направленных на решение данного класса задач включает в себя несколько этапов, на каждом из которых решается множество специфических задач, требующих привлечения экспертов из различных областей, а также разнообразного методологического и математического аппарата.

Первым этапом является непосредственное получение космических снимков. Поскольку в настоящее время существует большое количество космических аппаратов, осуществляющих мониторинг земной поверхности и имеющих на борту различную целевую аппаратуру, на данном этапе необходимо провести анализ требований, предъявляемым к снимкам в рамках решаемой технической задачи, в результате которого будут определены возможные источники получения исходных данных.

После непосредственного получения космических снимков следующим этапом является их дешифрирование. Основными задачами, решаемыми на данном этапе, являются предварительная обработка снимка с целью улучшения его качества, построение полей физических параметров, а также непосредственно дешифрирование, в результате которого выделяются границы прогнозируемых структур, в которых предположительно имеются залежи углеводородов. Решение задач дешифрирования предполагают анализ и интерпретацию больших объемов разнородной информации, а также наличие определенного опыта решения подобных задач и, зачастую некоторой интуиции. Вследствие этого в настоящее время задачи дешифрирования решаются в основном с привлечением экспертов геологов. Отметим также, что весьма перспективным направлением в данной области является разработка систем и алгоритмов автоматического дешифрирования.

Заключительным этапом является интерпретация результатов космических съемок непосредственно с целью оценки нефтегазоносного потенциала предварительно выделенных локальных структур. Наиболее часто интерпретация предполагает отнесение прогнозируемой структуры к одному из нескольких классов, в качестве которых могут, например, выступать класс нефтегазоносных структур и класс пустых структур. В более общем случае структуры могут дифференцироваться по объемам залежей углеводородов, например нефтегазоносные, с непромышленным содержанием углеводородов и пустые. В качестве теоретической базы для решения данной задачи используются методы классификации, имеющие общей целью обоснованное принятие решений об отнесении различных наблюдаемых объектов и явлений к конкретным, заранее известным, либо неизвестным (кластерный анализ) классам. Однако, как будет показано далее, задача прогнозирования перспектив нефтегазоносности по данным космических съемок имеет ряд особенностей, вызывающих определенные затруднения на этапе решения задачи классификации. Решению данной проблемы посвящена настоящая диссертационная работа.

Краткая характеристика диссертационной работы

Анализ состояния и тенденций развития современных методов классификации показывает, что на данный момент существует огромное разнообразие технических задач, требующих в той или иной степени применения методов классификации и распознавания образов. Во многих случаях решение этих задач может быть достигнуто за счет тех возможностей, которые предлагают современные методы классификации. Однако, несмотря на значительный теоретический задел в области классификации, применение известных методов для целей обработки и анализа космических снимков может столкнуться с серьезными проблемами. Специфика задачи анализа космических снимков выбранного участка земной поверхности проявляется в том, что их качество в существенной степени зависит от состояния атмосферы, прежде всего наличия облачности, закрывающей отдельные фрагменты интересующего участка. Кроме того, ограниченность полосы захвата целевой аппаратуры является причиной того, что большие по площади районы не могут быть отражены на одном снимке. Эти обстоятельства приводят к необходимости использования серии снимков, полученных в различные периоды времени. С точки зрения последующей интерпретации этих снимков мы сталкиваемся с нетипичной для задач классификации ситуацией, когда данные привлекаемые в качестве обучающей выборки, и, более того, данные о распознаваемых объектах получены в различные моменты времени.

Учитывая это обстоятельство, целью диссертационной работы является повышение достоверности результатов интерпретации космических снимков путем разработки эффективных алгоритмов решения задач классификации с обучением в случае, если имеет место временная несинхронизированность данных ОВ и РО, то есть данные об объектах ОВ и РО получены в различные моменты времени. Данная задача является особенно актуальной, если признаки РО и объектов ОВ изменяются во времени.

В Главе 1 «Актуальность проблемы временной несинхронизированности данных обучающей выборки и распознаваемого объекта. Постановка технической задачи» описана современная технология обработки и анализа результатов космических съемок, рассмотрены физическо-технические основы использования космических снимков для целей прогноза нефетгазоносности геологических структур, а также современные технические средства, используемые для получения исходных данных (космических снимков). Также рассмотрены причины возникновения и суть проблемы временной несинхронизированности данных ОВ и РО. Проведен анализ методических трудностей, возникающих при решении задачи классификации, в случае, если данные о РО и объектах ОВ не синхронизированы во времени. Рассмотрены возможные пути решения задачи классификации в описываемых условиях. Одним из таких путей, позволяющих исключить временную несогласованность данных является объединение данных об объектах ОВ, полученных в различные моменты времени, в единую обучающую выборку. Однако, такое объединение равносильно тому, предположению о том, что характеристики излучения земной поверхности не зависят от времени, что на самом деле является неверным. Вследствие этого попытка объединения разновременных данных в единую обучающую выборку и последующее использование традиционных методов классификации, как показано в работе, сопровождается недопустимыми ошибками классификации.

В соответствии с вышеизложенными обстоятельствами, наиболее привлекательным представляется путь, связанный с предварительной временной синхронизацией данных, что делает возможным последующее использование любого известного метода классификации с обучением. Разработке такого метода посвящена последующая часть диссертационной работы.

В заключении главы 1 сформулирована математическая постановка задачи классификации в условиях временной несинхронизированности данных ОВ и РО.

Глава 2 посвящена разработке нового подхода к решению задач классификации с обучением в условиях временной несогласованности данных об эталонных и распознаваемых объектах. Проведен анализ традиционной схемы классификации, практическая реализация которой предполагает наличие следующих этапов:

• выбор метода, обеспечивающего наилучшее качество классификации;

• адаптация выбранного метода (с привлечением обучающей выборки) к конкретным условиям распознавания;

• отнесение распознаваемого объекта к одному из эталонных классов с использованием выбранного метода.

Оценка возможности применения этой традиционной схемы для целей анализа разновременных космических снимков показала, что игнорирование временной несогласованности данных ОВ и РО приводит к недопустимо большим ошибкам. Учитывая это, предложена модификация изложенной традиционной схемы классификации, в основе которой лежит ее расширение дополнительным этапом, обеспечивающим предварительную синхронизацию данных, то есть их привязку к некоторому единому моменту времени. Указанная синхронизация в диссертационной работе достигается за счет применения методов теории случайных процессов. Зависимости, описывающие изменение во времени значений признаков распознавания, интерпретируются как гауссовские случайные процессы. В рамках такого представления в качестве прогнозируемых оценок векторов признаков для объектов ОВ и РО в любой единый для всех произвольный момент времени могут рассматриваться их условные математические ожидания, рассчитанные на основе измерений, проведенных в известные моменты времени. Проблема состоит в том, чтобы на основе имеющейся обучающей информации сформировать наилучшую в определенной смысле модель гауссовского случайного процесса, используемую в качестве основы для временной синхронизации данных. Известно, что статистические свойства гауссовского случайного процесса исчерпывающе описываются функцией математического ожидания и корреляционной функцией. В работе предложены методы оптимизации, позволяющие определять оптимальные (в смысле минимума вероятности ошибочной классификации объектов обучающей выборки, отнесенных к некоторому прогнозируемому моменту времени) их оценки, как в условиях изолированной оптимизации функции математических ожиданий, так и в условиях совместной оптимизации функций математических ожиданий и элементов корреляционной матрицы.

Учитывая ограниченное число объектов обучающей выборки (разведанных геологических структур), общие свойства разработанного метода иллюстрируются и анализируются на модельных примерах, отражающих особенности процесса анализа космических снимков. В рамках модельного представления показано, что решение задачи классификации может быть достигнуто с использованием традиционной схемы решения задачи классификации с обучением при условии стационарности случайных процессов, описывающих временные изменения значений яркостей. На примерах, моделирующих решение задач классификации в условиях нестационарности случайных процессов, продемонстрировано, что применение традиционной схемы сопровождается недопустимыми ошибками классификации, что однозначно указывает на необходимость ее адаптации.

Использование разработанной в диссертационной работе методики классификации в подобных условиях позволило почти в 2 раза уменьшить вероятность ошибочной классификации, что указывает на возможность её использования в практических задачах. Достигнутое уменьшение вероятность ошибочной классификации достигнуто за счет мер по оптимизации оцениваемых параметров гауссовских случайных процессов, описывающих временные вариации признаков. В работе даются оценки эффективности применения методик и изолированной оптимизацией параметров функции математического ожидания, а также с совместной оптимизацией параметров функции математического ожидания и компонент матричной корреляционной функции.

Глава 3 диссертационной работы посвящена анализу результатов применения разработанной методики классификации с обучением в условиях временной несогласованности данных обучающей выборки и распознаваемого объекта в процессе интерпретации космических снимков, полученных аппаратурой ИСЗ «LandSat-7» для различных периодов съемки, в интересах оценки перспектив нефтегазоносности геологических структур.

Объекты обучающей выборки представлены совокупностью геологических структур, нефтегазоносный потенциал которых определенно установлен. В качестве компонент вектора признаков распознавания в данном случае выступают средние по площади значения яркостей, соответствующих семи спектральным диапазонам, полученные в результате предварительной обработки космических снимков для четырех моментов съемки. То обстоятельство, что компонентами вектора признаков выступают значения спектральных яркостей, полученных в результате усреднения по большому числу точек (пикселей) в границах структуры, позволяет использовать в качестве статистической модели, описывающей их временные эволюции, гауссовский случайный процесс.

С целью обоснования возможности использования средних значений спектральных яркостей для решения задачи классификации приведены данные, подтверждающие наличие классифицирующих возможностей данных величин. Также проведен анализ корреляционных зависимостей разновременных данных, показавший, что существует устойчивая корреляционная связь данных, полученных в период май - сентябрь, для класса нефтегазоносных структур. При этом для класса пустых структур аналогичной связи не обнаруживается.

Для окончательного подтверждения эффективности разработанного метода проведена его апробация в процессе обработки реальных космических снимков геологических структур в районе Тимано-Печорского бассейна. Показано, что в условиях существенной сезонной вариабельности значений спектральных яркостей применение традиционных методов классификации без предварительной синхронизации обучающих данных сопровождается вероятностью ошибочных решений на уровне 0,56. Применении разработанной в диссертационной работе модифицированной схемы на основе процедуры предварительной синхронизации данных позволило уменьшить вероятность ошибочной классификации почти в 1,5 раза. Этот результат указывает на необходимость широкого применения предложенного решения в практику обработки и анализа результатов космических съемок.

В результате исследований, проведенных в диссертационной работе, получены следующие новые научные результаты:

1. Проведен анализ процесса обработки и интерпретации космических снимков земной поверхности в целях оценки углеводородного потенциала перспективных геологических структур. Показано, что реализация этого процесса приводит к необходимости решения задачи классификации, осложненной временной несогласованностью данных обучающей выборки и распознаваемого объекта.

2. Рассмотрены существующие методы решения задач классификации, которые не учитывают факт временной несогласованности данных. На основании обработки реальных результатов космических съемок показано, что применение традиционных методов в условиях несинхронизированности данных приводит к недопустимым ошибкам классификации.

3. Предложен подход к решению задачи классификации для условий, когда данные по объектам обучающей выборки и о распознаваемом объекте не синхронизированы во времени. В его основе лежит дополнение традиционной схемы этапом временной синхронизации.

4. Предложен метод синхронизации данных обучающей выборки и распознаваемого объекта, базирующийся на гауссовской аппроксимации процессов, описывающих временную динамику признаков распознавания. В рамках такого представления привязка данных обучающей выборки и распознаваемого объекта к единому (прогнозируемому) моменту времени достигается путем вычисления оценок их условных математических ожиданий.

5. Разработаны алгоритмы синхронизации данных, обеспечивающие максимум частоты правильной классификации на основе изолированной оптимизации функции математического ожидания и на основе совместной оптимизации функции математического ожидания и матричной корреляционной функции случайного процесса, описывающего изменение вектора признаков объектов во времени

7. Создан специализированный программный комплекс, реализующий предложенный метод синхронизации данных и разработанные алгоритмы, предназначенный для проведения классификации в условиях временной несогласованности данных обучающей выборки и распознаваемых объектов.

8. На серии тестовых примеров, имитирующих решение задачи прогнозирования перспектив нефтегазоносности геологических структур с использованием разновременных космических снимков проведен анализ возможности использования разработанного метода классификации для решения поставленной технической задачи. При этом показана возможность повышения достоверности результатов классификации как за счет изолированной оптимизации функции математических ожиданий, так и за счет совместной оптимизации функций математических ожиданий и матричной корреляционной функции вектора признаков.

9. На примере обработки космических снимков геологических объектов Тимано-Печорского бассейна показано, что использование разработанного метода классификации с синхронизацией данных обучающей выборки и распознаваемого объекта статистически достоверно увеличивает частоту правильной оценки углеводородного потенциала в 1,6 раза. Причем основное увеличение величины частоты правильной классификации достигается за счет изолированной оптимизации функции математических ожиданий, и в меньшей степени эффект проявляется за счет оптимизации элементов корреляционной матрицы.

Работа выполнена на кафедре «Информационно-управляющие комплексы» Московского Авиационного Института (Государственного технического университета) под руководством профессора В. Н. Евдокименкова.

Результаты диссертационной работы обсуждались на:

- 11-ой Международной конференции «Системный анализ, управление и навигация». Крым, Евпатория, 3 июля - 9 июля 2006 г.

- Юбилейной научно-технической конференции «Информационно-управляющие системы - 2006» г. Королев, ФГУП «НПО ИТ» 12-13 октября 2006г.;

- 12-ой Международной конференции «Системный анализ, управление и навигация». Крым, Евпатория 1 июля - 8 июля 2007 г.;

Научном семинаре кафедры «Информационно-управляющие комплексы» Московского Авиационного института;

- Научном семинаре кафедры «Системный анализ» Московского Авиационного Института, а также были отражены в следующих публикациях:

1. Ким P.B., Евдошшенков B.H. Развитие методов классификации в условиях временной несогласованности данных обучающей выборки и распознаваемого объекта и их применение для анализа результатов космических съемок земной поверхности // Вестник информационных и компьютерных технологий. 2008, №9

2. Ком Р.В., Евдошшенков В.Н. Временная синхронизация данных обучающей выборки и распознаваемых объектов в задачах классификации в процессе интерпретации космических снимков земной поверхности. // Известия РАН. Теория и системы управления. 2009, №1.

На защиту выносятся следующие основные положения диссертационной работы:

1) модифицированная с учетом особенностей процесса интерпретации космических снимков схема решения задачи классификации с обучением, адаптированная к условиям временной несогласованности данных обучающей выборки и распознаваемого объекта путем включения в традиционную схему дополнительного этапа синхронизации данных;

2) метод временной синхронизации данных обучающей выборки и распознаваемых объектов, основу которого составляет процедура оптимального оценивания параметров гауссовского случайного процесса;

3) методы оптимизации параметров гауссовского случайного процесса в процессе синхронизации данных, обеспечивающие минимизацию частоты ошибочной классификации;

4) комплекс алгоритмов решения задач классификации в условиях временной несогласованности данных обучающей выборки и распознаваемых объектов, объединяющих традиционные методы классификации с предварительной процедурой синхронизации данных;

5) программно-математическое обеспечение на основе объектно-ориентированного подхода, реализующее комплекс разработанных алгоритмов, разработанное;

6) результаты решения задачи оценки перспектив нефтегазоносности геологических структур Тимано-Печорского бассейна по результатам космических съемок, проведенных в различные периоды времени, подтверждающие эффективность предложенных алгоритмов.

Достоверность результатов, полученных в работе, подтверждается: математической обоснованностью и адекватностью моделей, применяемых в методе синхронизации данных ОВ и РО; использованием большого объема тестовых примеров, имитирующих процесс обработки космических снимков; результатами обработки реальных космических снимков района Тимано-Печорского нефтегазоносного бассейна в процессе оценки перспектив нефтегазоносности геологических структур и их сопоставлением с данными по ранее разведанным месторождением.

Заключение диссертация на тему "Разработка метода временной синхронизации данных обучающей выборки и распознаваемых объектов в задаче классификации в интересах интерпретации результатов космических съемок земной поверхности"

Выводы по главе 3

1. На примере обработки разновременных космических снимков геологических объектов Тимано-Печорского бассейна подтверждена эффективность разработанной схемы классификации с предварительной синхронизацией данных обучающей выборки и распознаваемого объекта.

2. Показано, что использование в алгоритме синхронизации данных обучающей выборки и распознаваемого объекта изолированной процедуры оптимизации параметров регрессионной зависимости, описывающей изменение во времени средних значений спектральных яркостей, повышает частоту правильной классификации нефтесодержащих и пустых геологических структур в 1.4 раза.

3. Использование в алгоритме синхронизации данных совместной оптимизации функций математических ожиданий, описывающих изменение во времени средних значений яркостей в каждом из спектральных каналов и элементов корреляционных матриц, описывающих статистическую взаимосвязь значений спектральных яркостей, соответствующих различным периодам съемки, повышает частоту правильной классификации нефтесодержащих и пустых геологических структур в 1.64 раза

Заключение

В результате проведенных исследований получены следующие основные результаты:

1. Проведен анализ процесса обработки и интерпретации космических снимков земной поверхности в целях оценки углеводородного потенциала перспективных геологических структур. Показано, что реализация этого процесса приводит к необходимости решения задачи классификации, осложненной временной несогласованностью данных обучающей выборки и распознаваемого объекта.

2. Рассмотрены существующие методы решения задач классификации, которые не учитывают факт временной несогласованности данных. На основании обработки реальных результатов космических съемок показано, что применение традиционных методов в условиях несинхронизированности данных приводит к недопустимым ошибкам классификации.

3. Предложен подход к решению задачи классификации для условий, когда данные для объектов обучающей выборки и для распознаваемого объекта не синхронизированы во времени. Основу подхода составляет дополнение традиционной схемы этапом временной синхронизации.

4. Предложен метод синхронизации данных обучающей выборки и распознаваемого объекта, использующий для временной синхронизации данных методы теории случайных процессов, и базирующийся на гауссовской аппроксимации процессов, описывающих временную динамику признаков распознавания. В рамках такого представления привязка данных обучающей выборки и распознаваемого объекта к единому (прогнозируемому) моменту времени достигается путем вычисления оценок их условных математических ожиданий.

5. Разработан алгоритм синхронизации данных, обеспечивающий максимум вероятности правильной классификации на основе изолированной оптимизации функции математического ожидания случайного процесса, описывающего изменение вектора признаков объектов во времени.

6. Предложен алгоритм синхронизации данных, обеспечивающий максимум вероятности правильной классификации на основе совместной оптимизации функции математического ожидания и матричной корреляционной функции случайного процесса, описывающего изменение вектора признаков объектов во времени.

7. Создан специализированный программный комплекс, реализующий предложенную модифицированную методику и предназначенный для проведения классификации в условиях поставленной задачи, а также для исследования влияния различных параметров предложенных алгоритмов на результаты решения задачи классификации.

8. На серии тестовых примеров, имитирующих решение задачи прогнозирования перспектив нефтегазоносности геологических структур с использованием разновременных космических снимков, проведен анализ возможности использования разработанного метода классификации для решения поставленной технической задачи. При этом показана- возможность повышения достоверности результатов классификации как за счет изолированной оптимизации функции математических ожиданий, так и за счет совместной оптимизации функций математических ожиданий и матричной корреляционной функции вектора признаков.

9. На примере обработки разновременных космических снимков геологических объектов Тимано-Печорского бассейна показано, что использование разработанного метода классификации с синхронизацией данных обучающей выборки и распознаваемого объекта статистически достоверно увеличивает частоту правильной оценки углеводородного потенциала в 1,5 раза. Причем основное увеличение величины частоты правильной классификации достигается за счет изолированной оптимизации функции математических ожиданий, и в меньшей степени эффект проявляется за счет оптимизации элементов корреляционной матрицы.

Библиография Ким, Роман Валерьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Антыпко А.И. Основы дистанционного теплового мониторинга геологической среды городских агломераций. М.: "Недра", 1992

2. Банди Б. Методы оптимизации. Вводный курс. М.: Радио и связь, 1988

3. Браверман Э.М., Мучник И.Б. Структурные методы обработки эмпирических данных. М.: Наука. 1983

4. Васильев В.И. Проблемы обучения распознаванию образов. Принципы, алгоритмы реализация. Киев. ВШ. 1989

5. Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1980

6. Верхаген К. и др. С англ. Распознавание образов. Состояние и перспективы. М.: Радио и связь. 1985

7. Горелик А.Л.,Гуревич И.Б.,Скрипкин В.А. Современное состояние проблемы распознавания. М.: Радио и связь. 1985

8. A.JI. Горелик, В.А. Скрипкин. Методы распознавания: Учеб. Пособие для ВУЗов 4-е издание, испр. -М.: Высшая школа. 2004

9. Горелик A.JL, Эпштейн С.С. Некоторые особенности задачи селекции. Кибернетика 1988, №1.

10. Даджион Д., Мерсеро Р. Цифровая обработка многомерных сигналов: Пер. с англ. под ред. Л.П. Ярославского. М.: Мир, 1988

11. Дейвис Ш.М. Ландгребе Д.А., Филипс Т.Л. Свейн Ф.Х. Хоффер P.M. Ланденлауб Д.С. СиеваЛеР.Ф. Дистанционное зондирование: количественный подход» MeGraw-Hill, Inc, 1978, перевод на русский язык, Недра, 1983

12. Демидович Б.П Марон И.А. Шувалова Э.З Численные методы анализа М. Наука, 1967

13. Дуда Р., ХартП. Распознавание образов и анализ сцен., М. Мир, 1976

14. Евдокименков В.Н., Карлов В.И., Красильщиков М.Н. Оценка вероятностных показателей качества, близких к единице, на основе методов планирования эксперимента//Изв. АН СССР. Техн. кибернетика. 1989. № 4

15. Евтушенко Ю. Г. Методы решения экстремальных задач и их применение в системах оптимизации. М.: Наука, 1982

16. Золотухин В.Г., Усиков ДА., Грушин В.А. Учет рассеяния света в атмосфере при обработке космических снимков земной поверхности. Исследование Земли из космоса, 1980, N 3. - С. 58 - 68.

17. Исаев А.С. Коровин Г.Н. Сухих В.И. Плешиков Ф.И. Дистанционное зондирование лесного покрова: состояние и перспективы. Сб. «Дистанционное зондирование земного покрова и атмосферы аэрокосмическими средствами». Муром 2001 с.9-12.

18. Кашкин В.Б., Сухинин А.И. Дистанционное зондирование Земли из космоса. Цифровая обработка изображений. Центр «Интеграция, 2001

19. Ким Дж.-0., Мюллер Ч. У. Клекка У.Р. Олдендерфер М.С., Блэшфилд Р.К. Факторный, дискриминантный и кластерный анализ, М. Финансы и статистика, 1989

20. Ким Н.В. Обработка и анализ изображений в системах технического зрения. -М.: МАИ, 2001

21. Козодеров В.В. Атмосферная коррекция видеоизображений. // Исследование Земли из космоса. 1983. - N 2. - С. 65 - 75

22. Козодеров В.В. Косолапов В.В. «Модели взаимосвязей биометрических и оптико-спектральных характеристик лесной растительности» «Исследование Земли из космоса» 1996 г. №1 с 91-98.

23. Кондратьев К.Я., Федченко ГГ.П. Спектральная отражательная способность и распознание растительности. JI.: Гидрометеоиздат, 1982

24. Коршунов Ю.М. Математические основы кибернетики. М. Энергоатомиздат, 1987г.

25. Крамер Г. Математические методы статистики М.: Мир, 1975

26. Крючков А.И. «Устранение влияния атмосферы и учёт топографии подстилающей поверхности при многоспектральном дистанционном зондировании Земли из космоса», г.Москва, «Земля из космоса»», 2002, №05. с.45-49.

27. Кузин JI.T. Основы кибернетики. Т.2. Учебное пособие. М.: Энергия. 1979

28. А. А. Лебедев, В.Т. Бобронников, М.Н. Красильщиков, В.В. Малышев. Статистическая динамика и оптимизация управления летательных аппаратов: учеб. пособие для авиационных специальностей ВУЗов. М.Машиностроение, 1985

29. МелникМ. Основы прикладной статистики-М.: Энергоатомиздат, 1983

30. Миллер Б.М. Панков А.Р. Случайные процессы в примерах и задачах. М. МАИ, 2001

31. П. Мюллер, П. Нойман, Р. Шторм. Таблицы по математической статистике. М. финансы и статистика 1982

32. Орлов В. А. Граф-схемы алгоритмов распознавания. М.: Наука. 1982

33. Пантелеев А.В., Летова Т.А. Методы оптимизации в примерах и задачах. М.: Высшая школа. 2005

34. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990

35. Распознавание. Классификация. Прогноз. В.2 Под. Ред. Журавлева Ю.И. М.: Наука. 1989

36. Растригин JI.A., Эренштеин Р.Х. Метод коллективного распознавания. М.: Энергоиздат 1981

37. Реброва М.П. Автомаическая классификация в системах обработки информации. Поиск документов. М.: Радио и связь. 1983

38. М.Ф. Решетнев, А.А. Лебедев, В.А. Бартенев. Управление и навигация искусственных спутников Земли на околокруговых орбитах. М.Машиностроение, 1988

39. Справочник по прикладной статистике Под ред. Ллойда Э., Ледермана У. М.: Финансы и статистика, 1989

40. Ту Дж., Гонсалес Р. Принципы распознавания образов. Изд. Мир, М.,1978

41. Фор А. Восприятие и распознавание образов. С фр. М.: Машиностроение. 1989

42. ХантЭ. Искусственный интеллект. М.: Мир. 1978. Часть 2. Распозн. Образов

43. Chavez, P. S. Jr, 1988. An Improved Dark-Object Subtraction Technique for Atmospheric Scattering Correction of Multispectral Data. Remote Sensing of the Environment, 24, 459-479

44. Chavez, P.S. Jr., 1996. Image-based atmospheric corrections—revisited and revised. Photogrammetric Engineering and Remote Sensing 62(9):1025-1036

45. Gao, В., 1996, NDWI a normalized difference water index for remote sensing of vegetation liquid water from space, Remote Sensing of Environment, 257-266.

46. Huete A., Justice C., van Leeuwen W. MODIS VEGETATION INDEX (MOD13).

47. Algorithm theoretical basis document. Verion 3. April, 1999 ° 6 7 3 3 V48.http://agpru.com/index.php официальный сайт ГНПП Аэрогеофизика49.www.ntsomz.ru/satellites/russatellites/monitore50.http://landsathandbook.gsfc.nasa.gov/handbook/handbooktoc.html