автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Инструментальные средства интерпретации геофизических исследований скважин на основе преобразованных каротажных диаграмм с помощью многослойной нейронной сети
Автореферат диссертации по теме "Инструментальные средства интерпретации геофизических исследований скважин на основе преобразованных каротажных диаграмм с помощью многослойной нейронной сети"
На правах рукописи
УДК 681 3+681 518+550 832
КОСТИКОВ Денис Владиславович
ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ИНТЕРПРЕТАЦИИ ГЕОФИЗИЧЕСКИХ ИССЛЕДОВАНИЙ СКВАЖИН НА ОСНОВЕ ПРЕОБРАЗОВАННЫХ КАРОТАЖНЫХ ДИАГРАММ С ПОМОЩЬЮ МНОГОСЛОЙНОЙ НЕЙРОННОЙ СЕТИ
Специальности
05 13 18 - Математическое моделирование, численные методы и комплексы программ 05 13 01 - Системный анализ, управление н обработка информации (в промышленности)
Автореферат диссертации на соискание ученой степени кандидата технических наук
□ОЗОТ118 1
Ижевск 2007
003071181
Работа выполнена в ГОУ ВПО «Ижевский I осударственный технический университет» (ИжГТУ)
Научные руководители
заслуженный изобретатель Российской Федерации, доктор технических наук, профессор Лялин В.Е.
доктор технических наук, профессор Миловзоров Г.В. (Уфимский государственный авиационный технический университет)
Официальные оппоненты
доктор технических наук, профессор Нистюк А И. (ИжГТУ)
кандидат технических наук, доцент Качурин СИ (ЗАО «Ижевский нефшной научный центр»)
Ведущая организация
ГОУ ВПО «Уфимский государственный нефтяной технический университет» (г Уфа)
Защита состоится 25 мая 2007 г в 12 00 часов на заседании диссер! анионного совета Д 212 065 04 в ИжГТУ по адресу 426069, г Ижевск, ул Студенческая, 7
Отзыв на автореферат, заверенный гербовой печатью, просим выслать по указанному адресу
С диссертацией можно ознакомиться в библиотеке института Автореферат разослан 21 апретя 2007 г
Ученый секретарь диссертационного совет,
доктор технических наук, профессор
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы. Нефтегазодобывающая отрасль играет ведущую роль в экономике страны Развитие данной отрасли на современном этапе неразрывно связано с разведкой, разработкой и освоением новых месторождений нефти и газа Цитологическая классификация и выделение коллекторов основаны па различии физических и I еофизических параметров горных пород Нахождение значений геологических параметров в некоторых диапазонах даег возможность прогнозирования литологии пласта Так как диапазоны перекрываются для различных пород, то необходима идентификация литологии пород по набору коштекторских, физических и геофизических параметров
Использование компьютерной техники при решении задач нефтегазодобывающей ограсли позволяет отойти от традиционных методов сбора и обработки информации, решать проблему переработки больших массивов информации, исключить субъективность интерпретации результатов исследований
Для проведения экспресс-оценок продуктивности скважин при геологической разведке месторождений создаются автоматизированные интеллектуальные интерпретирующие системы Они обеспечивают управление измерениями, регистрацию, первичную обработку, интерпретацию и хранение скважинных материалов Хотя существует большое количество протраммных среды в и аппаратно-программных комплексов, позволяющих автоматизировать все процессы сбора, обработки и хранения данных геофизических исследований скважин (ГИС), но даже при современном многообразии различных программных средств, производящих интерпретацию ГИС, системы, использующие возможности искусственного интеллекта, немногочисленны по своей номенклатуре и обладают достаточными интеллектуальными способностями
Использование преимуществ искусственного ишеллекта позволяет выйги на иной, более качественный уровень обработки результатов ГИС, поскольку он дает в значительной мере заменить геофизика-интерпретатора, занимающегося рутинной работой просмотра огромных массивов однотипной геотого-геофизической информации, на автоматизированный программно-аппаратный комплекс, который может решать задачу интерпретации данных ГИС с высокой скоростью и точностью Одним из направлении развития систем искусственного интеллекта является использование в них аппарата искусственных нейронных сетей Несмотря на простоту их построения и функционирования, они позволяют накапливать уже известные закономерности ГИС, обобщать факты и давать вполне корректные оценки в ситуациях, когда на входе нейронной сети (НС) представлены зашумленные данные НС уже широко применяются за рубежом в различных системах, например, распознавания образов, аппроксимации прогнозирования, управтсния и др
На практике, при проведении нейросетевого анализа данных, основное внимание уделяется этапам, связанным с обучением и функционированием собственно нейронных сетей, в то врьмя как не менее важным является этап подготовки исходных данных Хотя этот этап не связан непосредственно с нейронными сетями, он является одним из ключевых элементов этой информационной технологии Успех обучения сети может решающим образом зависеть ог того, в каком виде
представлена информация для ее обучения
В настоящее время создано множество программных продуктов, имитирующих работу НС Но возможности их применения в геофизической области весьма ограничены Эго связано с тем, что данные программы не содержат в себе ни правил формализации исходных данных и заключений, применяемых для решения задач ГИС, ни специализированных НС, ни комплексных решений подготовки данных, используемых для решения задачи, ни средств импорта/экспорта геофизических данных
Таким образом, правильная подготовка исходных даннык при применении НС для интерпретации данных ГИС позволит повысить надежность результатов интерпретации и сократить время, затрачиваемое на решение данной задачи Решению эгих актуальных задач и посвящена настоящая диссертация
Объектом исследования являются методы и алгоритмы подготовки исходных данных для решения задачи интерпретации результатов ГИС нейронной сетью, а также аппарат искусственных нейронных сетей, применяемый для обработки данных ГИС, и каротажные диаграммы, представленные в цифровом виде
Предметом исследования является математическое описание алгоритмов и мегодик подготовки исходных данных для повышения скорости и качества лиюлогического расчленения разреза скважины, многослойная нейронная сеть, программное и информационное обеспечение ПС
Цель раболы - разработка и научное обоснование применения методов функционального преобразования каротажных диаграмм и подготовки обучающей выборки для повышения эффективности применения многослойной нейронной сети при осуществлении качественной интерпретации данных ГИС, внедрение которой имеет существенное значение в области обработки и экспресс-интерпретации геофизической информации непосредственно на скважине
Для достижения поставленной цели требуется решить следующие задачи
- формализация задачи качественной интерпретации данных ГИС для ее решения с помощью аппарата НС,
- выбор и обоснование путем теоретических и экспериментальных исследований методов функционального преобразования исходных данных и формирования обучающей выборки (ОВ) для задачи интерпретации ГИС,
- выбор на основе рассмотренных методов оптимальной последовательности подготовки исходных данных и обучающей выборки для задачи интерпретации ГИС,
- выбор оценок, позволяющих определять качество полученной ОВ, до проведения процесса обучения НС,
- выбор коррекшых оценок, позволяющих определять качество интерпретации с помощью НС,
- разработка инструментальных средств для проведения подготовки исходных данных
Методы исследования. В работе применялись теоретические и экспериментальные методы исследования
При решении задачи качественной шперпреыции данных ГИС применялась многослойная нейронная сеть, обучаемая алгоритмом обратного распро-
странепия ошибки В качестве функции активации сети использовалась сигмоида (логистическая функция) В качесгве методов функционального преобразования каротажных диаграмм используются методы скользящего окна данных, спектральный и вейвлет анализы, методы декорреляции исходных сигналов и несколько методов нормализации данных Для понижения размерности входного вектора испотьзуются корреляционный анализ и метод анализа iлавных компонент В качестве алгоритмов снижения объема ОВ рассмотрены мегод группировки, основанный на расстоянии Евклида, и метод кластеризации (¿-средних)
Каротажные кривые исследовались на предмет выделения в скважине пласгов-коллекторов и пластов с различными видами насыщения Исследования проводились по группе из пяти каротажных методов (В К, DS, DT, GR, NGR) Обработка исходных геофизических данных велась поточечно с тем же шагом дискретизации, что и оцифровка исходных данных, без предварительного расчленения разреза на пласты
Инструментальные средства реализованы на алгоритмическом языке высокого уровня Delphi {Borland Delphi 7)
Достоверность и обоснованность полученных в работе результатов и выводов подтверждена результатами экспериментальных исследований
Магматические модели, алгоритмы и прикладные программы, предложенные в работе, основаны на фундаментальных положениях функционального анализа, теории статистического анализа временных рядов, а также теории вероятностей и методологии построения экспертных систем
Достоверность экспериментальных результатов обеспечена использованием большого объема экспериментального материала, статистическими методами обработки данных и хорошей воспроизводимостью результатов
Достоверноеib эталонного материала для обучения НС обеспечена использованием утвержденных в ОАО «Башнефтегеофизика» экспертных заключений по обрабатываемым скважинам
На защиту выносятся результаты исследования применения методов подготовки исходных данных для многослойной нейронной сети при качественной интерпретации данных ГИС, обеспечивающих повышение скорости и качества при получении заключения по наличию неф ^насыщенных коллекторов непосредственно после проведения каротажных работ на скважине, в том числе
- выбор и обоснование правил формализации задачи литологического расчленения разреза скважины с помощью многослойной НС,
- схема подготовки исходных данных, включающая в себя этапы сбора и предобработки данных, а также этап формирования ОВ, ее основные цели и задачи,
применение схемы подготовки исходных данных, предложенной автором, для повышения эффективности интерпретации ГИС с помощью НС,
- выбор и обоснование методов подготовки исходных данных и формирования ОВ для повышения скорости и надежности распознавания данных ГИС,
- определение корректных оценок для анализа качества решения задачи качественной интерпретации данных ГИС с помощью НС,
- разработка и программная реализация инструментальных средств подготовки исходных данных,
Научная новизна полученных результатов определяется проведенными комплексными исследованиями, в результате которых, вопреки классическому подходу, основанному на решении системы петрофизических уравнений методами вычислительной математики, применен аппарат искусственных нейронных сетей При этом большое внимание было отведено этапу подготовки данных Предложен комплекс методов, который позволяет повысить скорость и качество решения задачи Все это позволяет использовать накопленный эмпирический материал и знания опытных, интерпретаторов, являющийся ядром базы знаний интеллектуальной системы для литолошческого расчленения разреза скважины, в ходе которых
- получены зависимости литологической структуры разреза скважины от вида представления каротажных данных, что дает возможность применять аппарат искусственных НС в геолого-геофнзической области,
- предложен комплексный подход к подготовке данных при использовании НС, который нашел свое отображение в разработанной автором схеме подготовки исходных данных, включающей в себя этапы сбора и предобработки информации, а также этап формирования ОВ, которые ставят своей задачей повышение качества исходных сигналов за счет функциональных преобразований исходных данных, понижение размерности задачи и формирование сокращенной ОВ, следствием чего являет ся повышение качества и скорости работы НС,
- показано применение схемы подготовки исходных данных к задаче интерпретации результатов ГИС, при этом, в результате проведения эксперимента по подготовке НС для решения задачи интерпретации данных ГИС удалось повысить качество интерпретации и сократить время, необходимое на подготовку НС, в два раза,
- предложены методики, которые могут быть использованы при подготовке исходных данных для задачи интерпретации результатов I ИС, проведены эксперименты, позволяющие сделать выводы об эффективности применения этих методов, в результате чего, на основе наиболее подходящих методов построены последовательности подготовки данных, почностыо реализующие предложенную автором схему, определена эффективность рассмотренных последовательностей,
- разработанный программный модуль подготовки исходных данных, который позволяет быстро создавать необходимые последовательности методов для улучшения эффективности применения НС, имеет открытый исходный код, вследствие чего может быть интегрирован в разрабатываемые и существующие программные комплексы
Практическая полезность Полученные в работе методики и алгоритмы подготовки исходных данных, совместно с применением аппарата искусственных нейронных сетей, дчя качественной экспресс-интерпретации данных ГИС позволяют существенно автоматизировать труд геофизика-интерпретатора за счет котоссальных вычислительных возможностей по обработке большого объема геофизической информации интеллектуальными системами на базе как отдельных компьютеров, так и компьютерных сетей, существенно использующих реляционные базы данных таких как <'Ртс1ег» и др НС, за счет заложенных в них эталонных данных, и меюды подютовки
данных позвочяют сократить время, необходимое на проведение качественной экспресс-интерпретации скважин, в нескотько раз, повысить качество интерпретации и сократи 1 ь количество ошибок при принятии решений
Использование предложенной схемы подготовки данных с применением рассмотренных методов позволяет быстрее и качественнее проводить обучение НС Это повышает эффективность ГИС за счет резкого расширения возможностей проведения экспресс-интерпретации во время проведения каротажных исследований с достаточно высокой степенью достоверности
Настоящая работа обеспечивает необходимую базу для дальнейшего развития и совершенствования методов подготовки исходных данных для НС, в том числе и подготовки данных ГИС
Апробация работы Основные положения и результаты диссертации докладывались и обсуждались на российских и международных научно-технических конференциях и конгрессах Международных НТК «Информационные технологии в инновационных проектх» (Ижевск, 2004), \;1-м научном симпозиуме «Геоинформационные технологии в нефтегазовом сервисе» (Уфа, 2005), Международном симпозиуме «Надежность и качество» (Пенза, 2006), 33 Международной конференции «Информационные технологии в науке, социологии, экономике и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2006), 34 Международной конференции «Информационные технологии в науке, социологии, экономике и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2007)
Публикации Результаты работы отражены в 12 научных публикациях, в том числе 10 статей в журналах и сборниках, 1 тезис докладов на научно-технической конференции, 1 отчет о НИР (91с) Автор имеет 8 научных трудов в изданиях, выпускаемых в РФ и рекомендуемых ВАКом для публикации основных результатов диссертаций
Структура и объем работы. Диссертация содержит введение, 4 главы и заключение, изложенные на 189 с машинописного текста В работу включены 56 рис, 25 табл и список литературы из 127
СОДЕРЖАНИЕ РАБОТЫ Введение содержит обоснование актуальности темы, формулировку целей работы, основные положения, выносимые на защиту, и определяет содержание и методы выполнения работы
В первой главе рассмотрены физические основы методов каротажа, особенности их применения для разчичных литолотических структур регионов и условий проведения бурильных работ, приведены параметры регистрации показаний Рассмотрены существующие на данный момент методы сбора данных ГИС, алюригмы интерпретации каротажных диаграмм в автоматизированных системах Исследованы возможности нейросетевых технологий в области качественной интерпретации ГИС, а также проведен обюр применимости основных топочогни НС Выполнен сопоставительный анализ программ автоматизированной интерпретации данных ГИС и программ-нейросимуляторов
Во второй главе дано математическое описание каротажных диаграмм, заключений интерпретатора, описана связь между каротажными диаграммами и результатами интерпретации Описаны подходы к формалтации задачи ли ю-
логического расчленения разреза скважины Приведена предлагаемая автором схема подготовки исходных данных Выделены основные цели и задачи, которые решаются при подготовке данных ГИС в рамках описанной схемы Предложены методы, которые могут быть использованы для подготовки исходных каротажных кривых при интерпретации данных ГИС, на каждом этапе схемы подготовки данных Приведены оценки качества обучающей выборки Предложены оценки качества распознавания лшологических пластов с помощью НС
Каротажная диаграмма рассматривается, как функция от глубины скважины п — /(с/)+£, где и - значение метода каротажа, й- глубина, £ - случайная компонента (шум или помеха)
Заключения интерпретатора описываются функциональной зависимостью от I лубипы скважины (у', ,у*)=/(сО, где у1, ,у1 - результаты качественной интерпретации по различным типам литологических пластов и характера насыщения коллекторов (у' = {0,1})
Таким образом, основная задача качественной интерпретации сводится к получению зависимостей между каротажными диаграммами и типами л отологических пластов на указанной глубине скважины В математической нотации
и, ,/)=/(«;, ,«:)
где у', ,ук - результаты качественной интерпретации по различным типам литологических пластов и характера насыщения коллекторов (у' = {0,1}) для отсчета /, и', ,и\ - значения каротажных диаграмм для отсчета /
Однако, применение НС к не подготовленным данным может быть не эффективным и не давать необходимых результатов Следовательно, при применении нейронных сетей необходимо подготовить исходные данные То есть, при интерпретации результатов ГИС использую 1ся не исходные каротажные диатраммы, а исходные сигналы, прошедшие этап подготовки данных Этап подготовки можно записать следующим образом {р], ,p"') = g{u], ,н'), где (р], ,р") - вектор подготовленных данных для отсчета /, § - функция подготовки данных, преобразующая входной вектор (и', ,//') во входной вектор подготовленных данных (р], ,р"), [и], ,м') - вектор исходных данных (каротажных диаграмм) для отсчета г Возможна ситуация когда шф1, так как при подготовке данных могут использоваться алгоритмы изменяющие размерность исходных данных (например окна данных)
Исходя из этого, окончательное решение задачи качественной интерпретации сводится к получению зависимостей между подготовленными каротажными кривыми и типами литологических пластов на указанной глубине скважины Это можно записать в следующем виде (у', ,ук,)= {[р], ,р") (1) Функцию связи между подготовленными каротажными кривыми и результатами интерпретации предлагается реализовать с использованием аппарата искусственных нейронных сетей При этом, входным вектором для ПС будет являться вектор (р), ,р"'), а выходным - (у], , ^)
Задача, которая ставится нейронной сети, должна описываться двумя множествами множеством входных векторов {л1, ,х5}, называемым формализованным ювием задачи, и множеством векторов решения задачи {у1, , V4], называемым формализованным решением
Решением задачи литоло1 ического расчленения разреза скважины будет являться получение зависимости (1)
Выходные данные могут содержать, как вероятностные, так и абсолютные оценки принадлежности входных данных к какому-либо классу Рассмотрим выходной вектор при использовании вероятностных оценок Тогда, каждый пласт можно описать вектором С = {!,, ,£,„), где /,, ,/, - вероятности принадлежности пласта к тому или иному типу породы, А,, ,А"„ - вероятносги принадлежности пласта к тому или иному типу коллектора, 5,, - вероятности насыщения пласта тем или иным типом флюида При этом выполняются следующие условия
0</<1,£/,=1, 0<£, <1, ¿А, =1, 0<*<1,Х?=1
В зависимости от постановки задачи (определение только коллекторов, только водонасыщения и т д) некоторые компоненты вектора (2) могут опускаться
Процесс нейросетевого анализа данных можно представить в виде схемы, изображенной на рисунке !
Рис 1 Схема неГфосетевого анализ
В процессе нейросегевого анализа можно выделить четыре э i ana
1 На первом этапе происходит идентификация проблемы и формализация задачи Здесь часто бывает необходима помощь эксперта по предметной области
2 Целью вюрого этапа является подготовка качественных данных, то есть получение, на основе исходных данных, обучающего, тестового и проверочного множеств
3 На третьем этапе происходит создание и обучение нейронной сети
4 Четвертый этап позволяет оценить качество порученных результатов В случае, если результаты яв тяготея гге удовлетворительными, можно перейти к первому этапу и заново проанализировать задачу, а также определить какой этап был выполнен не корректно Рели результаты нас устраивают, то можно использовать полученные maní для решения поставленной задачи
Рис 2 Схема подготовки данных
Подготовка данных - важный и критичный шаг в нейросетевом моделировании, но обычно на практике мало времени уделяется этому этапу Прсдла-
гаемая схема подготовки исходных данных представлена на рисунке 2 Она состоит из трех этапов сбор и анализ исходных данных, предобработка исходных дачных и подготовка обучающей выборки
Целью первого этапа является сбор данных, преобразование исходных данных для получения более информативных сигналов, а также выявление наиболее значимых входных переменных Этот этап можно разделить на следующие фазы
1 Получение новых данных на основе исходных сингалов Цель этой фазы получение данных, которые можно будет более качественно интерпретировать с помощью НС Могут использоваться методы скользящего окна данных, спектральный, вейвлет анализ и т д
2 Выбор наиболее значимых переменных После того как данные собраны, становиться возможным определение переменных, которые будут использоваться при работе НС Целью любой модели должно быть стремление к уменьшению количества входных переменных, то есть поиск наиболее простою объяснения явления с помощью доступных переменных Следовательно, необходимо определить наиболее значимые переменные (признаки) Это сократит пространство состояний и уменьшит время обучения и работы НС
Второй этап позволяет повысить информативность входов за счет устранения ошибок в полученных данных Этап можно разделить на следующие фазы
1 Проверка данных Цель этой фазы поиск ошибок в данных Анализу подвергается количество и качество данных При анализе количества данных в основном сталкиваются с двумя проблемами слишком много данных и слишком мало данных При оценке качества данных проверяются зашумленность данных, наличие пропусков, шкала данных, присутствие трендов и т д
2 Обработка данных На данной фазе проводятся исправления и корректировки найденных на предыдущей фазе проблем При этом используются методы уменьшения и увеличения количества исходных данных, удаление шума, восстановление пропущенных данных, нормализация, удаление трендов и т д
На третьем этапе все множество примеров разбивается на части и формируется обучающая выборка Данный этап делиться на следующие фазы
1 Деление данных Посте проведения предыдущих этапов, данные используются для создания и обучения НС Первое, что необходимо сделать с данными на этом этапе, это разделить их на множества Обычно выделяют два множества обучающие и тестовое Реже выделяют третье множество - проверочное На данный момент не существует универсальных правил для определения размеров этих множеств
2 Оценка качества полученного обучающего множества (ОВ)
1аким образом, из сказанного выше можно выделить основные проблемы, которые решаются на каждом из этапов А также, привести возможные методы их решения (табл 1) При решении конкретных задач, в связи с особенностями исходных данных, некоторые фазы подготовки данных могут пропускаться Поэтом}', адаптированная схема, применяемая к задаче интерпретации данных ГНС, несколько отличается от общей схемы подготовки данных Решение задач и методы реализации этих решений для адаптированной схемы подготовки данных приведены в таблице 2
Табпша 1
Проблема и ее решение для каждого этапа обшей схемы подготовки данных
ПроСлеиа Решение
Этап 1 Сбор и анализ исходных данных
Потучение новых данных, имеющих большую информативность Преобразование исходных данных, с целью поту-чения более качественных сигналов Пспотьзуются преобразования, предпопагаемые предметной областью, окна данных, спсмральный п вейвтег анализы, методы повышения совместной энтропии и др
Высокая размерность задачи Понижение размерности задачи Выделение наибо-тее значимых входных переменных, с целью уменьшения размерности задачи Используются корреляционный анализ, анализ шаппмх компонент (АГК), генетический ачгоритм и др
Этап 2 Предобработка данных
Не нормированные данные Нормализация данных
Пропущенные значения Восстановление пропущенных значении
Данные с присутствием шума Удатение выбросов, фильтрация
Присутствие тренда Удаление тренда
Слишком много исходных данных Методы уменьшения котичества исходных данных Кластеризация
Слишком мало исходных данных Методы генерации примеров
Этап 3 Подготовка обучающей выборки
Оценка качества ОВ Расчет коэффициентов качества ОВ
Табчица Адаптированная схема подготовки исходных данных с указанием используемых алгоритмов
Задача | Методы решения
Этап 1 Сбор и анализ исходных данных
Преобразование исходных данных, с целью получения более качественных сигналов Преобразования предполагаемые предметной областью Метод окон данных Спектральный анализ Вейвтет анализ Методы декорреляцип данных (метод «выбеливания» входов)
Выделение наиболее значимых входных переменных, с цетыо уменьшения размерности задачи Корреляционный анализ Анализ главных компонент (АГК)
Этап 2 Предобработка данных
Нормировка данных Линейная нормировка Линейная нормировка с удалением выбросов Статистическая нормировка с нелинейным преобразованием
Слишком мною данных Группировка на основе расстояния Евклида Кластеризация (мегоц А-средних)
Этап 3 Под1 оговка обучающей выборки
Оценка качества ОВ Константа Липшица Коэффициент повторяемости Коэффициент прошворечивости
Далее приводится подробное описание алгоритмов, которые могут быть использованы в адаптированной схеме подготовки данных (габл 2)
Для оценки качества интерпретации предлагается использовать два вида оценок среднеквадратическое отклонение (СКО) и взаимную корреляцию
Третья глава содержит описание экспериментальных исследований, проведенных на оцифрованном материале скважин Вятской площади, разработанные Арланским УГР ОАО «Баншенфтегсофизика» Данные получались с помощью выборок из специализированной базы данных каротажной информации «Carbon» Ввиду тою, что представленные каротажные кривые были уже увязаны по глубине, дополнительная увязка ire проводилась В исследовании принимали участие 1) скважин, на которых использовались одинаковые условия проведения измерений, и снимался набор из пяти методов каротажа (ВК, DS, DT, GR, NGR) Дтя подготовки обучающего множества использовались шесть скважин, остальные использовались в качестве тестовых На каждую скважину пришлось порядка 700-900 отсчетов Поскольку имеющиеся в распоряжении заключения по скважинам содержат только данные по коллекторам и характеру насыщения, все эксперименты были направлены на поиск коллекторов и выявление типа флюида
Целью исследования является проверка применимости методов подготовки исходных данных и обучающей выборки для многослойной нейронной сети при литологическом расчленении разреза скважины, а также оценка скорости и качества интерпретации
Для определения применимости того или иного метода подготовки данных проводиться следующий эксперимент К исходным данным применяется один из методов подготовки данных На основе полученных результатах строятся обучающее и тестовое множество Далее проводиться обучение НС Для оценки влияния методов подготовки данных структура НС фиксируется В эксперименте используется нейронная сеть с одним скрытым слоем, содержащим 21 нейрон В качестве функции активации нейрона выбрана сигмоида (логистическая функция) Все нейронные сети обучаются 10 000 эпох
В ходе эксперимента были обучены НС на каждый вариант подготовки данных, а затем с помощью оценок качества интерпретации были отобраны тс методы, которые позволяют получать положительные результаты При проведении исследования рассматривались следующие методы подготовки данных
Нормирование Для подготовки исходных данных применялись следующие методы нормировки 1) без нормировки, 2) линейная нормировка, 3) линейная нормировка с удалением выбросов, 4) статистическая нормировка с нелинейным преобразованием /(г) = (1 + е~*)~', 5) статистическая нормировка с нелинейным преобразованием /(х) = 0 5 (th(2 х) +1)
Полученные результаты, усредненные по пяти тестовым скважинам, приведены в таблице 3 Результаты позволяют сказать, что использование нормировки является необходимым элементом подготовки данных Использование нормировки входных данных для данной задачи улучшает скорость и качество обучения Результаты применения различных видов нормировки близки, но лучшие результаты показывают статистические методы нормировки входных данных
13
Табчица 3
Сравнительная табчица результатов применения различных видов нормировки
Коннектор Нефть Вода Нефть- вода
К» СКВ Входные данные ско Коэфф коррел ско Коэфф коррел ско Коэфф коррел СКО Коэфф коррет
Ср зн Метод 1 Метод 2 Метод 3 Метод 4 Метод 5 0,016 0,012 0,012 0,012 0,012 0,321 0,732 0,734 0,735 0,712 0,014 0,013 0,013 0,012 0,012 0,483 0,544 0,566 0,660 0,650 0,008 0,008 0,008 0,006 0,006 0 279 0,262 0,272 0,657 0,648 0,007 0,007 0,007 0,007 0,007 -0,038 0,226 0,229 0,238 0,272
Использование окон данных Использование окон данных позволяет ПС анализировать не только текущее значения каротажных диаграмм, но и характер поведения кривой в окрестности оцениваемой глубины В ходе эксперимента применялись окна шириной в 1, 3 и 5 отсчетов глубины Следовательно, размерность входного вектора составляла 5,15 и 25 отсчетов соответственно
Ниже приводиться сравнительная таблица результатов эксперимента по выделению пластов-коллекторов с использованием окон данных
Таблица 4
Сравнительная таблица результатов применения окон данных_
Коллектор Нефтч Вода Нефть- вода
№ СКВ Ширина окна данных, отсч СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф корреч
Ср зн 1 3 5 0,012 0,012 0,012 0,732 0,738 0,742 0,013 0,012 0,012 0,544 0,596 0,615 0,008 0,008 0,007 0,262 0,304 0,349 0,007 0,007 0,007 0,226 0,235 0,238
Как видно из таблицы 4 качество распознавания пластов-коллекторов при использовании окна данных возрастает Но одновременно с этим, возрастает размерность интерпретирующей НС и, как следствие, время ее обучения В дальнейшем все методы сравниваются с методом, в котором применяется линейная нормировка и окно данных пять отсчетов
Спектральный анализ Результаты интерпретации данных ГИС по спектральным плотностям приведены в таблице 5
Табчица 5
Сравнительная таблица результатов применения спектрального анализа
№ СКВ Входные данные Кол тек гор Нефть Вода Нефгь- вода
СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф корреч
Ср ш СпекгрАн 5 отсч 0,012 0,012 0,720 0,742 0,012 0,012 0,642 0,615 0,006 0,007 0,677 0,349 0,007 0,00^ 0,231 0,238
При вычислении спекгралыгьах плотностей использовалось взвешивающее окно Блэкмана
Полученные данные показывают, что метод интерпретации данных ГИС по спектральным плотностям, в общем, не дает улучшения качества по сравнению с методом, когда на вход нейронной сети подаются сам» каротажные диаграммы
Вейвлет анализ Рассматриваются два способа использования вейвлет анализа В первом способе (МНАТ1) на вход НС подаются значения вейвлет спектра при фиксированном сдвиге (Ь), во втором (МНАТ2) - при фиксированном масштабе (а) В обоих методах используется МНАГ вейвлет Результаты приведены в таблице 6
Таблица б
Сравнительная таблица результатов эксперимента с использованием веивлет спектра при фиксированном Ь и а_
Коллектор Нефть Вода Нефгь- вода
Л!' СКВ Входные данные ско Коэфф коррет СКО Коэфф коррет СКО Коэфф коррет СКО Ко^фф коррел
13089 MIIAT1 МНАТ2 а= 1 МНЛ.Т2 а-3 МНАТ2 о= 5 МНАТ2 д=10 МНАТ2 ср 20 5 отсч 0,013 0,015 0,015 0,015 0,014 0,015 0,011 0,650 0,423 0,472 0,504 0,512 0,484 0,748 0,013 0,014 0,014 0,014 0,014 0,014 0,012 0,540 0,352 0,384 0,411 0,441 0,413 0,5842 0,008 0,010 0,009 0 009 0,009 0 008 0 009 0,590 0,092 0,244 0,306 0,442 0,571 0,456 0,007 0 007 0,007 0,007 0,007 0,007 0,007 0,211 0,083 0,084 0,087 0,086 0,213 0,266
060 £1 МНАТ1 МНЛТ2 а=\ МНАТ2я=3 МНЛТ2 сг-Ь МНАТ2 д=10 MIÍAT2 а=20 5 отсч 0,014 0,016 0,015 0,015 0,015 0,016 0,012 0,600 0,436 0,485 0,501 0,493 0,412 0,748 0,013 0,014 0014 0,014 0,014 0,014 0012 0,530 0,405 0,432 0,446 0,463 0,361 0,588 0,009 0,010 0,010 0,010 0,010 0,009 0,009 0,550 0,095 0,203 0,261 0,383 0,522 0,624 0,009 0,009 0,009 0,009 0,009 0,009 0,009 0,112 0,051 0,064 0,063 0,032 0,074 0,322
Из таблицы видно, что ни один из рассмотренных методов (МНАТ1, МНАТ2) не улучшает качество распознавания по сравнению с методом, когда на НС подаются сами каротажные диаграммы
Метод «выбеливания» входов позволяет увеличить совместную энтропию исходных сигналов за счет декорреляции исходных сигналов
Табчгща 7
Сравнительная таблица результатов эксперимента с использованием метода «выбеливания» входов_
№ скв Входные данные Ко ьтектор Нефть Вода Нефть- вода
ско Кшфф коррет СКО Коэфф коррел СКО Коэфф коррел СКО Коэф4 коррел
Ср зн Безвыбея Свыбел. 0,012 | 0,742 0,011 | 0,744 0,012 0,012 0615 0,617 0,007 0,007 0,349 0,412 0,007 ¡ 0,238 0,007 | 0,232
Полученные данные показывают, что использование метода «выбеливания» входов позволяет улучшить качество интерпретации данных ГИС
Коэффициент корреляции для выделения наиболее значимых входов Оставляя наиболее значимые входы, получим следующие результаты (табл 9) Уменьшение входного вектора сокращает время обучения нейронной сети
Таблгща 8 Результаты
уменьшения времени обучения представлены в таблице 8 Все временные оценки получены на компьютере с процессором
РепП ит4-2400МГц и ОП 512Мб
Таблица 9
Изменение времени обучения НС при уменьшении размерности входного вектора
Количество используемых значении
Время обучения, мин
25 20 15 10
24 21 19 17
Сравнительная таблица результатов интерпретации на основе
Кот-во используемых значений Коллектор Нефть Вота Нефть- вода
№ СКВ ско Коэфф коррм СКО Коэфф коррет СКО Коэфф коррел СКО Коэфф коррел
25 0,012 0,742 0,012 0,615 0,007 0,349 0,007 0,238
Ср 20 0,011 0,746 0,012 0,591 0,008 0,284 0,007 0,240
зн 15 0,011 0,746 0,013 0,567 0,008 0,270 0,007 0,243
10 0,012 0,700 0,013 0,510 0,008 0,280 0,007 0,239
Из полученных результатов видно, что предложенный метод позволяет уменьшить размерность входного вектора Эю влечег повышение скорости обучения НС При этом удалось улучшить качество выделения пластов-коллекторов при интерпретации данных ГИС
Анатз главных компонент (АГК) для выделения наиболее значимых признаков Рассматриваются результаты применения анализа главных компонент для нормированных исходных данных, к которым применен метод скользящего окна данных шириной 5 отсчетов Таким образом, исходные данные состоят т 25 входных сигналов Оставляя только первые главные компоненты, получим следующие результаты (табл 10)
Таблгща 10
Сравнительная таблица результатов интерпретации на основе входных векторов уменьшенных с помощью АГК_
Коллектор Нефть Вода Нефть- вода
№ СКВ Входные данные СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф коррел
Без АГК 0,012 0,742 0,012 0,615 0,007 0,349 0,007 0,238
Ср зн 25 0,011 0,747 0,013 0,585 0,008 0,324 0,007 0,212
20 0,011 0,746 0,013 0,575 0,008 0,302 0,007 0,236
15 0,011 0,746 0,013 0,585 0,008 0,338 0,007 0,234
10 0,012 0,736 0,013 0,556 0,008 0,324 0,007 0,229
Результаты, приведенные в таблице 10, показывают, что использование метода АГК приводит к улучшению результатов интерпретации и при этом позволяет уменьшить размерность входного вектора
Табпща 11
Изменение времени обучения НС при уменьшении размерности входного век-гора
Количество используемых значений
Время обучения, мин
Помимо этого, как уже было сказано выше, уменьшение размерности входных векторов приводит к уменьшению времени обучения НС Изменение времени обучения приведено в таблице и
Группировка на основе расстояния Евклида для снижения количества входных примеров Применив данный меюд для уменьшения избыточности данных обучающей выборки, получим следующие результаты (табл 12)
Табтца 12
Сравнительная таблица объемов ОВ Обучающая выборка Объем ОВ Часть от всей ОВ, %
Без А1К 25 20 15 10
24 24 21 19 17
Без уменьшения объема Классы при а = 0,1 Классы при а = 0,15 Классы при а = 0,2 Классы при а = 0,3
6110 3779 1943 1004 360
100 00% 61,85% 31,80/о 16,43% 5,89%
Уменьшив объем ОВ, проведем обучение сети и сравним результаты
Таблица 13 Все нейронные
Сравнительная таблица времени обучения Обучающая выборка Время, мин
Без уменьшения объема Классы при а = 0,1 Кадссы при а = 0,15 Классы при а = 0,2 Классы при а - 0,3
24
15
9
5
3
сети обучались 10 000 эпох Сравнительная таблица времени обучения представлена ниже (табл 13) Время уменьшения ОВ составило меньше минуты
Табпща 14
Сравнительная таблица результатов интерпретации
Коллектор Нефть Вода Неф п.- вола
№ Входные Коэфф
СКВ цанные СКО СКО Ко )фф СКО Коэфф СКО Коэфф
коррел коррел коррсп коррст
Безуменьш 0,012 0,742 0 012 0,615 0,007 0,349 0,007 0,238
Ср а = 0,1 0,012 0,748 0,013 0,601 0 007 0,363 0,007 0,236
зн а 0,15 0,012 0,745 0,012 0,615 0,007 0,436 0,007 0,223
а = 0,2 0,012 0,732 0,013 0,610 0,007 1 0 478 0,007 0,235
я = 03 | 0,014 0 667 0,014 0,550 0,007 | 0,493 0,007 0 239 [
Из представленных таблиц (табл 13, 14) видно, что применение методов уменьшения объема обучающей выборки позволяет значительно сократить время обучения нейронной сети и при огам повысить качество распознавания
Метод к-средних для снижения количества входных примеров В отличие от алгоритма основанного на расстоянии Евклида, в котором задается размер группы, в алгоритме А-средних необходимо задавать количество кластеров
Таблица 15 Количества
Сравнительная таблица обьемов ОВ кластеров исполь-
зуемых для работы ал1 оритма А-средних соответствуют количеству групп предыдущего эксперимента (табл 15) Все нейронные сети обучались 10 ООО эпох Таблица 16
Сравнительная таблица времени подготовки данных, времени обучения и суммарного времени представлены
Время подго- Время обучс- Суммарное юьки, мин ния, мин время, мин
Обучающая Объем Часть о г
выборка ОВ всей ОВ, %
Без уменьшения объема 6110 100,00%
ОВ 1 3779 61,85%
ОВ 2 1943 31,80%
ОВЗ 1004 16,43%
ОВ 4 360 5,89%
Обучающая выборка
Ьез уменьшения объема ОВ 1 ОВ 2 ОВЗ ОВ 4
24 15 9 5 3
24 17 11 б 4
Сравнительная таблица времени подготовки данных, времени обучения и суммарного времени представлены в таблице 16 Результаты интерпретации представлены в таблице 17
Таблица 17
Сравнительная таблица результатов интерпретации
Копектор Нефть Вода Нефть- вода
№ ск в Входные данные СКО Коэфф корреч СКО Коэфф коррел СКО Коэфф корреч СКО Коэфф коррел
Без уменьш 0,012 0,742 0,012 0,615 0,007 0,349 0,007 0,238
Ср 311 ОВ1 0,011 0,748 0,012 0,618 0,007 0,427 0,007 0,230
ОВ2 0,011 0,746 0,012 0,635 0,007 0,489 0,007 0,211
ОВЗ 0,012 0,732 0,012 0,631 0,007 0,588 0,007 0,213
ОВ4 0,012 0,727 0,012 0,625 0,007 0,616 0,007 0,231
Результаты показывают, что уменьшение объема обучающей выборки методом А-средних не привело к ухудшению результатов, а даже позволило улучшить их' Из представленных таблиц (табл 16, 17) видно, что применение методов уменьшения объема обучающей выборки позволяет значительно со-
кратигь время обучения нейронной сети и при этом повысить качество распознавания
Последоватечыюсти методов Выше приведены результаты отдельных алгоритмов подготовки данных Они позволяют выделить те алгоритмы, которые дали положительные изменения Рассмотрим результаты последовательного применения методов подготовки данных
1) без подготовки данных,
2) применение линейной нормировки исходных данных
3) применение линейной нормировки и окна данных (5 отсчетов),
4) применение линейной нормировки, окна данных и уменьшения количества входов с помощью коэффициента корреляции (15 значений),
5) применение линейной нормировки, окна данных и выделения наиболее значимых признаков при помощи метода АГК (15 значений),
6) применение линейной нормировки, окна данных, уменьшения количества входов с помощью коэффициента корреляции и уменьшения количества обучающих примеров (группировка на основе расстояния Евклида),
7) применение линейной нормировки, окна данных, уменьшения количества входов с помощью коэффициента корреляции и уменьшения количества обучающих примеров (метод к-средних),
8) применение линейной нормировки, окна данных, выделения наиболее значимых признаков при помощи метода АГК и уменьшения количества обучающих примеров (группировка на основе расстояния Евклида),
9) применение линейной нормировки, окна данных, выделения наиболее значимых признаков при помощи метода АГК и уменьшения количества обучающих примеров (метод к-средних),
Усредненные результаты эксперимента по применению методов подт-товки данных приведены в таблице 18
Табтца 18
Сравнительная таблица усредненных результатов интерпретации_
Коллектор Нефть Вода Нефть- вода
X« СКВ Входные данные СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф коррел СКО Коэфф коррел
Ср 311 Мет од 1 Метод 2 Метод 3 Метод 4 Метод 5 Метод 6 Метод 7 Метод 8 Метод 9 0,016 0,012 0,012 0,011 0,011 0,011 0,011 0,012 0,011 0,321 0,732 0,742 0,746 0,746 0,741 0,743 0,744 0,747 0,014 0,013 0,012 0,013 0,013 0,013 0,013 0,013 0,012 0,483 0,544 0,615 0,567 0,585 0,564 0,563 0,594 0,614 0,008 0,008 0,007 0,008 0,008 0,008 0 008 0,007 0,007 0,279 0,262 0,349 0,270 0,338 0,278 0,268 0,366 0,411 0,007 0,007 0,007 0,007 0,007 0,007 0,007 0,007 0 007 -0,038 0,226 0,238 0,243 0,234 0,231 0,235 0,228 0229
Предыавлишые результаты показывают, что последовательность «Метод 9» дает наилучшие результаты но качеству интерпретации данных 111С
Время, затраченное на подгоювку данных и обучение нейронной сеги, приведено в таблице 19 Время округляется до целых минут Для методов 1-5
время подютовкн данных занимает менее 1 минуты Результаты, приведенные в таблице 19, показывают, что наименьшее время требуют методы с 6 по 9, то есть те методы, для которых применяются алгоритмы понижения количества обучающих примеров
Табчица 19
Сравнительная табчица времени подготовки данных, времени обучения и суммарного времени
,, „ Суммарное Часть от макси-
., Время подго- Время обу-
Метод время, малыюго време-
товки, мин чения, мин '
мин ни, %
Метод 1 0 17 17 71
Метод 2 0 17 17 71
Метод 3 0 24 24 100
Метод 4 0 24 24 100
Метод 5 0 24 24 100
Метод 6 1 10 И 46
Метод 7 2 10 12 50
Метод 8 1 10 11 46
Метод 9 2 10 12 50
Коэффициенты оценки качества обучающих выборок приведены в табл 20 Сравнение первого метода с остальными не корректно в связи с тем, что в первой обучающей выборке исходные данные не нормированы Уменьшение выборочной константы Липшица для последних ОВ свидетельствует о том, что множества стали более простыми и нейронная сеть может быстрее обучиться Однако, уменьшение константы Липшица может быть связано с удалением из обучающего множества ключевых примеров, которые несут важную информацию Поэтому ориентироваться только на значение выборочной константы Липшица не всегда возможно
Табчица 20
Сравнительная таблица коэффициентов качества обучающих выборок
Метод Выборочная кон-С1анта Липшица Коэффициент повторяемости Коэффициент противоречивости
Метод 1 14,85 0 0
Мет од 2 334,25 0 080 0,080
Метод 3 40,35 0,017 0,012
Метод 4 53,21 0,034 0,020
Метод 5 36,03 0,028 0,021
Метод 6 24,22 0,003 0,002
Метод 7 27,41 0,003 0,002
Метод 8 20,90 0,005 0,004
Метод 9 34,14 0,008 0,005
На рисунке 3 приведен пример интерпретации данных ГИС нейронной сетью с применением последовательности подготовки данных
Для дополнительной оценки полученных результатов введем порот округления и проанализируем количество верно опредсченных выходных значении Введение порога округления подразумевает преобразование выходного сигнала НС к двум значениям - 0 и 1 в случаях когда оценка выше и ни ниже за-
данного порога
Рис 3 Результаты интерпретации данных ГИС с применением носледоватетыюсти подттолки «Метол 9» для скважины 13089 13090 13115
Проценты совпадения с эталонными данными, усредненными по пяти скважинам, используемым при тестировании, приведены в таблице 21
Таб ища 21
Таблица совпадений результатов интерпретации данных ГИС
Метод Порог округлеш'я
0,1 0,3 0,5 0,7 0,9
Метод 1 42% 42% 66% 58% 58%
Метод 2 74% 81% 81% 75% 63%
Метод 3 75% ос •е. ч.О о 83% 75% 62%
Метод 4 74% 83% 85% 78% 63%
Метод 5 75% 84% 83% 75% 62%
Метод 6 69% 82% 84% 77% 63%
Метод 7 73% 82% 85% 79% 64%
Метод 8 73% 84% 82% 74% 62%
Метод 9 76% 83% 86% 78% 66%
Из данных приведенных в таблице 21 видно, что наилучшие результаты достигаются при пороге округления равном 0,5 По результатам всех проведенных экспериментов можно сказать, что послсдоватечьность «Метод 9» является оптимальной при подготовке данных для интерпретации результатов ГИС с помощью НС Применение «Метода 9» позволило повысить качество интерпретации данных ГИС, а также сократить время обучения НС в два раза
Результаты выделения пластов-коллекторов с помощью порога окрупе-ния (0,5) для скважин 13089, 13090, 13115 при использовании «Метода 9» представлены на рисунке 4
Таким образом, и этой главе показано, что использование схемы подготовки исходных данных позволяет улучшать качество интерпретации и сокращать время обучения НС
Рис. 4. Результаты применения порога округления (0,5) к результатам работы НС для скважин 13089,13090, 13115 при использовании «МсгодаЧ» для подготовки данных
В четвертой главе описывается программный модуль подготовки исходных данных, разработанный автором, который позволяет нормировать исходные данные, преобразовывать исходные данные с помощью метода скользяще-I о окна данных, применять метод «выбеливания» входов, оценива л» значимость входов, выделять наиболее значимые факторы, уменьшать объем обучающей выборки, рассчитывать коэффициенты качества обучающего множества и др.
Приведен полный список функций, реализованных в рамках модуля, и существенно облегчающих создание процедур подготовки исходных данных. Помимо этого приводиться пример использования модуля подготовки исходных данных,
ЗАКЛЮЧЕНИЕ
В результате анализа применимости методов функционального преобразования исходных данных и подготовки обучающей выборки при распознавании литологической структуры скважины с помощью многослойной нейронной сети показано, что их применение позволяет повысить скорость и качество интерпретации данных ГИС. Это расширяет возможности использования аппарата НС и позволяет автоматизировать качественную интерпретацию непосредственно на скважине с достаточно высокой степенью надежности-
Основные результаты и выводы работы следующие.
!. Проведен обзор существующих методов интерпретации геологе-геофизической информации, возможностей нейросетевых технологий, программных комплексов автоматизированной интерпретации результатов ГИС и программ, имитирующих работу НС, - пеиросимуляторов. I [оказано, что существующие программные средства интерпретации основаны на классических подходах к решению данной задачи и, практически, пе используют возможности искусственного интеллекта, а нейроснмуляторы не имеют комплексного подхода к подготовке данных и пе адаптированы к решению задач ГИС, поэта-
му, на практике онн не применяются для интерпретации
2 Приведены правила формализации входных и выходных (заключений интерпретатора) данных при решении задачи литологического расчленения разреза скважины, с помощью которых возможен анализ, как по самим исходным данным, так и по исходным данным, прошедшим этап подготовки (функциональной предобработки)
3 Разработана общая схема подготовки исходных данных, которая реализует комплексный подход к подготовке входных сигналов при использовании ПС Выделены основные этапы подготовки данных сбор и анализ исходных данных, на котором происходит функциональное преобразование входных данных и решается проблема высокой размерности исходной задачи, предобработка данных, на котором корректируются существующие ошибки в данных и уменьшается или увеличивается количество примеров, и формирование ОВ для обучения НС, на котором помимо создания ОВ происходит вычисление коэффициентов качества ОВ. Сформулированы проблемы, цели и задачи, решаемые на каждом этапе схемы подготовки данных
4 Произведена адаптация общей схемы подготовки данных для решения задачи интерпретации данных ГИС Определены цели и задачи, которые являются актуальными в условиях, используемых в работе Предложены методы, которые могут быть использованы для подготовки исходных каротажных кривых при интерпретации данных ГИС, на каждом этапе адаптированной схемы подготовки данных
5 Проведены эксперименты в результате, которых найдена оценка применимости каждого из предложенных методов Определены методы, даюшие улучшение процесса интерпретации С помощью наиболее эффективных методов составлены последовательности подготовки данных, из которых на основании экспериментальных данных, определена оптимальная последовательность, позволяющая повысить качество и скорость под1 отовки НС
6 Выбраны оценки качества обучающего множества, которые могут быть вычислены до проведения процесса обучения НС И, как следствие, могут быть использованы дчя решения вопроса о необходимости дополнительной подготовки данных Использование коэффициентов качества ОВ позволяет снизить затраты на формирования НС
7 Выбраны оценки качества интерпретации данных ГИС с помощью НС, которые позволяют в числовом виде характеризовать результаты решения задачи, и дают возможность проводить сравнение различных методов подготовки НС
8 Проведен комплексный эксперимент по обучению НС с применением различных методов подготовки данных Целью эксперимента было выделение пластов-коллекторов и нефтенасыщеыных, водонасыщенных, нефте-водонасы-шенных пластов Применение алгоритмов подготовки исходных данных и использования аппарата НС позволило получить до 86% совпадений оценок сети с эталонными данными при использовании порога округления и сократить время обучения нейронной сети в 2 раза Следует заметить тот факт, что данные оценки являются относительными, поскольку отсутствуют доказательства абсолютной точности определения коллекторов экспертами и, как следствие, ука-
занные оценки являются производными с учетом возможных ошибок экспертов Иными словами, точность выделения литологических пластов в разрезе скважины с помощью НС может быть выше указанной
9 Разработана библиотека подготовки данных, которая реализует основные методы, использованные в работе, а также функции, которые упрощают создание процедур подготовки данных Созданная библиотека имеет открытый исходный код, вследствие чего может быть интегрирована в разрабатываемые и существующие программные комплексы
10 В качестве развития исследований предложено провести поиск альтернативных методов, которые MoiyT использоваться в рамках схемы под! отов-ки данных, для повышения информативности исходных данных, а также поиск более точных оценок качества обучающей выборки Также предложено провести анализ применимости других топологий НС и алгоритмов обучения для качественной и количественной интерпретации данных ГИС
НАУЧНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ:
1 Оцифровка каротажного материала Каширо-подольского объекта Вятской площади Арланского месторождения Отчег о НИР / Институт интеллектуальных технологий, Рук В Е Лялин, Исп МЛ Сенилов, ДВ Костиков, А В Гурьянов и др - № ГР 01200 405095 - Ижевск, 2004, 91 с
2 Лялин В Ь, Костиков Д В , Федоров А В Анализ эффективности применения нейронной сеш для распознавания литологической структуры скважины / VI конгресс нефтегазопромышленников России, секция «Геоинформационные технологи в нефтепромысловом сервисе» тезисы докладов научного симпозиума - Уфа Изд-во ОАО НПФ «Геофизика», 2005 - с 122-123
3 Костиков Д В Методы нормировки входных данных при распознавании литологической структуры скважины // Известия ТулГУ Серия Математика Механика Информатика - Т 11 Вып 5 Информатика - Тула Изд-во ТулГУ, 2005 - с 67-72
4 Лялин В Е, Костиков Д В Оценка эффективности вейвлет-апализа данных геофизических исследований // Известия ТулГУ Серия Математика Механика Информатика - Т 11 Вып 5 Информатика - Тула Изд-во ГулГУ, 2005 — с 87-96
5 Костиков Д В , Лялин В Ь Результаты применения метода уменьшения объема обучающей выборки при распознавании литологической структуры скважины нейронной сетью по данным геофизических исследований скважин // Надежность и качество Труды междунар симпозиума В 2-х томах / Под ред H К Юркова-Пенза Изд-во Пенз гос ун-та, 2006 -Т 1 -С 241-245
6 Костиков Д В , Лялин В Е Применение спектрального анализа для улучшения качества распознавания литологической структуры скважины нейронной сетью по данным геофизических исследований скважин // Надежность и качество Труды междунар симпозиума В 2-х томах / Под ред H К Юркова -Пенза Изд-во Пенз гос ун-та, 2006 - Т 1 - С 245-248
7 Костиков Д В Анализ главных компонент для предобработки входных данных при распознавании литологической структуры скважины нейронной сетью по данным геофизических исследований скважин // Информационные тех-
нологии в науке, социологии, экономике и бизнесе Материалы 33 Междунар конф - Украина, Крым, Ялта-Гурзуф- Прилож к журн «Открытое образование», 2006 -с 157-160
8 Костиков Д В , Лялин В Е Оценка значимости входных переменных при распознавании литологической структуры скважины нейронной сетью по данным геофизических исследований скважин // Информационные технологии в науке, социологии, экономике и бизнесе Материалы 33 Междунар конф-Украина, Крым, Ялта-Гурзуф Прилож к журн «Открытое образование», 2006 -с 160-161
9 Костиков Д В , Лялин В Е Оценка сложности обучающей выборки с помощью выборочной константы Липшица при распознавании литологической структуры скважины нейронной сетью // Известия ТулГУ Серия Математика Механика Информатика - Вып 3 Информатика - Тула Изд-во ТулГУ, 2006 -с 155-160
10 Костиков Д В , Лялин В Е Применение метода «выбеливания» входов обучающих примеров при распознавании литологической структуры скважины нейронной сетью // Известия ТулГУ Серия Математика Механика Информатика -Вып 3 Информатика - Тула Изд-во ТулГУ, 2006 -с 161-167
11. Костиков Д В Подготовка данных для интерпретации результатов ГИС с помощью нейронных сетей // Информационные технологии в науке, социологии, экономике и бизнесе Материалы 34 Междунар конф - Украина, Крым, Ялта-Гурзуф Прилож к журн «Открытое образование», 2007 - с 145-147
12 Костиков Д В Результаты применения метода ¿-средних для уменьшения объема обучающей выборки при интерпретации данных ГИС // Информационные технологии в науке, социологии, экономике и бизнесе Материалы 34 Междунар конф - Украина, Крым, Ялта-Гурзуф Прилож к журн «Открытое образование», 2007 - с 147-149
Д.В. Костиков
Лицензия ЛР 020764 от 29 04 98
Подписано в печать 19 04 2007 Форма! 60x84 1/16 Отпечатано на ризографе Уч-издл 1,89 Уел печ л 1,39 Тираж 100 экз Заказ №7504.
Издатетьство Института экономики УрО РАН 620014, г Екатеринбург, 5 т Московская - 29
Оглавление автор диссертации — кандидата технических наук Костиков, Денис Владиславович
ИСПОЛЬЗУЕМЫЕ ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ.
ВВЕДЕНИЕ.
1. ОБЗОР МЕТОДОВ СБОРА, ОБРАБОТКИ И ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ ГИС.
1.1. Роль ГИС при разведке месторождений с помощью скважин.
1.2. Методы каротажа.
1.2.1. Использование методов каротажа.
1.2.2. Электрические методы каротажа.
1.2.2.1 Индукционный каротссж.
1.2.2.2 Боковой каротаж.'.
1.2.2.3 Каротаж микро-зондами.
1.2.3. Акустический каротаж^.
1.2.4. Радиоактивные методы каротажа.
1.2.4.1 Гамма-каротаж.
1.2.4.2 Нейтронный гамма-каротаж.
1.2.5. Кавернометрия.
1.3. Интерпретация данных ГИС.
1.4. Алгоритмы интерпретации результатов ГИС.
1.4.1. Методы классификации,, основанные на петрофизических данных.'.
1.4.2. Метод нормализации.
1.4.3. Статистические методы.
1.4.4. Алгоритм с использованием комплексных кодов.
1.4.5. Цитологическое расчленение с оценкой вероятности.
1.5. Анализ возможностей нейросетевых технологий.
1.6. Подготовка данных при использовании нейронных сетей.
1.7. Обзор программного обеспечения.
1.7.1. Программы интерпретации.
1.7.2. Нейросимуляторы.
1.8. Выводы, постановка целей и задач исследований.
2. РАЗРАБОТКА СИСТЕМЫ ПОДГОТОВКИ ДАННЫХ ДЛЯ ИНТЕРПРЕТАЦИИ ДАННЫХ ГИС.
2.1. Исходные данные и постановка задачи.
2.2. Формализация задачи.
2.2.1. Формализация условия.
2.2.2. Формализация решения.
2.3. Общая схема подготовки данных.
2.4. Применение общей схемы подготовки данных для задачи интерпретации данных ГИС.
2.5. Методы подготовки данных.
2.5.1. Этап 1. Преобразование исходных данных.
2.5.1.1 Увязка кривых по глубине.
2.5.1.2 Переход к равномерному масштабу по глубине.
2.5.1.3 Скользящее окно данных.
2.5.1.4 Спектральный анализ.
2.5.1.5 Вейвлет анализ.
2.5.1.6 Выбеливание.
2.5.2. Этап 1. Понижение размерности входных данных.
2.5.2.1 Коэффициент корреляции.
2.5.2.2 Анализ главных компонент.
2.5.3. Этап 2. Нормализация.:.
2.5.4. Этап 2. Уменьшение объема ОВ.
2.5.4.1 Группировка на основе расстояния Евклида.
2.5.4.2 Алгоритм k-средних.
2.5.5. Этап 3. Оценка качества ОВ.
2.5.5.1 Константа Липшица.
2.5.5.2 Коэффициент повторяемости.
2.5.5.3 Коэффициент противоречивости.
2.6. Оценка качества интерпретации.
2.6.1.1 Среднеквадратическое отклонение.
2.6.1.2 Коэффициент взаимной корреляции.
2.7. Полученные результаты и выводы.
3. СОЗДАНИЕ И ПРИМЕНЕНИЕ АЛГОРИТМОВ ПОДГОТОВКИ ИСХОДНЫХ ДАННЫХ ДЛЯ КАЧЕСТВЕННОЙ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ ГИС.
3.1. Исходные данные.
3.2. Условия проведения эксперимента.
3.3. Используемые правила формализации.
3.4. Анализ применения методов подготовки данных.
3.4.1. Результаты применения различных видов нормировки.
3.4.2. Результаты применения метода скользящего окна данных.
3.4.3. Результаты применения спектрального анализа.
3.4.4. Результаты использования вейвлет анализа.
3.4.5. Результаты применения метода «выбеливания» входов.
3.4.6. Результаты уменьшения входного вектора, с помощью абсолютного значения коэффициента корреляции.
3.4.7. Результаты уменьшения входного вектора, с помощью метода анализа главных компонент.
3.4.8. Результаты применения метода снижение количества входных примеров с помощью группировки на основе расстояния Евклида.
3.4.9. Результаты применения метода снижение количества входных примеров методом k-средних.:.
3.5. Результаты применения схемы подготовки данных для решения задачи интерпретации ГИС.
3.6. Полученные результаты и выводы.
4. РАЗРАБОТКА БИБЛИОТЕКИ ПОДГОТОВКИ ДАННЫХ.
4.1. Основные мотивы разработки системы.
4.2. Назначение библиотеки подготовки данных.
4.3. Состав библиотеки подготовки данных.
4.4. Пример использования библиотеки подготовки данных.
4.5. Полученные результаты и выводы.
Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Костиков, Денис Владиславович
Актуальность темы. Нефтегазодобывающая отрасль играет ведущую роль в экономике страны. Развитие данной отрасли на современном этапе неразрывно связано с разведкой, разработкой и освоением новых месторождений нефти и газа. Литологическая классификация и выделение коллекторов основаны на различии физических и геофизических параметров горных пород. Нахождение значений геологических параметров в некоторых диапазонах дает возможность прогнозирования литологии пласта. Так как диапазоны перекрываются для различных пород, то необходима идентификация литологии пород по набору коллекторских, физических и геофизических параметров.
Использование компьютерной техники при решении задач нефтегазодобывающей отрасли позволяет отойти от традиционных методов сбора и обработки информации, решать проблему переработки больших массивов информации, исключить субъективность интерпретации результатов исследований.
Для проведения экспресс-оценок продуктивности скважин при геологической разведке месторождений, создаются автоматизированные интеллектуальные интерпретирующие системы. Они обеспечивают управление измерениями, регистрацию, первичную обработку, интерпретацию и хранение сква-жинных материалов. Хотя существует большое количество программных средств и аппаратно-программных комплексов, позволяющих автоматизировать все процессы сбора, обработки и хранения данных геофизических исследований скважин (ГИС), но даже при современном многообразии различных программных средств, производящих интерпретацию ГИС, системы, использующие возможности искусственного интеллекта, немногочисленны по своей номенклатуре и обладают достаточными интеллектуальными способностями.
Использование преимуществ искусственного интеллекта позволяет выйти на иной, более качественный уровень обработки результатов ГИС, поскольку он дает в значительной мере заменить геофизика-интерпретатора, занимающегося рутинной работой просмотра огромных массивов однотипной геологогеофизической информации, на автоматизированный программно-аппаратный комплекс, который может решать задачу интерпретации данных ГИС с высокой скоростью и точностью. Одним из направлений развития систем искусственного интеллекта является использование в них аппарата искусственных нейронных сетей. Несмотря на простоту их построения и функционирования, они позволяют накапливать уже известные закономерности ГИС, обобщать факты и давать вполне корректные оценки в ситуациях, когда на входе нейронной сети (НС) представлены зашумленныё данные. НС уже широко применяются за рубежом в различных системах, например, распознавания образов, аппроксимации прогнозирования, управления и др'.
На практике, при проведении нейросетевого анализа данных, основное внимание уделяется этапам, связанным с обучением и функционированием собственно нейронных сетей, в то время как не менее важным является этап подготовки исходных данных. Хотя этот этап не связан непосредственно с нейронными сетями, он является одним из ключевых элементов этой информационной технологии. Успех обучения сети может решающим образом зависеть от того, в каком виде представлена информация для ее обучения.
В настоящее время создано множество программных Продуктов, имитирующих работу НС. Но возможности их применения в геофизической области весьма ограничены. Это связано с тем, что данные программы не содержат в себе ни правил формализации исходных данных и заключений, применяемых для решения задач ГИС, ни специализированных НС, ни комплексных решений подготовки данных, используемых для решения задачи, ни средств импорта/экспорта геофизических данных.
Таким образом, правильная подготовка исходных данных при применении НС для интерпретации данных ГИС позволит повысить надежность результатов интерпретации и сократить время, затрачиваемое на решение данной задачи. Решению этих актуальных задач и посвящена настоящая диссертация.
Объектом исследования являются методы и алгоритмы подготовки исходных данных для решения задачи интерпретации результатов ГИС нейронной сетью, а также аппарат искусственных нейронных сетей, применяемый для обработки данных ГИС, и каротажные диаграммы, представленные в цифровом виде.
Предметом исследования является математическое описание алгоритмов и методик подготовки исходных данных для повышения скорости и качества литологического расчленения разреза скважины, многослойная нейронная сеть, программное и информационное обеспечение НС.
Цель работы - разработка и научное обоснование применения методов функционального преобразования каротажных диаграмм и подготовки обучающей выборки для повышения эффективности применения многослойной нейронной сети при осуществлении качественной интерпретации данных ГИС, внедрение которой имеет существенное значение в области обработки и экспресс-интерпретации геофизической информации непосредственно на скважине.
Для достижения поставленной цели требуется решить следующие задачи:
- формализация задачи качественной интерпретации данных ГИС для ее решения с помощью аппарата НС;
- выбор и обоснование путем теоретических и экспериментальных исследований методов функционального преобразования исходных данных и формирования обучающей выборки (ОВ) для задачи интерпретации ГИС;
- выбор на основе рассмотренных методов оптимальной последовательности подготовки исходных данных и обучающей выборки для задачи интерпретации ГИС;
- выбор оценок, позволяющих определять качество полученной ОВ, до проведения процесса обучения НС;
- выбор корректных оценок, позволяющих определять качество интерпретации с помощью НС;
- разработка инструментальных средств для проведения подготовки исходных данных.
Методы исследования. В работе применялись теоретические и экспериментальные методы исследования.
При решении задачи качественной интерпретации данных ГИС применялась многослойная нейронная сеть, обучаемая алгоритмом обратного распространения ошибки. В качестве функции активации сети использовалась сиг-моида (логистическая функция). В качестве методов функционального преобразования каротажных диаграмм используются методы скользящего окна данных, спектральный и вейвлет анализы, методы декорреляции исходных сигналов и несколько методов нормализации данных. Для понижения размерности входного вектора используются корреляционный анализ и метод анализа главных компонент. В качестве алгоритмов снижения объема ОВ рассмотрены метод группировки, основанный на расстоянии Евклида, и метод кластеризации {к-средних).
Каротажные кривые исследовались на предмет выделения в скважине пластов-коллекторов и пластов с различными видами насыщения. Исследования проводились по группе из пяти каротажных методов (ВК, DS, DT, GR, NGR). Обработка исходных геофизических данных велась поточечно с тем же шагом дискретизации, что и оцифровка исходных данных, без предварительного расчленения разреза на пласты.
Инструментальные средства реализованы на алгоритмическом языке высокого уровня Delphi {Borland Delphi 7).
Достоверность и обоснованность полученных в работе результатов и выводов подтверждена результатами экспериментальных исследований.
Математические модели, алгоритмы и прикладные программы, предложенные в работе, основаны на фундаментальных положениях функционального анализа, теории статистического анализа временных рядов, а также теории вероятностей и методологии построения экспертных систем.
Достоверность экспериментальных результатов обеспечена использованием большого объема экспериментального материала, статистическими метои дами обработки данных и хорошей воспроизводимостью результатов.
Достоверность эталонного материала для обучения НС обеспечена использованием утвержденных в ОАО «Башнефтегеофизика» экспертных заключений по обрабатываемым скважинам.
На защиту выносятся результаты исследования применения методов подготовки исходных данных для многослойной нейронной сети при качественной интерпретации данных ГИС, обеспечивающих повышение скорости и качества при получении заключения по наличию нефтенасыщенных коллекторов непосредственно после проведения каротажных работ на скважине, в том числе:
- выбор и обоснование правил формализации задачи литологического расчленения разреза скважины с помощью многослойной НС;
- схема подготовки исходных данных, включающая в себя этапы сбора и предобработки данных, а также этап формирования ОВ, ее основные цели и задачи;
- применение схемы подготовки исходных данных, предложенной автором, для повышения эффективности интерпретации ГИС с помощью НС;
- выбор и обоснование методов подготовки исходных данных и формирования ОВ для повышения скорости и надежности распознавания данных ГИС;
- определение корректных оценок для анализа качества решения задачи качественной интерпретации данных ГИС с помощью НС;
- разработка и программная реализация инструментальных средств подготовки исходных данных;
Научная новизна полученных результатов определяется проведенными комплексными исследованиями, в результате которых, вопреки классическому подходу, основанному на решении системы петрофизических уравнений методами вычислительной математики, применен аппарат искусственных нейронных сетей. При этом .большое внимание было отведено этапу подготовки данных. Предложен комплекс методов, который позволяет повысить скорость и качество решения задачи. Все это позволяет использовать накопленный эмпирический материал и знания опытных интерпретаторов, являющийся ядром базы знаний интеллектуальной системы для литологического расчленения разреза скважины, в ходе которых:
- получены зависимости литологической структуры разреза скважины от вида представления каротажных данных, что дает возможность применять аппарат искусственных НС в геолого-геофизической области;
- предложен комплексный подход к подготовке данных при использовании НС, который нашел свое отображение в разработанной автором схеме подготовки исходных данных, включающей в себя этапы сбора и предобработки информации, а также этап формирования ОВ, которые ставят своей задачей повышение качества исходных сигналов за счет функциональных преобразований исходных данных, понижение размерности задачи и формирование сокращенной ОВ, следствием чего является повышение качества и скорости работы НС;
- показано применение схемы подготовки исходных данных к задаче интерпретации результатов ГИС, при этом, в результате проведения эксперимента по подготовке НС для решения задачи интерпретации данных ГИС удалось повысить качество интерпретации и сократить время, необходимое на подготовку НС, в два раза;
- предложены методики, которые могут быть использованы при подготовке исходных данных для задачи интерпретации результатов ГИС, проведены эксперименты, позволяющие сделать выводы об эффективности применения этих методов, в результате чего, на основе наиболее подходящих методов построены последовательности подготовки данных, полностью реализующие предложенную автором схему, ■ определена эффективность рассмотренных последовательностей ;
- разработанный программный модуль подготовки исходных данных, который позволяет быстро создавать необходимые последовательности методов для улучшения эффективности применения НС, имеет открытый исходный код, вследствие чего может быть интегрирован в разрабатываемые и существующие программные комплексы.
Практическая полезность. Полученные в работе методики и алгоритмы подготовки исходных данных, совместно с применением аппарата искусственных нейронных сетей, для качественной экспресс-интерпретации данных ГИС позволяют существенно автоматизировать труд геофизика-интерпретатора за счет колоссальных вычислительных возможностей по обработке большого объема геофизической информации интеллектуальными системами на базе как отдельных компьютеров, так и компьютерных сетей, существенно использующих реляционные базы данных таких как «Finder» и др. НС, за счет заложенных в них эталонных данных, и методы подготовки данных позволяют сократить время, необходимое на проведение качественной экспресс-интерпретации скважин, в несколько раз, повысить качество интерпретации и сократить количество ошибок при принятии решений:
Использование предложенной схемы подготовки данных с применением рассмотренных методов позволяет быстрее и качественнее проводить обучение НС. Это повышает эффективность ГИС за счет резкого расширения возможностей проведения экспресс-интерпретации во время проведения каротажных исследований с достаточно высокой степенью достоверности.
Настоящая работа обеспечивает необходимую базу для дальнейшего развития и совершенствования методов подготовки исходных данных для НС, в том числе и подготовки данных ГИС.
Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на российских и международных научно-технических конференциях и конгрессах: Международных НТК «Информационные технологии в инновационных проектах» (Ижевск, 2004); VI-м научном симпозиуме «Геоинформационные технологии в нефтегазовом сервисе» (Уфа, 2005); Международном симпозиуме «Надежность и качество» (Пенза, 2006); 33 Международной конференции «Информационные технологии в науке, социологии, экономике и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2006); 34 Международной конференции «Информационные технологии в науке, образовании, телекоммуникации и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2007); Международном симпозиуме «Надежность и качество» (Пенза, 2007).
Публикации. Результаты работы отражены в 14 научных публикациях, в том числе: 12 статей в журналах и сборниках, 1 тезис докладов на научно-технической конференции, 1 отчет о НИР (91с.). Автор имеет 8 научных трудов в изданиях, выпускаемых в РФ и рекомендуемых ВАКом для публикации основных результатов диссертаций.
Структура и объем работы. Диссертация содержит введение, 4 главы и заключение, изложенные на 189 с. машинописного текста. В работу включены 56 рис., 25 табл. и список литературы из 127.
Заключение диссертация на тему "Инструментальные средства интерпретации геофизических исследований скважин на основе преобразованных каротажных диаграмм с помощью многослойной нейронной сети"
Основные результаты и выводы работы следующие.
1. Проведен обзор существующих методов интерпретации геолого-геофизической информации, возможностей нейросетевых технологий, программных комплексов автоматизированной интерпретации результатов ГИС и программ, имитирующих работу НС, - нейросимуляторов. Показано, что существующие программные средства интерпретации основаны на классических подходах к решению данной задачи и, практически, не используют возможности искусственного интеллекта, а нейросимуляторы не имеют комплексного подхода к подготовке данных и не адаптированы к решению задач ГИС, поэтому, на практике они не применяются для интерпретации.
2. Приведены правила формализации входных и выходных (заключений интерпретатора) данных при решении задачи литологического расчленения разреза скважины, с помощью которых возможен анализ, как по самим исходным данным, так и по исходным данным, прошедшим этап подготовки (функциональной предобработки).
3. Разработана общая схема подготовки исходных данных, которая реализует комплексный подход к подготовке входных сигналов при использовании НС. Выделены основные этапы подготовки данных: сбор и анализ исходных данных, на котором происходит функциональное преобразование входных данных и решается проблема высокой размерности исходной задачи, предобработка данных, на котором корректируются существующие ошибки в данных и уменьшается или увеличивается количество примеров, и формирование ОВ для обучения НС, на котором помимо создания ОВ происходит вычисление коэффициентов качества ОВ. Сформулированы проблемы, цели и задачи, решаемые на каждом этапе схемы подготовки данных.
4. Произведена адаптация общей схемы подготовки данных для решения задачи интерпретации данных ГИС. Определены цели и задачи, которые являются актуальными в условиях, используемых в работе. Предложены методы, которые могут быть использованы для подготовки исходных каротажных кривых при интерпретации данных ГИС, на каждом этапе адаптированной схемы подготовки данных.
5. Проведены эксперименты в результате, которых найдена оценка применимости каждого из предложенных методов. Определены методы, дающие улучшение процесса интерпретации. С помощью наиболее эффективных методов составлены последовательности подготовки данных, из которых на основании экспериментальных данных, определена оптимальная последовательность, позволяющая повысить качество и скорость подготовки НС.
6. Выбраны оценки качества обучающего множества, которые могут быть вычислены до проведения процесса обучения НС. И, как следствие, могут быть использованы для решения вопроса о необходимости дополнительной подготовки данных. Использование коэффициентов качества ОВ позволяет снизить затраты на формирования НС.
7. Выбраны оценки качества интерпретации данных ГИС с помощью НС, которые позволяют в числовом виде характеризовать результаты решения задачи, и дают возможность проводить сравнение различных методов подготовки НС.
8. Проведен комплексный эксперимент по обучению НС с применением различных методов подготовки данных. Целью эксперимента было выделение пластов-коллекторов и нефтенасыщенных, водонасыщенных, нефте-водонасы-щенных пластов. Применение алгоритмов подготовки исходных данных и использования аппарата НС позволило получить до 86% совпадений оценок сети с эталонными данными при использовании порога округления и сократить время обучения нейронной сети в 2 раза. Следует заметить тот факт, что данные оценки являются относительными, поскольку отсутствуют доказательства абсолютной точности определения коллекторов экспертами и, как следствие, указанные оценки являются производными с учетом возможных ошибок экспертов. Иными словами, точность выделения литологических пластов в разрезе скважины с помощью НС может быть выше указанной.
9. Разработана библиотека подготовки данных, которая реализует основные методы, использованные в работе, а также функции, которые упрощают создание процедур подготовки данных. Созданная библиотека имеет открытый исходный код, вследствие чего может быть интегрирована в разрабатываемые и существующие программные комплексы.
10. В качестве развития исследований предложено провести поиск альтернативных методов, которые могут использоваться в рамках схемы подготовки данных, для повышения информативности исходных данных, а также поиск более точных оценок качества обучающей выборки. Также предложено провести анализ применимости других топологий НС и алгоритмов обучения для качественной и количественной интерпретации данных ГИС.
ЗАКЛЮЧЕНИЕ
В результате анализа применимости методов функционального преобразования исходных данных и подготовки обучающей выборки при распознавании литологической структуры скважины с помощью многослойной нейронной сети показано, что их применение позволяет повысить скорость и качество интерпретации данных ГИС. Это расширяет возможности использования аппарата НС и позволяет автоматизировать качественную интерпретацию непосредственно на скважине с достаточно высокой степенью надежности.
Библиография Костиков, Денис Владиславович, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Bernard Widrow, Michael A. Lehr, 30 Years of Adaptive NeuralNetworks: Per-ceptron, Madaline, and Backpropagation //Artificial Neural Networks: Concepts and Theory, 1.EE Computer Society Press, 1992, pp.327-354.
2. BrainMaker Professional. Neural Network Simulation Software User's Guide and Reference Manual. California Scientific Software, Inc, 1998.
3. Data Mining. Методы кластерного анализа. Итеративные методы. http://www.intuit.ru/department/database/datamining/14/datamining14.html
4. J.T. Yao and C.L. Tan, "A Case Study on Using Neural Networks to Perform Technical Forecasting of Forex," Neurocomputing, vol.34, pp. 79-98, 2000.
5. M. Lou, "Preprocessing Data for Neural Networks," Technical Analysis of Stocks & Commodities Magazine, Oct. 1993
6. Neural and Adaptive Systems: Fundamentals Through Simulations. NeuroDi-mension, Inc, 2000. 243 p.
7. Neural Computing: NeuralWorks Professional II/Plus and Neural Works Explorer. NeuralWare, Inc., 1991. 355 p.
8. Paul J. Werbos, Backpropagation Through Time: What It Does and How to Do It //Artificial Neural Networks: Concepts and Theory, IEEE Computer Society Press, 1992, pp.309-319.
9. Альбом палеток и номограмм для интерпретации промыслово-геофизических данных. М.: Недра, 1984.
10. Ануфриев И. Самоучитель Matlab 5.3/6.Х. СПб.: BHV, 2002
11. Аронов В. И. Об оптимальном размещении разведочных скважин / Математические методы решения задач нефтяной геологии на ЭВМ. М.: ВНИГ1. НИ, 1979. С. 3 -13.
12. Архангельский А. Я. Программирование в Delphi. Учебник по классическим версиям Delphi. Бином-Пресс, 2006.
13. Бадабаглы В.А., Изотова Т.С., Карпенко И.В., Кучеров Е.В. Литологическая интерпретация геофизических материалов при поисках нефти и газа. М.: Недра, 1998.
14. Бенамеур Л., Минаев Ю.Н., Филимонова О.Ю., Методы и алгоритмы решения задач идентификации и прогнозирования в условиях неопределенности в нейросетевом логическом базисе. М: Горячая линия - Телеком, 2003.
15. Бескровный Н.И., Кулигин Е.А. Система сбора/регистрации данных каротажа в реальном времени. НТВ Каротажник. №78. - С. 62-68.
16. Боганик В.Н. Методы оперативного обобщения промыслово-геофизической информации. М.: Недра, 1983.
17. Боганик В.Н., Медведев А.И., Григорьев С.Н., и др. Способы повышения достоверности обработки данных ГИС// НТВ "Каротажник". Тверь: Изд. АИС. 2001. Вып. 86. С. 99-110.
18. Бонгард М.М. и др. Опыт использования обучающейся программы для выделения нефтеносных пластов. Сб. "Проблемы расширения возможностей автоматов", №5. Ротапринт, 1964.
19. Вахитова Г.Р., Валиуллин Р.А., Ремеев И.С. Экспертная система обработки данных ГИС//НТВ "Каротажник". Тверь: Изд. АИС. 2000. Вып.72. С. 93101.
20. Вендельштейн Б.Ю., Резванов Р.А: Геофизические методы определения параметров нефтеносных коллекторов. -М.: Недра, 1978.-317 с.
21. Вентцель Е.С. Теория вероятностей — М., 1969. — 567 с.
22. Вержбицкий В. М. Основы численных методов: Учебник для ву-зов/В.М.Вержбицкий. М.: Высш. шк., 2002. - 840 с.
23. Витязев В.В. Вейвлет-анализ временных рядов: Учеб. пособие. СПб.: Иадво С.-Петерб. ун-та, 2001. 58 с.
24. Волков A.M. Решение практических задач геологии на ЭВМ. М.: Недра, 1980.
25. Вычислительная математика и техника в разведочной геофизике: Справочник геофизика/Под ред. В.И. Дмитриева-М.: Недра, 1990.
26. Геолого-технологические исследования в процессе бурения // РД 39-0147716-102-87. Уфа: ВНИИнефтепромгеофизика. 1987. 273 с.
27. Геолого-технологйческие исследования скважин/ J1.M. Чекалин, А.С. Моисеенко, А.Ф. Шакиров и др. М.: Недра. 1993. 240 с.
28. Геофизические методы исследования скважин. Справочник геофизика. Под ред. В.М.Запорожца. М., Недра, 1983.
29. Герман О. В. Введение в теорию экспертных систем и обработку знаний. -Минск: ДизайнПРО, 1995.
30. Головин Б.А., Калинникова М.В. Оптимальный технико-методический комплекс литолого-петрофиЗических исследований в процессе бурения нефтегазовых скважин//НТВ "Каротажник". Тверь: Изд. АИС. 1998. Вып.51. С. 55-64.
31. Горбачев Ю.И. Геофизические исследования скважин. М.: Недра, 1990. -398с.
32. Городнов А.В., Добрынин В.М., Черноглазов В.Н., Рыжков В.И. Применение системы "Камертон" для обработки волновых акустических полей и комплексной интерпретации данных ГИС// НТВ "Каротажник". Тверь: Изд. АИС. 2000. Вып. 71. С. 69-77.
33. Григорьев А.И., Тульчинский В.Г. Практическое применение пакета программ "Геопоиск" для обработки данных ГИС. НТВ Каротажник. №77. -С. 60-69.
34. Губерман Ш.А., Извекова М. Д., Хургин Я. И. Применение методов распознавания образов при интерпретации геофизических данных. М.: Самообучающиеся автоматические системы, 1966.
35. Гурьянов А.В., Нистюк А.И., Лялин В.Е. Комплекс программ для оперативной предварительной обработки каротажных сигналов//НТЖ "Вестник Иж-ГТУ". Ижевск: Изд. ИжГТУ, 2002. Вып.З. С. 93-101.
36. Давыдов А.В. Сигналы и линейные системы // http://prodav.narod.ru/
37. Дамаскин М.М., Семенов П.В., Васильев В.Ю. Опыт внедрения программного обеспечения ГТИ в зарубежных компаниях. НТВ Каротажник. №70. -С. 54-60.
38. Дахнов В.Н. Интерпретация результатов геофизических исследований резервов скважин. М., Недра, 1982. - 448с.
39. Дебранд Р. Теория и интерпретация результатов геофизических методов исследования скважин. -М.: Недра, 1972.
40. Дементьев Л.Ф., Жданов М.А., Кирсанов А.Н. Применение математической статистики в нефтегазопромысловой геологии. М.: Недра, 1977.
41. Добеши И. Десять лекций по вейвлетам. Москва-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2004, 464 с.
42. Дьяконов В., Круглов В. Математические пакеты расширения MATLAB. Специальный справочник. СПб.: Питер, 2001.
43. Дьяконов Д.И., Леонтьев Е.И., Кузнецов Г.С. Общий курс геофизических исследований скважин. М.: Недра, 1984. - 432 с.
44. Дьяконова Т.Ф. Применение ЭВМ при интерпретации данных геофизических исследований скважин: Учеб', пособие для вузов. М.:Недра, 1991. -220 е.: ил.
45. Ежов А.А., С.А. Шумский. Нейрокомпьютинг и его применения в экономике и бизнесе. М., 1998.
46. Зайченко В.Ю. Интеллектуализация добычных нефтегазовых технологий в России следствие глобализации// НТВ "Каротажник". Тверь: Изд. АИС. 2001. Вып. 84. С. 59-70.
47. Зверев Г.Н., Халилов Д.Д., Головацкая И.Б. Применение алгоритма распознавания образцов для интерпретации промыслово-геофизических данных в Башкирии. Тр. МИНХиГП, Вып. 62. М.: Недра, 1966.
48. Зунделевич С.М., Сохранов Н.Н. и др. Описание алгоритмов интерпретации данных электрического каротажа в рамках АСОИГИС/ЕС. М.: Изд. ВНИИГеофизики, 1983. - 82 с!
49. Ивакин В.Н., Карус Е.В., Кузнецов O.J1. Акустический метод исследования скважин. -М: Недра, 1978.
50. Иванов В.А., Лялин В.Е., Тарануха В.П. Разработка технических средств для повышения точности привязки каротажных сигналов к глубине скважины.// Тез. докл. 32 Научно-технической конференции ИжГТУ. Ижевск: ИжГТУ, 2000.
51. Ильинский В.М. Боковой каротаж. -М: Недра, 1971.
52. Итенберг С.С. Интерпретация результатов геофизических исследований скважин. М.: Недра, 1987. - 375с.
53. Итенберг С.С. Интерпретация результатов каротажа скважин. М.: Недра, 1978.
54. Итенберг С.С., Шнурман Г.А. Интерпретация результатов каротажа сложных коллекторов. М.: Недра, 1984. „
55. Каждан "А.Б. Разведка месторождений // БСЭ: В 30 т. / Гл. ред. А.М.Прохоров. 3-е изд. -М.: СЭ, 1975. Т. 21: Проба - Ременсы. - С. 406.
56. Каллан Р. Основные концепции нейронных сетей. М.: Вильяме, 2002.
57. Карпов Б.И. Delphi: специальный справочник. СПб: Питер-пресс, 2002. -688с.
58. Кафедра ТИС РГУ нефти и газа им. И.Н. Губкина предлагает компьютерную систему "Камертон"// НТВ "Каротажник". Тверь: Изд. АИС. 1999. Вып. 54. С. 106-109.
59. Кнеллер Л.Е., Гайфуллин Я.С., Потапов А.П. и др. Некоторые вопросы теории и интерпретации материалов геофизических исследований скважин// НТВ "Каротажник". Тверь: Изд. АИС. 2001. Вып. 82. С. 188-205.
60. Кнеллер JI.E., Гайфуллин Я.С., Рындин В.Н. Автоматизированное определение коллекторских свойств, нефтегазонасыщенности по данным каротажа (петрофизические модели и методы)// Обзор. М.: ВИЭМС. 1990 72 с.
61. Кнеллер Л.Е., Рындин В.Н., Плохотников А.Н. Оценка проницаемости пород и дебитов нефтегазовых скважин в условиях сложных коллекторов по данным ГИС// Обзор. Сер. Разведочная геофизика. М.: ВИЭМС МГП "Гео-информмарк". 1991. 65 с.
62. Колмогоров А.Н. Введение в теорию вероятностей. М.:Наука, 1982.
63. Кондратов В.Е., Королев С.Б. MATLAB как система программирования научно-технических расчетов. М: Мир, 2002. - 350 е.: ил.
64. Конев С.Н., Косолапов Ю.В. Пять лет использования компьютеризированных комплексов ГЕОТЕК// НТВ "Каротажник". Тверь: Изд. АИС. 2001. Вып. 83. С. 30-39.
65. Короткий С. Нейронные сети Хопфилда и Хэмминга // http://www.neuropower.de/rus/books/index.htm
66. Короткий С. Нейронные сети: алгоритм обратного распространения // http://www.neuropower.de/rus/books/index.htm
67. Короткий С. Нейронные сети: обучение без учителя // http://www.neuropower.de/rus/books/index.htm
68. Короткий С. Нейронные сети: основные положения // http://www.neuropower.de/rus/books/index.htm
69. Крейтер В.М. Поиски и разведка месторождений полезных ископаемых. 2 изд., М., Недра, 1969.
70. Крисилов В.А., Кондратюк А.В. Преобразование входных данных нейросе-ти с целью улучшение их различимости. // http://neuroschool.narod.ru/pub/krikon.pdf
71. Крисилов В.А., Чумкин К.В. Ускорение обучения нейронных сетей за счет адаптивного упрощения обучающей выборки. // http://neuroschool.narod.ru/pub/fstd.pdf
72. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. 2-е изд., стереотип. - М.: Горячая линия - Телеком, 2002. - 382 е.: ил.
73. Купер Дж., Макгиллем К. Вероятностные методы анализа сигналов и систем: Пер с англ.-М.: Мир, 1989.-376 с.
74. Латышова М.Г. Практическое руководство по интерпретации диаграмм геофизических методов исследования нефтяных и газовых скважин. М.: Недра, 1996.
75. Латышова М.Г., Венделыптейн Б.Ю., Тузов В.П. Обработка и интерпретация геофизических исследований скважин. М.: Недра, 1990. - 312с.
76. Ломтадзе В.В. Программное и информационное обеспечение геофизических исследований. М.: Недра, 1993.
77. Лукин А. Введение в цифровую обработку сигналов (математические основы) : МГУ 2002. 44с.
78. Лукьянов Э.Е., Нестерова Т.Н. Компьютерная технология проведения геолого-технологических исследований//НТВ "Каротажник". Тверь: Изд. АИС. 1998. Вып.53. С. 18-29.
79. Лукьянов Э.Е., Стрельченко В.В. Геолого-технологические исследования скважин в процессе бурения. М.: Нефть и газ. 1997. 679 с.
80. Лялин В.Е. Интеллектуальные информационно-измерительные технологии и программно-аппаратные комплексы для автоматизации геофизических исследований скважин. Екатеринбург-Ижевск, 2001. 352с.
81. Макс Ж. Методы и техника обработки сигналов при физических измерениях. Т. 1-М.: Мир, 1983.
82. Макс Ж. Методы и техника обработки сигналов при физических измерениях. Т. 2-М.: Мир, 1983.
83. Марпл С. JI. Цифровой спектральный анализ и его приложения / Пер. с англ. О. И. Хабарова, Г.А. Сидоровой; Под ред. И. С. Рыжака. М. : Мир, 1990. - 584 с.
84. Математические методы в задачах петрофизики и корреляции/Под ред. Вайнбер Я.М. и др. М.: Наука, 1983.
85. Миркес Е.М. Нейроинформатика: Учеб. пособие для студентов / Е.М. Мир-кес. Красноярск: ИПЦ КГТУ, 2002^ 347 с.
86. Мкртчян С.О. Нейроны и нейронные сети. (Введение в теорию формальных нейронов) М.: Энергия, 1971. - 232 с.
87. Нейроинформатика / А.Н.Горбань, В.Л.Дунин-Барковский, А.Н.Кирдин и др. Новосибирск: Наука. Сибирское предприятие РАН, 1998.
88. Нейропрограммы. Учебное пособие: В двух частях / Под. ред. А.Н.Горбаня. Красноярск: изд. КГТУ, 1994. Часть 1.-137 с. Часть 2.-123 с.
89. Нестерова Т.Н. Состояние и перспективы развития программного обеспечения геолого-технологических исследований. НТВ Каротажник. №69. - С. 20-30.
90. Обработка и интерпретация данных промысловых геофизических исследований на ЭВМ. Справочник /.Сохранов Н.Н., Аксельрод С.М., Зунделевич С.М., Чуринова И.М.; Под. ред. Сохранова Н.Н. М.: Недра, 1989. - 240с.
91. Описание Neural Bench // http://www.icmm.ru/~masich/win/lexion/neyro/neuralb.htm
92. Осипов Д. Delphi. Профессиональное программирование. Символ-Плюс, 2006.
93. Осовский С. Нейронные сети для обработки информации. М: Финансы и статистика, 2001.
94. Подсчет запасов месторождений полезных ископаемых. М.: Недра, 1960.
95. Померанц Л.И., Белоконь Д.В., Козяр В.Ф. Аппаратура и оборудование геофизических методов исследования скважин. М.: Недра, 1985. - 271с.
96. Померанц Л.И., Бондаренко М.Т., Гулин Ю.А., Козяр В.Ф. Геофизические методы исследования нефтяных и газовых скважин. М.: Недра, 1981.
97. Померанц Л.И., Чуркин В.Т. Аппаратура и оборудование для геофизических исследований скважин. М., Недра, 1978.
98. Попов Э. В. Экспертные системы. Решение неформализованных задач в диалоге с ЭВМ. М.: Наука, 1987.
99. Потемкин В.Г. Инструментальные средства MATLAB 5.x. М: Диалог-Мифи, 2001.
100. Рекламные материалы НПЦ "Тверьгеофизика": Комплекс программ обработки данных электрического, электромагнитного, акустического и радиоактивного каротажа нефтегазовых скважин// НТВ "Каротажник". Тверь: Изд. АИС. 1997, Выпуск 32, С. 81-95.
101. Розов Е.А., Нестерова Т.Н. Принципы построения системы сбора и обработки геолого-технологической информации в реальном времени. НТВ Каротажник. №70. - С. 5-19.
102. Руководство пользователя программы Neuro Office.
103. Руководство пользователя программы NNet.
104. Сайт BaseGroup Labs Кластеризация // http://www.basegroup.ru/clusterization/
105. Сайт BaseGroup, Labs Нейронные сети // http://www.basegroup.ru/neural/
106. Сайт BaseGroup Фильтрация // http://www.basegroup.ru/filtration/
107. Сато Ю. Обработка сигналов: первое знакомство, Додэка, 2002, 176 стр.
108. Система автоматизированной визуальной интерпретации результатов геофизических исследований скважин Gintel 97. Руководство пользователя.- М.: Компания ГИФТС Ко. Лтд., 2000.
109. Словарь терминов разведочной геофизики/В. Н. Ботаник и др.; Под ред. А.И. Богданова. М.: Недра, 1989.
110. Служаев В.Н. Состояние и перспективы НИОКР в ОАО НПФ "Геофизика". НТВ Каротажник. №88. - С. 106-115.
111. Сохранов Н.Н. Машинные методы обработки и интерпретации результатов геофизических исследоваций скважин. М.: Недра, 1973.
112. Сохранов Н.Н. XX Век некоторые вехи биографии нашего карота-жа//НТВ "Каротажник". - Тверь: Изд. АИС, 2000. Вып.76. С. 30-54.
113. Сохранов Н.Н., Аксельрод С.М. Обработка и интерпретация с помощью ЭВМ результатов геофизических исследований нефтяных и газовых скважин. М.: Недра, 1984. - 255 с.
114. Тарасенко Р.А., Крисилов В.А. Предварительная оценка качества обучающей выборки для нейронных сетей в задачах прогнозирова-ния'временных рядов. // Труды Одесского политехнического университета.- Одесса, 2001. Вып.1. - С. 90-93.
115. Уоссермен Ф. Нейрокомпьютерная техника. М., Мир, 1992.
116. Устройства для регистрации аналого-цифровой информации автоматических каротажных станций / Вахрушев И.А., Лялин В.Е., Попович М.Е.; ИжГТУ- Деп. в ВИНИТИ 1999, № 3428-В99. 54с.
117. Хайкин С. Нейронные сети: полный курс, 2-е издание. М., Издательский дом «Вильяме», 2006.
118. Царегородцев В.Г. Об исследовании эффективности одного метода построения отказоустойчивых нейросетей // Материалы X Всеросс. семинара "Нейроинформатика и ее приложения", Красноярск, 2002. 185с. с.157-160.
119. Царегородцев В.Г. Оптимизация предобработки данных для обучаемой нейросети: критерии оптимальности предобработки // Материалы XIV Международной конференции по н^йрокибернетике, Ростов-на-Дону, 2005.1. Т.2. С.64-67.
120. Царегородцев В.Г. Оптимизация предобработки данных: константа Липшица обучающей выборки и свойства обученных нейронных сетей И Нейрокомпьютеры: разработка, применение. 2003, №7. с.3-8.
121. Царегородцев В.Г. Перспективы распараллеливания программ нейросете-вого анализа и обработки данных // Материалы III Всеросс. конф. "Математика, информатика, управление 2004", Иркутск, 2004.
122. Чуринова И.М., Сержантов Р.Б., Скрипникова Г.В., Шацкий А.В. Интегрированная система "Гемма",и ее применение при моделировании залежей углеводородов. НТВ Каротажник. №80. - С. 108-120.
123. Шерстнев С.Н. Аппаратное обеспечение компьютеризированной технологии геолого-геохимических исследований скважин в процессе буре-ния//НТВ "Каротажник". Тверь: Изд. АИС. 2000. Вып.73. С. 47-68.
124. Элланский М.М. Использование современных достижений петрофизики и физики пласта при решении задач нефтегазовой геологии по скважинным данным: Учебное пособие для вузов. М.: РГУ нефти и газа, 1999.
125. Элланский М.М., Холин А.И., Зверев Г.Н., Петров А.П. Математические методы в газонефтяной геологии и геофизике. М.: Недра, 1972.
-
Похожие работы
- Анализ применимости многослойной нейронной сети для распознавания литологической структуры скважины по данным геофизических исследований
- Интеллектуальная система программного и информационного обеспечения процессов контроля и обработки каротажных данных и их интерпретации
- Программно-аппаратные средства для интерпретации геофизических исследований скважин на основе нейроинформационных технологий
- Системный анализ определения погрешностей при формировании скан-образов каротажных диаграмм для интерпретации геофизических исследований скважин
- Математические модели и программно-аппаратные средства интеллектуальных систем для интерпретации геофизических исследований скважин
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность