автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Методы неметрического многомерногошкалирования для анализа нечисловойгеологической информации при поискахи оценке месторождений золота Казахстана
Автореферат диссертации по теме "Методы неметрического многомерногошкалирования для анализа нечисловойгеологической информации при поискахи оценке месторождений золота Казахстана"
Вычислительный Центр Сибирского Отделения Российской Академии Наук
Методы неметрического многомерного шкалирования для анализа нечисловой геологической информации при поисках и оценке месторождений золота Казахстана
Специальность 05.13.16 - применение вычислительной техники, математического моделирования л матздкпгаесхих методов в научных исследованиях
На правах рукописи
Грачева Светлана Семеновна
Автореферат
диссертации иа соискание ученой степени кандидат» технических наук
Новосибирск 1996 г.
Работа выполнена в Вычислительном Центре Сибирского Отделения Академии Наук России
Научные руководители - доктор фнзико-математичеехмх наук,
член-корреспондент Российской Акадешс* естественных наук Воронин Ю.А.,
доктор геолсго-мзгнералогических наук, Бугаед АН.
Официальные оппоненты - доктор физшсо-матемашчюских наук Лбов Г.С.,
кандидат геетогомкнералогтеских наук Федосеев Г.С,
Бздувдая организация - Южно-Сибирский Региональный
информационный компьютерный центр
Защита диссертации сосгоистся 24 декабря 1996 года в 14 часов 30 ш^хут на заседании диссертационного совета Д 002.10.02 в Вычислительном центре Сибирского Оидошшя РАН по. адресу : 630090, Новосибирск, 90, пр. Акад. Лаврентьева, 6.
С диссертацией можно ознакомиться в читальном зале библиотеки ВЦ СО РАН (Новосибирск, 90, пр. Акад. Лаврентьева, 6)
Автореферат разослан " " 1996г.
Ученый секретарь специализированного совета
кандидат технических наук Забиняко Г.И.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы.
При решении прогнозно-поисковых задач в геологии, как правило, одним из этапов работы является исследование структуры множества объектов прогноза и эталонных объектов, выяснение взаимоотношений между ними. Исходная информация зачастую носит качественный характер и ее источником являются суждения экспертов-геологов. Задача состоит в том, чтобы на основе анализа таких неколмчественных оценок выявить структуру множества геологических объектов, их взаимоотношение друг с другом. При использовании известных формальных оптимизационных процедур обработки многомерных геологических данных всегда остается сомнение в достоверности получаемых выводов, так как при всем желании нельзя в полной мере отразить все знания к представления специалиста-геолога.
Выход из этой ситуации возможен, если оптимальным образом перейти от решения задачи оценки сходства, аналогии геологических объектов в многомерных геологических пространствах к решению этих задач в трехмерных или двумерных пространствах, допускающих визуальный анализ взаимоотношений оцениваемых объектов с известными месторождениями и рудопроявлениями.
Эта содержательная задача называется задачей визуализации и является предметом исследования в методах неметрического многомерного шкалирования (НМШ).
До недавнего времени были достаточно хорошо разработаны и широко применялись в геологии методы метрических многомерных отображений, решающие задачу визуализации для количественных геологических данных, однако качественные геологические данные не использовались и были известны только теоретические возможности методов НМШ н примеры их использования в других областях знаний, но не были ясны способы использования их при решении задач оценки и разбраковки месторождений полезных ископаемых и вычислительные аспекты этой проблемы.
В отечественной литературе все исследования по этой проблеме посвящены исключительно решению социально-экономических задач и задач социологии (В.С.Каменский, ГА Сатаров, А-Ю.Терехина и др.). Большое число исследований в этом направлении проведено за рубежам, но исключительно для решения задач психоиетрики (ПГепард, Крускзл, Вандерборх, Клейн, Розенберг, Кэнделл и др.).
Целью диссертации является".
1. Выделение классов содержательных геологических задач, связанных с визуализацией многомерных некаличесхвенных геологических данных в процессе решения задач прогноза и поиска месторождений.
2. Разработка методики использования методов НМШ для решения этих задач.
3. Разработка математического обеспечения и пакета прикладных программ для решения прогнозно-поисковых задач на основе применения алгоритмов НМШ.
Защищаемые положения.
1. Выделен широкий класс содержательных геологических задач прогноза и поиска месторождений, которые допускают формальную постановку и решение в терминах теории неметрического многомерного шкалирования.
2. Оптимальное решение задач многомерного неметрического шкалирования целесообразно осуществляется с помощью методов случайного поиска экстремумов функций многих переменных и использования методов теории идентификации. Решения в классе методов оценки групповых решающих правил можно получить, используя методы неметрического многомерного шкалирования.
3. Разработанные алгоритмы и программы неметрического многомерного шкалирования являются адекватным математическим аппаратом обработки некаличественных геологических данных при прогнозе и поиске месторождений.
Научная новизна.
1. Впервые выделен и сформулирован класс геологических задач, связанный с прогнозом и поиском месторождений, допускающий эффективное решение с помощью методов неметрического многомерного шкалирования.
2. Впервые предложены к разработаны методы решения задач неметрического многомерного шкалирования с помощью методов случайного поиска экстремумов функции многих переменных и методов идентификации.
3. Впервые предложен алгоритм оценки групповых решающих правил с помощью методов неметрического многомерного шкалирования.
4. Разработан пакет прикладных программ, реализующий методы неметрического многомерного шкалирования для решения задач прогноза и оценки месторождений. С его помощью решены реальные задачи оценки золоторудных месторождений Казахстана.
Практическая ценность.
Разработанная методика позволяет существенно расширить возможности применения экспертных геологических данных, более полно использовать знания и опыт зкспертов-гесяогов в виде ела б ©формализованных суждений об объектах прогноза. Также она может быть использована как средство отбора наиболее компетентных источников информации, например, на этапе создания баз знаний в экспертных системах, решающих прогнозно-поисковые задачи.
Апробация работы.
Основные положения диссертации л ее результаты были доложены на 5 Республиканской конференции молодых ученых и специалистов-геологов (Алма-Ата 1986 г.), на научно-технической конференции КазИМСа (Алма-Ата 1985 г.), на Международном симпозиуме по применению математических методов в геологии (ЧССР, 1993 г.) Пакет программ по НМЖ передан для внедрения в Производственное Геологическое Объединение "Укргеофнзика" Мингео Республики Украина, Управление геологии Грузии, Комплексную тематическую экспедицию производственного геологического объединения "Дальгеология" Госкомгеологии России, Информашгонно-вычислители шй пенгр производственного геологического объединения "Самаркандгеология" Республики Узбекистан.
По теме диссертации опубликовано 4 работы и написано два отчета. Издано методическое руководство "Пакет прикладных программ по неметрическому многомерному шкалированию" (Алма-Ата, 1986 г.).
СОДЕРЖАНИЕ РАБОТЫ
В настоящее время в самых различных областях исследований широко применяются методы, связанные со сбором и обработкой мнений специалистов по исследуемой проблеме - методы, использующие экспертные оценки.
Рассмотрим схему, под которую попадает большинство задач, решаемых с помощью опроса экспертов. Имеется группа экспертов и набор объектов. Экспертам дается задание оценить объекты или группы объектов, в частности, пары, по шкале, которую экспериментатор считает интервальной, порядковой или классификационной. Результатом обработки должны являться опять-таки оценки объектов по одной или нескольким шкалам, т.е. одна или несколько числовых оценок, упорядочений или разбиений объектов.
Рассмотрим 3 задачи НМЩ.
Задача 1.
Непосредственно в результате экспертного опроса или после первичной обработки получена матрица близости объектов, т.е. матрица, строки и столбцы которой соответствуют: объектам, а элементы - оцишк близости ¡-го объекта .¡-му, измеренные в порядковой шкале. Необходимо представить объекты в виде точек в пространстве меньшей размерности так, чтобы порядок расстояний = <3(1 о) меаду точками соответствовал порядку мер близости между объектами.
Задача 2.
Имеется набор упорядочений объектов. Каждое упорядочение дано непосредственно экспертом гош полученно каким-либо другим способом. Объекты и признаки считаются точками в пространстве, Координатные оси этого просгранства - факторы, определяющие ранги объектов по признакам. Матрица упорядочений порождается расстояниями в этом пространстве: порядок величин г^ совпадает с порядком расстояний от .¡-го признака до всех объектов. В соответствии с этой моделью задача обработки матрицы упорядочений ставится так: построить пространство минимальной размерности таким образом, чтобы порядок расстояний от точек-признаков до точек - объектов совпадал (или был близок) с порядком величин в строках матрицы Цгр|| (задача неметрического многомерного развертывал пш).
Задача 3.
Непосредственно в результате экспертного опроса или после первичной обработки получено упорядочение объектов. Кроме того, имеется набор классификационных признаков, описывающих эти же объекты, Необходимо приписать градации признакам таким образом, чтобы функция фиксированного вида достаточно хорошо восстанавливала упорядочение. Эта задача носит название "сопряженные измерения". Ее можно интерпретировать как задачу о построении целевой функции, в случае, когда входные параметры не являются числовыми признаками.
В приложении к проблемам обработки качественных геологических данных методы НМШ могут быть использованы для решения следующих содержательных задач.
Пусть имеется п объектов и к экспертов или критериев, или, вообще, некоторых качественных признаков. Объекты оценены в ранговой или балльной шкалах (порядковых шкалах), так, что они могут быть упорядочены по этим оценкам.
Тогда появляются следующие содержательные задачи:
1. Выяснение минимального числа факторов, общих для всех экспертов или критериев.
2. Визуализация (отображение в 2-х или 3-х мерное пространство) к*п точек и анализ результатов визуализации - выделение однородных групп объектов и экспертов (или критериев).
3. После выделения минимального числа факторов, общего для всех экспертов или критериев - их объяснение по следующим возможным схемам:
а) с помощью упорядочения расположения п объектов по каждой из выделенных осей (по каждому фактору),
б) если объекты описаны исходными полиномиальными качественными признаками - то оценка по гам некоторых "весов" каждого полиномиального признака, таких, что по суммам этих полиномиальных признаков с их "весами", эти суммы можно ранжировать так же, как ранжируются п объектов по той или иной из осей-факторов.
Задача, которая раньше была названа задачей "сопряженных измерений" и которая называется "Задачей неметрического многомерного шкалирования с дополнительной информацией", в содержательном плане может появляться также в следующих случаях.
1. Задано некоторое упорядочение эталонных месторождений и эталонных рудопроявлений, и все они описаны системой полиномиальных качественных признаков. Требуется найти веса полиномиальных признаков такие, что суммы полиномиальных признаков с их весами упорядочиваются так же, как и объекты в исходном упорядочение Полученная таким образом линейная комбинация полиномиальных признаков может использоваться в дальнейшем в качестве решающего правила для отнесения новых объектов к эталонным месторождениям или эталонным рудопроявлениям по величине суммы полиномиальных признаков нового объекта с учетам найденных весов признаков.
2. Имеется некоторое групповое решение об упорядочении п объектов прогноза по ряду индивидуальных упорядочений. Это групповое решение может быть "объяснено" в терминах весов полиномиальных признаков, найденных по тем или иным процедурам "многомерного неметрического шкалирования с дополнительной информацией".
Алгоритмы для решения задач НМШ состоят в поиске экстремума коэффициента соответствия, измеряющего для задачи 1 - степень соответствия порядка расстояний <3ц с порядком мер близости, для задачи 2 - порядка расстояний <5у с порядков рангов гр, для задачи 3 - порядка значений выбранной функции £ для объектов с имеющимся порядком объектов г^.
1.1. Метод Шепарда неметрического многомерного шкалирования
Задачу неметрического многомерного шкалирования можно поставить следующим образом.
Пусть имеется симметрическая матрица различий порядка п(п-1)/2 с элементами Цу. Элементы этой матрицы упорядочзсл в порядке возрастания. Пусть, кроме того, задана некоторая начальная конфигурация п точек в пространстве размерности г. Вычислим расстояния между п точками ^ и упорядочим их в порядке возрастания. Тогда задача неметрического многомерного шкалирования сводится к сравнению ранжированных расстояний с ранжированными различиями при выполнении условия монотонности, т.е. при условии, когда точки с маленьким значением меры различия должны находиться на небольшом расстоянии в искомом пространстве, а точки с большим значением различия - на значительном. Если конфигурация не удовлетворяет условию монотонности, то необходимо найти лучшую конфигурацию путем передвижения точек таким образом, чтобы растянуть маленькие расстояния, соответствующие большим различиям, и сжать большие расстояния, соответствующие малым различиям.
Для оценки приближения порядка расстояний к исходному порядку различий вводится некоторая мера, характеризующая расхождение рангов исходных различий Е>у и полученных расстояний для каждой пары объектов. На оснозе таких мер строятся векторы, в направлении которых на данной итерации перемещаются точки с целью получения конфигурации, удовлетворяющей условию монотонности.
Особенность метода Шепарда заключается в том, что размерность пространства объектов не оценивается заранее, а определяется в ходе анализа.
1.2. Метод Крускэла неметрического многомерного шкалирования
Крускэл, развивая идеи Шепарда, предлагает, во-первых, более формализованный метод, целью которого также является сохранение монотонного отношения между исходными различиями и полученными расстояниями. Крускэл вводит некоторую количественную меру немонотонности, называемую "стресс", тго даст возможность для любой конфигурации точек измерить, насколько хорошо она приближает данные. Во-вторых, Шепард определяет размерность искомого пространства в ходе самого анализа, в то время как Крускэл предполагает, что размерность оценивается заранее. Точнее говоря, проблема нахождения наилучшей конфигурации решается всякий раз в пространстве фиксированной размерности г. Но такая процедура может быть проделана для нескольких
значений г, и затем по конечной конфигурации и по величине стресса экспериментатор может выбрать наиболее подходящую размерность.
В случае, когда количество объектов достаточно велико (п>50) и требуется много времени для работы алгоритма, можно сделать прерывание его работы, а координаты конечной конфигурации записать на диск. При обращении к программе еще раз, можно исходить из конфигурации, полученной при предыдущей работе алгоритма.
1.3. Метод Гутгмана неметрического многомерного шкалирования
Этот метод, так же, как и другие методы неметрического многомерного шкалирования, ставит своей целью представление п объектов в виде точек в некотором координатном пространстве с фиксированной метрикой, удовлетворяя при этом двум условиям:
а) отображение должно быть монотонным,
б) пространство должно быть минимально возможной размерности.
Существует два способа реализации: однофазовый и двухфазовый.
Однофззовый алгоритм более сложный, он не накладывает независимых ограничений на процесс решения задачи и поэтому может увести в сторону локального минимума.
В данном случае использовался двухфазовый алгоритм. Начальные этапы алгоритма совпадают с соответствующими этапами алгоритма Кру скала.
По степени сохранения в матрице информации об алементах матрицы можно выделить четыре типа монотонности: полуслабый, слабый, полусильный, сильный.
В зависимости от типа монотонности существует четыре способа получения монотонного преобразования
При проведении итеративного процесса предполагается, что известна размерность искомого координатного пространства и вычисляется Каждый алгоритм имеет еще одну дополнительную фазу определения минимального значения г. Пусть ц(г) - максимально достигнутая величина ц для фиксированного г. Для идеального решения г удовлетворяет соотношению |л(г-1)<ц(г)=1.
Эксперименты показывают, что хорошие результаты получают при наименьшей размерности пространства г , для которой коэффициент отклонения от монотонности к<1,5.
Процесс останавливается, если мера отклонения от монотонности ц=1-е, где « - достаточно малое число, задаваемое пользователем, или достигнут максимум количества итераций. При работе алгоритма Гутгмана, если число объектов достаточно велико (п>50), можно произвести программное прерывание такое же, как при работе алгоритма Кру скала.
8
1.4. Метод Джонсона неметрического многомерного шкалирования
Метод Джонсона основан на минимизации попарных отклонений от монотонности.
Пусть для двух пар объектов (А,, Ар и (А^, А^ заданы различия и В^] и пусть в данный момент вычисленные расстояния между соответствующими точками равны <3^ и Если разность (Ву-Цц) и (с^-сЗц) имеют один и тот же знак, то считается, что расстояния в згой паре находятся в желаемом соотношении; если же разности имеют разные знаки - требуемое соотношение для двух пар нарушается.
Критерий качества приближения определяется как
¡<1 и)
1<!Л<1
иух
©2= ъ^М-^)
Процедура заканчивается, когда © либо перестает убывать, либо достигает малого значения. ®=0, когда все пары находятся в желаемом порядке. Можно задать верхний предел для числа итераций. © возрастает с увеличением числа точек и уменьшается с увеличением размерности.
1.5. Метод неметрического многомерного развертывания В.С.Каменского
Имеется набор упорядочений объектов. Каждое упорядочение дано непосредственно экспертом или получено каким-либо другим способом. Необходимо представить объекты и экспертов в виде "точек" в метрическом пространстве так, чтобы порядок расстояний с1(х£,х^ от точки "эксперта" до точек "объектов" соответствовал присвоенным рангам г; экспертом уз.
В методе неметрического многомерного развертывания различия в ответах экспертов не случайны и объясняются различным положением точек, соответствующих экспертам в пространстве. Считается, что точка, соответствующая эксперту - это "идеальный" с точки зрения эксперта объект.
Нахождение конфигурации точек-признаков и точек-объектов, минимизирующих коэффициент соответствия © проводится по градиентному методу Крускала.
1.6. Неметрическое многомерное шкалирование с использованием дополнительной информации
Рассмотрим задачи неметрического многомерного шкалирования, используюхцис дополнительную информацию.
Алгоритм для решения задачи "соизмерения признаков" состоит из следующей последовательности, шагов;
1. Задано и объектов х;, описанных га признаками.
2. Задано упорядочение п объекте®
3. Предполагается, что каждый признак имеет две градации, одна из которых имеет значение 1, другая - 0.
4. У каждого признака выбираем ту градацию, которая имеет единичное значение. Выбранные градации нумеруются. Эти градации будут использованы при вычислении функций
5. С помощью датчика случайных чисел присваиваем всем (га*2) градациям начальные числовые значения.
6. Вычисляем значения функций +аз® +... +ат(к). где а^) -градация, выбранная у к-го объекта для 1-го признака.
7. Для полученных на предыдущем шаге { вычисляем значение коэффициента соответствия.
8. Вычисляем значение производных по каждой градацшг.
9. Вычисляем координаты точек последующей конфигурации.
10. Оцениваем разность между значениями &2 на предыдущем и текущем шаге итерации.
Если эта разность меньше заданной величины е, вычисления прекращаются, если больше или равна с, возвращаемся к шагу 6.
Алгоритм для решения задачи "монотонная регрессия" состоит из следующей последовательности шагов:
1. Задано п объектов, описанных т признаками и их упорядочение
%
2. С помощью датчика случайных чисел генерируется совокупность начальных значений весов признаков.
3. Получаем конфигурацию п объектов со взвешенными признаками
> ГДС ^ " Ес0признака.
4. Вычисляем функции fJ-=WJ*Xl(t)+W2»X2W+...-^•wпl*xот(t).
5. Вычисляем значение коэффициента соответствия.
6. Вычисляем значение частных производных функции по всем весам (1=1,Ш).
Последующие шаги данного алгоритма аналогичны шагам 9 и 10 в задаче "соизмерения признаков".
1,7. Комбинация матричного алгоритма Каменского с алгоритмами минимизации функции многих переменных методами "случайного поиска" и "случайного поиска с адаптацией"
Этот метод решает задачу многомерного развертывания для двух типов данных.
1. Исходные данные к матриц предпочтений п объектов. Каждая .¡-я матрица 0=1,...,к) предпочтений задается экспертом в виде квадратной мат-рицы порядка тип.
2. Исходные данные: л объектов к 1с экспертов. Исходная матрица рангов состоит из п столбцов и к строк с элементами г^ 0=1,п; ;р1,к), где г^ - ранг, поставленный 1.-му объекту .¡-м экспертом.
Эта матрица может быть преобразована в матрицу предпочтений, исходя из условии; чем больше ранг, тем более предпочтительнее объект.
Задача ставится так, чтобы развернуть эти матрицы на пространство заданной более низкой размерности ш (ш, как правило, равно 2).
Алгоритм состоит из следующей последовательности шагов.
1. В пространстве размерности т вводятся начальные координаты п объектов (Хд'; 1=1 ,п; 1=1,т) и к экспертов (у^; 3=1,к; 1я=1,т).
2. Вводятся к матриц предпочтений для п объектов.
т
3. Оцениваются величины: Г/ = - ур)
»-I
4. Оценивается к матриц различий.
Оценивается "мягкий" парный коэффициент соответствия.
Данный коэффициент соответствия использует в качестве исходных данных только верхние треугольные матрицы ЦЭДщ! и ЦбивИ-
Идеальное значение ©*=0.
Далее происходит выбор начальной конфигурации.
6. Оценивается матрица ||В| из к строк и п столбцов с элементами Ьр.
4-1
7. Оценивается диагональная матрица И размером п*п, в которой
У
8. Оценивается матрица |)Аи|| размером (п+к)*(п+к):
и к
2 -ъ
-Ь 0
Для полученной на предыдущем шаге (г>1) конфигурации находятся и ш собственных векторов матрицы Аи, удовлетворяющих следующим условиям:
1)Е Л, >0;
ы
т
2) -> гаи;
1-1 1.1
3) ии один из собственных векторов не должен быть вектором из констант.
Найденные т векторов размерности п+к каждый берутся в качестве новой конфигурации (первые п. компонент т-го вектора - ш-я координата п объектов; к последних - ш-я координата к экспертов).
Собственные числа не ранжируются, а выбирается та их пара, алгебраическая сумма которых положительна и минимальная из всех возможных пар.
Задача поиска ш собственных векторов, соответствующих ш минимальным собственным числам X, матрицы Аи решается с помощью метода ортогональных разложений.
После оценки начальной конфигурации с помощью матричного алгоритма Каменского поиск наилучшей конфигурации, обеспечивающей минимум коэффициента соответствия осуществляется с помощью алгоритма случайного поиска или случайного поиска с адаптацией.
При работе алгоритмов случайного поиска или случайного поиска с
адаптацией используется модифицированный коэффициент соответствия
>
\Д
I * / я-1 а 2 п-1 л .
© / I
(1.1)
1
кроме деления на количество экспертов он делится на сумму всех для верхней треугольной матрицы.
1.8. Задача поиска группового линейного порадка (гл.п.)
В качестве исходной информации выступает к матриц предпочтений.
Алгоритм поиска гл.п. состоит из следующей последовательности шагов.
1. В пространстве размерности 2 задаются начальные координаты п объектов и идеального объекта X.
2. Для всех п объектов оценивается матрица расстояний
3. Оценивается к матриц соответствия порядка п»п.
4. Оценивается критерий соответствия по формуле (1.1)
5. Для поиска координат объектов и идеального объекта, обеспечивающего минимум коэффициента соответствии ©2, используются
алгоритмы минимизации функций многих переменных такие, как алгоритмы случайного поиска и случайного поиска с адаптацией.
6. При достижении минимума коэффициента соответствия или при
остановке по исчерпанию заданного количества итераций, оценка в
2
двухмерном пространстве величины: £{ = £ {хл - у,) .
(-1
Объекты щ (т=1,п) ранжируются по увеличению Искомое ранжирование и является искомым групповым линейным порядком.
При равенстве ^ и ^ ранжирование этих объектов произвольно. Для решешея задача "объяснения" каждой координатной оси НМШ в зависимости о тех или иных геологических факторов используются регрессионные уравнения зависимости координат найденного пространства от наеденных факторов (чисел или дихотомических переменных).
Поиск регрессионных уравнений осуществляется с помощью алгоритмов идентификация.
Для оценки идентификационных линейных уравнений используются следующие алгоритмы теории идентификации: алгоритм последовательного обучения Кагумо-Нода, алгоритм ГЬБА ("Идентификация линейная по методу стохастической аппроксимации"), алгоритм 1А111 ("Линейная регрессжг адашканая"), алгоритм ЬАЮ, алгоритм РЬй. ("доелгдоватслъная линейная регрсссия").
1.9. Алгоритм построения бинарных матриц для комбинации матричного алгоритма Каменского с алгоритмами минимизации функции многих переменных методами случайного поиска и случайного поиска с
адаптацией и для алгоритма оценки групповых решающих правил
1. В кач&стве исходной информации заданы к линейных порядков или квазипорядков.
2. Задано к ранжирований объектов, причем считается что, чем больше ранг, тем более предпочтительный объект. Наименее предпочтительный объект имеет нулевой ранг .
1,10. Модификация алгоритмов задач "соизмерения признаков" и "монотонной регрессии"
В отличие от известных алгоритмов решения задач соизмерения признаков и монотонной регрессии, модифицированные алгоритмы используют для поиска наилучшей конфигурации случайный поиск и случайный поиск с адаптацией.
МЕТОДЫ НМШ ПРИ ОБРАБОТКЕ НЕЧИСЛОВОЙ ГЕОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ПО ЗОЛОТОРУДНЫМ ОБЪЕКТАМ КАЗАХСТАНА
I. В распоряжении эксперта-геолога имелось 19 золоторудных объектов Казахстана. Объекты Майкаин С, Майкаин В, синтезированный эталон месторождении Майкаинского типа, Васильковскос. Бакырчик эксперт отнес к явным месторождениям и присвоил им самый большой ранг
- два. Объекты Сувенир, Майкаин Е, Большевик, Загадка, Кулуджун, С. Байлюсгы, Данилонка, Секисонка, Жанан эксперт отнес к объектам с не очень явными перспективами ("неявные месторождения") и присвоил ранг
- единица. Объекты Крот, Жангабул, Железная горка, Мальва, Кедей он отнес к явным неместорождезпвш (рудопроявленням) и присвоил им ранг
- ноль.
Каждый объект был описан следующим набором геологических характеристик:
I. Вмещающие породы: 1. Конгломераты, гравелиты; 2. Песчаники; 3. Алевролиты; 4. Глинистые, кремнистые сланцы; 5. Нерасчлененные метаморфические толщи; 6. Углисто-глинистые сланцы; 7. Туфо-песчаники, туффшы; 8. Известняки, доломиты; 9. Кварц-хлсритоныс слашш.
П, Магматические породы: 10. Кварцевые диориты; 11. Диабазы, габбро-диабазы; 12. Гранодиоршы; 13. Граниты; 14. Кварцевые порфиры; 15. Габбро; 16. Плагиограниты; 17. Сненодкорты, монцоншы; 18. Габ-бродиоршн; 19. Граносиешгш, сиениты.
III. Вулканические породы: 20. Кварцевые порфиры и их туфы; 21, Дацитовые порфириты; 22. Андезитовые порфирит; 23. Липариты и их туфы; 24. Порфириты; 25. Туфы основных эффузивов; 26. Диабазы, диабазовые порфириты; 27. Базальтовые порфирит и их туфы.
Были поставлены следующие задачи:
1. Найдутся ли хотя бы два фактора, которые влияют на оценки рангов объектов экспертом.
2. Если такие факторы найдутся, то как их можно объяснить с точки зрения наличия у объекта тех или иных геологических характеристик.
Первая задача решалась с помощью методов неметрического многомерного шкалирования. В результате работы алгоритма было получено наилучшее отображение объектов в пространство, осями которого являются два фактора. Анализ этой диаграммы показал следующее. При проектировании объектов на ось X (фактор X) не наблюдается какого-либо разделения объектов по значениям их рангов. При проектировании объектов на ось Y (фактор Y) имеется достаточно четкое разделение объектов по их рангам. Четыре объекта с рангом 2 (т.е. "явные
месторождения") из пяти имеют значения на оси У большее, чем 0,356, и только один объект 2-го ранга имеет значения меньшее, чем 0,356. Четыре объекта с рангом 0 из пяти объектов (т.е. " явные неместорождения" )имеют значения на оси У меньше или равное 0,356, и только один объект ранга 0, имеет значение больше, чем 0,356. Таким образом, по значению фактора У "явные месторождения" четко отличаются от "явных нсместорождсний". Промежуточные объекты, т.е. "неявные месторождения"с рангом 1 ведут себя также неявно: Четыре объекта из девяти имеют значения фактора У больше 0,356 и пять объектов из девяти имеют значения фактора У меньше или рапное 0,356.
Таким образом по значению фактора У можно наделить два класса объектов: 1 класс - "явные месторождения" и "неявные месторождения" и 2 класс - "явные неместорождения" и "неявные месторождения".
Содержательное (геологическое) объяснение фактора У было получено с помощью методов идентификационных уравнений, по которым оценены коэффициенты при 27 геологических признаках, чтобы их сумма была бы наиболее близка к значению оси У для каждого из 27 объектов.
Из анализа идентификационного уравнения следует, что наличие признаков со знаком " шпос" благоприятно для появления " явных месторождений", а со знаком "минус" - неблагоприятно для появления "явных месторождений" и наоборот, - благоприятно для появления "явных немесгорождений".
С этой точки зрения благоприятны для месторождений признаки "конгломераты, гравелиты", "песчаники", "кварцево-хлориговые сланцы", "кварцевые диориты, диориты", "диабазы, габбро-диабазы", "гранодиори-ты", "габбро", "платиограниты", "габбро-диориты", т.е. магматические породы средне-основного ряда, "андезитовыс порфириты", "порфириты", " базальтовые порфириты и их туфы", т.е. вулканические породы среднего, основного ряда.
Полученное уравнение может быть использовано очевидным образом для отнесения новых объектов к классу "явных месторождений" и "неявных месторождений" (алгебраическая сумма уравнения больше 0,356) и к классу "явных неместорождений" и "неявных месторождений" (алгебраическая сумма меньше или равна 0,356), что имеет существенное прикладное значение для предварительной экспрессной оценки перспектив тех или иных вновь выявленных золоторудных объектов без постановки на них дорогих геологоразведочных работ.
II. Имеются описания золоторудных объектов Восточного, Центрального и Северного Казахстана.
1. Восточный Казахстан: Бакырчик, Промежуточный, Баладжал, Глубокий Лог, Загадка, Секи совка, Васильковское, Параллельная зона, Ку-
луджун, Акжал, Зспс, Жанан, Жерек, Большевик, Ксдей, Лесть, Сенташ, Кемпиржанан.
2. Центральный Казахстан: Жолымбет, Бесгобе, Майкаин В, Май-каин С, Долинное, Сувенир, Кварциговые горки, Жангабул, Акбеиг, Аксу, Железная горка, Бактай, Новое, Аймандал, Иткудук, Найзатас.
3. Северный Казахстан: Степняк, Васильковка, Джетыгара, Шне-ковое, Мезгильсор, Орловское, Новоднепровскос, Айгабак, Мийкинская группа, Маданият.
Каждый объект описан ранговыми значениями шести кр1ггериев.
1 критерий: степень сходства объекта с промышленным месторождением - ранг 2 ("большое сходство"), ранг 1 ("сходство среднес"), ранг 0 ("сходство малое").
2 критерий: наиболее вероятная оценка прогнозных ресурсов золота на объекте, данная экспертом-геологом - ранг 3 (высокая оценка), ранг 2 (достаточно высокая оценка), ранг 1 (средняя оценка), ранг 0 (низкая оценка).
3 критерий: наиболее вероятная оценка прогнозных ресурсов золота на объекте, полученная моделированием по методу Монте-Карло - ранг 3 (высокая оценка), ранг 2 (достаточно высокая оценка), ранг 1 (средняя оценка), ранг 0 (низкая оценка).
4 критерий: наиболее вероятная оценка прогнозных ресурсов залога на объекте, полученная по идентификационным уравнениям - ранг 3 (высокая оценка), ранг 2 (достаточно высокая оценка), ранг I (средняя оценка), ранг 0 (низкая оценка).
5 критерий: экспертная оценка вероятности вовлечения объекта в изучение до 2000 года - рант 2 (высокая), ранг 1 (средняя), ранг 0 (малая).
6 критерий: оценка предпочтения постановки геологоразведочных работ на объекте - ранг 2 (высокая), ранг 1 (средняя), ранг 0 (малая).
Была поставлена задача ранжировать в виде линейного порядка золоторудные объекты для каждого района по степени их перспективности с учетом значений всех шести ранговых критериев.
Для решения згой задачи матрицы размером п^к, где п, - объекты ь го района, к - критерии были вначале преобразованы в матрицы Каменского по правилу:
[1, если ранг 12 больше ранга ^ ! 1, сели ранг равен рангу 15, глй' = 4 0, если ранг 15 больше ранга ¡3, 10, если отсутствует информация, I для сравнения 11 и
Здесь - элементы]-ой матрицы 0=1,к).
Данные матрицы Каменского (по шесть матриц для каждого района) обрабатывались алгоритмом поиска группового линейного порядка с использованием алгоритма минимизации функций многих переменных -случайным поиском.
При достижении минимума коэффициента соответствия для каждого 2
объекта оценивались f, = £ (.v!t - 7,), где x¿ - t-я координата i-ro объекта,
t-i
a yt - t-я координата "идеального" эксперта t.
Объекты xi ранжируются по увеличению значений fj, а объекты с близкими значениями £ объединяются в группы (линейный квазипорядок).
Были получены следующие результаты:
I. Восточный Казахстан. 1. Группа с i 0,14 - 0,21: Бакырчих, Промежуточный, Баладжал, Глубокий Лог. 2. Группа с f¡ 0,41 - 0,59: Загадка, Секисовка. 3. Группа с f¿ 0,70 -0,74: Васильковсхое, Параллельная зона. 4. Группа с f¡ 1,0 - 1,19: Кулуджун, Акжал, Эспе, Жанан. S. Группа с f¡ 1,30 - 1,49: Джерек, Большевик, Кедей, Лесть, Сешаш. б. Группа с f¡ 1,55 - 1,74: Бижан, Ксмпиржанан.
Такое упорядочение объектов от 1-ой до 6-ой группы действительно отражает упорядочение объектов по степени их перспективности и промышленной значимости. Так в 1,2 и 3 группы вошли объекты, по которым ведется промышленная эксплуатация, в 4 группу объекты, или довольно детально изученные, но в настоящее время законсервированные, или объекты, по которым окончена старательская добыча. В 5 и 6 группы вошли недостаточно изученные объекты, законсервированные в настоящее время.
На основании этого, можно рекомендовать первоочередное доизучение ряда объектов ipynn 1, 2, 3, на которых сейчас работы остановлены: Баладжал, Параллельная зона. Вторыми по необходимости доизучения являются объекты 4 группы; Кулуджун, Акжал, Жаман. Третьими по необходимости доизучения являются объекты 5-ой и 6-ой групп: Кедей, Лесть, Сешаш, Бижан, Ксмпиржанан. Желательно также продолжение работ на объектах Джерек и Большевик.
Аналогичным образом были решены задачи, связанные с оценкой перспективности золоторудных месторождений Северного и Центрального Казахстана.
Пакет прикладных программ NMS предназначен для решения ряда вопросов, связанных с прогнозированием в геологии.
Во-первых, он решает три основные классические задачи НМШ градиентными методами Шепарда, Крускала, Гупмана, Каменского и Каменского с дополнительной информацией.
Во-вторых, решает задачу поиска группового линейного порядка с использованием алгоритмов случайного поиска к случайного поиска с адаптацией, в случае недифференцируемого коэффициента соответствия.
В-третьих, реализует матричный алгоритм Кайенского и допускает его комбинацию с алгоритмами случайного поиска или случайного поиска с адаптацией.
В-четвертых, предполагает получение графического представления результатов на экране дисплея или с помощью принтера в виде координат объектов или коэффициентов соответствия в зависимости от величины размерности пространства.
В-пятых, так как пакет работает в диалоговом режиме, то может выступать как вспомогательное средство, позволяющее исследователю познакомиться с особенностями существующих методов решения задач HMHI и на основе анализа входных данных выбрать необходимый алгоритм или провести опробование нескольких алгоритмов (в случае решения 1 задачи НМШ) на некоторой усеченной матрице небольшой размерности. Для получения усеченных матриц исследователю предлагается выбрать признаки и объекты наиболее информативные с его точки зрения. После анализа полученных результатов, исследователь может выбрать наиболее подходящий для себя алгоритм и провести анализ всей матрицы уже с помощью этого алгоритма.
ППП по НМШ подключен к система управления данными FOXPRO.
ЗАКЛЮЧЕНИЕ
В результате проведенных исследований были получи ш следующие основные результаты:
1. Выделен класс содержательных геологических задач, связанных с визуализацией многомерных неколичествснных данных в процессе решения задач прогноза и оценки месторождений полезных ископаемых.
2. Разработана методика использования методов НМШ для решения этих задач.
3. Разработано математическое обеспечение и пакет прикладных программ для решения прогнозно-поисковых задач на основе применения алгоритмов НМШ для персональных ЭВМ, совместимых с IBM PC/XT/ и PC/AT, подключенный к системе управления базами данных FOXPRO.
4. Разработан и реализован комбинированный алгоритм Каменского с алгоритмами минимизации функций многих переменных методами "случайного поиска" и "случайного поиска с адаптацией", в случае недифференцируемого коэффициента соответствия. Для решения задачи "объяснения" каждой координатной оси НМШ в зависимости от тех или иных геологических факторов использовались идентификационные
уравнения зависимости координат найденного пространства от введенных факторов. Разработан и реализован алгоритм оценки групповых решающих правил методами НМШ.
5. На основе использования разработанных в диссертации методов получены конкретные рекомендации по сщенкс ранжирования по перспективности ряда золоторудных месторождений Казахстана.
По теме диссертации опубликованы следующие работы:
1. Черняк С.С. Неметрическое многомерное шкалирование - один из методов решения прогнозных задач. - В кн. Тезисы YI Республиканской конференции молодых ученых и специалистов-геологов "Задачи прогнозирования, поисков, оценки и освоения месторождений полезных ископаемых", Алма-Ата, 1986.
2. Черник С.С. Многомерное неметрическое шкалирование при решении прогнозных .задач. - В кн.: Геология и методы оценки месторождений твердых полезных ископаемых Казахстана. Алма-Ата, 1986.
3. Черник С.С., Дворниченко Г.К- Пакет прикладных программ "Неметрическое многомерное шкалирование", Алма-Ата, КазИМС, 1986.
4. Бугаец А.Н., Черпак С.С. Некоторые нетрадиционные подходы к решению геологических задач на основе методов неметрического многомерного шкалирования. Hornicka. Pribram ve veda a texnice. Pribram, 1991.
5. Бугаец АН., Грачева С.С, Неметрическое многомерное шкалирование при решении задач геологического прогнозирования и поисков месторождений. Москва. Изд. Теоинформмарх", 1996г., 120 с. (в печати).
-
Похожие работы
- Методы неметрического многомерного шкалирования для анализа нечисловой геологической информации при поисках и оценке месторождений золота Казахстана
- Организационно-технический механизм повышения эффективности и конкурентоспособности добычи золота из россыпных и техногенных месторождений
- Исследование и обоснование кондиций на полезные ископаемые при групповом освоении месторождений открытым способом
- Изыскание технологии очистной выемки для повторной подземной разработки мощных сложноструктурных золоторудных месторождений
- Концепция развития сети железных дорог Республики Казахстан
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность