автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Методы неметрического многомерного шкалирования для анализа нечисловой геологической информации при поисках и оценке месторождений золота Казахстана

кандидата технических наук
Грачева, Светлана Семеновна
город
Новосибирск
год
1996
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Методы неметрического многомерного шкалирования для анализа нечисловой геологической информации при поисках и оценке месторождений золота Казахстана»

Автореферат диссертации по теме "Методы неметрического многомерного шкалирования для анализа нечисловой геологической информации при поисках и оценке месторождений золота Казахстана"

со

СП СП

1Г7

Вычислительный Цешр Сибирского Отаелешш Российской Академии Наук

о- "г—

Н» права* рукописи

Грачева Светлана Семеновна

Методы неметрического многомерного шкалирования для анализа нечисловой геологической информации при поисках и оценке месторождений золота Казахстана

Специальность 05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Новосибирск 1996 г.

Работа выполнена в Вычислительном Центре Сибирского Отделения Академии Наук России

Научные руководители - доктор физико-математических наук,

член-корреспондент Российской Академии естественных наук Воронин Ю.А.,

доктор гетого-минералогических наук, Бугаец АН.

Официальные оппоненты - доктор физико-математических наук Лбов Г.С.,

кандидат геллого-мшкрачотических наук Федосеев Г.С.

Ведущая организация - Южно-Сибирский Региональный

информационный компьктторный центр

Защита диссертации состоистся 24 декабря 1996 года в 14 часов 30 минут на заседании диссертационного совета Д 002.lu.02 в Вычислительном центре Сибирского Отделения РАН по адресу : 630090, Новосибирск, 90, пр. Акад. Лаврентьева, 6.

С диссертацией можно ознакомиться в читальном зале библиотеки ВЦ СО РАН (Новосибирск, 90, пр. Акад. Лаврентьева, 6)

Автореферат разослан ' 1996г.

Ученый секретарь />

специализированного совета

кандидат технических наук /г^ Забиняко Г.И.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы.

При решении прогнозно-поисковых задач в геологии, как правило, одним из этапов работы является исследование структуры множества объектов прогноза и эталонных объектов, выяснение взаимоотношений между ними. Исходная информация зачастую носит качественный характер и ее источником являются суждения экспертов-геологов. Задача состоит в том, чтобы на основе анализа таких неколичсственных оценок выявить структуру множества геологических объектов, нх взаимоотношение друг с другом. При использовании известных формальных оптимизационных процедур обработки многомерных геологических данных всегда остается сомнение в достоверности получаемых выводов, так как при всем желании нельзя в полной мере отразить все знания и представления специалиста-геолога.

Выход го этой ситуации возможен, если оптимальным образом перейти от решения задачи оценки сходства, аналогии геологических объектов в многомерных геологических пространствах к решению этих задач в трехмерных или двумерных пространствах, допускающих визуальный анализ взаимоотношений оцениваемых объектов с известными месторождениями и рудопроявлениями.

Эта содержательная задача называется задачей визуализации и является предметом исследования в методах неметрического многомерного шкалирования (НМЕП).

До недавнего времени были достаточно хорошо разработаны и широко применялись в геологии методы метрических многомерных отображений, решающие задачу визуализации для количественных геологических данных, однако качественные геологические данные не использовались и были известны только теоретические возможности методов НМШ и примеры их использования в других областях знаний, но не были ясны способы использования их при решении задач оценки и разбраковки месторождений полезных ископаемых и вычислительные аспекты этой проблемы.

В отечественной литературе все исследования по этой проблеме посвящены исключительно решению социально-экономических задач и задач социологии (В. С. Каменский, ГА Сатаров, АЛО.Тере.хина и др.). Большое число исследований в злом направлении проведено за рубежам, но исключительно для решения задач психометрики (Шепард, Крускзл, Вандерборх, Клейн, Розенберг, Кэнделл и др.).

Целью диссертации является;

1. Выделение классов содержательных геологических задач, связанных с визуализацией многомерных неколичествсшшх геологических данных в процессе решения задач прогноза и поиска месторождений.

2. Разработка методики использования методов НМП1 для решения этих задач.

3. Разработка математического обеспечения и пакета прикладных программ для решения прогнозно-поисковых задач на основе применения алгоритмов НМН1.

Защищаемые положения.

1. Выделен широкий класс содержательных геологических задач прогноза и поиска месторождений, которые допускажгг формальную постановку и решение в терминах теории неметрического многомерного шкалирования.

2. Оптимальное решение задач многомерного неметрического шкалирования целесообразно осуществляется с помощью методов случайного поиска экстремумов функций многих переменных и использования методов теории идентификации. Решения в классе методов оценки групповых решающих правил можно получить, используя методы неметрического многомерного шкалирования.

3. Разработанные алгоритмы и программы неметрического многомерного шкалирования являются адекватным математическим аппаратом обработки неколичественных геологических данных при прогнозе и поиске месторождений.

Научная новизна.

1. Впервые выделен и сформулирован класс геологических задач, связанный с прогнозом и поиском месторождений, допускающий эффективное решение с помощью методов неметрического многомерного шкалирования.

2. Впервые предложены и разработаны методы решения задач неметрического многомерного шкалирования с помощью методов случайного поиска экстремумов функции многих переменных и методов идентификации.

3. Впервые предложен алгоритм оценки групповых решающих правил с помощью методов неметрического многомерного шкалирования.

4. Разработан пакет прикладных программ, реализующий методы неметрического многомерного шкалирования для решения задач прогноза и оценки месторождений. С его помощью решены реальные задачи оценки золоторудных месторождений Казахстана.

Практическая ценность.

Разработанная методика позволяет существенно расширить возможности применения экспертных геологических данных, белее полно использовать знания и опыт экспертов-геологов в виде слабофор-мализованных суждений об объектах прогноза. Также она может быть использована как средство отбора наиболее компетентных источников информации, например, на этапе создания баз знаний в экспертных системах, решающих прогнозно-поисковые задачи.

Апробация работы.

Основные положения диссертации и ее результата были доложены на 5 Республиканской конференции молодых ученых и специалистов-геологов (Алма-Ата 1986 г.), на научно-технической конференции КазИМСа (Алма-Ата 1985 г.), на Международном симпозиуме по применению математических методов в геологии (ЧССР, 1993 г.) Пакет программ по НМШ передан для внедрения в Производственное Геологическое Объединение "Укргсофкзика" Мингео Республики Украина, Управление геологии Грузии, Комплексную тематическую зхспедицию производственного геологического объединения "Дальгеология" Госкомгеологии России, Инфврма1Шонно-вычиатательный центр производственного геологического объединения "С амаркандг еология" Республики Узбекистан.

По теме диссертации опубликовано 4 работы и написано два отчета. Издано методическое руководство "Пакет прикладных программ по неметрическому многомерному шкалированию" (Алма-Ата, 1986 г.).

СОДЕРЖАНИЕ РАБОТЫ

В настоящее время в самых различных областях исследований широко применяются методы, связанные со сбором и обработкой мнений специалистов по исследуемой проблеме - методы, использующие экспертные оценки.

Рассмотрим схему, под которую попадает большинство задач, решаемых с помощью опроса экспертов. Имеется группа экспертов и набор объектов. Экспертам дается задание оценить объекты или группы объектов, в частности, пары, по шкале, которую экспериментатор считает интервальной, порядковой или классификационной. Результатом обработки должны являться опять-таки оценки объектов по одной или нескольким шкалам, т.е. одна или несколько числовых оценок, упорядочений или разбиений объектов.

Рассмотрим 3 задачи НМШ.

Задача 1.

Непосредственно в результате экспертного опроса или после первичной обработки получена матрица близости объектов, т.е. матрица, строки и столбцы которой соответствуют объектам, а элементы 5ц - оценки близости ьго объекта ,)-му, измеренные в порядковой шкале. Необходимо представить объекты в виде точек в пространстве меньшей размерности так, чтобы порядок расстояний = <3^^ между точками соответствовал порядку мер блшосхи между объектами.

Задача 2.

Имеется набор упорядочений объектов. Каждое упорядочение дано непосредственно экспертом или полученно каким-либо другим способом. Объекты и признаки считаются точками в пространстве. Координатные оси этого пространства - факторы, определяющие ранги объектов по признакам. Матрица упорядочений порождается расстояниями в этом пространстве: порядок величин г^ совпадает с порядком расстояний от ]-го признака до всех объектов. В соответствии с згой моделью задача обработки матрицы упорядочений ставится так: построить пространство минимальной размерности таким образом, чтобы порядок расстояний су от точек-признаков до точек - объектов совпадал (клн был близок) с порядком величин в строках матрицы Цг^Ц (задача неметрического многомерного развертывания).

Задача 3.

Непосредственно в результате экспертного опроса или после первичной обработки получено упорядочите объектов. Кроме того, имеется набор классификационных признаков, описывающих эти же объекты. Необходимо приписать градации признакам таким образом, чтобы функция фиксированного вида достаточно хорошо восстанавливала упорядочение. Эта задача носит название "сопряженные измерения". Ее можно интерпретировать как задачу о построении целевой функции, в случае, когда входные параметры не являются числовыми признаками.

В приложении к проблемам обработки качественных геологических данных методы НМШ могут быть использованы для решения следующих содержательных задач.

Пусть имеется п объектов и к экспертов или критериев, или, вообще, некоторых качественных признаков. Объекты оценены в ранговой или балльной шкалах (порядковых шкалах), так, что они могут быть упорядочены по этим оценкам.

Тогда появляются следующие содержательные задачи:

1. Выяснение минимального числа факторов, общих для всех экспертов или критериев.

2. Визуализация (отображение в 2-х или 3-х мерное пространство) к*п точек и анализ результатов визуализации - выделение однородных групп объектов и экспертов (или критериев).

3. После выделения минимального числа факторов, общего для всех экспертов или критериев - их объясните по следующим возможным схемам:

а) с помощью упорядочения расположения п объектов по каждой из вьщеленных осей (по каждому фактору),

б) если объекты описаны исходными полиномиальными качественными признаками - то оценка по ним некоторых "весов" каждого полиномиального признака, таких, что по суммам этих полиномиальных признаков с их "весами", эти суммы можно ранжировать так же, как ранжируются п объектов по той или иной из осей-факторов.

Задача, которая раньше была названа задачей "сопряженных измерений" и которая называется "Задачей неметрического многомерного шкалирования с дополнительной информацией", в содержательном плане может появляться также в следующих случаях.

1. Задано некоторое упорядочение эталонных месторождений и эталонных рудопроявлений, и все они описаны системой полиномиальных качественных признаков. Требуется найти веса полиномиальных признаков такие, что суммы полиномиальных признаков с их весами упорядочиваются так же, как и объекты в исходном упорядочении. Полученная таким образом линейная комбинация полиномиальных признаков может использоваться в дальнейшем в качестве решающего правила для отнесения новых объектов к эталонным месторождениям или эталонным рудопроявлениям по величине суммы полиномиальных признаков нового объекта с учетом найденных весов признаков.

2. Имеется некоторое групповое решение об упорядочении п объектов прогноза по ряду индивидуальных упорядочений. Это групповое решение может быть "объяснено" в терминах весов полиномиальных признаков, найденных по тем или иным процедурам "многомерного неметрического шкалирования с дополнительной информацией".

Алгоритмы для решения задач НМШ состоят в поиске экстремума коэффициента соответствия, измеряющего для задачи 1 - степень соответствия порядка расстояний с порядком мер близости, для задачи 2 - порядка расстояний <3ц с порядков рангов гр, для задачи 3 - порядка значений выбранной функции Г для объектов с имеющимся порядком объектов г^.

б

1.1. Метод Шепарда неметрического многомерного шкалирования

Задачу неметрического многомерного шкалирования можно поставить следующим образом.

Пусть имеется симметрическая матрица различий порядка п(п-1)/2 с элементами Е>щ. Элемент этой матрицы упорядочим в порядке возрастания. Пусть, кроме того, задана некоторая начальная конфигурация п точек в пространстве размерности г. Вычислим расстояния между п точками ¿у- и упорядочим их в порядке возрастания. Тогда задача неметрического многомерного шкалирования сводится к сравнению ранжированных расстояний с ранжированными различиями при выполнении условия монотонности, т.е. при условии, когда точки с маленьким значением меры различия должны находиться на небольшом расстоянии в искомом пространстве, а точки с большим значением различия - на значительном. Если конфигурация не удовлетворяет условию монотонности, то необходимо найти лучшую конфигурацию пугем передвижения точек таким образом, чтобы растянуть маленькие расстояния, соответствующие большим различиям, и сжать большие расстояния, соответствующие малым различиям.

Для оценки приближения порядка расстояний к исходному порядку различий вводится некоторая мера, характеризующая расхождение рангов исходных различий Бу и полученных расстояний 6ц для каждой пары объектов. На основе таких мер строятся векторы, в направлении которых на данной итерации перемещаются точки с целью получения конфигурации, удовлетворяющей условию монотонности.

Особенность метода Шепарда заключается в том, что размерность пространства объектов не оценивается заранее, а определяется в ходе анализа.

1.2. Метод Крускэла неметрического многомерного шкалирования

Крускзл, развивая идеи Шепарда, предлагает, во-первых, более формализованный метод, целью которого также является сохранение монотонного отношения между исходными различиями и полученными расстояниями. Крускол вводит некоторую количественную меру немонотонности, называемую "стресс", что дает возможность для любой конфигурации точек измерить, насколько хорошо она приближает данные. Во-вторых, Шспард определяет размерность искомого пространства в ходе самого анализа, в то время как Крускэл предполагает, что размерность оценивается заранее. Точнее говоря, проблема нахождения наилучшей конфигурации решается всякий раз в пространстве фиксированной размерности г. Но такая процедура может бъпь проделана для нескольких

значений г, и затем по конечной конфигурации и по величине стресса экспериментатор может выбрать наиболее подходящую размерность.

В случае, когда количество объектов достаточно велико (п>50) и требуется много времени дли работы алгоритма, можно сделать прерывание его работы, а координаты конечной конфигурации записать на диск. При обращении к программе еще раз, можно исходить из конфигурации, полученной при предыдущей работе алгоритма.

1.3. Метод Гуттмана неметрического многомерного шкалирования

Этот метод, так же, как и другие методы неметрического многомерного шкалирования, ставит своей целью представление п объектов в виде точек в некотором координатном пространстве с фиксированной метрикой, удовлетворяя при этом двум условиям:

а) отображение должно быть монотонным,

б) пространство должно быть минимально возможной размерности.

Существует два способа реализации: однофазовый и двухфазовый.

Однофазовый алгоритм более сложный, он не накладывает независимых ограничений на процесс решения задачи и поэтому может увести в сторону локального минимума.

В данном случае использовался двухфазовый алгоритм. Начальные этапы алгоритма совпадают с соответствующими этапами алгоритма Крускэла.

По степени сохранения в матрице информации об алиментах матрицы {Цд} можно выделить четыре типа монотонности: полуслабый, слабый, полусилъный, сильный.

В зависимости от типа монотонности существует четыре способа получения монотонного преобразования

При проведении итеративного процесса предполагается, что известна размерность искомого координатного пространства и вычисляется ц=ц(г). Каждый алгоритм имеет еще одну дополнительную фазу определения ми-зшмальнсго значения г. Пусть ц(г) - максимально достигнутая величина ц для фиксированного г. Для идеального решения г удовлетворяет соотношению ц(т-1 )<ц(г)= 1.

Эксперименты показывают, что хорошие результаты получают при наименьшей размерности пространства г , для которой коэффициент отклонения от монотонности к< 1,5.

Процесс останавливается, если мера отклонения от монотонности ц=1-8, где 8 - достаточно малое число, задаваемое пользователем, или доел пнут максимум количества итераций. При работе алгоритма Гуттмана, если число объектов достаточно велико (п>50), можно произвести программное прерывание такое же, как при работ© алгоритма Крускэла.

8

1.4. Метод Джонсона неметрического многомерного шкалирования

Метод Джонсона основан на минимизации попарных отклонений от монотонности.

Пусть для двух пар объектов (А^, Ар и (А^, А^ заданы различия Цц и Е>ц и пусть в данный момент вычисленные расстояния между соответствующими точками равны <3^ и Если разность (Ощ-Е>и) к (<3^-с1ц) имеют один и тот же знак, то считается, что расстояния в згой паре находятся в желаемом соотношении; если же разности имеют разные знаки - требуемое соотношение для двух пар нарушается.

Критерий качества приближения определяется как

/ ч

Процедура заканчивается, когда © либо перестает убывать, либо достигает малого значения. ©-0, когда все пары находятся в желаемом порядке. Можно задать верхний предел для числа итераций. © возрастает с увеличением числа точек и уменьшается с увеличением размерности.

1.5. Метод неметрического многомерного развертывания В.С.Каменского

Имеется набор упорядочены! объектов. Каждое упорядочение дано непосредственно экспертом или получено каким-либо другим способом. Необходимо представить объекты и экспертов в виде "точек" в метрическом пространстве так, чтобы порядок расстояний от точки "эксперта" до точек "объектов" соответствовал присвоенным рангам г; экспертом yj.

В методе неметрического многомерного развертывания различия в ответах экспертов не случайны и объясняются различным положением точек, соответствующих экспертам в пространстве. Считается, что точка, соответствующая эксперту - это "идеальный" с точки зрения эксперта объект.

Нахождение конфигурации точек-признаков и точек-объектов, минимизирующих коэффициент соответствия © проводится по градиентному методу Крускала.

/

1.6. Неметрическое многомерное шкалирование с использованием дополнительной информации

Рассмотрим задачи неметрического многомерного шкалирования, использующие дополнительную информацию.

Алгоритм для решения задачи "соизмерения признаков" состоит из следующей последовательности, шагов:

1. Задано п объектов х^, описанных га признаками.

2. Задано упорядочение п объектов Л^Щх*).

3. Предполагается, что каждый признак имеет две градации, одна из которых имеет значение 1, другая - 0.

4. У каждого признака выб!граем ту градацию, которая имеет единичное значение. Выбранные градации нумеруются. Эти градации будут использованы при вычислении функций %

5. С помощью датчика случайных чисел присваиваем всем (ш*2) градациям начальные числовые значения.

6. Вычисляем значения функций а}(к)+а2... +ат№, где а^*) -градация, выбранная у к-го объекта для 1-го признака.

7. Для полученных на предыдущем шаге Г вычисляем значение коэффициента соответствия.

8. Вычисляем значение производных по каждой градации.

9. Вычисляем координаты точек последующей конфигурации.

10. Оцениваем разность между значениями ©2 на предыдущем и текущем шаге итерации.

Если эта разность меньше заданной величины б, вычисления прекращаются, если больше или равна е, возвращаемся к шагу 6.

Алгоритм для решения задачи "монотонная регрессия" состоит из следующей последовательности шагов:

1. Задано п объектов, описанных га признаками и юс упорядочение

Н*

2. С помощью датчика случайных чисел генерируется совокупность начальных значений весов признаков.

3. Получаем конфигурацию п объектов со взвешенными признаками хя^Чк»^ > гДе - вес ьго признака.

4. Вычисляем функции

5. Вычисляем значение коэффициента соответствия.

6. Вычисляем значение частных производных функции по всем весам \\') (г=1,ш).

Последующие шаги данного алгоритма аналогичны шагам 9 и 10 в задаче "соизмерения признаков".

1,7. Комбинация матричного алгоритма Каменского с алгоритмами

минютзации функции многих переменных методами "случайного поиска" и "случайного поиска с адаптацией"

Этот метод решает задачу многомерного развертывания для двух типов данных.

1. Исходные данные к матриц предпочтений п объектов. Каждая }-я матрица 0=1,...,3с) предпочтений задается экспертом в виде квадратной мат-рицы порядка п*п.

2. Исходные данные: и объектов и к экспертов. Исходная матрица рангов состоит из п столбцов и к строк с элементами г*) (i~l.ii; 1 ,к.), где т^ - ранг, поставленный Ьму объекту .¡-м экспертом.

Эта матрица может быть преобразована в матрицу предпочтений, исходя 5гз условия: чем больше ранг, тем более предпочтительнее объект.

Задача ставится так, чтобы развернуть эти матрицы на пространство заданной более низкой размерности ш (ш, как правило, равно 2).

Алгоритм состоит го следующей последовательности шагов,

1. В пространстве размерности т вводятся начальные координаты п объектов (ха; 1=1,п; 1=1,ш) и к экспертов (у^; j=l,k; 1=1,т).

2. Вводятся к матриц предпочтений для и объектов.

т

3. Оцениваются величины: // = - у^)

(-1

4. Оценивается к матриц различий.

Оценивается "мягкий" парный коэффициент соответствия.

1 * / я-1 л . ,

® =тЕ Z

* J-1 -

Данный коэффициент соответствия использует в качестве исходных данных только верхние треугольные матрицы l&ijicü и Идеальное значение ©*=0.

Далее происходит выбор начальной конфигурации.

6. Оценивается матрица ||В|| кз к строк и п столбцов с элементами Ъ/

7. Оценивается диагональная матрица ¡Zj| размером п*п, в которой

*s = Íb¡

8. Оценивается матрица ||Auj| размером (n+k)*(n+k):

n к Au=4/k z -b п к

Z -Ъ

-Ъ 0

Для полученной на предыдущем шаге (г>1) конфигурации находятся и m собственных векторов матрицы Au, удовлетворяющих следующим условиям:

т

1)1 Л, >0;

{-1

т

2) £ X, min;

t-i

3) ни один из собственных векторов не должен быть вектором из констант.

Найденные m векторов размерности n+k каждый берутся в качестве новой конфигурации (первые и компонент ni-го вектора - ш-я координата п объектов; к последних - ш-я координата к экспертов).

Собственные числа не рагаагруются, а выбирается та их пара, алгебраическая сумма которых положительна и минимальная из всех возможных пар.

Задача поиска m собственных векторов, соответствующих га минимальным собственным числам X, матрицы Au решается с помощью метода ортогональных разложений.

После оценки начальной конфигурации с помощью матричного алгоритма Каменского поиск наилучшей конфигурации, обеспечивающей минимум коэффициента соответствия осуществляется с помощью алгоритма случайного поиска или случайного поиска с адаптацией.

При работе алгоритмов случайного поиска или случайного поиска с адаптацией используется модифицированный коэффициент соответствия

©2=4£f£ i'M-tfUt i^-nf

Л 7-1 } V'i"1

кроме деления на количество экспертов он делится на сумму всех fji-ifr д ля верхней треугольной матрицы.

(1.1)

1.8. Задача поиска группового линейного порядка (гл.п.)

В качестве исходной информации выступает к матриц предпочтений.

Алгоритм поиска гл.п. состоит из следующей последовательности шагов.

1. В пространстве размерности 2 задаются начальные координаты п объектов и идеального объекта У.

2. Для всех п объектов оценивается матрица расстояний

3. Оценивается к матриц соответствия порядка п»п.

4. Оценивается критерий соответствия по формуле (1.1)

5. Для поиска координат объектов и идеального объекта, обеспечивающего минимум коэффициента соответствии ©2, используются

алгоритмы минимизации функций многих переменных такие, как алгоритмы случайного поиска и случайного поиска с адаптацией,

6. При достижении минимума коэффициента, соответствия или при

остановке по исчерпанию заданного количества итераций, оценка в

2

двухмерном пространстве величины: = - у,) .

1-1

Объекты щ (1=1,п) ранжируются по увеличению Искомое ранжирование и является искомым групповым линейным порядком.

При равенстве Г; и ^ ранжирование этих объектов произвольно. Для решения задачи "объяснения" каждой координатной оси НМШ в зависимости о тех или иных геологических факторов используются регрессионные уравнения зависимости координат найденного пространства от введенных факторов (чисел или дихотомических переменных).

Поиск регрессионных уравнений осуществляется с помощью алгоритмов идентификации.

Для оценки идентификационных линейных уравнений используются следующие алгоритмы теории идентификации: алгоритм последовательного обучения Нагумо-Нода, алгоритм 1ЬБА ("Идентификация линейная по методу стохастической аппроксимации"), алгоритм ЬАШ ("Линейная регрессия адаптивная"), алгоритм ЬАЮ, алгоритм РЬЙ. ("последовательная линейная регрессия").

1.9. Алгоритм построения бинарных матриц для комбинации матричного алгоритма Каменского с алгоритмами минимизации функции многих переменных методами случайного поиска и случайного поиска с

адаптацией и для алгоритма оценки групповых решающих правил

1. В качестве исходной информации заданы к линейных порядков или квазипорядков.

2. Задано к ранжирований объектов, причем считается что, чем больше ранг, тем более предпочтительный объект. Наименее предпочтительный объект имеет нулевой ранг .

1.10. Модификация алгоритмов задач "соизмерения признаков" и "монотонной регрессии"

В отличие от известных алгоритмов решения задач соизмерения признаков и монотонной регрессии, модифицированные алгоритмы используют для поиска наилучшей конфигурации случайный поиск и случайный поиск с адаптацией.

МЕТОДЫ НМШ ПРИ ОБРАБОТКЕ НЕЧИСЛОВОЙ ГЕОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ПО ЗОЛОТОРУДНЫМ ОБЪЕКТАМ КАЗАХСТАНА

I. В распоряжении эксперта-геолога имелось 19 золоторудных объектов Казахстана. Объекты Майкаин С, Майкаин В, синтезированный эталон месторождений Майкаинсксто типа, Васильховское. Бакырчик эксперт отнес к явным месторождениям и присвоил им самый большой ранг

- два. Объекты Сувенир, Майкаин Е, Большевик, Загадка, Кулуджун, С. Байлюсты, Даниловка, Секисонка, Жанан эксперт отнес к объектам с не очень явными перспективами ("неявные месторождения") и присвоил ранг

- единица. Объекты Крот, Жангабул, Железная горка, Мальва, Кедей он отнес к явным неместорождениям (рудопроявленням) и присвоил им ранг

- ноль.

Каждый объект был описан следующим набором геологических характеристик:

I. Вмещающие породы: 1. Конгломераты, гравелиты; 2. Песчаники; 3. Алевролиты; 4. Глинистые, кремнистые сланцы; 5. Нерасчленешше метаморфические толщи; 6. Углисто-глинистые сланцы; 7. Туфо-песчакики, туфф1пы; 8. Известняки, доломиты; 9. Кварц-хлоритовые сланцы.

П. Магматические породы: 10. Кварцевые диориты; 11. Диабазы, габбро-диабазы; 12. Гранодиориты; 13. Граниты; 14. Кварцевые порфиры; 15. Габбро; 16. Плагиограниты; 17. Сиенодиоригы, монцониты; 18. Габ-бродиориты; 19. Граносиенигы, сиениты.

III. Вулканические породы: 20. Кварцевые порфиры и их туфы; 21. Дацитовые порф>гриты; 22. Андезитовые порфирита; 23. Липариты и их туфы; 24. Порфириты; 25. Туфы основных эффузивов; 26. Диабазы, диабазовые порфириты; 27. Базальтовые порфирита и их туфы.

Были поставлены следующие задачи:

1. Найдутся ли хотя бы два фактора, которые влияют на оценки рангов объектов экспертом.

2. Если такие факторы найдутся, то как их можно объяснить с точки зрения наличия у объекта тех или иных геологических характеристик.

Первая задача решалась с помощью методов неметрического многомерного шкалирования. В результате работы алгоритма было получено наилучшее отображение объектов в пространство, осями которого являются два фактора. Анализ этой диаграммы показал следующее. При проектировании объектов на ось X (фактор X) не наблюдается какого-либо разделения объектов по значениям их рангов. При проектировании объектов на ось Y (фактор Y) имеется достаточно четкое разделение объектов по их рангам. Четыре объекта с рангом 2 (т.е. "явные

месторождения") из пяти имеют значения на оси У большее, чем 0,356, и только один объект 2-го ранга имеет значения меньшее, чем 0,356. Четыре объекта с рангом 0 из пяти объектов (т.е. " явные неместорождения" ) имеют значения на оси У меньше или равное 0,356, и только сдай объект ранга 0, имеет значение больше, чем 0,356. Таким образом, по значению фактора У "явные месторождения" четко отличаются от "явных неместорождений". Промежуточные объекты, т.е. "неявные месторождения^ рангом 1 ведут себя также неявно: Четыре объекта из девяти имеют значения фактора У больше 0,356 и пять объектов го девяти имеют значения фактора У меньше или равное 0,356.

Таким образом по значению фактора У можно выделить два класса объектов: 1 класс - "явные месторождения" и "неявные месторождения" и 2 класс - "явные немссторождения" и "неявные месторождения".

Содержательное (геологическое) объяснение фактора У было получено с помощью методов идентификационных уравнений, по которым оценены коэффициенты при 27 геологических признаках, чтобы их сумма была бы наиболее близка к значению оси У для каждого из 27 объектов.

Из анализа идентификационного уравнения следует, что наличие признаков со знаком " плюс" благоприятно для появления " явных месторождений", а со знаком "минус" - неблагоприятно для появления "явных месторождений" и наоборот, - благоприятно для появления "явных неместорождений".

С этой точки зрения благоприятны для месторождений признаки "конгломераты, гравелиты", "песчаники", "кварцево-хлориювые сланцы", "кварцевые диориты, диориты", "диабазы, габбро-диабазы", "гранодиори-ты", "габбро", "плагиограшгты", "габбро-диориты", т.е. магматические породы средне-основного ряда, "андезитовыс порфиршы", "порфириты", " базальтовые порфириты и их туфы", т.е. вулканические породы среднего, основного ряда.

Полученное уравнение может быть использовано очевидным образом для отнесения новых объектов к классу "явных месторождений" и "неявных месторождений" (алгебраическая сумма уравнения больше 0,356) и к классу "явных неместорождений" и "неявных месторождений" (алгебраическая сумма меньше или равна 0,356), что имеет существенное прикладное значение для предварительной экспрессной оценки перспектив тех или иных вновь выявленных золоторудных объектов без постановки на них дорогих геологоразведочных работ.

II. Имеются описания золоторудных объектов Восточного, Центрального и Северного Казахстана.

1. Восточный Казахстан: Бакырчик, Промежуточный, Баладжал, Глубокий Лог, Загадка, Сскисовка, Васильковское, Параллельная зона, Ку-

луджун, Акжал, Эспс, Жанан, Жсрск, Большевик, Кедей, Лесть, Сенташ, Кемпиржанан.

2. Центральный Казахстан: Жолымбет, Бестобе, Майкаин В, Май-каин С, Долинное, Сувенир, Кварцитоеые горки, Жангабул, Акбеит, Аксу, Железная горка, Бактай, Новое, Аймандай, Иткудук, Найзатас.

3. Северный Казахстан: Степняк, Васильковка, Джетыгара, Шне-ковое, Мезгильсор, Орловское, Новоднепровское, Айгабак, Мийкинская группа, Маданият.

Каждый объект описан ранговыми значениями шести критериев.

1 критерий: степень сходства объекта с промышленным месторождением - ранг 2 ("большое сходство"), ранг 1 ("сходство среднее"), ранг 0 ("сходство малое").

2 критерий: наиболее вероятная оценка прогнозных ресурсов залога на объекте, данная экспертом-геологом - ранг 3 (высокая оценка), ранг 2 (достаточно высокая оценка), ранг 1 (средняя оценка), ранг 0 (шикая оценка).

3 критерий: наиболее вероятная оценка прогнозных ресурсов золота на объекте, полученная моделированием по методу Монте-Карло - ранг 3 (высокая оценка), ранг 2 (достаточно высокая оценка), ранг 1 (средняя оценка), ранг 0 (низкая оценка).

4 критерий: наиболее вероятная оценка прогнозных ресурсов золота на объекте, полученная по идентификационным уравнениям - ранг 3 (высокая оценка), ранг 2 (достаточно высокая оценка), ранг 1 (средняя оценка), ранг 0 (низкая оценка).

5 критергаг экспертная оценка вероятности вовлечения объекта в изучение до 2000 года - ранг 2 (высокая), ранг 1 (средняя), ранг 0 (малая).

6 критерий: оценка предпочтения постановки геологоразведочных работ на объекте - ранг 2 (высокая), ранг 1 (средняя), ранг 0 (малая).

Была поставлена задача ранжировать в виде линейного порядка золоторудные объекты для каждого района по степени их перспективности с учетом значений всех шести рантовых критериев.

Для решения этой задачи матрицы размером п;*к, где гц - объекта i-го района, к - критерии были вначале преобразованы в матрицы Каменского по правилу:

f 1, если ранг ij больше ранга ij, ! 1, если ранг 12 равен рангу ij, rjji^j — •{О, если рант ij больше ранга ij, 10, если отсутствует информация, I для сравнения il и ¡2.

Здесь Tjji2 - элементы j-ой матрицы (j=l,K).

Данные матрицы Каменского (по шесть матриц для каждого района) обрабатывались алгоритмом поиска группового линейного порядка с использованием алгоритма минимизации функций многих переменных -случайным поиском.

При достижении минимума коэффициента соответствия для каждого 2

объекта оценивались = £{х„ - у,), где х^ - 1-я координата ьго объекта,

а У4 - 1-я координата "идеального" эксперта I.

Объекты 1й ранжируются по увеличению значений а объекты с близкими значениями А объединяются в группы (линейный квазипорядок).

Были получены следующие результаты:

I. Восточный Казахстан. 1. Группа с ^ 0,14 - 0,21: Бакырчик, Промежуточный, Баладжал, Глубокий Лог. 2. Группа с ^ 0,41 - 0,59: Загадка, Секисовка. 3. Группа с £ 0,70 -0,74: Васильковское, Параллельная зона. 4. Группа с $ 1,0 - 1,19: Кулуджун, Акжал, Эспе, Жанан. 5. Группа с ^ 1,30 - 1,49: Джерек, Большевик, Кедей, Лесть, Сенташ. 6. Группа с ^ 1,55 - 1,74: Бижан, Кемлиржанан.

Такое упорядочение объектов от 1-ой до 6-ой группы действительно отражает упорядочение объектов по степени их перспективности и промышленной значимости. Так в 1,2 и 3 группы вошли объекты, по которым ведется промышленная, эксплуатация, в 4 группу объекты, или довольно детально изученные, но в настоящее время законсервированные, или объекты, по которым окончена старательская добыча. В 5 и 6 группы вошли недостаточно изученные объекты, законсервированные в настоящее время.

На основании этого, можно рекомендовать первоочередное доизучение ряда объектов групп 1, 2, 3, на которых сейчас работы остановлены: Баладжал, Параллельная зона. Вторыми по необходимости доизучения являются объекты 4 группы: Кулуджун, Акжал, Жанан. Третьими по необходимости доизучения являются объекты 5-ой и 6-ой групп: Кедей, Лесть, Сенташ, Бижан, Кемлиржанан. Желательно также продолжение работ на объектах Джерек и Большевик.

Аналогичным образом были решены задачи, связанные с оценкой перспективности золоторудных месторождений Северного и Центрального Казахстана.

Пакет прикладных программ NN15 предназначен для решения ряда вопросов, связанных с прогнозированием в геологии.

Во-первых, он решает три основные классические задачи НМШ градиентными методами Шепарда, Крускала, Гутгмана, Каменского и Каменского с дополнительной информацией.

Во-вторых, решает задачу поиска группового линейного порядка с использованием алгоритмов случайного поиска и случайного поиска с адаптацией, в случае недифференцируемого коэффициента соответствия.

В-третьих, реализует матричный алгоритм Каменского и допускает его комбинацию с алгоритмами случайного поиска или случайного поиска с адаптацией.

В-четвертых, предполагает получение графического представления результатов на экране дисплея или с помощью принтера в виде координат объектов или коэффициентов соответствия в зависимости от величины размерности пространства.

В-пятыя, так ках пакет работает в диалоговом режиме, то может выступать как вспомогательное средство, позволяющее исследователю познакомиться с особенностями существующих методов решения задач НМ1П и на основе анализа входных данных выбрать необходимый алгоритм или провести опробование нескольких алгоритмов (в случае решения 1 задачи НМШ) на некоторой усеченной матрице небольшой размерности. Для получения усеченных матриц исследователю предлагается выбрать признаки и объекты наиболее информативные с его точки зрения. После анализа полученных результатов, исследователь может выбрать наиболее подходящий для себя алгоритм и провести анализ всей матрицы уже с помощью этого алгоритма.

ППП по НМШ подключен к система управления данными FOXPRO.

ЗАКЛЮЧЕНИЕ

В результате проведенных исследований были получены следующие основные результаты;

1. Выделен класс содержательных геологических задач, связанных с визуализацией многомерных неколичествекных данных в процессе решения задач прогноза и оценки месторождений полезных ископаемых.

2. Разработана методика использования методов НМШ для решения этих задач.

3. Разработано математическое обеспечение и пакет прикладных программ для решения прогнозно-поисковых задач на основе применения алгоритмов НМШ для персональных ЭВМ, совместимых с IBM PC/XT/ и PC/AT, подключенный к системе управления базами данных FOXPRO.

4. Разработан и реализован комбинированный алгоритм Каменского с алгоритмами минимизации функций многих переменных методами "случайного поиска" и "случайного поиска с адаптацией", в случае недифференцируемого коэффициента соответствия. Для решения задачи "объяснения" каждой координатной оси НМШ в зависимости от тех или шлих геологических факторов использовались идентификащюнные

уравнения зависимости координат найденного пространства от введенных факторов. Разработан и реализован алгоритм оценки групповых решающих правил методами НМП1.

5. На основе использования разработанных в диссертации методов получены конкретные рекомендации по оценке ранжирования по перспективности ряда золоторудных месторождений Казахстана.

По теме диссертации опубликованы следующие работы:

1. Чернкк С.С. Неметрическое многомерное шкалирование - один из методов решения прогнозных задач. - В кн. Тезисы YI Республиканской конференции молодых ученых и специалистов-геологов "Задачи прогнозирования, поисков, оценки и освоения месторождений полезных ископаемых". Алма-Ата, 1986.

2. Черник С.С. Многомерное неметрическое шкалирование при решении прогнозных задач. - В кн.: Геология: и методы оценки месторождений твердых полезных ископаемых Казахстана. Алма-Ата. 1986.

3. Черник С.С., Дворниченко Г.К. Пакет прикладных программ "Неметрическое многомерное шкалирование", Алма-Ата, КазИМС, 1986.

4. Бугаец А.Н., Черник С.С. Некоторые нетрадиционные подходы к решению геологических задач на основе методов неметрического многомерного шкалирования. Hornicka. Pribram ve veda a íexnice. Pribram, 1991.

5. Бугаец АН., Грачева С.С, Неметрическое многомерное шкалирование при решении задач геологического прогнозирования и поисков месторождений. Москва. Изд. "Геоинформмарк", 1996г., 120 с. (в печати).