автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка статистических методов анализа и классификация многомерных данных и их реализация в диалоговой системе

кандидата технических наук
Жаринов, Сергей Евгеньевич
город
Петропавловск Камчатский ; Москва
год
1984
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка статистических методов анализа и классификация многомерных данных и их реализация в диалоговой системе»

Оглавление автор диссертации — кандидата технических наук Жаринов, Сергей Евгеньевич

ВВЕДЕНИЕ

Глава I. МЕТОДЫ, АЛГОРИТМЫ И ПРОГРАММЫ АНАЛИЗА

СТРУКТУРЫ МНОГОМЕРНЫХ ДАННЫХ.

1.1. Исходные предпосылки

1.2. Пакеты и системы программ анализа данных. Диалоговый подход.II

1.3. Статистические тесты проверки гипотез о наличии классов

1.4. Выводы по главе I

Глава 2. ОРГАНИЗАЦИЯ ГРАФИЧЕСКОЙ ДИАЛОГОВОЙ СИСТЕМЫ

АНАЛИЗА СТРУКТУРЫ МНОГОМЕРНЫХ ДАННЫХ.

2.1. Требования к системе

2.2. Состав и структура системы.

2.3. Организация данных

2.4. Организация диалога

2.5. Краткая характеристика диалоговой системы ВУЛКАНИТ.

2.6. Выводы по главе 2.

Глава 3. РАЗРАБОТКА И ИССЛЕДОВАНИЕ ПРОЦЕДУР ПРОВЕРКИ

СТАТИСТИЧЕСКИХ ГИПОТЕЗ О НАЛИЧИИ КЛАССОВ.

3.1. Исходные предпосылки.

3.2. Локализация особенности на гистограмме.

3.3. Критерий локальной неоднородности.

Постановка задачи, формализация.

3.4. Решение задачи в общем случае

3.5. Модифицированная статистика. Приближенные тесты для случая трех интервалов группировки

3.6. Исследование мощности локальных тестов

3.7. Выводы по главе 3.

Глава 4. СТАТИСТИЧЕСКИЕ ПРОЦЕДУРЫ СРАВНЕНИЯ

СОВОКУПНОСТИ МНОГОМЕРНЫХ ОБЪЕКТОВ.

4.1. Вводные замечания.

4.2. Формализация и предпосылки статистической модели

4.3. Модель А.

4.4. Модель В.

4.5. Реализация процедур с помощью диалоговой системы ВУЛКАНИТ.

4.6. Выводы по главе 4.

Глава 5. ПРИМЕНЕНИЕ РАЗРАБОТАННЫХ СТАТИСТИЧЕСКИХ

ПРОЦЕДУР И ПРОГРАММНЫХ СРЕДСТВ ДЛЯ

СРАВНЕНИЯ АНДЕЗИТОВ КУРИЛЬСКИХ ОСТРОВОВ

И КЛАССИФИКАЦИИ БАЗАЛЬТОВ ТИХООКЕАНСКОГО

РЕГИОНА ПО ГЕОХИМИЧЕСКИМ ДАННЫМ.

5.1. Вводные замечания.

5.2. Статистическое сравнение вулканических пород (андезитов) Курильских островов по геохимическим данным. НО

5.3. Классификация вулканических пород (базальтов) Тихоокеанского региона по химическому составу

5.4. Выводы по главе 5.

Введение 1984 год, диссертация по информатике, вычислительной технике и управлению, Жаринов, Сергей Евгеньевич

Диссертационная работа посвящена разработке, исследованию и применению статистических методов и программных средств для автоматизации научных исследований по анализу и классификации I многомерных количественных данных.

Актуальность темы. Одной из основных задач экономического и социального развития СССР на I98I-I985 годы и на период до 1990 года является, как это отмечено на ХХУ1 съезде КПСС, задача повышения эффективности научных исследований. Для ее решения необходимо "расширить автоматизацию . научно-исследовательских работ с применением электронно-вычислительной техники" [i, с.144], а в области естественных и технических наук "сосредоточить усилия на развитии математической теории и повышении эффективности ее использования в прикладных целях" [i, с.146J. В 1983 году для усиления и координации работ по автоматизации в Академии наук СССР образовано отделение информатики, вычислительной техники и автоматизации.

Типичными для естественно-научных исследований являются задачи анализа и классификации больших объемов многомерных количественных данных. Например, в проанализированных 50 монографиях по геохимии горных пород за последние 10 лет используется от 100 до 30000 анализов в калздой (в среднем 1200); анализы содержат от 10 до 30 компонент. Математическая обработка отсутствует в 20 случаях (приводятся лишь таблицы исходных данных); в 24 работах применяются простейшие статистические приемы (расчет средних, дисперсий, коэффициентов корреляции, построение гистограмм); только в б книгах привлечен аппарат многомерр ной статистики (один раз Т -критерий, дважды алгоритмы кластер-анализа и по одному разу - линейный дискриминант и метод главных компонент . Так, в работе [73] 3000 петрохимических составов описаны в виде 26 таблиц средних и дисперсий, в работе [54] более 5000 химических определений пород и минералов сведены в 65 таблиц, занимающих 90 страниц. В монографии [з] использовано 30000 химических анализов (уникальный для геохимии объем информации); результаты обработки представлены на 300 гистограммах, в 50 таблицах средних, дисперсий и коэффициентов корреляции; из многомерных методов применен лишь метод главных компонент в одной из модификаций; вопросы статистической достоверности полученных закономерностей практически не рассматривались.

Приведенные примеры показывают типичность задач обработки больших объемов количественной информации, их трудоемкость (расчеты статистических характеристик, различные графические построения) и недостаточный уровень автоматизации и применения математических методов [18]. Существующие у нас в стране и за рубежом пакеты и системы программ, включающие в себя средства многомерного анализа, как показывает опыт, недостаточно просты для пользователей, не имеющих специальной подготовки по математической статистике и программированию.

Поиск неоднородностей в структуре данных и классификация - типичные задачи анализа многомерной информации [12,2], однако задача проверки статистических гипотез о наличии классов пока исследована недостаточно; она названа в списке нерешенных задач прикладной статистики [37]. Этим, а также необходимостью получения статистически достоверных выводов при поиске неоднородностей определяется актуальность рассмотрения данного вопроса в диссертации. Более подробно об актуальности проверки статистических гипотез о наличии классов сказано в разделе 1.3. Актуальность разрабатываемых в диссертации процедур анализа внутренней размерности при сравнении многомерных объектов определяетея необходимостью "внедрения в практику научных исследований математических методов (формализация понятий, статистическая обработка данных, создание моделей)", что было отмечено на У Всесоюзном вулканологическом совещании [58, сЛ2].

Диссертационная работа выполнялась по планам ДВНЦ АН СССР с 1978 по 1983 годы в лабораториях наземного вулканизма и математического обеспечения исследований Института вулканологии (тема 3.1.6.1 (Р 8I068I62), раздел 2 "Анализ пространственно-временного распределения вещества в вулканических центрах методами петрологии и математической статистики. Автоматизация исследования статистических задач геохимии и геофизики" .

Целью диссертации является разработка, исследование и применение статистических методов и диалоговой системы анализа и классификации многомерной количественной информации. Как известно [42], исследования по анализу многомерных данных носят итерационный характер, длятся месяцы и требуют участия трех специалистов: математика, программиста и предметника. Автоматизация ослабляет зависимость специалиста-предметника от математика и программиста и существенно ускоряет обработку информации. Для достижения этих эффектов диалоговая система должна, во-первых, содержать методы и процедуры анализа данных, применимые в случаях наличия у исследователя различной априорной информации (в том числе статистические методы проверки значимости обнаруженных особенностей и процедуры снижения размерности); во-вторых, быть доступна пользователю, не имеющему специальной подготовки по математическим методам и программированию; в третьих, позволять реализовывать типичные стратегии анализа структуры многомерных данных.

Задачи работы. В диссертации решаются следующие задачи:

- разрабатывается структура диалоговой системы, организация данных, диалога и соответствующее программное обеспечение;

- разрабатываются и исследуются статистические методы проверки гипотез о классах на выборочных гистограммах;

- разрабатываются статистические процедуры анализа внутренней размерности для задачи сравнения совокупности многомерных объектов;

- применяются разработанные математические методы и программное обеспечение для решения конкретных задач вулканологии.

Научная новизна. В диссертации показана целесообразность локализации особенности на выборочной гистограмме при проверке гипотезы неоднородности и предложена формализация понятия однородной совокупности в виде семейств унимодальных, сильно унимодальных и выпуклых на отрезке плотностей распределения вероятностей. Показано, что для каждой модели однородности задача определения статистики критерия сводится к задаче нелинейной условной оптимизации, имеющей единственное решение.

Получены формулы для процентных точек критерия локальной неоднородности, гарантирующих заданный уровень значимости при отклонении нулевой гипотезы. Получены простые аналитические приближения статистик критериев для случая трех интервалов группировки. Получены оценки мощности локальных тестов.

Предложена статистическая формализация класса задач сравнения совокупности многомерных объектов. Разработаны процедуры анализа внутренней размерности в случае линейной модели.

Практическая значимость работы определяется разработанным программным обеспечением диалоговой системы ВУЛКАНИТ. Структурная схема системы и организация данных позволяют, в отличие от известных систем, более эффективно использовать имеющиеся возможности для реализации типичных стратегий анализа данных, а также работать с пересекающимися классами, сохранять и использовать информацию, полученную на ранних этапах исследования. Система работает на ЕС ЭВМ и доступна пользователям, не имеющим специальной подготовки по математическим методам и программированию.

Разработанные в диссертации статистические процедуры позволяют повысить достоверность выводов при анализе данных. Обработка химических составов горных пород Курильской островной дуги и Тихоокеанского региона дала новые сведения для вулканологии.

Реализация результатов. Разработанные в диссертации статистические методы и диалоговая система ВУЛКАНИТ с 1982 года используются в Институте вулканологии ДВНЦ АН СССР для решения задач петрологии и геохимии вулканических горных пород, минералогии вулканических пеплов, изучения данных по термо- и рудо-проявлениям, исследования пространственно-временных характеристик землетрясений. Программное обеспечение внедрено и используется в Институте океанологии АН СССР, в ПГО "Камчатгеология", в НПО "Аналитприбор", во ВНИИПО МВД СССР.

Программное обеспечение зарегистрировано в Государственном фонде алгоритмов и программ (рег.Р П006613).

Апробация работы. Материалы работы докладывались и обсуждались: на УШ Всесоюзном совещании по проблемам управления (г.Таллин, 1980 г.); на У1 Всесоюзной конференции по планированию и автоматизации эксперимента в научных исследованиях (г.Москва, 1980 г.); на У Всесоюзном вулканологическом совещании (г.Тбилиси, 1980 г.); на Всесоюзном семинаре "Многомерный статистический анализ и вероятностное моделирование реальных процессов" (г.Москва, ЦЭМИ АН СССР, 1980, 1982, 1984 гг.); на 1У, У, У1, УН Конференциях молодых ученых Института вулканологии ДВНЦ АН СССР (г.Петропавловск-Камчатский, 1979, 1980,

1981, 1983 гг.).

По теме диссертации опубликовано 9 печатных работ [22-27, 90-91,115] и 4 работы находятся в печати.

Основное содержание диссертации изложено в пяти главах. Первая глава содержит обзор методов, алгоритмов"и программ анализа структуры многомерных данных, а также обоснование задач исследования.

Вторая глава посвящена разработке структуры диалоговой системы анализа и классификации многомерных данных, разработке организации данных и диалога. Здесь же дается краткое описание системы ВУЛКАНИТ, реализованной в ОС ЕС ЭВМ.

В третьей главе диссертации рассматривается задача о статистической проверке значимости замеченных визуально неодно-родностей в структуре данных. В рамках непараметрического подхода предложено и исследовано несколько моделей неоднородности; получены соответствующие статистические тесты и проведено их сравнение по мощности.

В четвертой главе для класса задач сравнения совокупности многомерных объектов предложены две статистические модели получения сжатой информации о различии между объектами. Результаты представлены в виде процедур анализа внутренней размерности, реализуемых с помощью диалоговой системы ВУЛКАНИТ.

Пятая глава диссертации содержит два исследования, проведенных с помощью разработанных в третьей и четвертой главах статистических процедур и системы ВУЛКАНИТ.

В приложениях к работе содержится описание основных алгоритмов обработки данных в системе ВУЛКАНИТ, а также приводятся акты, подтверждающие внедрение результатов диссертации.

Заключение диссертация на тему "Разработка статистических методов анализа и классификация многомерных данных и их реализация в диалоговой системе"

5.4. Выводы по главе 5

Решены две вулканологические задачи обработки геохимической информации с использованием разработанных в диссертации статистических процедур и диалоговой системы ВУЛКАНИТ.

1. Показано, что петрохимическое разнообразие изверженных пород андезитового состава Главной зоны Большой Курильской гряды определяется двумя главными факторами: первый интерпре- • тирован как глубина до сейсмофокальной зоны Беньофа, второй как мощность вулканогенно-осадочного слоя. Определены тенденции изменения компонентов химического состава в зависимости от вариаций контролирующих параметров. Доказана зависимость состава вулканических продуктов от типа и строения земной коры. Выдвинуто предположение о возможности определения глубины залегания близповерхностного очага для андезитовых вулканов по химическому составу изверженных пород.

2. Показано, что магматические продукты, проявляющиеся в различной геотектонической обстановке (платформенной или геосинклинальной) значимо отличаются по химическому составу, образуя две независимые серии вулканических пород. Получен пет-рохимический индекс в виде линейной комбинации исходных окислов, разделяющий серии океанических и островодужных базальтов Тихоокеанского региона. Определены тенденции изменения исходных окислов в зависимости от степени "океаничности".

ЗАКЛЮЧЕНИЕ

В диссертации разработаны, исследованы и применены при решении конкретных задач вулканологии статистические процедуры и программные средства, предназначенные для автоматизации научных исследований по анализу и классификации многомерных количественных данных.

1. Показано (глава I), что существующее программное обеспечение не полностью удовлетворяет требованиям простоты общения (пакеты программ), функциональной полноты и структурной организации (диалоговые системы). Обоснована необходимость разработки структурной схемы, организации данных и диалога. Обоснована также необходимость разработки и исследования статистических процедур проверки гипотез о классах.

2. Предложена и обоснована организация диалоговой системы анализа структуры многомерных данных (глава 2). Возможности сгруппированы в блоки предварительной обработки, операций над классами, статистического анализа, проверки гипотез, преобразо' вания, графического отображения. а). Предложена структурная схема системы (рис.2.1), позволяющая реализовывать различные стратегии анализа данных за счет поступательного движения вперед и возвратов, изучения совокупности данных целиком и по частям, в исходном и преобразованном пространстве, наглядного представления результатов и оперативной обратной связи пользователя с ЭВМ. б). Предложена организация данных, позволяющая, в отличие от известных схем, работать с пересекающимися классами (рис. 2.2.6), а также сохранять, использовать и сравнивать результаты, полученные на разных этапах исследования (рис.2.3).

3. Разработана, основываясь на опыте решения конкретных задач вулканологии, диалоговая система ВУЛКАНИТ (раздел 2.5, Приложение I) для обработки многомерной количественной информации. а). Разработаны логические схемы диалога (по типу "меню"), предполагающие простые правила ответов на вопросы, что позволяет работать с системой специалистам-предметникам, не имеющим специальной подготовки по математическим методам и программированию. б). Разработано программное обеспечение для реализации системы в ОС ЕС (версия 6.1) с дисплеями комплексов ЕС-7906 или ЕС-7920. Программное обеспечение объемом около 15000 операторов ФОРТРАНа зарегистрировано в ГосФАП.

4. Предложены статистические процедуры проверки гипотезы неоднородности по выборочным гистограммам (глава 3). а). Показана целесообразность локализации особенности. б). Предложены три непараметрические модели понятия однородной совокупности: классы унимодальных, сильно унимодальных и выпуклых плотностей. Для проверки гипотезы используется критерий локальной неоднородности (3.9), основанный на хи-квадрат статистике. в). Показано, что для каждой модели задача определения статистики критерия сводится к задаче нелинейной условной оптимизации, имеющей единственное решение. Построены вычислительные алгоритмы и показана их работоспособность. г). Получены выражения для процентных точек, гарантирующих заданный уровень значимости при отклонении нулевой гипотезы однородности.

5. Предложены приближенные тесты неоднородности для практически важного случая трех интервалов группировки (разделы 3.5 и 3.6). а). Получены простые аналитические приближения для статистик критериев: (3.3б)-(3.37) - унимодальность; (3.39) -(3.40) - сильная унимодальность; (3.41) - выпуклость. Показано, что относительная ошибка приближения, как правило, не превышает 5 %. б). Показано, что критерии сильной унимодальности и выпуклости близки по своей мощности и существенно превосходят критерий унимодальности для большого класса альтернатив.

6. Разработаны статистические процедуры анализа внутренней размерности для задачи сравнения совокупности многомерных объектов (глава 4). а). Предложена формализация задачи в терминах статистической теории. б). Исследованы две модели расположения неизвестных средних составов по объектам: идеальная гиперплоскость (модель А) и "шероховатая" гиперплоскость (модель В). в). Получены оценки направляющих векторов (4.15) и оценки размерности гиперплоскостей: (4.8)-(4.9) - модель А; (4.12)-(4.13) - модель В. г). Показано, как реализовать предложенные статистические процедуры при помощи диалоговой системы ВУЛКАНИТ.

7. Проведена апробация разработанных в диссертации статистических процедур и программных средств на двух реальных задачах вулканологии (глава 5). а). Показано, что петрохимическое разнообразие андезитов Большой Курильской гряды определяется двумя главными факторами: первый интерпретирован как глубина до сейсмофокальной зоны Беньофа, второй как мощность вулканогенно-осадочного слоя. Доказана зависимость химического состава вулканических продуктов от типа и строения земной коры. б). Получена петрохимическая классификация базальтов Тихоокеанского региона на две серии, соответствующие различным геотектоническим обстановкам (платформенной и геосинклинальной).

8. Разработанные в диссертации статистические процедуры и диалоговая система ВУЛКАНИТ с 1982 года используются сотрудниками Института вулканологии ДВНЦ АН СССР для решения задач петрологии и геохимии магматических пород, минералогии вулканических пеплов, изучения данных по термо- и рудопроявлениям, исследования пространственно-временных характеристик землетрясений. Система внедрена и используется в Институте океанологии АН СССР, в ПГО "Камчатгеология", в НПО "Аналитприбор", во ВНИИПО МВД СССР.

Библиография Жаринов, Сергей Евгеньевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Материалы ХХУ1 съезда КПСС. М.: Политиздат, 1981. 223 с.

2. Абрамович И.И., Груза В.В. Фациально-формационный анализ магматических комплексов. Петрохимические исследования. Л.: Недра, 1972. 240 с.

3. Абрамович И.И., Клушин И.Г. Петрохимия и глубинное строение Земли. Л.: Недра, 1978. 375 с.

4. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. М.: Статистика, 1974. 240 с.

5. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. О структуре и содержании пакета программ по прикладному статистическому анализу. В кн.: Алгоритмическое и программное обеспечение прикладного статистического анализа. М.: Наука, 1980, с.7-62.

6. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. М.: Финансы и статистика, 1983. 471 с.

7. Андерсон Т. Введение в многомерный статистический анализ. М.: Физматгиз, 1963. 500 с.

8. Андрукович П.Ф. Некоторые свойства метода главных компонент. В кн.: Многомерный статистический анализ в социально-экономических исследованиях. М.: Наука, 1974,с.189-228.

9. Апраушева Н.Н. Определение числа классов в задачах классификации. Известия АН СССР. Техническая кибернетика, 1981, № 3, с.71-77; IP 5, с.153-160.

10. Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. М.: Мир, 1982. 583 с.

11. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1965. 464 с.

12. Бондаренко В.Н. Статистические решения некоторых задач геологии. М.: Недра, 1970. 248 с.

13. Боннер Р.Е. Некоторые методы классификации. В кн.: Автоматический анализ сложных изображений. М.: Мир, 1969,с.205-234.

14. Браверман Э.М. Методы экстремальной группировки параметров и задача выделения существенных факторов. Автоматика и телемеханика, 1970, № I.

15. Бугаец А.Н., Дуденко Л.Н. Математические методы при прогнозировании месторождений полезных ископаемых. М.: Недра, 1976. 270 с.

16. Василенко В.Б., Холодова Л.Д., Блинчик Т.М. Петрохимия (математическая статистика, проблемы, алгоритмы, программы). Новосибирск, 1982. 133 с.

17. Верховская Л.А., Ронина A.M., Якшина И.А. Комплекс программ для обработки на ЭВМ ЕС геохимической информации при поисках рудных полезных ископаемых. Алгоритмы и програм-мы/ВИЭМС, 1980, вып.2, 97 с.

18. Воронин Ю.А., Еганов Э.А. Методологические вопросы применения математических методов в геологии. Новосибирск: Наука, 1974. 86 с.

19. Гаек Я., Шидак 3. Теория ранговых критериев. М.: Наука, 1971. 375 с.

20. Гольдин С.В. О проверке однородности совокупности геологических объектов. Тр./ЗапСибНИГРИ, 1968, вып.18,с.108-126.

21. Горицкий Ю.А. Автоматизация процесса классификации многомерных наблюдений с помощью графической диалоговой системы. Тр./Моск.энерг.ин-т, 1980, вып.496, с.8-14.

22. Горицкий Ю.А., Жаринов С.Е. Диалоговая система анализаданных ВУЛКАНИТ и ее возможности. В кн.: У1 Всесоюзная конференция по планированию и автоматизации эксперимента в научных исследованиях. М., часть I, 1980, с.78.

23. Горицкий Ю.А., Жаринов С.Е. Графическая диалоговая система ВУЛКАНИТ для классификации и анализа многомерных данных. -В кн.: УШ Всесоюзное совещание по проблемам управления. Таллин, 1980, книга 2, с.371-372.

24. Горицкий Ю.А., Жаринов С.Е. Организация графической диалоговой системы анализа данных. Автометрия, 1983, Р I,с.18-23.

25. Горицкий Ю.А., Жаринов С.Е., Масуренков Ю.П. Графическая диалоговая система ВУЛКАНИТ и ее применение для анализа и классификации петрохимической информации. Вулканология и сейсмология, 1983, Р I, с.3-24.

26. Горицкий Ю.А., Жаринов С.Е., Масуренков Ю.П. Графическая диалоговая система анализа структуры многомерных данных.-Алгоритмы и программы, 1983, № 6, с.45-46.

27. Горшков Г.С. Вулканизм Курильской островной дуги. М.: Наука, 1967. 288 с.

28. Дорофеюк А.А. Алгоритмы автоматической классификации. -Автоматика и телемеханика, 1971, Р 12, с.78-113.

29. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Статистика, 1973.

30. Дубровский С.А., Зейгер Е.М., Френкель А.А. Факторный анализ. Методы и приложения. В кн.: Многомерный статистический анализ в социально-экономических исследованиях. М.: Наука, 1974, с.229-293.

31. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. 511 с.

32. Дюран Б., Оделл П. Кластерный анализ. М.: Статистика, 1977. 128 с.

33. Жуковская В.М., Мучник И.Б. Факторный анализ в социально-экономических исследованиях. М.: Статистика, 1976. 151 с.

34. Загоруйко Н.Г. Методы распознавания и их применение. М.: Советское радио, 1972. 208 с.

35. Загоруйко Н.Г., Лбов Г.С., Машаров Ю.П. Пакет прикладных программ для обработки таблиц экспериментальных данных ОТЭКС-I. Вычислительные системы, 1977, вып.69, с.93-101.

36. Загоруйко Н.Г., Орлов А.И. Некоторые нерешенные математические задачи прикладной статистики. В кн.; Современные проблемы кибернетики (прикладная статистика). М.: Знание, 1981, с.53-63.

37. Закс Л. Статистическое оценивание. М.: Статистика, 1976. 598 с.

38. Исаенко O.K., Урбах В.Ю. Разделение смесей распределений вероятностей на их составляющие. В кн.: Итоги науки и техники. Теория вероятностей, математическая статистика, теоретическая кибернетика. М.: ВИНИТИ, том 13, 1976.

39. Канал Л. Обзор систем для анализа структуры образов и разработки алгоритмов классификации в режиме диалога. В кн.: Распознавание образов при помощи цифровых вычислительных машин. М.: Мир, 1974, с.124-143.

40. Кендалл М.Дж., Стьюарт А. Статистические выводы и связи. M.s Наука, 1973. 899 с.

41. Кульбак С. Теория информации и статистика. М.: Наука, 1967. 408 с.

42. Леман Э. Проверка статистических гипотез. М.: Наука, 1979. 408 с.

43. Лутц Б.Г. Геохимия океанического и континентального магматизма. М.: Недра, 1980.

44. Математическое обеспечение ЕС ЭВМ. Минск: Институт математики АН БССР, 1973, вып.2; 1976, вып.10; 1978, вып.14, вып.16; 1980, вып.25.

45. Мучник И.Б., Ослон А.А. Разработка и применение программных средств агрегирования социально-экономических данных.-В кн.: Вопросы разработки и внедрения систем обработки данных на базе ЕС ЭВМ. М.: МДНТП, 1980.

46. Мучник И.Б., Ослон А.А. Построение фактора, аппроксимирующего матрицу связей. Автоматика и телемеханика, 1980,4, с.89-96.

47. Орлов А.И. Некоторые вероятностные вопросы теории классификации. В кн.: Прикладная статистика. М.: Наука, 1983, с.166-179.

48. Пакет прикладных программ ОТЭКС (версия 2.1). Обзор. Новосибирск, 1978.

49. Пакет прикладных программ по прикладному многомерному статистическому анализу. М.: ЦЭМИ АН СССР, препринт, 1983.

50. Петрохимия кайнозойской Курило-Камчатской вулканическойпровинции. Под ред.Э.Н.Эрлиха. М.: Наука, 1966. 279 с.

51. Пополитов Э.И., Волынец О.Н. Геохимические особенности четвертичного вулканизма Курило-Камчатской островной дуги и некоторые вопросы петрогенезиса. Новосибирск: Наука, 1981. 181 с.

52. Рао С.Р. Линейные статистические методы и их применения. M.s Наука, 1968. 547 с.

53. Раудис Ш. Алгоритмы классификации и регрессии системы C0PPA-I. Статистические проблемы управления, 1978, № 27, с.23-39.

54. Раудис Ш., Пикялис В., Юшкявичус К. Система оперативной разработки распознающих алгоритмов (СОРРА). Статистические проблемы управления, 1978, № 27, с.9-22.

55. Решение У Всесоюзного вулканологического совещания. Тбилиси, 1980, 14 с.

56. Родионов Д.А. Статистические методы разграничения геологических объектов по комплексу признаков. М.: Недра, 1968. 158 с.

57. Родионов Д.А. Статистические решения в геологии. M.s Недра, 1981. 231 с.

58. Сборник научных программ на ФОРТРАНе. М.: Статистика, 1974, вып.1,2.

59. Себер Дж. Линейный регрессионный анализ. М.: Мир, 1980. 456 с.

60. Терехина А.Ю. Метрическое многомерное шкалирование. М.: Институт проблем управления, препринт, 1977. 75 с.

61. Тюрин Ю.Н. Непараметрические методы статистики. M.s Знание, 1978. 63 с.

62. Уилкс С. Математическая статистика. М.: Наука, 1967. 632 с.

63. Федотов С.А. 0 механизме глубинной магматической деятельности под вулканами островных дуг и сходных с ними структур. Известия АН СССР, серия геологическая, 1976, № 5, с.25-37.

64. Фукунага К. Введение в статистическую теорию распознавания образов. М.: Наука, 1979. 368 с.

65. Харман Г. Современный факторный анализ. М.: Статистика,1972.

66. Хартиган Дж.А. Задачи, связанные с функциями распределения в кластер-анализе. В кн.: Классификация и кластер. М.: Мир, 1980, с.42-65.

67. Шейнманн Ю.М. О связи между типами магм и тектоникой. -Советская геология, 1964, № 2, с.3-17.

68. Шеффе Г. Дисперсионный анализ. М.: Наука, 1980. 512 с.

69. Энциклопедия кибернетики. Киев, 1974, том I, с.262.

70. Эрлих Э.Н. Современная структура и четвертичный вулканизм западной части Тихоокеанского кольца. Новосибирск: Наука,1973. 243 с.

71. Ball G.H., Hall D.J. A clustering technique for summeriz-ing multivariate data. Behavioral Sciences, 1967, v.12, n.3, p.153-155.

72. Ball G.H., Hall D.J. Some implications of interactive graphic computer systems for data analysis and statistics. -Technometrics, 1970, v.12, n.1, p.17-31.

73. Bennett R.S. The intrinsic dimensionality of signal collections. IEEE Trans. Inform. Theory, 1969, v.IT-15, n.9, p.517-525.

74. BMDP: Biomedical Computer Programs (Ed. W.Dixon). -University of California Press, 1979.

75. Chang C.L., Lee R.C. A heuristic relaxation method for nonlinear mapping in cluster analisys. IEEE Trans. Syst. Man, Cybern., 1973, v.SMC-3, n.2, p.197-200.

76. Chayes P. Version HTRM2 of system KKKPSYS. Washington, D.C.: Geophisical Laboratory, 1977. 70 p.

77. Day П.Е. Estimating the components of a mixture of normal . distributions. Biometrika, 1969, v.56, n.3, p.463-474.

78. Dickinson W.R., Hatherton T. Andesitic volcanism and seismicity around the Pacific. Science, 1967, v.157, n.3790, p.801-803.

79. Dubes R., Jain A.K. Models and methods in cluster validity. Proc./IEEE Comput. Soc. Conf. Pattern Recognition and Image Process., Chicago, 1978, p.148-155.

80. Engelman L., Hartigan J.A. Percentage points of a test for clusters. Journal of the American Statistical Association, 1969, v.64, p.1647-1648.

81. Pisher R.A. The use of multiple measurments in taxonomic problems. Annals of Eugenics, 1936, v.7, p.179-188.

82. Poley D.H., Sammon J.W. An optimal set of discriminant vectors. IEEE Trans. Comput., 1975, v.C-24, n.3,p.281-289.

83. Priedman J.H., Tukey J.W. A projection pursuit algorithm for exploratory data analisys. IEEE Trans. Comput., 1974, v.C-23, n.9, p.881-890.

84. Gnanadesican R., Wilk M.B. Data analitic methods in multivariate statistical analysis. In: Multivariate Analysis II, Krishnaiah P.R. edit. - Hew York: Academic Press, 1969, p.593-638.

85. Goritsky Yu.A,, Zharinov S.E., Masurenkov Yu.P. VOLCAITITE: an interactive graphic computer system for petrochemical data analysis, Inг IAVCEI Symposium Arc Volcanism,1. оку о and Hakone, 1981, p. 113-114.

86. Green P.E., Rao V.R. Applied multidimensional scaling. A comparison of approaches and algorithms. Hew York, 1972. 284 p. v

87. Hall D.J., Ball G.H., Wolf D.E. Applications of PROMENADE data analysis system. IEEE Comput. Commun. Conf. Rec., 1969, p.101-108.

88. Hartigan J.A. Clustering algorithms. Hew York: John Wiley & Sons, 1975. 351 p.

89. James А.Ш. Tests of equality of latent roots of the cova-riance matrix. In: Multivariate Analysis II, Krishnaiah P.R. edit., Hew York: Academic Press, 1969, p.205-218.

90. Johnson C.I. Interactive graphics in data processing. Principles of interactive systems. IBM Syst. Journal, 1968, v.7, n.384, p.147-173.

91. Koontz W., Fukunaga K. Nonparametric mapping of multivariate measurements for separability inhancement. Proc./

92. Hat. Electron. Conf., Chicago, 1970, v.26, p.471-475.

93. Kruskal J.B. Linear transformations of multivariate data to reveal clustering. In: Multidimensional scaling. Theory and application in the Behavioral sciences, v.1. - Hew York & London: Seminar Press, 1972, p.179-191.

94. Kuno H. Origin of cenozoic petrographic provinces of Japan and surrounding areas. Bulletin volcanologique, 1959, v.20, p.37-76.

95. Lee K.L. Multivariate tests for clusters. Journal of the American Statistical Association, 1979, v.74» n.376, p.708-714.

96. LeMaitre R.W. Experiences with GLAIR: a computerized library of analized igneous rocks. Chemical Geology, v.12, 1973, p.301-308.

97. Niemann H. Linear and nonlinear mapping of patterns. -Pattern Recognition, 1980, v.12, n.2, p.83-87.

98. Otsu IT. An optimal nonlinear transformations based on variance criterion for pattern recognition. Bull., Electrotechn. Lab., 1972, v.36, p.815-830.

99. Rao S.R. The use and interpretation of principal component analysis in applied research. Sankhya, 1964, v.A26, n.4, p.329-358.

100. Rosen C.A., Hall D.J. A near-optimum categorization algorithm for certain artificial gaussian data. IEEE

101. Trans. Inform. Theory, 1966, v.IT-12, n.2, p.277.

102. Sammon J.W. A nonlinear mapping for data structure analysis. IEEE Trans. Comput., 1969, v.C-18, n.5,p.401-409.

103. Sammon J.W. Interactive pattern analysis and classification. IEEE Trans. Comput., 1970, v.C-19, n.7, p.594-616.

104. Sammon J.W. An optimal discriminant plane. IEEE Trans. Comput., 1970, v.C-19, n.9, p.826-829.

105. Sammon J.W., Proctor A.H., Roberts D.P. An interactive-graphic subsystem for pattern analysis. Pattern Recognition, 1971, v.3, April, p.37-52.

106. Scott D.W. On optimal and data-based histograms. -Biometrika, 1979, v.66, n.3, p.605-610.

107. Shepard R.N., Carroll J.D. Parametric representation of nonlinear data structures. In: Multivariate Analysis I, Krishnaiah P.R. edit., Hew York: Academic Press, 1966, p.561-592.

108. Sneath P.H.A, Method for testing distinctness of clusters test of disjunction of 2 clusters in euclidian space as measured by their overlap. - Mathematical Geology, 1977, v.9, p.123-143.

109. Sugimura A. Chemistry of volcanic rocks and seismicity of the Earth's mantle in the island arc. Bulletin volcanologique, 1967, v.30, p.319-334.