автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы обработки статистических данных по выявлению и прогнозированию критических состояний систем

кандидата технических наук
Лукьянова, Валентина Георгиевна
город
Москва
год
1996
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Методы обработки статистических данных по выявлению и прогнозированию критических состояний систем»

Автореферат диссертации по теме "Методы обработки статистических данных по выявлению и прогнозированию критических состояний систем"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И АВТОМАТИКИ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

На правах рукописи

Лукьянова Валентина Георгиевна

Методы обработки статистических данных по выявлению и прогнозированию критических состояний систем

Специальность 05.13.01 "Управление в технических системах"

Автореферат диссертации на соискание ученой степени кандидата технических наук

МОСКВА 1996

Работа выполнена на кафедре Математических моделей природных и экономических систем Московского государственного института радиотехники, электроники и автоматики (Технического университета).

Научный руководитель: доктор технических наук, профессор В.И.Кузьмин

Официальные оппоненты:

- доктор технических наук, профессор Ткаченко В.М.

- кандидат технических наук, профессор Лебедев A.B.

Ведущая организация : Институт экономики и информации в радиотехнике,

Защита состоится 1996 г. в на заседании

диссертационного совета Д 063.54.01 Московского государственного института радиотехники, электроники и автоматики (Технического университета) по адресу: 117454, Москва, пр-т Вернадского,д.78. С диссертацией можно ознакомиться в библиотеке МИРЭА.

Автореферат разослан 1996 г.

Ученый секретарь диссертационного совета

к.т.н., проф.

Д.Э.Федотова

I.ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы

Создание современных баз знаний связано с необходимостью построения на основе Есего имеющегося экспериментального материала систем естественных классификаций, характеризующих структурно полные сведения о качественно однородных диапазонах функционирования и развития систем!

Решение этих проблемм сеяззно с необходимостью разработки методических подходов и конкретных моделей, алгоритмов и программ для выявления критических состояний различных уровней иерархии и регулярностей во взаимном расположении таких критических состояний. Естественно, такие методы обработки даннных необходимы и для решения конкретных задач исследований физических характеристик систем, анализа и прогнозирования надежности технических устройстз, их проектирования и эксплуатации.

Актуальность темы исследования определяется принципиальной ориентацией на выделение в реальных экспериментальных данных критических состояний, тогда как общепринятые методы ориентированы, в основном, на сглаживание результатов и исключения критических состояний, как аномальных.

Цель работы

Целью настоящей работы явилась разработка обобщенных моделей, алгоритмов и программ для выявления диапазонов стабильности характеристик и критических состояний(точек фазо-

вых переходов) при обработке результатов измерений, для выя вления общих закономерностей функционирования, развития и прогнозирования характеристик сложных систем.

Предает исследования

Предметом исследования явились модели и методы обработки экспериментальных данных в их конкретной эффективности для выявления диапазонов стабильности и критических состояний.

Задачи исследования

Задачи исследования з данной диссертационной работе:

1. Разработка класса обобщенных математических моделей включзщие в качестве частных случаев основные модели, используемые для обработки экспериментальных данных з кинетике, прогнозировании динамики(моделей роста), моделей теории вероятности и математической статистики;

2. Установление границ, диапазонов использования таких обобщенных моделей и установление аналитических соотношений определяющих положения критических состояний(точек фазовых переходов):

3. Разработка алгоритмов и программ для выявления диапазонов стабильности и критических состояний применительно к обобщенным моделям и их конкретным частным реализациям в общепринятых моделях обработки экспериментальных данных;

4-Идентификация характеристик реальных систем на основе разработанных моделей алгоритмов;

5. Анализ обших закономерностей з формировании диапазонов стабильности и критических состояний в системах различной физической природы.

Методы исследования

При решении поставленных задач использовались математические модели кинетики, роста, теории вероятности, математической статистики, теории дифференциальных и дифференциально-разностных уравнений.

Научная новизна рэботы

В диссертации представлены оригинальные методы обработки экспериментальных данных основанные на исследовании качественных свойств обобщенных моделей динамики объектов и совокупностей объектов в данных статического разреза. Полученные результаты применения этих методов к конкретным областям знаний и систем выявили ряд принципиально новых количественных закономерностей в расстановке критических состояний и позволили установить ряд естественных классификаций.

Приведенные методы язляштся ноеытж применительно к обработке экспериментальных данных и актуальными,с точки зрения их практического использования в исследовательской и управленческой практике.

Основные положения, выносимые на защиту

К основным положениям, выносимым на защиту, можно отнести:

1. Обобщенные модели для обработки экспериментальных данных о характеристиках систем для динамики и статических статистических совокупностей;

2. Методы идентификации границ диапазонов стабильности на разных уровнях иерархии систем;

3. Алгоритмы идентификации параметров систем для определения критических уровней их развития (фазовых переходах);

4. Результаты применения обобщенных моделей и алгоритмов для определения критических состояний, классификаций их иерархической значимости, установление закономерностей в расстановке критических состояний;

5. Результаты исследования целостных свойств систем, как представленных взаимодействием последовательностей критических состояний различных уровней значимости и построение на этой основе систем естественных классификаций.

Практическая ценность исследования заключается б следующем:

1. в использовании обобщенкных моделей, описывающих систему в пирс-ком диапазоне параметров;

2. в разработке простых методик по выявлению однородных классов з пространств параметров системы;

3. в создании алгоритмоз и программ по выявлению критических состояний, >:ласснфикгцпй их иерархий и установлении ритмичности появления критического состояния:

4. в создании разработок по системам естественных классификаций и оценки структурной целостности системы.

Внедрение результатов работы

Результаты диссертационной работы внедрены во

в Московском государственном институте радиотехники, электроники и автоматики (техническом университете ).

Апробация работы

Основные положения диссертационной работы были представлены:

- на Всесоюзной конференции "Прогнозирование нефтегазоносн-ости и совершенствование поиска и тд.'\ г.5рунзе,1932;

- на конференции "Теоретические и методологические вопросы седиментаркой цикличности и нефтегазсносности",

г.Новосибирск, 1983;

- на научно-технических конференциях МИРЗА, Москва, 1982 - 1994 ГГ.

Публикации

По теме диссертации опубликовано 9 работ . Структура и объем работы

Диссертация состоит из введения, 3 глаз, зызодоз, списка литературы из 123 наименований. Диссертация содержит 153 страницы машинописного текста, 13 таблиц и 34 рисунка.

а

2. СОДЕРЖАНИЕ РАБОТЫ Во введении обосновывается актуальность темы диссертационной работа. Приводятся цели и задачи исследования. Показана предыстория вопроса прогнозирования сложных систем и место работы в развитие этой задачи. Кратко представлены опубликованные предварительные результаты исследований по выявлению и прогнозированию критических состояний з развитии сложных систем.

В первой главе рассматриваются 15 моделей надежности систем. Показано, что физические основы надежности систем определяются основными физическими процессами и факторами, которые лимитируют работоспособность системы. Фазозые и структурные изменения , за период работы системы, происходят за счет смены лимитирующих процесс параметров, что приводит к необходимости нового модельного описания процесса. Предъявлены основные требования к данным и методам их обработки.

Показана принципиальная необратимость происходящих процессов, а также существенное влияние пространственных и временных релаксаций на раззтие систем.

Описать процесс единой моделью позволяет применение моделей в виде уравнений дифференциально-разностного типа, которые органически учитывают влияние релаксаций на развитие системы и необратимый характер процесса.

Во второй главе рассматриваются основные свойства модели процесса с предысторией, дифференциальное уравнение которого имеет вид,

1Т1

где ат и Ьп постоянные кооэффициенты, % -запаздывание.

Показано, что характеристический квазиполином модели с запаздыванием на уровне оценок (выбираются члены с наибольшей весомостью)

И (г) л» а гт+ Ь гп е « 0 , совпадает с основными законами распределений математической статистики, при конкретных значениях входящих в него параметров (табл.1). При исследовании корней квазиполинома были выделены такие области в пространстве его параметров, внутри которых решения, соответствующие основной модели, устойчивы (т.е. в динамике этих систем отсутствуют колебания с экспоненциально возразтаицей амплитудой). Выход за установленные границы а реальных случаях соответствует изменению принципа функционирования системы. Из представленных в таблице 1 распределений экспоненциальное, хи-квадрат, гамма и Пуассона имеют запаздывание не зависящее от параметра з, а для нормального, Вейбула и Релея запаздывание зависит от этого параметра. Для нормального распределения запаздывание пропорционально параметру г.

Ограничения на область использования нормального распределения для уравнения запаздывающего типа: для г > о г < 1,55 о, для г < о \г\ < 0,75 сг; для уравнения опережающего типа:

для 2 > 0 2 < 0,75 о, для г < 0 |г( < 1,41 ст.

Таблица 1

Параметры характеристического уравнения и соответствующие им функции плотности вероятности

параметры уравнения

а -/гтс

Ст (пы)! ш

1С/о V

2 /ьТ(§) (

~пГ!

п - ш

Я) -

т -

2 о

Функции плотности

вероятности

2—2

О У 2ТС

1 е „т-1 -

х2

С т( ш - 1)!

т т-1 - -5— 2 е "о

__ _"О

— е 2о"

о ^

а -

И-2 2

V

2

т '

Наименование закона распределения.

нормальное

экспоненциальное.

гамма

Вейбулла

г еле я

хи-кзадрат

Пуассона

Таблица 2

Ограничения на область использования распределений с запаздыванием, не зависящим от параметра:

Распределение Ограничения на область 2 > 0 : использования1 2 < 0 !

■1 экспоненциальное 2 , 1 <1,29 : ¡2! % < 1 |

1 2 хи-кзадрзт •7 < 2,58 : ¡21 < 2 ;

; 3 гамма 2 < 1,29 . с : ( т < 1 I < с |

! 4 Пуассона 2 <1,29 : 1 7 1 1 Ъ 1 < 1

Для распределения Вейбулла область устойчивости

1/ш

при г > 0 2 < (1,29 20)

"1 /т

при 2 < 0 2 < (0,28 20) .

Точность полученных ограничений была проверена обработкой исходных данных, соответствующих конкретным законам распределений. Данные взяты из опубликованных источников. Рассмотрены экспериментальные данные реальных процессов, параметры которых распределены по законам: нормальному, экспоненциальному, гамма, Вейбулла и Пуассона.

При этом оказывается, что знутри диапазона, относящегося к определенным теоретическим границам, система параметров является устойчивой, тогда как вне этих диапазонов наблюдаются особенности. Развитие этих исследований привело к созданию алгоритмов обработки данных и прогнозирования на примере вариационных рядов параметров систем.

Тгетья глаза пссзяшенз птогнсзиссзакизс надежности тех-

нических систем и естественным классификациям в информатике. Показано на примере существование дискретных характеристик в природных системах, которые существуют в одном ряду вне зависимости от физической структуры рассматриваемого объекта. Приведен алгоритм определения критических характеристик природных систем различных по уровню значимости в ранговых распределениях параметров, представляющих процесс в виде последовательности линейных участков экспоненциальных и степенных функций. Показано, что с помощью ранговых критериев можно выделить диапазоны параметров отвечающих одинаковому качеству сзойств объекта, зыявить характер последовательности критических точек и уровень иерархии, кроме того, в определенной степени, можно говорить о целостности системы.

Приведены -примеры применения указанных методов обработки к конкретным данным с целью прогнозирования надежной работы технических систем и построения естественных классификаций з информатика.

1) Прогнозирование надежности технических систем

Как уже указывалось, при прогнозировании надежности особо важно определение критического уровня параметров системы, где она теряет устойчивость. В работе приведен пример последовательных отказов аппаратуры кондиционирования воздуха для 13 самолетоз типа "Еоинг-720".

Зависимость представляет собой последовательность прямолинейных (экспоненциальных в полулогарифмической системе координат) участков, в которых логарифм эмпирической кривой

надежности убывает на величину «1. Регулярность смекы характера отказов соответствует геометрической прогресии с модулем » е. Тогда предельные значение времени между отказами, до которого будет сохраняться тренд экспоненциального типа с постоянным параметром составит величину равную абциссе, на которой этот тренд принципиально меняется. Существование закономерности в смене экспоненциальных режимов облегчает прогнозирование следующих критических точек.

2) Естественные границы з природных объектах

На примере ранговых распределений запасов месторождений нефти и газа разной степени интеграции (залехи, месторождения, области, районы, провинции) показано, что в логарифмической системе координат на объектах разного качестза границы однородных участков (изломы прямых)в данном диапазоне параметров лежат на одних и тех :ке уровнях.

Т.е. положение точек качественной смены параметра объекта не зависит от природы оъекта. Местоположение изломов не случайно и имеет регулярность соответствующей геометрической прогрессии с модулем в (см.рис.1). Наличие дискретов а этих диапазонах наблюдались на массах других объектов. Выделение естественных рубежей в ряду месторождений з зависимости от их размеров важно для проверки классификаций. Отметим, что применяемая в России классификация, даваемая для извлекаемых запасов во многом совпадает с полученными оубежами.

и

Выявление закономерности в чередовании критических уровней параметров было проведено на геологических объектах. За основу были взяты замеры длины и ширины платформенных тектонических структур, сводов и впадин, плавающих льдин, ограниченные трещинами отдельности и т.д. Следует отметить, что любая качественно однородная совокупность имеет пределы. Если необходимо расширить диапазон размеров приходится привлекать объекты другого типа. Исследование ранговых распределений длин этих систем показало наличие критических значений в одних и тех же уровнях параметра и соотношение между последовательными изломами » е.

Следовательно, регулярность появления дискретов в параметрах остается одинаковой как для объектов, выделяемых по массе, так и для тех, которые выделяются по размерам.

3) Дискретность в физических свойствах и характеристиках На рис.2, представлен вариационный ряд значений температур плавления простых веществ, из которого еидно, что изменению температур плавления в е раз соответствуют рубежи, где резко меняется ход вариационного ряда. Это выражается в изломах, представляющих изменение темпов экспоненциальных тенденций, и даже в скачках (диапазон 720-900 К).

Аналогичный вид имеет зависимость, характеризующая за-риационный ряд плотностей простых веществ . Здесь также фиксируется последовательность критических рубежей с модулем е, отмеченных излома™ вариационной кривой.

Бисл. Ранговые распределения скоплений нефти и газа з зависимости от их запасов.

7000-

2СОС

3 *"' !)Ь

то-

1*001 о

■ с

,!00-

Си

-

1ма, / <-1

Ег

-Те

■Г

? 200-

I

юг.

ЧИЛг-АО ■

—~ »1

Рис.2. Ранговое распределение температур плавления простых зещестз.

4) Классификации в информатике Для классификаций структурных свойств систем, предъявленных з виде текстов, проведена обработка информации, которая содержится в частотных словарях в частности русского словаря (общего), литературного языка, частотного словаря словника языка А.С.Пушкина и англо-русский частотного словаря (подъязык философии).

Частотные словари представляют собой свод статических данных о лексическом составе языка. Они составляются с опорой на различные единицы счета. Ниже рассматриваемые частотные словари составлены на основе лексем (слово-типы, обладающие свойством порождать текстовые слова).

Так словарь современного русского языка составлен нз основании обработки на ЗБМ около 1 млн. словоупотреблений, что дало около 40 тыс. единиц счета. В словаре учтены по крайней мере четыре самостоятельные сферы употребления лексики (художественная литература, разговорная речь, научная, публистическая и деловая речь).

Статистическая структура лексем словника языка А.С.Пушкина состоит из 22 тыс. словоупотреблений. Ранговые распределения частот лакеем этих словарей (масштаб логарифмический) предъявляют структуру в виде последовательности степенных зависимостей. Рассмотрим структуру русского частотного словаря и определим размеры однородных участков. Результаты анализа сведены в таблицу 3-Причем надо отметить, что изломы 1 и 3 лежат вблизи критических значений абсолютной шкалы числа элементов в системе

(отмечено на биологических популяциях ) равных (е®)2 и Второй участок, соответствующий динамической области языка, имеет критическое соотношение, которое соответствует процессу с экспоненциальным развитием неустойчивого типа. Что является характерным для словника А.С.Пушкина?

Анализ показал, что нарушение однородности на участках практически везде совпадают с этими отметками. Причем некоторые критические точки по оси ординат синхронизируются с критическим значением по рангу (ось абцисс)- это частоты Р * ед - ранг э2;

? » (ев}3и э3 - -санг э3; г

> -ранг е3,51;

» (9е)2 - ранг с эвг. Все эти критические точки лежат з области часто встречающихся лексем и динамической части языка. Переходная часть словника состоит из 3-х прямолинейных участков, хотя по оси абцисс и

Таблица 3 Анализ структуры частотного словаря русского языка

Л частоты на краях участка "Соотношвшк частот по краям Структурная область

1 4-2852-2900 14,8 н е® обл.часто встречавшихся лексем

2 2500 - 70 е3-7 динамическая область языка

3 70-14 е1.6 переходная область

4 14 - 1 ..................................................... - 89 обл. редко зстоечаю-гихся*лексем !..............................................................

ординат соотношение между динамической частью языка и облас-

тыо редко встречающихся лексем ~ е*.

В работе представлено ранговое распределение частоты встречаемости лексем англо-русского словаря (подъязык философии), оказалось что уровни проявляющихся здесь критических границ ниже, чем у вышеописанных словарей, что является предъявлением более низкой структурной организации системы.

Кроме того рассмотрены частотное распределение по Цип-фу. Анализировались частотные распределения лексем в логарифмической системе координат: по оси абцисс частота лексем, по оси ординат количество лакеем с данной частотой (рис.з).

бай

Рис.з. Зависимость количества лексем К частотного русского словаря от частоты лексем Рл.

Были выделены 3 структурные группы с критическим соотношением по количеству лексем равным ее(словарь современного русского языка и словник языка А.С.Пушкина). Причем установлено, что структура англо-русского словаря размыта и количество однородных участков меньше, т.е. подобное распределение может служить оценкой целостности системы по количеству элементов.

Таким образомм, из вышеизложенного видно, что путем проведения довольно простых последовательных процедур выявляются однородные участки в распределениях характеристик систем рангового типа.

Можно выявить, по крайней мере, три уровня иерархии систем с равномерным тактом изменения структуры и геометрическими шзсггессиями с модулями е и эв.

Результаты подобного типа могут быть использованы для определения границ основной лексики, для различных проблем общей и учебной лексикографии и, з частности, при разработке систем по распознаванию образов ТЕЗАРУС.

, Для естественной класификаши- природных объектов, например, месторождений полезных ископаемых по запасам, можно получить полную информацию об областях значений параметров, где должна происходить смена стуктуры объекта. То же самое можно сказать и о научных исследованиях, то есть применяя подобную методику при изучении новых явлений, появление критических точек можно предсказать, что позволит получить результат качественно нового уровня.

ЗАКЛЮЧЕНИЕ

1. Создание современных баз данных требует построения на основе всего имеющегося экспериментального материала систем естественных классификаций (структурно-целостные сведения о качественно однородных диапазонах функционирования и развития систем). Причем резко выделяющиеся значения надо рассматривать как крайне неустойчивое состояние.

2. Что требует создания таких методических подходов и конкретных моделей, алгоритмов и программ для выявления критических состояний и различных регулярностей в их взаимном расположении.

3. Анализ существующих моделей надежности работы систем показывает, что фазовые и структурные изменения в работе происходят за счет смены лимитирующих параметров. Все они включают в себя степенные и показательные функции.

4. Все реальные процессы имеют принципиально необратимый характер.

5. Известные модели, отражающие надежность реальных процессов, являются марковскими. Описание процесса при этом возможно только в узком диапазоне параметров. Переход на новый принцип функционирования требует новой математической модели.

6. Что можно избежать применяя модель с запаздыванием, которая позволяет представить процесс з широком диапазоне характеристик и предсказать моменты в них скачков и характера зависимости за ним.

7. Модель с запаздыванием в общем случае представляет ссссй дифференциально-разностное уравнение, характеристический

квазиполином которого на уровне оценок совпадает (при определенных зачениях параметров) со многими функциями плотностей вероятностей , используемых в математической статистике, а. Оценка корней квазиполинома при определенном значении параметров дает диапазон стабильного развития системы. Определение подобного диапазона возможно, применив ограничения на использование законов распределения математической статистики.

9. Определение качественного (однородного) различия параметра объекта хорошо проявляется в полулогарифмической системе координат в его ранговом расределении, в зиде последовательности прямолинейных участков, разделяемыми изломами.

10. Появление изломов з ранговых распределениях имеет регулярный характер, соответствующий геметрической прогрессии с модулем, величина которого отражает уровень иерархии системы.

11. Применение методов определения однородных свойств объектов поможет в установлении и предсказании их критических уровней. Способствует созданию естественных классификаций в природе.

12.Полученные здесь результаты показывают возможность определения структурной полноты зкбсрки, а значит, и качество совокупности. Зто позволяет на основе разработанного в работе подхода создать формальные методы анализа структурной целостности, в частности для специализированных и общих словарей .

По теые диссертации опубликованы следующие работы:

1. Лившиц И.Г., Лукьянова В.Г. и др. Методика статистической обработки информации о надежности технических изделий на ЭЦВМ. -М., изд-во Стандартизации, 1974. -55 с.

2. Наливкин В.Д..Кузьмин В.И.,Лукьянова В.Г. Естественные границы в ряду распределений месторождений нефти и газа по запасам. //Докл. АН СССР.1982.-Т.266, JS 4.- 947-951 с.

3. Евтихиев H.H., Кузьмин В.И., Гранин А.И., Лукьянова В.Г. О проявлении принципа симметрии в свойствах элементов таблицы Д.И. Менделеева. //Вопросы кибернетики. Устройства и системы. Межвуз.сб.науч.трудов.- М.,МИРЭА,1983-с. 3-7.

4. Наливкин В.Д.,Кузьмин В.И.,Лукьянова В.Г. Дискретность распределения масс в природных объектах. //Тезисы докл.на Всесозозн. конференции "Прогнозирование нефтегазонос-ности и соверш.поиска.и."- М.,1983. с.5-7-

5. Наливкин В.Д.,Кузьмин В.И.,Лукьянова В.Г. Дискретность в распределении и развитии природных объектов. -Фрунзе., Кыргызстан,1984. с. 27-35.

6. Евтихиев H.H., Кузьмин В.И., Гракин А.И., Лукьянова В.Г. Исследование закономерностей изменения асимметрии ядер элементов таблицы Д.И. Менделеева. //Вопросы кибернетики. Устройства и системы. Межвуз.сб.науч.трудов.-

М.,МИРЗА,1984. С. 3-97- Евтихиев H.H., Кузьмин В.И., Лукьянова В.Г. О критических рубежах и периодизации ядерных свойств элементов. //Вопросы кибернетики. Устройства и системы. Межвуз.сб. на-

уч. трудов.- М.,МИРЗА,1985. с. 5-12.

8. Евтихиев H.H., Кузьмин В.И., Гранин А.И., Лукьянова В.Г. Исследование структура критических периодов физических сеойств элементов. //Вопр. кибернетики. Устройства и системы. Межвуз.сб.науч.трудов.- М.,МИРЭА,1986. с.4-7.

9. НалиЕКНН В.Д.,Кузьмин В.И.,Лукьянова В.Г.К исследованию закономерностей проявления дискретности в сзойстзах природных систем. //В сб. "Теоретические и методолог, зопр. седиментационной цикличности и нефтегазоносн." -Новосибирск, Наука(Сиб.отд.), 1988. с. 13-19.

Лицензия 02и45о от и4.и3.92. Подписано з печать 15.05.53. Формат Зи 34 1/16. Бумага пасчая. Печать офсетная. Узл.печ.л. 1,40. Уел.хр.-отт. 5,58. Уч.-изд.л. 1,5. Тараз 55 экз. Заказ 277. Бесплатно.

иоскозсхпй государственник институт радиотехника, олектронака и азто:.атпки (-геяначаски:: --назэроате?)

117454 ..юеаза, прооп.Ззриадсаого ,73