автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Нестатистические модели и методы построения и анализа зависимостей

кандидата физико-математических наук
Жилин, Сергей Иванович
город
Барнаул
год
2004
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Нестатистические модели и методы построения и анализа зависимостей»

Автореферат диссертации по теме "Нестатистические модели и методы построения и анализа зависимостей"

На правах рукописи

Жилин Сергей Иванович

НЕСТАТИСТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ ПОСТРОЕНИЯ И АНАЛИЗА ЗАВИСИМОСТЕЙ

05.13.01 - системный анализ, управление и обработка информации

Автореферат

диссертации на соискание ученой степени кандидата физико-математических наук

Барнаул - 2004

Работа выполнена на кафедре информатики Алтайского государственного университета

Научный руководитель: доктор технических наук, профессор

Поляков Юрий Александрович

Официальные оппоненты: доктор физико-математических наук, профессор

Семкин Борис Васильевич

кандидат технических наук, доцент Каган Елена Сергеевна

Ведущая организация: Институт вычислительных технологий СО РАН

(г. Новосибирск)

Защита диссертации состоится 26 марта 2004 г., в 1000 часов, на заседании регионального диссертационного совета КМ 212.004.01 в Алтайском государственном техническом университете по адресу: 656038, г. Барнаул, пр. Ленина, 46.

С диссертацией можно ознакомиться в библиотеке Алтайского государственного технического университета им. И.И. Ползунова.

Автореферат разослан 25 февраля 2004 г.

Ученый секретарь регионального диссертационного совета к.э.н., доцент

А.Г. Блем

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Проблема построения и анализа функциональной зависимости по эмпирическим данным встает перед многими исследователями в различных отраслях науки. С помощью конструируемых математических моделей реальных объектов, явлений и процессов в природе и обществе решаются задачи выяснения внутренних характеристик изучаемого процесса, сжатия массивов эмпирической информации, прогнозирования, управления и т.п. Задача анализа зависимости включает в себя выявление и устранение противоречий в исходных данных, проверку гипотез о виде искомой зависимости, ее свойствах и оценку степени работоспособности найденной функции, то есть ответ на вопрос о пригодности эмпирической зависимости на практике.

В настоящее время построение и анализ зависимостей по эмпирическим данным развивается чаще всего в рамках вероятностно-статистического подхода, основными инструментами которого является метод наименьших квадратов и статистические процедуры исследования и анализа полученных с его помощью оценок. Указанные методы обладают экстремальными свойствами при выполнении определенных предположений. Однако на практике обеспечение или проверка исходных гипотез по имеющейся совокупности эмпирических данных затруднена. Кроме того, имеются случаи, в которых предположения об ограниченности ошибки наблюдений являются более естественными. Эти обстоятельства привели к появлению нестатистического подхода, который развивался как самостоятельно, так и в рамках интервального анализа в работах отечественных исследователей А.Ф. Бочкова, А.П. Вощинина, Л.В. Канторовича, А.В. Максимова, Н.М. Оскорбина, А.Е.-Померанцева, О.Е. Родионовой, В.А. Суханова и др., а также зарубежных авторов таких,' как Г. Бельфорте, Е. Вальтер, В. Крейнович, М. Миланезе, Р.Е. Мур, Дж. Нортон, Л. Пронцато, Г.Р. Сотиров и других. Основное предположение нестатистического подхода состоит в том, что границы ошибок наблюдения переменных и невязок зависимости являются известными. Такие задачи, в частности, возникают при геометрической коррекции цифровых изображений и при обработке инженерно-геодезических измерений.

Вместе с тем, в литературе отсутствуют исследования, устанавливающие связь статистического и нестатистического подходов и описывающие концептуальные основы моделирования с использованием нестатистического подхода. Недостаточное внимание уделено в рамках нестатистического подхода постановке и решению ряда значимых задач таких, как определение ценности наблюдений в общей совокупности, выделение активных наблюдений, устранение выбросов, моделирование процесса старения информации и др. Решение указанных проблем позволило бы расширить сферу применения нестатистического подхода, заимствовать ряд приемов из статистического

РОС НАЦИОНАЛЬНАЯ I БИБЛПОгал 1

ти применения статистического и нестатистического подходов в прикладных исследованиях.

Цель исследования. Цель работы заключается в разработке концептуальных основ и методов построения и анализа зависимостей при обработке наблюдений с интервально заданными нестатистическими ошибками.

Задачи исследования.

1. Разработка концептуальной модели процесса эмпирического моделирования при нестатистическом подходе.

2. Разработка логической схемы процесса эмпирического моделирования.

3. Разработка способов построения зависимостей, включающих количественные и качественные факторы, с использованием метода внешней аппроксимации множества неопределенности гиперпараллелепипедом (метода центра неопределенности) по интервальным наблюдениям без выбросов.

4. Разработка метода обработки совокупности интервальных наблюдений с выбросами при построении и анализе зависимостей.

5. Экспериментальное сравнение метода центра неопределенности с основными статистическими методами построения зависимостей.

6. Апробация разработанных нестатистических методов построения и анализа зависимостей при решении задач обработки пространственно распределенных интервальных измерений.

Объектом исследования является обработка наблюдений с интервально заданными нестатистическими ошибками.

Предметом исследования являются математические задачи построения и анализа зависимостей в рамках нестатистического подхода, сравнение статистических и нестатистических методов оценивания, нестатистические методы обработки наблюдений с выбросами, нестатистические методы построения зависимостей, включающих количественные и качественные факторы.

Методы исследования. При выполнении работы использовались методы системного анализа, математического программирования, математической статистики, имитационного моделирования, обработки изображений.

Научная новизна.

1. Предложена теоретико-множественная концептуальная модель процесса обработки информации при нестатистическом подходе к построению и анализу зависимостей, позволяющая формализовать информационные задачи определения ценности наблюдений, учета старения данных, сжатия данных, планирования одиночных наблюдений, и разработана логическая схема процесса обработки совокупности наблюдений.

2. Разработана методика сравнения метода центра неопределенности с методами максимума правдоподобия и наименьших квадратов при обработке наблюдений без выбросов и по результатам вычислительного эксперимента оп-

использования сравниваемых методов.

3. Разработан нестатистический метод обработки интервальных наблюдений с выбросами, апробированный на реальных данных.

Теоретическая и практическая значимость результатов работы.

Разработанная концептуальная теоретико-множественная модель позволяет формализовать и выработать математические постановки задач обработки информации, возникающие при эмпирическом моделировании в рамках нестатистического подхода.

Выводы об областях преимущественного использования статистических и нестатистических методов оценивания могут использоваться для обоснованного выбора способов построения и анализа зависимостей по эмпирическим данным в условиях отсутствия достоверной информации о распределении ошибок.

Предложенные в работе методы, обработки наблюдений с интервально заданной нестатистической ошибкой могут быть использованы при обработке данных физического эксперимента, геодезических измерений, данных дистанционного зондирования.

Основные положения, выносимые на защиту.

1. Формализация эмпирического моделирования, включающая концептуальную теоретико-множественную модель и логическую схему процесса построения и анализа зависимостей при нестатистическом подходе.

2. Результаты сравнения статистических и нестатических методов построения и анализа зависимостей, проведенного на основе вычислительного эксперимента, и разграничение областей преимущественного применения указанных методов.

3. Методика построения и анализа зависимостей в рамках нестатистического подхода, апробированная при решении задач обработки пространственных данных.

Апробация работы. Основные положения и отдельные результаты исследования докладывались и обсуждались на Республиканской научно-технической конференции «Региональные проблемы информатизации», (Барнаул, 1995), третьей Международной конференции «Методы дистанционного зондирования и ГИС-технологии для контроля и диагностики состояния окружающей среды» (Москва, 1996), на второй и четвертой Международных конференциях Интер-карто (Иркутск, 1996; Барнаул, 1998), на Международной научно-практической конференции «Историческая и современная картография в развитии Алтайского региона» (Барнаул, 1997), первой и шестой краевых конференциях по математике (Барнаул, 1998; Барнаул, 2003).

Публикации. По теме диссертации опубликовано 13 печатных работ, в том числе 6 статей в журналах и сборниках статей и 7 тезисов докладов на конференциях.

Структура и объем работы. Диссертация состоит из введения, трёх глав, заключения, списка литературы из 143 источников, двух приложений. Общий объем работы составляет 119 страниц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность исследования, определяются цель, задачи, объект, предмет, методы исследования, раскрывается научная новизна, формулируются положения, выносимые на защиту.

В первой главе рассматриваются проблемы построения и анализа эмпирических зависимостей с помощью статистических методов, излагаются основные идеи нестатистического подхода, в рамках которого проводится формализация процесса эмпирического моделирования и построение поэтапной логической схемы указанного процесса, а также выделение необходимых для ее реализации математических моделей и методов.

На практике не всегда удается обеспечить выполнение или проверку условий применимости вероятностно-статистических процедур построения и анализа зависимостей, традиционно используемых для обработки эмпирических данных. Кроме того, принятая при вероятностно-статистическом подходе интерпретация неопределенных факторов как случайных не охватывает всех практически значимых ситуаций; в которых неопределенность может быть также связана с незнанием и неединственностью возможных исходов. Эти причины обуславливают актуальность развития нестатистического подхода к обработке эмпирических данных, система гипотез которого не требует знаний о виде распределения ошибки, а предполагает только ограниченность ошибки, или, что то же самое, интервальное ее представление.

Интервальное описание неопределенности позволяет взглянуть на процесс эмпирического моделирования с иных, нестатистических позиций. В работе проводится формализация процесса эмпирического моделирования с акцентом на те возможности, которые открываются при нестатистическом подходе к интерпретации неопределенности и которые часто связаны с существенными затруднениями при вероятностно-статическом подходе. Одной из таких фундаментальных возможностей, которой должен располагать исследователь в процессе эмпирического моделирования, является возможность выделять наблюдения-выбросы.

Довольно широкий класс конструируемых зависимостей выражается в форме, разделяющей детерминированную и неопределенную составляющие:

где х - вектор входных переменных; X - множество значений х\ /3 - вектор параметров, подлежащих определению; - выходная переменная, которая ради простоты записей предполагается скалярной; - функция, описывающая де-

терминированную составляющую вариации у\ £у - непредсказуемая составляющая вариации у. Вообще говоря, величина Еу может включать в себя как

вклад необъясняемых зависимостью факторов, так и ошибку наблюдения выходной переменной. Однако наиболее часто она выражает только погрешность измерения переменной

Далее, мы предполагаем, что функция F(x,p) известна с точностью до параметров; наблюдения за переменными х, у не содержат выбросов; наблюдаемые значения входных переменных xt, i — \,...,M известны точно (измеряются с пренебрежимо малой погрешностью), а соответствующие им значения выходной переменной измеряются с ошибками для которых известны оценки

Определение 1.1. Порцией информации назовем группу наблюдений (данных) и знаний, которая позволяет сформировать самостоятельное ограничение на параметры р

Следует подчеркнуть важность введенного понятия порции информации как отражения существенных сторон реальных информационных процессов при эмпирическом моделировании. Понятие «порция информации» соединяет в себе такие важные информационные понятия как «данные» и «знания». При сборе, хранении, обработке эмпирической информации эти понятия неразделимы. Выражение (1.3) можно воспринимать как некоторый предикат, т.е. один из способов выражения знаний, а сужение области действия этого предиката производится за счет подстановки в него конкретных данных. Впрочем, иногда порции информации могут образовываться исключительно знаниями - априорной информацией.

Определение 1.2. Множество В значений параметров ¡3, удовлетворяющих (1.3), назовем информационным множеством.

Определение 1.3. Множество В1 значений параметров ¡3 удовлетворяющих неравенству ~ <F{ р) ~ (14)

назовем информационным множеством наблюдения i.

Определение 1.4. Априорным назовем информационное множество, сформированное только на основе знаний о свойствах моделируемого объекта (знаний теоретического характера).

Примером априорной информации может служить информационное множество В = {/?е R" |F(;c,^)>0 Vxe Х}, отражающее априорные знания о неотрицательности функции

Использование введенных понятий порции информации и информационного множества позволяет основным инструментом процесса обработки информации при эмпирическом моделировании сделать теоретико-множественные операции. Суть обработки информации в этом случае сводится к выяснению того, каким образом соотносятся между собой, а также со свойствами моделируемого объекта информационные множества В(, ¡ = 1,...,Ы(Ы>М), сформированные на основе эмпирической информации (таблицы из М наблюдений), априорных знаний и т.д. Основной принцип при этом дает следующее

Определение 1.4. Информационное множество В1 не противоречит свойствам моделируемого объекта, если выполнено включение

где ¡3 - «истинное» значение параметров.

При эмпирическом моделировании проверить условие (1.5) не представляется возможным. В связи с этим расширим принцип эмпирического моделирования «так было - так будет», включив в него

Условие 1. Если пересечение информационных множеств, имеющихся при построении модели, не пусто, то есть

то включение (1.5) выполнено.

Условие (1.6) можно усилить введением эмпирически формируемого множества В^, которое можно трактовать как «минимальное» допустимое. Этот вариант условия имеет вид:

Замена условия (1.5) на (1.6) или (1.6'), несущественная при эмпирическом моделировании, требует при построении модели определенной научной добросовестности в процессе формирования множеств В1. Легко привести примеры, когда (1.5) выполнено, а (1.6) не выполнено. В частности, в случае, когда неверно выбран вид функции F(;кф). Развитие и формализация этого случая в эмпирическом моделировании представляются перспективными, однако, в данной работе не проводятся.

Ниже мы предполагаем, что (1.5) выполнено, а (1.6) используется лишь для контроля данного предположения. Тогда задача эмпирического моделирования зависимости у = Р(х,/3) решается в предположении (1.6).

Между множеством параметров В(И), которое также будем называть множеством неопределенности, и множеством функций F(;c,/?), устанавлива-

ется взаимно однозначное соответствие. Каждой точке соответствует

единственная функция и наоборот.

Выделим два фундаментальных для эмпирического моделирования свойства множества B(N). Первое связано с его «размером» и непротиворечивостью наблюдений и априорных знаний. Формальный признак непротиворечивости исходной информации выражается условием (1.6), которое на содержательном уровне можно выразить так: если B(N) пусто, то исходные данные и знания противоречивы, однако, нельзя утверждать, что если B(N) не пусто, то противоречий нет. Более реальным на практике может оказаться индикатор непротиворечивости, выражающий как быстро уменьшается мера множества неопределенности B(N) при N—>0°. Если для множества B(N) известна или легко конструируется его внутренняя аппроксимация, то динамика «объема» аппроксимирующего множества и ее сравнение с нормативной (закономерной) при росте N могли бы служить такого рода индикатором непротиворечивости исходных предположений и наблюдений. Этот прием является еще одним способом усиления условия (1.6).

Второе фундаментальное свойство B(N) связано с его ограниченностью. Можно утверждать, что если множество B(N) содержит бесконечно удаленные точки, то исходных данных для построения модели недостаточно. Следует иметь в виду, что если B(N) - ограниченное множество, то может оказаться, что эмпирическая модель не является работоспособной, то есть конечные пользователи модели не получают результаты с требуемой точностью. В каждой конкретной ситуации необходимо разработать критерии на «размер» множества неопределенности, при выполнении которых эмпирическая модель становится работоспособной.

Понятия, введенные в определениях 1.1-1.4, и принцип, выражаемый условием (1.6), или его усиленные варианты составляют собою концептуальную теоретико-множественную модель процесса обработки информации при эмпирическом моделировании. Эта модель отражает суть процесса обработки информации и обеспечивает формализм, необходимый для математической постановки информационных задач, а логическую последовательность и этапность обработки информации предлагается подчинить схеме, приведенной на рисунке 1.

Кратко изложим основное содержание каждого этапа предложенной логической схемы процесса построения и анализа зависимостей по эмпирическим данным в рамках нестатистического подхода.

1. Принятие системно-технических решений по построению эмпирической зависимости. На первом этапе проводится изучение и анализ моделируемого объекта, объектов-аналогов, по результатам которых определяются

Рис. 1. Логическая схема построения и анализа эмпирических зависимостей при нестатистическом подходе

входные и выходные переменные, и проводится обоснование возможности применения нестатистического подхода к построению и анализу зависимостей. На этом этапе формулируются требования к модели, определяется область пространства входных переменных, в рамках которой проводится моделирование, выбирается способ описания и, если возможно, вид эмпирической зависимости.

2. Сбор априорных знаний и данных. На этом этапе априорные знания о моделируемом объекте формулируются в виде порций информации, выбираются

объекты-аналоги для наблюдений, формируется стартовая информационная совокупность и устанавливаются правила «поведения» множества неопределенности (минимальный допустимый «размер», темп сокращения и т.п.).

3. Планирование эксперимента и включение новых порций информации. Дополнительные к стартовому информационному множеству порции информации могут являться результатом формализации новых знаний о моделируемом объекте и сбора данных путем проведения «активного» или «пассивного» эксперимента.

4. Выявление и устранение противоречий. Противоречия во вновь образованной информационной совокупности могут быть обусловлены двумя причинами: а) неправильными измерениями, несовместимыми с общей массой наблюдений; б) несоответствием гипотетического вида зависимости, выбранного на этапе принятия системно-технических решений, накопленной информационной совокупности. Выяснение причин противоречий и корректировка совокупности данных или исходных гипотез составляют существо настоящего этапа.

5. Сжатие информационных совокупностей. Включение каждой порции информации в общую информационную совокупность на этапах 2 и 3 сопровождается определением ее ценности. Содержание настоящего этапа состоит в выделении активных порций информации, то есть порций, имеющих ненулевую ценность. Порции информации, имеющие нулевую ценность, могут быть устранены, что позволяет сократить размерность задачи описания множества неопределенности.

6. Расчет, анализ и уточнение параметров зависимости. На этом этапе производится построение множества неопределенности или его приемлемых аппроксимаций, позволяющих выяснить интервалы изменения параметров конструируемой зависимости и получить точечные оценки, оптимальные в некотором смысле. Проверка гипотез о свойствах коэффициентов может проводиться непосредственным включением порций информации, описывающих те или иные предположения, в общую информационную совокупность. Наличие или отсутствие противоречий во вновь полученной информационной совокупности может служить основанием для отклонения или принятия гипотез.

7. Использование зависимости. После проверки полноты и работоспособности построенной зависимости модель может приниматься в эксплуатацию. Использование модельной зависимости сопровождается процессами старения имеющейся информации и накопления новых данных и знаний о моделируемом объекте, что делает необходимым повторение шагов 3-6 через определенные промежутки времени и подчеркивает актуальность разработки рекуррентных алгоритмов оценивания.

8. Корректировка вида зависимости. Изменение структуры зависимости, возможно сопровождаемое изменением состава входных переменных, требует дополнительных исследований моделируемого объекта и его объектов-аналогов.

Переход к этому шагу производится в случае, когда на этапе 4 в информационной совокупности завершена процедура удаления выбросов, но множество неопределенности остается пустым, или, несмотря на непустоту множества неопределенности, модель оказывается неработоспособной.

Для реализации описанной логической схемы необходимы следующие математические инструменты (методы и модели).

1. Методы определения меры ценности порции информации.

2. Методы внешней и внутренней аппроксимации множества неопределенности.

3. Методы и модели точечного и интервального оценивания параметров зависимости и выходной переменной.

4. Методы сжатия информационной совокупности, то есть выделения активных порций информации.

5. Модель процесса старения информационных совокупностей в случае, когда свойства моделируемых объектов меняются во времени.

6. Методы обработки потока наблюдений, то есть бесконечной последовательности информационных множеств.

7. Методы определения оптимального плана эксперимента, позволяющего минимизировать «размеры» множества неопределенности.

8. Модели и методы обработки наблюдений с выбросами, то есть обработки данных и знаний в случае их искажения.

Из указанного списка математических инструментов, необходимых для реализации логической схемы процесса эмпирического моделирования, основное внимание в диссертационной работе уделено пунктам 3 и 8. Апробация предлагаемых в работе моделей проводится на задачах обработки пространственных данных. В качестве основы для создаваемых математических инструментов выбран один из нестатистических методов построения и анализа зависимостей - метод центра неопределенности (МЦН). МЦН состоит во внешней аппроксимации множества неопределенности и поиске интервальных и точечных оценок параметров зависимости как характеристик этой аппроксимации. Важное место в работе отводится также сравнительному анализу МЦН с основными статистическими методами оценивания.

Во второй главе предлагаются способы, позволяющие с помощью МЦН по интервальным наблюдениям строить зависимости при наличии в их структуре не только количественных, но и качественных факторов. Предлагается метод обработки наблюдений с выбросами. Кроме того, на основе метода статистических испытаний строится схема сравнения МЦН с методом максимального правдоподобия (ММП) и методом наименьших квадратов (МНК), и по результатам сравнения на модельной зависимости указываются области преимущественного использования сравниваемых методов.

Проведенный в первом разделе второй главы анализ литературы, посвященной нестатистическим методам построения и анализа зависимостей, позволил сделать вывод о том, что методы, предложенные независимо в разное время рядом авторов (Л.В. Канторович, СИ. Спивак, М. Миланезе, Г. Бельфорте, Н.М. Оскорбин, А.П. Вощинин, В.М. Белов, В.А Суханов, О.Е. Родионова, А.Е. Померанцев и др.), сходны в своих основных положениях с точностью до терминологии. В работе используется терминология Н.М. Оскорбина.

Основные идеи МЦН изложим на примере задачи построения и анализа линейно-параметризованной зависимости

У- 10Л,

1=0

(2.1)

хотя, в общем случае, в МЦН вид зависимости может быть и иным. Зависимость конструируется по эмпирической информации, главное место в которой занимает таблица экспериментальных данных, полученная в N наблюдениях

т = Ърхорхи.....ХП})\ } = 1.....М- (2-2)

При этом предполагается, что погрешностью входных переменных х можно пренебречь, а выходная переменная у в ;-м наблюдении измеряется с предельной абсолютной погрешностью £ . Тогда имеют место неравенства

(2.3)

1*0

Основным объектом дальнейшего анализа является область допустимых значений параметров Д (множество неопределенности)

В

= |д = (Д0,...,Д,

у} -е}<£Дл<у, + е,,] = 1.....ЛГ(2.4)

1=0

Выпуклое множество В ограничено тогда и только тогда, когда ранг матрицы наблюдений равен Содержательно неограниченность множества

В может интерпретироваться как недостаток эмпирической информации. Пустота множества В говорит о противоречивости собранной информации.

Главным принципом нестатистической обработки наблюдений, определяющим все последующие алгоритмы обработки наблюдений и получаемые выводы, является равная значимость всех элементов множества В.

В виду сложности полного описания множества В в ряде случаев ограничиваются некоторыми его аппроксимациями. В частности, в этой роли можно использовать брусы (гиперпараллелепипеды с гранями, параллельными координатным плоскостям)," охватывающие множество неопределенности В. Наименьший из таких брусов отыскивается путем решения задач линейного программирования

Д=тмД, Д,=тахД, / = (),...,л,

1 /ЗеВ ' рев

(2.5)

Интервалы / = 0.....п, определяющие этот брус, содержат в себе воз-

можные точечные оценки параметров а их длины могут выступать в качестве меры точности точечных оценок.

Одним из наиболее простых способов построения точечной оценки параметров зависимости

является выбор срединной точки минимального охватывающего бруса, отыскиваемого при решении задач (2.5):

Известны и другие способы построения точечных оценок: чебышевский центр множества В, центр тяжести множества В, оскорбинский центр множества В и др.

Помимо задачи точечного и интервального оценивания параметров зависимости (2.1) в отношении множества В может ставиться и задача интервального оценивания выходной переменной у в точке х:

%(х) = тп/3х, у(х) = тал . (2.7)

Интервал [2(*)> УС*)] содержит возможные значения выходной переменной у в точке х при различном выборе параметров зависимости. В качестве точечной оценки прогнозного значения зависимости (2.1) в точке х может использоваться полусумма концов интервала:

>(*) = + У«). - 2«)- (2-8)

Во втором разделе второй главы предложены способы применения МЦН при решении задач построения по интервальным наблюдениям зависимостей, включающих наряду с количественными и качественные факторы. Предлагаемые построения основаны на известном в классическом статистическом анализе приеме использования фиктивных переменных. Показано, каким образом, используя этот прием и МЦН в условиях правильных наблюдений возможно решать задачи дисперсионного и ковариационного анализов, задачи учета линейных и кусочно-линейных временных трендов в эмпирических данных.

Для учета влияния на значение выходной переменной каждого из качественных факторов х1, принимающих значения на Ц уровнях ={*,о»«ч*и)_1} , в зависимость вводятся фиктивных переменных, значения которых в сово-

купности кодируют уровень фактора , соответствующий каждому из наблюдений. Способ выбора фиктивных переменных не единственен, но одним из наиболее простых для реализации и интерпретации является следующий вариант

сопоставления уровней фактора и значений совокупности фиктивных переменных.

Один из уровней фактора выбирается в качестве эталонного, например, , а для остальных определяются фиктивные переменные , прини-

мающие значения 0 или 1. Ситуация, когда все переменные ¿л»—»^«*,-!) равны нулю, соответствует эталонному уровню фактора хю. Равенство единице переменной при нулевых значениях остальных фиктивных переменных соответствует уровню фактора

Коэффициент 5Л при каждой из заданных таким способом фиктивных переменных представляет собой оценку так называемого «чистого» эффекта, то есть разницы в значении выходной переменной, обусловленной переходом фактора с эталонного уровня на уровень при фиксированных значениях прочих переменных, входящих в зависимость.

После пополнения фиктивными переменными структура зависимости приобретает вид

где входные переменные являются количественными факторами, а ка-

чественные факторы представлены группами фиктивных переменных

задача построения и анализа зависимости вида (2.9) соответствует задаче дисперсионного анализа, а при от>0 - задаче ковариационного анализа. Добавляя в структуру зависимости один или несколько подходящим образом определенных фиктивных факторов, можно описывать и временные тренды. В работе показано, каким образом можно учесть линейные и кусочио-линейные временные тренды, в том числе и в ситуациях, когда неизвестны абсциссы точек их стыковки. Для оценивания коэффициентов используются методы, изложенные в предыдущем разделе.

В третьем разделе второй главы предложен метод, позволяющий выявлять выбросы в совокупности наблюдений. Выброс, обусловленный грубым промахом при регистрации результатов измерений, можно трактовать как наблюдение, предельная погрешность которого занижена по отношению к реальной ошибке, имевшей место при измерении. Чтобы такое наблюдение стало фиктивно правильным, необходимо найти такое новое значение являющееся нижней границей реальной ошибки, при котором наблюдение не будет вступать в противоречие с остальными.

Нижние границы предельных ошибок наблюдений, при которых множество неопределенности становится непустым, можно отыскивать, решая задачу

где - масштабирующие коэффициенты, при умножении на которые исходные значения ошибок наблюдений е} дают искомые величины £'} . При этом выполнение неравенства означает, что наблюдение является выбросом и для совместимости с общей информационной совокупностью необходимо увеличить соответствующую ему предельную ошибку наблюдения в раз. Если у исследователя есть основания считать, что надежность некоторых наблюдений одинакова, то система ограничений (2.11) может быть пополнена ограничениями вида . В случае, когда в надежности каких-либо наблюдений

исследователь уверен полностью, при решении задачи (2.10)-(2.11) соответствующие им величины можно положить равными единице.

Количество наблюдений, для которых масштабирующие коэффициенты ■и^, полученные в результате решения задачи (2.10)-(2.11), превосходят единицу,

позволяет судить о доле выбросов в совокупности данных. Большая доля выбросов может говорить либо о неверно выбранной структуре зависимости, либо о том, что предельные ошибки измерения занижены во многих наблюдениях (например, в результате неверной оценки точности измерительного прибора).

Четвертый раздел второй главы посвящен сравнительному анализу МЦН и ММП, и МЦН и МНК в условиях правильных измерений на основе вычислительного эксперимента. Разработана схема статистических испытаний, позволяющая сравнить статистические и нестатистические методы построения зависимостей. Схема состоит в построении и сравнении разброса оценок прогнозных значений для модельных зависимостей каждым из сравниваемых методов при различных распределениях ошибки. Функция плотности вероятностей ошибки выбирается из параметрического семейства плотностей, в различной степени соответствующих базовым гипотезам сравниваемых методов в зависимости от значения параметра.

Результаты сравнительного анализа свидетельствуют 1) о более высокой эффективности МЦН-оценок по отношению к МНК-оценкам при нарушении исходной гипотезы МНК о нормальном распределении ошибки и 2) о более высокой эффективности МЦН-оценок по отношению к ММП-оценкам при распределении ошибки, близком к равномерному.

В третьей главе приводятся решения двух прикладных задач обработки пространственных данных с использованием МЦН и методов, разработанных во второй главе: геометрической коррекции и привязки изображений и обработки результатов неравноточных косвенных инженерно-геодезических измерений.

, Использование разработанного метода выявления выбросов совместно с МЦН для построения трансформирующей зависимости по опорным точкам при решении задачи геометрического преобразования и привязки изображений позволяет 1) устранять грубые промахи оператора при расстановке опорных точек и 2) производить обоснованный выбор вида зависимости, не вступающего в противоречие с системой опорных точек, установленных с заданной точностью.

Возможность вычисления интервальных оценок метода центра неопределенности в заданной точке изображения, подвергнутого геометрическому преобразованию, позволяет сопровождать результирующее изображение картой позиционной неопределенности. Карта неопределенности может использоваться как для внесения обоснованных дополнений и изменений в систему опорных точек геометрического преобразования, так и для последующего точностного анализа геоинформационных продуктов, построенных на основе преобразованного изображения.

При обработке неравноточных инженерно-геодезических измерений с известной предельной погрешностью каждого вида измерений отношения между измеренными величинами могут формулироваться в виде системы неравенств, что позволяет с помощью МЦН находить интервалы неопределенности для искомых величин. Разработаны схемы обработки косвенных вР8-измерений координат стоек опор линии электропередач, используемых при межевании земельных участков.

В приложениях приведен пример решения задачи геометрической коррекции и привязки спутникового изображения и пример расчета интервалов неопределенности координат стоек для конкретной опоры линии электропередач.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Предложена концептуальная теоретико-множественная модель процесса эмпирического моделирования при интервально заданной нестатистической ошибке.

2. Построена логическая схема процесса эмпирического моделирования. В составе логической схемы выделен ряд информационных задач и указаны необходимые для их решения математические модели и методы.

3. Предложены способы использования метода центра неопределенности для решения в условиях наблюдений без выбросов задач построения и анализа зависимостей, включающих наряду с количественными и качественные входные переменные, а также задач обработки данных, содержащих временные тренды, в том числе линейные и кусочно-линейные.

4. Разработан метод обработки противоречивых наблюдений, позволяющий выявлять выбросы путем поиска минимальных коэффициентов увеличения предельной ошибки наблюдений-выбросов, при которых множество неопределенности является непустым.

5. Разработана схема статистических испытаний, позволяющая сравнить статистические и нестатистические методы построения зависимостей в условиях наблюдений без выбросов. На основе разработанной схемы испытаний проведен сравнительный анализ МЦН и ММП, а также МЦН и МНК. Результаты сравнительного анализа позволяют производить обоснованный выбор процедур построения и анализа зависимостей в соответствии с условиями наблюдений.

6. Разработанные нестатистические методы выявления выбросов и оценивания параметров зависимостей апробированы на реальных данных при построении трансформирующей зависимости по опорным точкам в задаче геометрического преобразования и привязки изображений, а также при обработке неравноточных косвенных инженерно-геодезических измерений.

Результаты работы переданы для использования в ФГУП «Алтайский институт мониторинга земель и экосистем» и Лабораторию обработки изображений физико-технического факультета Алтайского государственного университета. Материалы работы используются в учебном процессе математического факультета Алтайского государственного университета при подготовке студентов по специальности «Прикладная математика».

ПУБЛИКАЦИИ ПО ТЕМЕ ИССЛЕДОВАНИЯ

1. Байкалова Т.В. Давыдов Е.С., Дубина И.Н., Евтюшкин А.В., Жилин СИ., Оскорбил Н.М., Поляков Ю.А., Юшаков В.Н. Комплекс цифрового картографирования для решения задач экологии и природопользования // Региональные проблемы информатизации: Труды Респ. науч.-тех. конф. Барнаул: Изд-во АлтГТУ, 1995. С. 54-55.

2. Baikalova T.V., Dubina I.N., Yevtyushkin A.V., Oskorbin N.M., Polyakov YuA, Yushakov V.N., Zhilin S.I. Automation of digital mapping in systems of regional ecological monitoring // Intercarto 2: GIS for Environmental Studies and Mapping: Proceedings of the International Conference. Irkutsk, 1996. p. 67-71.

3. Байкалова Т.В., Евтюшкин А.В., Жилин СИ., Оскорбин Н.М., Юшаков В.Н. Автоматизация построения экологических карт // Методы дистанционного зондирования и ГИС-технологии для контроля и диагностики состояния окружающей среды: Тезисы докладов 3-й Международной конференции. Москва: МИИГАиК, 1996.

4. Байкалова Т.В., Евтюшкин А.В., Жилин СИ., Юшаков В.Н. Информационные технологии автоматизации построения экологических карт // Проблемы предотвращения деградации земель Западной Сибири и осуществление госу-

дарственного контроля за их использованием и охраной: Сб. науч. тр. - Барнаул: Минсельхозпрод РФ, 1997. С. 108-113

5. Жилин СИ. Решение задачи трансформации векторных и растровых изображений с использованием методов линейного программирования // Проблемы предотвращения деградации земель Западной Сибири и осуществление государственного контроля за их использованием и охраной: Сб. науч. тр. - Барнаул: Минсельхозпрод РФ, 1997. С. 152-156.

6. Байкалова Т.В., Евтюшкин А.В., Жилин СИ., Юшаков В.Н. Пространственно-временной мониторинг состояния земных покровов Алтая по данным ИСЗ «КОЛА» // Историческая и современная картография в развитии Алтайского региона: Тезисы докл. междунар. науч.-практ. конф. Барнаул: Изд-во Алт. гос. ун-та, 1997. С 70-71.

7. Жилин СИ., Паршуков Л.Н. Математическая модель коррекции площадей элементов векторного топологического полигонального покрытия по априорным данным // Первая краевая конференция по математике. Барнаул: Изд-во Алт. гос. ун-та, 1998. С. 34-35.

8. Байкалова Т.В., Евтюшкин А.В., Жилин СИ., Казанцев К.В., Редькин А.Г. Дешифрирование ледниковых форм рельефа на радиолокационных изображениях // ИНТЕРКАРТО 4: ГИС для оптимизации природопользования в целях устойчивого развития территорий: Материалы междунар. конф. - Барнаул: Изд-во Алт. гос. ун-та, 1998. С. 226-231.

9. Оскорбин Н.М., Максимов А.В., Жилин СИ. Построение и анализ эмпирических зависимостей методом центра неопределенности +// Известия Алтайского государственного университета. - 1998. № 1. - С. 35-38.

10.Байкалова Т.В., Евтюшкин А.В., Жилин СИ., Юшаков В.Н. Мониторинг состояния земных покровов Алтая по данным ИСЗ «КОЛА» // Известия Алтайского государственного университета. - 1998. №1. - С 49-52.

11.Оскорбин Н.М., Жилин СИ., Дронов СВ. Сравнение статистической и нестатистической оценок параметров эмпирической зависимости // Известия Алтайского государственного университета. - 1998. №4. - С 38-41.

12.Жилин СИ. Эксперименты по оцениванию параметров эмпирической зависимости методом наименьших квадратов и методом центра неопределенности // Известия Алтайского государственного университета. - 2003. №1. - С. 2427.

13.Жилин СИ. Эксперименты по нестатистическому оцениванию параметров эмпирических зависимостей // Материалы шестой краевой конференции по математике «МАК-2003». - Барнаул: Изд-во Алт. гос. ун-та, 2003. С. 56-57.

Подписано в печать 20.02.2004 г. Формат 60x84/16.

Бумага для множительных аппаратов. Печать офсетная.

Объем 1 п.л. Тираж 100 экз.

Лаборатория множительной техники экономического факультета АГУ.

»-6468

Оглавление автор диссертации — кандидата физико-математических наук Жилин, Сергей Иванович

Введение.

1. Теоретические аспекты обработки информации: нестатистический подход.

1.1 Проблемы построения и анализа эмпирических зависимостей.

1.2 Обоснование постановок информационных задач, возникающих при построении и анализе эмпирических зависимостей.

1.2.1 Формализация схемы эмпирического моделирования при нестатистическом подходе.

1.2.2 Логическая схема построения и анализа зависимостей при нестатистическом подходе.

1.2.3 Математические методы и модели решения информационных задач.

1.3 Направления дальнейших исследований.

2. Построение и анализ зависимостей методом центра неопределенности.

2.1 Метод центра неопределенности: предпосылки, варианты и основные результаты.

2.2 Обработка информации методом центра неопределенности при правильных наблюдениях.

2.2.1. Задачи регрессионного анализа.

2.2.2. Задачи дисперсионного и ковариационного анализов.

2.2.3. Временные тренды в данных.

2.3 Обработка информации в случае неправильных наблюдений.

2.4 Метод центра неопределенности и статистические методы оценивания: сравнительный анализ.

2.4.1. Метод центра неопределенности и метод максимального правдоподобия.

2.4.2. Метод центра неопределенности и метод наименьших квадратов.

3. Использование метода центра неопределенности при решении задач обработки пространственных данных.

3.1 Геометрические преобразования и привязка изображений.

3.2 Совместная обработка неравноточных инженерно-геодезических измерений.

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Жилин, Сергей Иванович

Актуальность темы. Проблема построения и анализа функциональной зависимости по эмпирическим данным встает перед многими исследователями в различных отраслях науки. С помощью конструируемых математических моделей реальных объектов, явлений и процессов в природе и обществе решаются задачи выяснения внутренних характеристик изучаемого процесса, сжатия массивов эмпирической информации, прогнозирования, управления и т.п. Задача анализа зависимости включает в себя выявление и устранение противоречий в исходных данных, проверку гипотез о виде искомой зависимости, ее свойствах и оценку степени работоспособности найденной функции, то есть ответ на вопрос о пригодности эмпирической зависимости на практике.

В настоящее время построение и анализ зависимостей по эмпирическим данным развивается чаще всего в рамках вероятностно-статистического подхода, основными инструментами которого является метод наименьших квадратов и статистические процедуры исследования и анализа полученных с его помощью оценок. Указанные методы обладают экстремальными свойствами при выполнении определенных предположений. Однако на практике обеспечение или проверка исходных гипотез по имеющейся совокупности эмпирических данных затруднена. В то же время имеются случаи, в которых предположения об ограниченности ошибки наблюдений являются более естественными. Эти обстоятельства привели к появлению нестатистического подхода, который развивался как самостоятельно, так и в рамках интервального анализа в работах отечественных исследователей А.Ф. Бочкова, А.П. Вощинина, JI.B. Канторовича, А.В. Максимова, Н.М. Оскорбина, А.Е. Померанцева, О.Е. Родионовой, В.А. Суханова и др., а также зарубежных авторов таких, как Г. Бельфорте, Е. Вальтер, В. Крейнович, М. Милане-зе, Р.Е. Мур, Дж. Нортон, JI. Пронцато, Г.Р. Сотиров и других. Основное предположение нестатистического подхода состоит в том, что границы ошибок наблюдения переменных и невязок зависимости являются известными.

Такие задачи, в частности, возникают при геометрической коррекции цифровых изображений и при обработке инженерно-геодезических измерений.

Вместе с тем, в литературе отсутствуют исследования, устанавливающие связь статистического и нестатистического подходов и описывающие концептуальные основы моделирования с использованием нестатистического подхода. Недостаточное внимание уделено в рамках нестатистического подхода постановке и решению ряда значимых задач таких, как определение ценности наблюдений в общей совокупности, выделение активных наблюдений, устранение выбросов, моделирование процесса старения информации и др. Решение указанных проблем позволило бы расширить сферу применения нестатистического подхода, заимствовать ряд приемов из статистического подхода и разграничить области применения статистического и нестатистического подходов в прикладных исследованиях.

Цель исследования. Цель работы заключается в разработке концептуальных основ и методов построения и анализа зависимостей при обработке наблюдений с интервально заданными нестатистическими ошибками.

Задачи исследования.

1. Разработка концептуальной модели процесса эмпирического моделирования при нестатистическом подходе.

2. Разработка логической схемы процесса эмпирического моделирования.

3. Разработка способов построения зависимостей, включающих количественные и качественные факторы, с использованием метода внешней аппроксимации множества неопределенности гиперпараллелепипедом (метода центра неопределенности) по интервальным наблюдениям без выбросов.

4. Разработка метода обработки совокупности интервальных наблюдений с выбросами при построении и анализе зависимостей.

5. Экспериментальное сравнение метода центра неопределенности с основными статистическими методами построения зависимостей.

6. Апробация разработанных нестатистических методов построения и анализа зависимостей при решении задач обработки пространственно-распределенных интервальных измерений.

Объектом исследования является обработка наблюдений с интер-вально заданными нестатистическими ошибками.

Предметом исследования являются математические задачи построения и анализа зависимостей в рамках нестатистического подхода, сравнение статистических и нестатистических методов оценивания, нестатистические методы обработки наблюдений с выбросами, нестатистические методы построения зависимостей, включающих количественные и качественные факторы.

Методы исследования. При выполнении работы использовались методы системного анализа, математического программирования, математической статистики, имитационного моделирования, обработки изображений.

Научная новизна.

1. Предложена теоретико-множественная концептуальная модель процесса обработки информации при нестатистическом подходе к построению и анализу зависимостей, позволяющая формализовать информационные задачи сжатия данных, определения ценности наблюдений, учета старения данных, планирования одиночных наблюдений, и разработана логическая схема обработки совокупности наблюдений.

2. Разработана методика сравнения метода центра неопределенности с методами максимума правдоподобия и наименьших квадратов при обработке наблюдений без выбросов и по результатам вычислительного эксперимента определены области преимущественного использования сравниваемых методов.

3. Разработан нестатистический метод обработки интервальных наблюдений с выбросами, апробированный на реальных данных.

Теоретическая и практическая значимость результатов работы.

Разработанная концептуальная теоретико-множественная модель позволяет формализовать и выработать математические постановки задач обработки информации, возникающие при эмпирическом моделировании в рамках нестатистического подхода.

Выводы об областях преимущественного использования статистических и нестатистических методов оценивания могут использоваться для обоснованного выбора способов построения и анализа зависимостей по эмпирическим данным в условиях отсутствия достоверной информации о распределении ошибок.

Предложенные в работе методы обработки наблюдений с интервалыю заданной нестатистической ошибкой могут быть использованы при обработке данных физического эксперимента, геодезических измерений, данных дистанционного зондирования.

Основные положения, выносимые на защиту.

1. Формализация эмпирического моделирования, включающая концептуальную теоретико-множественную модель и логическую схему процесса построения и анализа зависимостей при нестатистическом подходе.

2. Результаты сравнения статистических и нестатических методов построения и анализа зависимостей, проведенного на основе вычислительного эксперимента, и разграничение областей преимущественного применения указанных методов.

3. Методика построения и анализа зависимостей в рамках нестатистического подхода, апробированная при решении задач обработки пространственных данных.

Апробация работы. Основные положения и отдельные результаты исследования докладывались и обсуждались на Республиканской научно-технической конференции "Региональные проблемы информатизации", (Барнаул, 1995), третьей Международной конференции "Методы дистанционного зондирования и ГИС-технологии для контроля и диагностики состояния окружающей среды" (Москва, 1996), на второй и четвертой Международных конференциях Интеркарто (Иркутск, 1996; Барнаул, 1998), на Международной научно-практической конференции «Историческая и современная картография в развитии Алтайского региона» (Барнаул, 1997), первой и шестой краевых конференциях по математике (Барнаул, 1998; Барнаул, 2003).

Публикации. По теме диссертации опубликовано 13 печатных работ, в том числе 6 статей в журналах и сборниках статей и 7 тезисов докладов на конференциях.

Структура и объем работы. Диссертация состоит из введения, трёх глав, заключения, списка литературы из 143 источников, двух приложений. Общий объем работы составляет 119 страниц.

Заключение диссертация на тему "Нестатистические модели и методы построения и анализа зависимостей"

Результаты работы переданы для использования в ФГУП «Алтайский институт мониторинга земель и экосистем» и Лабораторию обработки изображений физико-технического факультета Алтайского государственного университета. Материалы работы используются в учебном процессе математического факультета Алтайского государственного университета при подготовке студентов по специальности «Прикладная математика».

ЗАКЛЮЧЕНИЕ

Библиография Жилин, Сергей Иванович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. - М.: Финансы и статистика, 1989. - 607 с.

2. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. — М.: Финансы и статистика, 1985. 488 с.

3. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.-471 с.

4. Айвазян С.А., Мхитарян B.C. Теория вероятностей и прикладная статистика. М.: ЮНИТИ-ДАНА, 2001. - 656 с.

5. Алгазин А.И., Шойхет Я.Н., Кисилев В.И., Оскорбин Н.М. Оценка риска радиационного заражения населения Алтайского края // Семипалатинский полигон Алтай. - 1997. - №8.

6. Алгоритмы и программы восстановления зависимостей / Под ред. В.И. Вапника. -М.: Наука, Гл. ред. физ.-мат. лит., 1984. 816 с.

7. Алефельд Г.Ш., Херцбергер 10. Введение в интервальные вычисления. -М.: Мир, 1987.-370 с.

8. Алимов Ю.И. Альтернатива методу математической статистики. М.: Знание, 1980.-64 с.

9. Алимов Ю.И., Кравцов Ю.А. Является ли вероятность «нормальной» физической величиной? // УФН. 1992. - Т. 162. - №7. - С. 149-182.

10. Алтунин А.Е., Семухин М.В. Модели и алгоритмы принятия решений в нечетких условиях. Тюмень: Издательство Тюменского гос. ун-та, 2000. - 352 с.

11. Байкалова Т.В., Евтюшкин А.В., Жилин С.И., Юшаков В.Н. Мониторинг состояния земных покровов Алтая по данным ИСЗ "NOAA". // Известия Алтайского государственного университета. 1998. №1. - С. 49-52.

12. Белов В.М., Суханов В.А., Гузеев В.В., Унгер Ф.Г. Оценивание параметров линейных физико-химических зависимостей прямоугольником метода центра неопределенности // Изв. вузов. Физика, 1991. №8.C. 35-45.

13. Белов В.М., Суханов В.А., Унгер Ф.Г. Аппроксимация эллипсом множества неопределенности параметров зависимостей, сводящихся к линейным. Томск, 1990. 28 с. - (Препр. / АН СССР. Сиб. отд-ние. Ин-т химии нефти; №45).

14. Белов В.М., Суханов В.А., Унгер Ф.Г. Обзор основных статистических методов определения параметров аппроксимирующих функций. Препринт №46, ТНЦ СО АН СССР, Томск, 1990. 34 с.

15. Белов В.М., Суханов В.А., Унгер Ф.Г. Оценка физико-химических величин методом центра неопределенности. Томск, 1990. 45 с. - (Препр. / АН СССР. Сиб. отд-ние. Ин-т химии нефти; №16).

16. Белов В.М., Суханов В.А., Унгер Ф.Г. Теоретические и прикладные аспекты метода центра неопределенности. Новосибирск: Наука. Сибирская издательская фирма РАН, 1995. - 144 с.

17. Болдырев В.И., Спивак С.И. Чебышевские приближения для кинетической модели с дробно-линейной зависимостью от параметров // Математические проблемы химии. Новосибирск: ВЦ СО АН СССР, 1973. - Ч. 2.-С. 58-65.

18. Болч Б., Хуань К.Дж. Многомерные статистические методы для экономики.-М.: Статистика, 1979.-317 с.

19. Бородюк В.П. Комментарий I к статье А.П. Вощинина, А.Ф. Бочкова, Г.Р. Сотирова "Метод анализа данных при интервальной нестатистической ошибке". Заводская лаборатория. - 1990. - Т.56. - №.7. - С. 8183.

20. Вапник В.II. Восстановление зависимостей по эмпирическим данным. -М.: Наука, 1979.-447 с.

21. Вощинин А.П. Интервальный анализ данных: развитие и перспективы. // Заводская лаборатория. Диагностика материалов. 2002. - Т.68. - №.1. -С. 118-126.

22. Вощинин А.П. Метод анализа данных с интервальными ошибками в задачах проверки гипотез и оценивания параметров неявных линейно параметризованных функций. // Заводская лаборатория. Диагностика материалов. 2000. - Т.66. - №3. - С. 51-65.

23. Вощинин А.П. Решение задач оптимизации по интервальным оценкам критерия. И Заводская лаборатория. 1987. - Т.54. - №7. - С. 45-48.

24. Вощинин А.П., Бочков А.Ф., Сотиров Г.Р. Метод анализа данных при интервальной нестатистической ошибке // Заводская лаборатория. -1990. Т.56. - № 7. - С. 76-81.

25. Вощинин А.П., Сотиров Г.Р. Оптимизация в условиях неопределенности. М., София: Изд-во МЭИ, Техника, 1989. - 224 с.

26. Гермейер Ю.Б. Введение в теорию исследования операций. М.: Наука, 1971.-383 с.

27. Турин Л.С. О состоятельности оценок метода наименьших квадратов. // Математическое обеспечение космических экспериментов. М.: Наука, 1978.

28. Демиденко Е.З. Комментарий II к статье А.П. Вощинина, А.Ф. Бочкова, Г.Р. Сотирова "Метод анализа данных при интервальной иестатистиче-ской ошибке". Заводская лаборатория. - 1990. - Т.56. - №.7. - С. 8384.

29. Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных систем управления. М.: Наука, 1981.

30. Доугерти К. Введение в эконометрику. М.: ИФРА-М, 1999. - XIV, 402 с.

31. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Финансы и статистика, 1987. - 717 с.

32. Еремин И.И. Противоречивые модели оптимального планирования. М.: Наука. Гл. ред. физ.-мат. лит., 1988. - 160 с.

33. Еремин И.И., Астафьев Н.Н. Введение в теорию линейного и выпуклого программирования. М.: Наука. Гл. ред. физ.-мат. лит., 1976. - 192 с.

34. Жилин С.И. Эксперименты по нестатистическому оцениванию параметров эмпирических зависимостей // Материалы шестой краевой конференции по математике МАК-2003. Барнаул: Изд-во Алт. гос. ун-та, 2003. С. 56-57.

35. Жилин С.И. Эксперименты по оцениванию параметров эмпирической зависимости методом наименьших квадратов и методом центра неопределенности. // Известия Алтайского государственного университета. -2003. -№1.- С. 24-27.

36. Ибрагимов И.А. Максимального правдоподобия метод // Математическая энциклопедия. М., 1982. Т. 3. - С. 483-484.

37. Инженерная геодезия. Учеб. для вузов / Е.М. Клюшин, М.И. Киселев, Д.Ш. Михелев, В.Д. Фельдман; Под ред. Д.Ш. Михелева. — М.: Высш. шк., 2001.-464 с.

38. Информационные множества в задаче наблюдения за движением самолета в горизонтальной плоскости / Кумков С.И., Пацко B.C., Пятко С.Г., Решетов В.М., Федотов А.А. // Известия РАН. Теория и системы управления. 2003. - №4. - С. 51-61.

39. Ицкович И.А., Спивак С.И. Анализ применения методов линейного программирования при построении кинетической модели сложной химической реакции // Управляемые системы. Новосибирск: Наука. Сиб. отд-ние, 1970. - Вып. 4-5. - С. 142-147.

40. Калмыков С.А., Шокин Ю.И., Юлдашев З.Х. Методы интервального анализа. Новосибирск: Наука, Сибирское отделение, 1986. - 222 с.

41. Канторович JI.B. О некоторых новых подходах к вычислительным методам и обработке наблюдений // Сиб. мат. журнал. 1962. - Т.З. - № 5. -С. 701-709.

42. Кендалл М., Стюарт А. Статистические выводы и связи. М.: Наука, 1973.-542 с.

43. Колеников С. Прикладной эконометрический анализ в статистическом пакете Stata. М.: Российская экономическая школа, 2000. - 112 с.

44. Кравцова В.И. Космические методы картографирования. М.: Изд-во МГУ, 1995.-240 с.

45. Кузнецов В.П. Комментарий VI к статье А.П. Вощинина, А.Ф. Бочкова, Г.Р. Сотирова "Метод анализа данных при интервальной нестатистической ошибке". // Заводская лаборатория. 1990. - Т.56. - №7. - С.90-93.

46. Куржанский А.Б. Задача идентификации теория гарантированных оценок. // Автоматика и телемеханика. - 1991. - №4. — С. 3-26.

47. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. - 390 с.

48. Куркин О.М., Коробочкин Ю.Б., Шаталов С.А. Минимаксная обработка информации. М.: Энергоатомиздат, 1990. - 216 с.

49. Легостаева И.Л. Комментарий V к статье А.П. Вощинина, А.Ф. Бочкова, Г.Р. Сотирова "Метод анализа данных при интервальной нестатистической ошибке" // Заводская лаборатория. 1990. - Т.56. - №7. - С.90-93.

50. Лецкий Э.К. Комментарий III к статье А.П. Вощинина, А.Ф. Бочкова, Г.Р. Сотирова "Метод анализа данных при интервальной нестатистической ошибке" И Заводская лаборатория. 1990. - Т.56. - №7. - С.84-86.

51. Люблинский Р.Н., Оскорбин Н.М. Методы декомпозиции при оптимальном управлении непрерывными производствами. Томск: Изд-во Томск, ун-та, 1979.-220 с.

52. Метрология и электрорадиоизмерения в в телекоммуникационных системах: Уч. для вузов. / Ред. Нефедов В. М.: Высшая школа, 2001. -383 с.

53. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия М.: Финансы и статистика, 1982. - 556 с.

54. Налимов В.В. Применение математической статистики при анализе вещества. М.: Физматгиз, 1960. - 430 с.

55. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений.-Л.: Энергоатомиздат, 1985.-248 с.

56. Орлов А.И. Комментарий IV к статье А.П. Вощинина, А.Ф. Бочкова, Г.Р. Сотирова "Метод анализа данных при интервальной нестатистической ошибке" // Заводская лаборатория. 1990. - Т.56. - №7. - С. 86-89.

57. Орлов Л.И. Некоторые нерешенные вопросы в области математических методов исследования // Заводская лаборатория. Диагностика материалов. 2002. - Т.68. - №3. - С. 52-56.

58. Орлов А.И. Неустойчивость параметрических методов отбраковки резко выделяющихся наблюдений // Заводская лаборатория. 1992. - Т.58. -№7.-С. 40-42.

59. Орлов А.И. Об оценивании регрессионного полинома // Заводская лаборатория. 1994. - Т.60. - №5. - С. 43-47.

60. Орлов А.И. Современная прикладная статистика // Заводская лаборатория. 1998. - Т.64. - №3. - С. 52-60.

61. Орлов А.И. Устойчивость в социально-экономических моделях. М.: Наука, 1979.-296 с.

62. Орлов А.И. Часто ли распределение результатов наблюдений является нормальным?// Заводская лаборатория. 1991. -Т.57. -№7. - С. 64-66.

63. Орлов А.И. Термины и определения в области вероятностно-статистических методов // Заводская лаборатория. 1999. - Т.65. - №7. -С. 46-54.

64. Оскорбин Н.М. Некоторые задачи обработки информации в управляемых системах // Синтез и проектирование многоуровневых иерархических систем. Материалы конференции. — Барнаул: Алтайский государственный университет, 1983.

65. Оскорбин Н.М., Жилин С.И., Дронов С.В. Сравнение статистической и нестатистической оценок параметров эмпирической зависимости. // Известия Алтайского государственного университета. 1998. - №4. — С. 38-41.

66. Оскорбин Н.М., Максимов А.В., Жилин С.И. Построение и анализ эмпирических зависимостей методом центра неопределенности // Известия Алтайского государственного университета. 1998. - № 1. — С. 35-38.

67. Прохоров А.В. Регрессия // Математическая энциклопедия. М., 1984. -Т.4.-С. 929-931.

68. Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. - 790 с.

69. Смоляк С.А., Титаренко Б.П. Устойчивые методы оценивания: Статистическая обработка неоднородных совокупностей. М.: Статистика, 1980.-208 с.

70. Спивак С.И. Детальный анализ применения методов линейного программирования при определении параметров кинетической модели // Математические проблемы химии. Новосибирск: ВЦ СО АН СССР, 1975.-Ч. 2.-С. 35-42.

71. Спивак С.И. Информативность эксперимента и проблема неединственности решения обратных задач химической кинетики: Автореф. дис. . д-ра физ.-мат. наук. Черноголовка, 1984. - 30 с.

72. Спивак С.И. О неединственности решения задач восстановления констант химической кинетики и констант химических равновесий // Математические проблемы химической термодинамики. Новосибирск: Наука. Сиб. отд-ние, 1980. - С. 63-72.

73. Спивак С.И., Слинько М.Г., Тимошенко В.И. Оценка значимости влияния измерений на кинетическую модель химической реакции // Математические проблемы химии. Новосибирск: ВЦ СО АН СССР, 1973. - Ч. 2.-С. 3-9.

74. Спивак С.И., Шмелев А.С. Методологические аспекты определения физико-химических параметров по экспериментальным данным // Математика в химической термодинамике. Новосибирск: Наука. Сиб. отд-ние, 1980.-С. 84-91.

75. Срагович В.Г. Адаптивное управление. М.: Наука. Гл. ред. физ.-мат. лит., 1981.-384 с.

76. Суханов В.А., Белов В.М., Унгер Ф.Г. Теоретико-вероятностные исследования свойств оценок прямоугольника в методе центра неопределенности. Препринт. Томск: Институт химии нефти СО РАН, 1999. - 20 с.

77. Трусов B.C. Теория эксперимента. Томск: Изд-во Томск, ун-та, 1983. -184 с.

78. Тутубалии В.Н. Вероятность, компьютеры и обработка результатов экспериментов. // УФН. 1993. - Т. 163. - №7. - С. 93-109.

79. Тутубалин В.Н. Границы применимости (Вероятностно-статистические методы и их возможности). М.: Знание, 1977. - 64 с.

80. Устойчивые статистические методы оценки данных / Под ред. P.JT. Ло-нера, Г.Н. Уилкинсона: Пер. с англ. М.: Машиностроение, 1984. -232 с.

81. Хампель Ф., Рончетти Э., Рауссеу П., Штаэль В. Робастность в статистике. Подход на основе функций влияния. М.: Мир, 1989. - 512 с.

82. Хлебников А.И. О методе центра неопределенности // Журнал аналитической химии. 1996. - Т. 51. - №3. - С. 347-348.

83. Хлебников А.И. О проблемах использования метода центра неопределенности для обработки экспериментальных данных // Вычислительные технологии. 1999.-Т.4.-№4.-С. 80-81.

84. Хьюбер П. Робастность в статистике: Пер. с англ. Под ред. И.Г. Журбен-ко. М.: Мир, 1984. - 304 с.

85. Цифровая обработка изображений в информационных системах: Учеб. пособие / И.С. Грузман, B.C. Киричук и др. Новосибирск: Изд-во НГТУ, 2002.-352 с.

86. Черноусько Ф. JT. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука, 1988. - 320 с.

87. Шарый С.П. Еще раз о внутреннем оценивании множеств решений интервальных линейных систем // Материалы шестой краевой конференции по математике МАК-2003. Барнаул: Изд-во Алт. ун-та, 2003. С. 7374.

88. Шарый С.П. Интервальные алгебраические задачи и их численное решение. Дисс. докт. физ.-мат. наук. Новосибирск, 2000. - 327 с.

89. Шокин Ю.И. Интервальный анализ. Новосибирск: Наука, 1981.-281 с.

90. Эльясберг П.Е. Об устойчивости оценок точности определения орбит порезультатам измерений. Космические исследования. - 1978. - Т. 16. -№5.

91. Эльясберг П.Е., Измерительная информация. Сколько ее нужно, как ее обрабатывать? М.: Наука, 1983. - 208 с.

92. Яковлев Н.В. Высшая геодезия: Учебник для вузов. М.: Недра, 1989. -445 с.

93. Akyildiz Y., Markov S. Curve Fitting and Interpolation of Biological Data Under Uncertainties // Journal of Universal Computer Science. 1996. -Vol. 2. -№2.-P. 58-69.

94. Beard K.M., Buttenfield B.P., Clapham, S.B. Visualization of Spatial Data Quality. Technical Paper 91-26, National Center for Geographic Information and Analysis, Castine, Maine, 1991. 54 p.

95. Beaumont O. Solving interval linear systems with linear programming techniques // Linear Algebra and its Applications. 1998. - Vol. 281. - P. 293309.

96. Belforte G., Tay T.T. Two New Estimation Algorithms for Linear Models with Unknown but Bounded Measurement Noise // IEEE Transactions on Automatic Control. 1993. - Vol. 38. -№ 8. - P. 1273-1279.

97. Bounding Approaches to System Identification / Milanese M., Norton J., Walter E., editors. London: Plenum Press, 1996.- 586 p.

98. Chil J.-P., Delfiner P. Geostatistics: Modeling Spatial Uncertainty. Wiley-Interscience, 1999. - 720 pp.

99. Combettes P.L. Foundations of set-theoretic estimation // Proc. of IEEE. -1993. Vol. 81.-№2.-P. 182-208.113.de Vries D. K., Identification of Model Uncertainty for Control Design. PhD Thesis. Delft: Delft University of Technology, 1994. - 272 p.

100. Deller J., Nayeri M., Odeh S. Least-square identification with error bounds for real time signal processing and control // Proc. of IEEE. — 1993. Vol. 81. -№6.-P. 815-849.

101. Ehlschlaeger C.R., Goodchild M.F. Uncertainty in Spatial Data: Defining, Visualizing, and Managing Data Errors // Proc. of Conference GIS/LIS. -Phoenix, 1994.-P. 246-253.

102. Esbensen K.H. Multivariate Data Analysis in practice. An introduction to multivariate data analysis and experimental design. - САМО AS, 2000. -600 p.

103. Fogel E., Huang Y.F. On the value of information in system identification bounded noise case // Automatica. 1982. - Vol. 18. - P. 229-238.

104. Goodchild M.F. Accuracy of Spatial Databases. Research Initiative 1 Closing Report, National Center for Geographic Information and Analysis, University of California, Santa Barbara, 1992. 18 p.

105. Jaulin L., Kieffer M., Didrit O., Walter E. Applied Interval Analysis. -Springer-Verlag, Londres, 2001. 379 p.

106. Kearfott R. B. Rigorous Global Search: Continuous Problems. Dordrecht: Kluwer Academic Publishers, 1996. 280 p.

107. Kreinovich V. Data Processing Beyond Traditional Statistics: Applications of Interval Computations. A Brief Introduction. // Extended Abstracts of International Workshop on Applications of Interval Computations, El Paso, 1995.-P. 13-21.

108. Kreinovich V., Lakeev A., Rohn J., Kahl P. Computational Complexity and Feasibility of Data Processing and Interval Computations. Dodrecht: Klu-wer, 1997.-472 pp.

109. Kumkov S.I. Method of Informational Sets in Problems of Filtration, Identification and Control. Tampere: Tampere International Center for Signal Processing, 2001, p. 33.

110. Martens H., Naes T. Multivariate Calibration. Wiley, 1989. - XVIII, 420 p.

111. Milanese M., В el forte G. Estimation Theory and Uncertainty Intervals Evaluation in Presence of Unknown But Bounded Errors: Linear Families of Models and Estimators // IEEE Transactions on Automatic Control. 1982. -Vol. 27.-№2.-P. 408-414.

112. Moore R.E. Parameter sets for bounded-error data // Mathematics And Computers in Simulation. 1992. - Vol. 34. - №2. - P. 113-119.

113. Mowrer H.T., Congalton R.G. Quantifying Spatial Uncertainty in Natural Resources: Theory and Applications for GIS and Remote Sensing. Taylor & Francis, 2000.-350 p.

114. Nakaya Y„ Oishi S. Finding All Solutions of Nonlinear Systems of Equations Using Linear Programming with Guaranteed Accuracy // Journal of Universal Computer Science. 1998. - Vol 4. - № 2. - P. 171 -177.

115. Neumaier A. Interval Methods for Systems of Equations. Cambridge: Cambridge Univ. Press, 1990. 255 p.

116. Nguyen H.T., Kreinovich V., Tao C.-W. Why 95% and Two Sigma? A Theoretical Justification for an Empirical Measurement Practice // Proc. International Workshop on Intelligent Systems Resolutions, Taipei, 2000. P. 358362.

117. Orlov A.I. Interval statistics // Interval Computations. 1992. -№1. P. 44-52.

118. Pomerantsev A.E., Rodionova O.E., Esbensen K.H. Object status classification with SIC (Simple Interval Calculation) // J. Chemometrics (submitted), 2001.

119. Pomerantsev A.L., Rodionova O.Ye. Application of Simple Interval Calculation Method // Book of Abstracts, 7th Scandinavian Symposium on Chemometrics, Copenhagen, 2001.

120. Pronzato L., Walter E. Minimum-volume ellipsoids containing compact sets: application to parameter bounding // Proc. of IEEE. 1994. - Vol. 30, - №11. -P. 1731-1739.

121. Pronzato L., Walter E. Volume-optimal inner and outer ellipsoids. In M. Milanese, J.-P. Norton, H. Piet-Lahanier, and E.Walter, editors, Bounding Approaches to System Identification. London: Plenum, 1996. - P. 119-138.

122. Pronzato L., Walter. E. Minimal-volume ellipsoids // Int. Journal of Adaptive Control and Signal Processing. 1994. - Vol 8. - P. 15-30.

123. Rodionova O.E., Pomerantsev A.E. SIC (Simple Interval Calculation) a new approach for linear modeling. // J. Chemometrics (submitted), 2001.

124. Rodionova O.E., Pomerantsev A.E. Simple Interval Calculation A Method for Linear Modeling // Book of Abstracts, 7th Scandinavian Symposium on Chemometrics, Copenhagen, 2001.

125. Rodionova O.Ye., Pomerantsev A.L. Antioxidants Activity Prediction Using DSC Measurements and SIC Data Processing. // II Conference on Experimental Methods in Physics of Heterogeneous Condensed Media, Barnaul, 2001. -P. 239-246.

126. Wenzhong S., Ehlers M., Tempfli K. Modeling and Visualizing Uncertainties in Multi-Data-Based Spatial Analysis. // Proc. of European GIS Conference, 1994. P. 454-464.

127. Wilke F.Z., Franciosi B.R.T., Oliveira P.W., Claudio D.M. Modeling the Measurement Uncertainty by Intervals // Journal of Universal Computer Science. 1998. - Vol 4. - № 1. - P. 82-88.

128. Yamamura К. Interval solution of nonlinear equations using linear programming // Proc. of IEEE International Symposium on Circuits and Systems, 1997.-P. 837-840.