автореферат диссертации по строительству, 05.23.16, диссертация на тему:Новые функции распределения и методы оценки статистических параметров стока

кандидата технических наук
Ежов, Александр Вениаминович
город
Санкт-Петербург
год
1994
специальность ВАК РФ
05.23.16
Автореферат по строительству на тему «Новые функции распределения и методы оценки статистических параметров стока»

Автореферат диссертации по теме "Новые функции распределения и методы оценки статистических параметров стока"

| I и V •• X

■ 7 Ч'-!< '00/>

i L

ФЕДЕРАЛЬНАЯ СЛУЖБА РОССИИ ПО ГИДРОМЕТЕОРОЛОГИИ И МОНИТОРИНГУ ОКРУЖАЮЩЕЙ СРЕДЫ (РОСГИДРОМЕТ)

ГОСУДАРСТВЕННЫЙ ГИДРОЛОГИЧЕСКИЙ ИНСТИТУТ

На правах рукописи УДК 556.048+556.16

ЕЖОВ

Александр Вениаминович

НОВЫЕ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ И МЕТОДЫ ОЦЕНКИ СТАТИСТИЧЕСКИХ ПАРАМЕТРОВ СТОКА

Специальность: 05.23.16 гидравлика, инженерная гидрология

Автореферат

диссертации на соискание.ученой степени кандидата технических наук в форме научного доклада

Санкт-Петербург 1994

Работа выполнена в Государственном гидрологическом институте

Научный руководитель - доктор технических наук

А. В. Рождественский

Официальные оппоненты:

доктор географических наук В.А.Шелутко

кандидат технических наук 4 А.В.Фролов

Ведущая организация - Ленгипроводхсз

Защита диссертации состоится " "ОКТ 1994г. в УО час. на заседании специализированного совета К 024.03.01 Государственного гидрологического института по адресу: 199053,Санкт-Петербург, 2-я линия, д.23, ГГИ. факс: (812) 213-10-23

• С диссертацией можно ознакомиться в библиотеке ГГИ

Автореферат разослан " ^" С6ЦТ 1994г.

Заверенные печатью учереждения отзывы в 2-х экземплярах проси направлять в адрес института.

Ученым секретарь специализированного Совета

.п

кандидат географических наук .-.-;»,

В. А. Еу?ин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы

Внедрение в практику гидрологических расчетов нозых методов оценки основных гидрологических характеристик (ОГХ). позволяющих получать более точные и надежные оценки, является важнейшей задачей гидрологической науки и имеет несомненный научный и практический интерес.

С точки зрения теории информации, получение более эффективных оценок ОГХ сопряжено либо с более глубокой степенью извлечения информации из имеющихся источников, либо с привлечением новых ранее неиспользуемых источников. Раззитие методов расчетсз стока последних десятилетий плодотворно использовало оба подхода. Разработаны методы учета многих аспектов стохастической природы наблюденных гидрологических рядов (внутрирядной связности.наличия погрешностей измерений, нестацисмарности и т. п.). Суа^сс венно развиты методы гидрологической аналогии и районирования,постоянно растет объем учитываемых стокоформирующих факторов. Несомненно эти тенденции сохранятся и в будущем.Вместе с тем, уже сейчас,используя синтез разработанных методов,-до сих пор рассматриваемых изолированно, можно существенно повысить качество оценок ОГХ. Цель и задачи ■ исследования

Целью настоящей диссертационной работы являлась разработка статистических методов расчета ОГХ, синтезирующих информацию традиционных оценок статистических параметров стока, полученных по индивидуальным рядам наблюдений, и информацию дополнительных источников и на основе этого повысить точность и надежность расистов стока.

Главными злдччами, поставленными п работе, являлись: - разработать функцию распределения речного стока, в наибольссл

стопа ш соответствующую априорным сведениям и наблюдениям на основе информационного подхода;

- разработать методы учета погрешностей исходных данных при расчетах статистистических параметров и характеристик стока;

- разработать метод расчета статистических параметров стока, синтезирующий индивидуальную информацию наблюденного ряда и регионально-обобщенную информацию о стоке на . основании байесова подхода.

Исходные материалы и личный склад автора

Представляемые к защите результаты исследований являются личными разработками соискателя, выполненными автором в ГГИ в рачках научно-исследовательских тем. при подготовке методических указаний, рекомендаций и СНиП 2.01.14-83. •

Научная новизна работы:

1) разработана функция распределения речного стока, в наибольшей степени соответствующая априорным сведениям и наблюденниям на основе информационного подхода; 2} предложены ыетоды учета погрешностей исходных данных при расчетах статистистических параметров и характеристик стока; 3) разработан метод расчета статистических параметров стока, . синтезирующий индивидуальную информацию наблюденного ряда и регионально-обобщенную информацию о стоке на основании байесова подхода.

~ о ~

Практическое значение и реализация результатов исследования

Результаты исследований соискателя внедрены п СНиП 2.0".Н-83. "Международное руководство по методам расчета ОГХ", "Единое рекомендации по оценке влияния водохранилищ на водные ресурсы и режим стока", "Методические указания по оценке влияния хозяйственной деятельности на сток средних и больших рек и зосстгнов-лению его характеристик".

Апробация работы

Результаты исследований по теме диссертации догладывались на V Гидрологическом съезде, всесоюзных совещаниях, конференциях и симпозиумах, Ученых Советах и семинарах ГГИ.

Публикации

По теме диссертационных исследований соискателем опубликовало 16 статей, монография " Оценка точности расчетов стока"( в соавторстве с А.В.Рождественским и А.В. Сахарюком).

I.УЧЕТ СЛУЧАЙНЫХ ПОГРЕШНОСТЕЙ ИСХОДНЫХ ДАННЫХ В ГИДРОЛОГИЧЕСКИХ РАСЧЕТАХ

Расуеты стока сопряжены с обработкой наблюденных гидрологических рядов, содержащих случайные погреиности измерений, т.е. наблюдение ряды являются композицией "истинных" величин стока к погрсвнсстей измерений.Ясно, что многие оценки параметров стока, не учитывающие наличия погрешностей измерений в рядах наблюдении, имеют смещения, обусловленные исключительно погрешностями изморе- ■ ний. Вопрос влияния случайных погрешностей исходных данных на ста-

тистические параметры стока неоднократно рассматривался з гидрологической литературе. Прежде всего, следует отметить монографии Г.А.Алексеева и A.B.Рождественского, рассмотревших влияние го-москедастичных погрешностей ( погрешностей, дисперсия которых постоянна во всем диапазоне измеряемых величин) на оценки дисперсии рядов наблюдений за стоком. В отмеченной выие монографии Г. А.Алексеева рассмотрены вопросы учета погрешностей исходных данных при оценивании пространственных и временных корреляционных функций стока и вопросы, возникающие при осреднении, интерполяции и экстраполяции наблюденных рядов стока и оценивании квантилей функций распределения. Из других работ по учету влияния погрешностей измерений на оценки статистических параметров и характеристик стока следует отметить работы 3.В.Волковой и Е. Г. Влохинова.

Однако вопрос учета случайных погрешностей исходных данных при проведении гидрологических расчетов не может считаться решенным полностью. В частности, наиболее распространенный случай гетероскедастичных погрешностей, когда дисперсия погрешностей зависит от измеряемой величины, ранее не исследовался.

При отсутствии систематических и грубых погрешностей, что, как правило, гарантируемся методами'измерений и первичного контроля результатов наблюдений, измеренные величины Q представимы в виде суммы ненаблюдаемых истинных значений измеряемой величины q и случайной погрешности измерений е

Q - q + е ' ( 1 )

В большинстве случаев в отношении спучакнЩ. погрешностей измерений правомочны следующие стандартные допущения: Е(е)=Е(е е)-Б(е q)-0, - ( 2 ) .

где Б-симпЬл математического ожидания. Иными слезами, постлиру-ется некоррелированность случайных погрешностей как между собой, так и с измеряемой величиной.

В отношении дисперсии погресностсй могут рассматриваться различные гипотезы: а) гипотеза гомоскедастичносги, когда дисперсия погресностсй не зависит от измеряемой величины.

Се-сопзЦ 1 3 )

б) гипотеза геторосксдастичности, когда дисперсия погрешностей зависит от измеряемой величины.

К случаю б) относится пироко используемое в гидрологии положенно о постоянной относительной погрешности:

Се/ч=сопгЪ. ( 4 )

Эта модель погрекностей, более распространенная, и менее исследованная о части влияния на оценки ОГХ, корреляционных функций и параметры регрессии^ диссертационной работе рассмотрена белее подробно.

1,1 Учет. _погрешностей_исходкых_

ческих_парамстров_и кв.а.нтилей_Р1асп^сделенияи

Для оценки влияния случайных погрешностей на статистические параметры распределения стока необходимо моменты функций распределения наблюденных рядов до третьего включительно выразить через соответствующие характеристики истинных рядов и параметры случайных погрешностей. Используя формулу полного математического ожидания для вторых и третьих центральных моментов, после несложных' преобразований получаем зависимости между коэффициентами ва--рк.чцни и асимметрии наблюденных и истинных совокупностей:

СУч-[(СУг0 - Г)/(1+(Г)]1/2 { 5 )

Сзч-[(С5д/Суч)3 С2С - 6р2/СУч]/(1 +3е2 ), ( 6 )

Аналогичные формулы дня случат гомоскедастичной модели погрешностей имеют вид:

»

Са,-ССо(14 б\/дц)3/\ (8)

Сопоставление качества традиционных и предлагаемых оценок Су и Сз производилось методом статистических испытаний по дисперсии оценок относительно истинных значений параметров.

При этом оказалось, что предлагаемые оценки коэффициента вариации эффективнее традиционных. С учетом того, что предлагаемые оценки несмещенные, а оценка асимметрии лишь незначительно уступает в эффективности традиционной, внедрение их в практику гидрологических расчетов представляется целесообразным.

Самостоятельный интерес представляет вопрос влияния погрешностей измерений на квантили распределения. Выявлено, что в области редкой повторяемости рост погрешностей измерений приводит к завышения квантилей. Например смещение квантиля 0.01% обеспеченности может превышать 50%.

Значительно сложное к неоднозначно влияние случайных погрешностей исходных данных на квантили высокой повторяемости, кото-

рое зависит от соотношения коэффициентов вариации и асимметрии и относительных погрешностей измерений. С увеличением погрспностей квантили высокой повторяемости могут как расти, так и уменьшаться, что объясняется тем, что погреяности измерений влияют на коэффициенты вариации и асимметрии неодинаково. Тем не менее для грубых прикидок можно руководствоваться правилом, что при Са/Сч > 2 погрешности измерений занижают и, наоборот при Сг./Су < 2 завышают квантили высокой повторяемости.

1•2 Учет погрешностей исходных данных при оценивании корреляционных функций и уравнений регрессии.

Учет влияния погрешностей измерений на оценки корреляционных Функций и уравнений регрессии представляет'значительный практический интерес в связи с широким распространением аппарата корреляционного и регрессивного анализа в гидрологии. Значительное внимание исследований этого вопроса уделено в работах Л.С.Ганди-на и Г.А. Алексеева, рассмотревших различные аспекты наличия пог-рсшностестей исходных данных постоянной дисперсии при оценивании пространственных и временных корреляционных функций, интерполяции и экстраполяции случайных полей. Однако случай гетероскедас-тичной модели погрешностей (4), насколько нам известно, остался ноизученым. В связи с этим, в настоящем диссертационном исследовании основное внимание уделено рассмотрению модели постоянных относительных погрешностей исходных данных.

Используя формулу полного математического ожидания, получаем зависимость для взаимных корреляционных функций:

г (о) -с=о

^ (»41 )1/гК*уМ -х*0 5 ( 9 ) ф„, = (1+ Г, (1+0"%,)) ( 10 )

где - р относительная погрешность данных. - коэффициент вариации истинной совокупности. Таким образом, традиционные оценки являются смещсными, и требуют корректировки.

С помощью формул (9-10) можно корректировать оценки корреляционных и взаимных корреляционных функций, устраняя смещение, обусловленное погрешностями исходных данных. Корректировка сводится к умножению на коэффициент, значение которого равно произведению отношений срсдиеквадратических отклонений измереннных и истинных совокупностей.

Целесообразность применения корректировки определяется с помощью критерия:

(п/(<?ч1-%2 ))иг /(<рч, ч>чг)1/2) ( 11 )

Уравнение связи между истинными и традиционными коэффициентами регрессии, полученными по методу наименьших квадратов без учета погрешностей исходных данных, представляется в виде

а* = [1+[С*1/]] [б2]]а^ (12)

где 1-единичная матрица,[б 2]-диагональная матрица дисперсий

А

погрешностей аргументов, С*- ковариационная матрица истинных аргументов, а*-искомый вектор истинных коэффициентов регрессии.

Из уравнения Наследует, что в общем случае смещение коэффи-

циентов регрессии, обусловленное погреиностями исходных данных, .зависит как от дисперсии погрешностей, так и от ковариационной матрицы аргументов.

При известных дисперсиях погретностей аргументов, используя формулу (12)^ можно корректировать оценки коэффициентов регресс,1-ии,полученные стандартным методом наименьших квадратов. Другим, бо.^ее экономичным способом получения несмещенных оценок, является способ преобразования исходных данных по формуле (13) с последующим применением стандартной процедуры оценки регрессионных зависимостей:

х - ф1/2 г. * ( 13 >

В случае модели постоянных относительных погрешностей,трансформирующий множитель в форм/ле(13)рассчитьгвается по формуле (10?,а в случае постоянных погрешностей

Ф - О-62/0г ), ( 14 )

где Бг - дисперсия аргумента г: б2-дисперсия погрешностей.

В заключение рассмотрим важный с практической точки зрения вопрос корректировки параметров регрессии по неоднореднородкым по" точности совокупностям, что,например, имеет место при смене прибора или метода измерений. Естественно, что оценки регрессии, полученные по объединенному ряду, если не принять необходимых мер, будут смещенными. В зависимости от целей последующего использован;/) уравнения. в таких случаях могут быть использованы два подхода. Первый заключается в том, что все подвыборки приводятся к однородной форме путем домножения на индивидуальные ке-эффициены с последующим применением стандартной процедуры оценки регрессии. Такое решение имеет смысл, например, для получения истинного вида' зависимости. Другой подход может быть применен

при необходимости "настоить" уравнение регрессии на характеристики опрсделеннного периода, например, для целей заполнения пропусков наблюдений. В этом случае необходимо данные набдадений г.гочих периодов умножать на коэффициенты, которые приводят все данные в соответствие с характеристиками требуемого периода

К, = ФС/Ч\, ( 15 )

где ф. и (р0 - коэффициенты определяемые по формула!.! (10/14) для прочих и требуемого периода соответственно.

2. БАЖСОВЫ ОЦЕНКИ СТАТИСТИЧЕСКИХ ПАРАМЕТРОВ СТОКА

К настоящему времени практически по всей территории бывшего СССР накоплен большой объем гидрологической информации, обобщенной в виде районных эмпирических зависимостей М*~:[(Р,..). С\'=1(Р,..) и т.д., являющихся основой расчетов стока при отсутствии гидрометрических наблюдений. С другой стороны, эту информации можно рассматривать в качестве дополнительной, априорной, также и при недостаточности и наличии наблюдений в расчетном створе реки и использовать при оценке статистических параметров стока. Следует ожидать, что оценки параметров стока, полученные с привлечением дополнительной информации, особенно в случае коротких рядов наблюдений за стоком, . обладают преимуществом в на-дежости по сравнению с традиционными оценками, полученными по индивидуальным рядам наблюдений. Другим, положительным обстоя-толством, немаловажным на практике, является унификация методов расчета стока: независимо от длины рядов наблюдений за стоком (включая как предельный случай отсутствия наблюдений) расчеты статистических параметров стока производятся по единой методике.

Разумеется, доля вклада априорной и индивидуальной компонент в итоговую оценку параметров зависит от тесноты районных зависимостей М* =Г (Г...), Су=Г (Р...) и от длины имеющегося ряда наб/гс^е-ний.

Методологической основой для построения оценки параметров стока, использующих дополнительную априорную информацию, язляет-ся байесов подход. Теория байесовых оценок в настоящее время представляет собой чрезвычайно сирскую область математической статистики, давно переросшую свои первоначальные границы, определенные собственно теоремой Байеса. Поэтому современнее понимание терминов "байесоза оценка", "байесов подход" имеет солее сн-рокую трактовку, а именно, как совокупность методов математической статистики, формализующих учет и объединение априрней и выборочной информации .

Формализованное выражение совокупности всех доопытно имеющихся сведений об искомых параметрах дается априрней плотностью распределения. Появление наблюденных значений процесса уточняет сведения о законе распределения искомых параметров в соответствии с теоремой Байеса:

р(й|(х)) ~ р(8)р({х>|9). (16)

где 0 --искомый параметр распределения; (х) - выборка наблюдений процесса; ' р(0), р(8|(х)) - соответственно априорная и апостериорная плотность параметра; р((х)0) - плотность распределния выборки (правдоподобие). _

Выбор априорной плотности искомых пара-.гетров является наиболее ответственным этапом байесового оценивания. С методической тачки зрения единственным условием, которое предъявляется к априорной плотности параметров, является требование адекватности

последней имеющимся априорным сведениям о параметрах.

Вместо с тем с практической точки зрения желательно, чтобы выбор априорной плотности параметров'осуществляйся исходя из принципа простоты последующих расчетов и анализа оценок. В этом смысле наибольший интерес представляют так называемые сопряженные семейства априорных распределений, отличительной особенностью которых является принадлежность априорной и апостериорной плотности параметров одному и тому же типу распределения.

Однако созйство сопряжения можно потребовать и по отношению к'функции правдоподобия выборки, т.е. потребовать, чтобы априорные и апостериорные Функции правдоподобия принадлежали одному и тему же типу распределения. Это означает, что апостериорные сценки параметров распределения можно производить аналогично классическим методам моментов и максимального правдоподобия. Например, для гаша-распредсДумя с параметрами й и & ,

Сч«=1/й1/л) логарифмическая'функция правдоподобия имеет вид:

1(х,й,&) = (а-1)Е1п(х ) --&Ех + п1п(р/Г(й)). ( 17 )

Нетрудно заметить, что если в качестве априорной плотности параметров а и & взять плотность сопряженного вида, то апостериорное правдоподобие выборки также будет принадлежать гамма-распределе-

Н'/'й'

Кх, а. (!) =й(Е1п(;:)+к1 )-р (Ех +к2 ) + <п+к3) 1п(Э^(о()). ( 18 )

Таким образом, выбирая априорную плотность распределения параметров сопряженного вида, ш значительно упрощаем процедуру оценивания апостериорных параметров и их интерпретация.

Действительно, параметры( kj.k2.k3) можно рассматривать как достаточные статистики некоторой гамма-распределенкой выборки Шобъемом п=к3 с параметра?.« х*,Су; соответственно параметры к! и к2 допускают интерпретацию как реализации статистик Гл - к3(1п(хл)+<р(СО), (19)

к2= ( 20 ) Ч> (Су* ) =<1> (1 /Су2 „) - 1п (1 /Су2 *). где <1>(.) - логарифмическая производная гамма-функция (псифунк-ция).

Параметры (х*.Су, к3), представляющие априорную компоненту, предлагается оценивать с помощью региональных зависимостей М-М(Г,...), О-СМГ,...); Параметр кз имеющий смысл объема априорной информации, заключенной в региональных зависимостях стока, определяется по следующей методике: t

а) в поле зависимости М=М(Р,..,) графическим способом проводится верхняя и нижняя 95%-ные доверительные границы М1" (Г) и Н" (Р);

б) определяется размах доверительного интервала для заданного значения площади:

И - - М (Р); . ( 21 )

в) параметр к3 определяется по формуле

( 22 )

Приведенная методика основана на использовании известной формулы математической статистики: г

Р(|х-Ех||у к3/б < 2> «. 0.95, ( 23.)

а также следующих-, соображений. Допустим, что мы наблюдаем процесс

со сродним значением М и коэффициентога вариации Су; длина выборки - кЗ-членов. Тогда выборочные оценки среднего значения с доверительной вероятностью 95% будут удовлетворять формуле (30). В этом смысле объем априорной информации, содержащейся в районных эмпирических зависимостях, эквивалентен информации, заключенной в выборке кЗ-членов

Оценим статистических параметров стока с учетом региональной информации определяются по форулам (24)-метод моментов и (25) -максимального правдоподобия :

Г=(хп+М?к3)/(п+к3)1

б" = ((п-1) б2(СуМР) г + [пк3 / (п+кз) ] (х-МП} / (п+к3-1); ( 24 )

у - V

Су=ф"1 ([кз<р(С^)+22пх+кз2пШ*Р)]/(п+кз)-1п(х)}. ( 25 )

Апробация метода, проведенная для районов избыточного и недостаточного увлажнения ( Белорусь и басс. Дона ) показала, что предлагаемые оценки существенно превосходят традиционные по точности, особенно в случае кратковременных наблюдений, а привлечение дополнительной информации эквивалентно нескольким годам наблюдений.

Предлагаемый метод оценивания статистических параметров стока позволяет учитывать априорную информацию-'о стоке, обобщенную в виде эмпирических районных зависимостей М=М(Р,...),

С'/=С;'(Р____). ■ _ :

Данный метод.существенно расширяет возможности уточнения выборочных параметров и квантелей распределения и нараяне с из-

вестньши методами приведения и групповго анализа гидрометеорол-гической информации может быть рекомендован в практику инженерно-гидрологических расчетов.

3 ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ,ПОЛУЧЕННАЯ НА ОСНОВЕ ИНФОРМАЦИОННОГО ПОДХОДА ( Н-распределение). 3.1 Общие положения

В настоящее время в статистической гидрологии для списания эмпирических функций распределения гидрологических характеристик наиболшее распространенна получили кривые Пирсона Ш типа и Крицкого-Менкеля, применение которых регламентировано нормативным документом СНиП 2,01.14-83. Наряду с ними часто используются и некоторые другие типы распределения случайных величин -логнор-мальное, Джонсона, Гумбеля и др. Подобное разнообразие используемых типов кривых обеспеченности объясняется рядом причин: во-первых, объективно существующими различиями условий формирования стока, находящими отражение в особенностях индивидуальных эмпирических кривых обеспеченности,во-вторых, отсутствием теории "случайного механизма,- порождающего процесс". В этих условиях, особенно при наличии коротких рядов наблюдений, зачастую трудно отдать предпочтение "'тому или другому типу теоретически кривых обеспеченности без привлечения некоторых дополнительных внешних критериев.

К числу таких критериев, выбранных практикой расчетов стока, можно отнести ограничение области изменения случайных величин положительной полуосью. Содержательные априорные основания для задания каких-либо других диапазонов изменения случайных ве-лпчин(по крайней мере,в области обеспеченнностей Р=(0,01-99,0)/)

отсутствуют.

Менее формализованы другие требования, предъявляемые к Функциям распределения стока - гибкости и простоты, характеризующие аппроксимирующие свойства распределения, трудоемкость и надежность оценивания их статистических параметров. Необходимо отмстить известную противоречивость этих требований, заключающуюся в том, что увеличение числа независимых параметров распределения, с одной стороны, повышает гибкость распределения, а с другой стороны, ведет к расширению совместной доверительной области оцениваемых статистических параметров и,как следствие, к снижению точности определения квантилей распределения. Необходимый комп- • роиисс на современном этапе изученности вероятностной природы речного стока может быть достигнут использованием трехпарамстри-ческих функций распределения, позволяющих оценить математическое ожидание, коэффициент вариации и коэффициент асимметрии.

Из применяемых с гидрологии функций распределения е наибольшей степени указанным выше требованиям удовлетворяет распределение К.рицкого-Менкеля. Вместе с тем оно также не лишено недостатков. Вопервых, при отноиениях Сз/Су < 2 кривые обеспеченности Крицкого -Менкеля о области редкой повторяемости имеют выпуклые очертания (шполажипаются). что характерно для ограниченных гверху случайных величин, и но свойственно для рядов наблюдений речного стока. Таким образом, вопрос о "наилучшем" типе Функций распределения стока нельзя считать окончательно ре-конннм. .

В связи с этим представляет интерес рассмотреть вопрос выбора типа функции распределения с позиций информационного подхода. Пионерные исследования ■с угом направление в гидрологии

представлены работами Дж.Сонуга и И. В.Бусалаева. в которых з качестве дополнительного внешнего критерия использован принцип максимуму условной энтропии. Указанные работы,тем не менее, значительно отличаются по математической формулировке задачи и,как следствие,по полученным решениям. Так в работе И. В. Бусалаева искомый вид функции распределения определяется перебором из предлагаемого автором набора распределений по принципу минимального расхождения с эмпирической энтропией ряда, в то время как в работе Да. Сонуга в качестве решения предлагается усеченное нормальное рапределение, полученное максимизацией, условной энтропии. Главный недостаток первого решения заключается в необоснованности исходного набора распределений, предложенного авторами, среди которых разыскивается оптимальный тип распределения. Например, о исходный набор включено распределение Крицкого-Менкелп. которое не удовлетворяет принципу максимума условной энтропии ни при каком из разумно назначаемых наборов априорных ограничений. Другой недостаток заключается в использовании в качестве "эталона" при обосновании выбора оптимального типа распределения эмпирической энтропии; известно,что оценки эмпирической энтропии определяются с большой погрешностью даже для значительных по объему выборок.

Несостоятельность решения, полученного-Дж,Сонуга объясняется некорректным заданием априорного нижнего предела распределения. в результате чего автором "утеряно " правильное решение. 3.2 Формулировка задачи и вывод плотное?и

Основным требованием, предъявляемым к функции, выбираемой для описания закона распределения случайной величины.является требование максимально возможной- гибкости при соблюдении некоторых априорно установленных ограничений. Это же полотенце »«¡«но

рассматривать как требование максимальной согласованности (адекватности) состава ограничеин и выбираемой функции распределения. С позиций теории информации сказанное можно сформулировать в виде критерия максимума условной энтропии распределения при заданных априорных ограничениях

Н— 1п(р(х) )р(х)с!х -» мах.

6, (х.р(х))-0, 1-1.2... , ( 26 )

где р(х) - плотность распределения; Н - энтропия по Шеннону; рл (х, р(х)) - набор ограничений, априорно налагаемых на функцию распределения.

Эквивалентность неформальной и математической формулировок задачи может быть обоснована следующими соображениями.- Искомая плотность распределения р(х), найденная в результате решения задачи (26) в силу принципа максимума условной энтропии не содержит никакой информации, кроме информации, заключенной в априорных ограничениях <С) >• Следовательно, форма распределения адекватна априорным ограничениям.' По этой же причине искомая Функция распределения будет обладать наилучшими аппроксимирующими свойствами для всех возможных функций распределения, удовлетворяющих заданному набору ограничений т.е. наиболее гибкой.

Ключевым этапом в решении поставленной задачи является обоснование состава априорных ограничений {[^ ) и формы их представлен:«:.

Применительно к функциям распределения, используемым п гид-релогич, апри'.'рнь:с> ограничения целесообразно формализовать в вп-

де следующих интегральных уравнений Во: ЫхЫх = 1.

(27)

(28)

(29)

(30)

: крШбх = М!. 52: 5х2р(хЫх = М2, Ппхр(хНх = Ь.

где М! и М2 - соответственно первый и второй начальные моменты распределения.

Уравнение (27) есть обычное условие нормировки плотности вероятности. Второе и третье уравнения системы определяют соответственно первый и второй момента искомого распределения. Отметим, что введение в состав ограничений моментов третьего и более высокого порядка нецелесообразно вследствие низкой точности их оценивания, даже в случае достаточно продолжительных рядов наблюдений. Уравнение (30), в частности, формализует требование неотрицательности случайных величин. В работе Дж, Сонуга это ограничение задано непосредственно в виде нижнего предела интегрирования системы (27).Такая форма ограничения имеет следующий недостаток.

Решение задачи (35) методом множителей Лагранха включает этап дифференцирования; при этом те ограничения, которые заданы не в виде функций, неизбежно утрачиваются и не- будут учтены в полученном решении. Именно поэтому требование неотрицательности случайных величин представлено нами функционально - в виде существования математического ожидания логарифма случайных величин, что позволило сохранить специфические особенности задачи на всех этапах ее решения и получить правильный результат.

Наиболее распространенным' способом решения задач на условный экстремум,. к числу которых относится задача (35), является метод

множителей Лагранжа. Функция Лагранжа в данном случае может быть записана в виде:

Ф-4Кх,р(х))+ЕХ;(х,р(х))Ю, ( 31. )

где Н(х,р(х)) - энтропия распределения: (х,р(х)) - априорные ограничения (27-30); х, - так называемые неопределенные множители Лагранжа, числовые значения которых определяются путем подстановки найденного общего решения задачи в исходные уравнения.

В соответствии с методом Лагранжа искомая плотность распределения р(х) удовлетворяет следующему дифференциальному уравнению:

<1Ф/с1р(х)-ан/<1р(х)^.с1в1/с1р(х)*0. ( 32 )

выполнив диффсрнцирование уравнений (36-39 ), получим -(1*1п(р(х)))Н 0+х1х+х.2х+х31пх-0, ( 33 )

Из (^) следует. что искомая плотность распределения имеет после замены постоянных вид:

р(х)*Сху'1 ехр(ах-Ьх2). ( 34 )

где С - нормировочная постоянная; (V,а, Ь)- естественные параметры распределения.

Таким ^образом, получено трехпараметрическое распределение, по определению оптимальное с позиций теории информации и удовлетворяющее априорным ограничениям,- характерным для речного стока. Кромо того, кок будет показано дальше, это распределение обладает полезны!,! сзойством, важным при оценивании статистических •параметров: оценки максимального правдоподобия среднего и кооф-Фкчун^нта вариации совпадают с соответствующими сценками метода моментов. Далее распределение (34) 0удом именовать "Н-распреде-л'.'чно" ввиду общепринятого обозначения энтропии символом "Н".

Отметим, что ряд известных в математической статистике типов распределения (показательное, нормальное, равномерное) также могут быть получены при определенных комбинациях ограничений (27 -30).

3.3 Свойства Н-распределения.

Н-раслределение по определению является наилучшим в смысле принципа максимума энтропии, предназначенного для аппроксимации эмпирических функций распределения неотрицательных случайных величин с заданными перешли двумя моментами.

Н-распределение является трехпараметрическим, что представляет необходимую в практике гидрологических расчетов гибкость в назначении статистических параметров (среднего, коэффициента вариации и коффициенга асимметрии). *

Кроме того, Н-распределение обладает рядом свойств, важных при оценивании статистических парам'тров наблюденных рядов. Во-первых, оно принадлежит экспоненциальному семейству распределений, что является необходимым условием существования достаточных статистик размерности меньшей, чем вариационный ряд выборки; именно этим объясняется возможность всю информацию о Н-распредо-ленной выборке без какой-либо потери свести к трем достаточном статистикам. Во-вторых, что также является следствием принадлежности Н-распределения экспоненциальному семейству распределений, оценки метода максимального правдоподобия и оценки метода моментов среднего и коэффициента вариации совпадают, что имеет большое практическое значение.

Н-распределение унимодально в практически важном ,диапозоне изменения коэффициентов вариации и асимметрии. Точнее: при зна-

чония параметра у>1 - унимодально, а при значениях наличие второй моды не подтверждается для реально встречающихся в гидрологии значений коэффициентов вариации и асимметрии.

Уравнение моды Н-распредселния относительно естественных параетров (а, Ь, V) имеет вид:

ЖЫ а-»/а2+8Ь(у-1) ]/4Ь . ( 35 )

Для Н-распределения справедливы следующие рекуррентные уравнения, связывающие естественные и статистические параметры:

гь\,г -аМк+! + ( 36 )

где Мк- начальный К'-гый момент распредеелния; (а, Ь, V) - есествен-ные параметры. В частности, используя (36) для трех первых моментов. можно|записать систему уравнений связи между статистическими и естественными параметрами Н-распределения: ^{СУ+Ш^йх+У,

2Ь(СьСу+ЗС1'+тг-а(Су+1)х+у+1. • ( 37 )

где "х, Су, Се - среднее, коэффициент вариации м коэффициент асимметрии соответственно.

Дополнив систему (37) уравнением для математического ожидания распределения, можно найти зависимость между статистическими и естественными параметрами Н-распрседеления.

3.4 ..Оцениванифтатист^ ления,.

Логарифмическая цункция правдоподобия Н-распределенной выборки объемоц с п чл->&в имеет сид:

L(x)=a£x, -bE(Xj )2 + (v-l)Eln(xj )-nlnIv (a,b), ( 38 )

Г

где Iv (a, b) = lxv_1exp(ax-bx2) ¿x , (39)

Jo

С учетом этих соотношений уравнения метода ¡гениального правдоподобия для ff-распределенной выборки могут быть записаны с виде*.

dl/da - Ex-nEx, Mj - Ех/п , ■ ( -10 )

dL/db = Ехг-пЕх —> М2 = Ех2/п , ( 41 )

dl/dv ' Elnx-nBlnx --> Ls = Elnx/n . ( 42 }

Воспользуемся свойством оценок максимального правдоподобия, заключающимся в том. что для произвольней функции случайных аргументов оценкой максимального правдоподобия является сама функция, при подстановке в нее оценок максимального - правдоподобия для аргументов. В таком случае, оценкой максимального правдоподобия коэффициента вариации для Н-распределения будет оценка

Cv-/ М2 /Mi-1 = /еО^-П/п., (43)

где к,~х, / Т.

Таким образом видим, что оценка метода максимального правдоподобия для коэффициента вариации совпадает с оценкой метода моментов. Ясно, что это свойство Н-распредеелния является следс-твиемтого, что оценка второго начального момента выборки являет- ■ ся достаточной статистикой выборки и линейно входит в уравнение функции правдоподобия. Из других используемых в гидрологии типов распределения таким свойством обладает только нормальнее распре-делние.

Сопоставление кривых обеспеченности Н-распределения и 'распределения Крицкого-Менкеля показывает, что Н-распределение лишено недостатка, присущего распределяй» Крицкого-Менкеля, связанного с выполаживанием кривых обеспеченности в области редкой повторяе мости при отношениях -Cs/Cv<2. OcHooiwo. пыроды:

1) Предложен новый вид функции распределения речного стока, полученный на основе принципа максимума энтропии с учетом априорной информации о стоке; разрЬотаны методы'оценивания со статистических параметров и квантилей; исследованы ее свойства и показаны преимущества в аналитических.и аппроксимирующих характеристиках по сравнению с используемыми в гидрологии типами функций распределения;

2) Разработан новый потоп оценивания статистических параметров стока, основанный на синтезе наблюденной и регионально-обобщенной информации о стоке, позволяющий существенно повысить точность и надежность расчетов стока в случае коротких рлдос наблюдений;

0) Разработаны методы учета случайных погрешностей исходных данных при оценивании статистических параметров и квантилей речного стока, при оценивании корреляционных функций и регрессионных зависимостей; предложены соответствующие оценки и показано их преимущество по сравнению с традиционными сценками.

Основные работы.опубликованные по теме диссертации

1.Рождественский A.B. .Ежов А.В.,Сахарюк A.B. Оценка точности гидрологических расчетов.Л. ,'Гидрометеоиздат. 1990,276 с.

2.Ежов A.B.Вопросы.усовершенствования методов расчета статистических параметров стока. Труды V Всесоюзного съезда, т. 6, Л., Гидрснетсоиздат.1989,с. 127-133.

3.Ежов A.B.Оценка влияния пбгрепностей измерений на функции распределения рядов, стока. Тр.ГГИ. 1983, вып. 294. с. 18-23.

4. Рождественский А. В., Ежов А. В.. Бусалаева Л. И. Гидрологические расчеты с одновременным использованием фактических наблюдений и региональных зависимостей. Метеорология и гчдро-• логия, 1992, N1, с. 70-78.

аэрологически?: расчетов. Л. ■ Гидромотоонздат, 1990,276 х»

5.Ежов А.В.Некоторые результаты статистического анализа материалов многократных измерений расходов малой реки.Вопросы гидрологии суш, Гидрометеоиздаг, 1980, с. 142-148.

6. Ежов А.В. Влияние погрешностей измерений на оценки параметров регрессии. Тр.ГГИ, 1988,вып.332,с. 18-23.

7.Георгиевский В.Ю.,Ежов A.B. Прогноз антропогенных изменений притока речных вод в Каспийское и Азовское моря и перспективы совместного регулирования их водного и солевого балансов. Тр.Ii Всесоюзного совещания по моделировании и прогнозироза- , нию изменений природных условий,Новосибирск, 1988, с.36-37.

8. Георгиевский В. Ю.. Ежов А. В. Перспективы совместного регулиро-

' взят водного и солевого балансов Касипийского и Азовского

морей.Труды V Всесоюзного Гидрологического съезда, т.6.Л., Гидрометеоиздзт, 1989, с. 127-133.

9.Георгиевский В. Ю.,Ежов А. В. Расчет изменений стока крупных рек под-влиянием оросительных мероприятий. Тр.Всесоюзного совещания. Минск, 1986, с. 36-37.

10. Международное руководство по методам расчета ОГХ.В гл.Общие указания по оценке статистических параметров и эмпирических Функций распределения, Л.,Гидрометеоиздат, 1984. с. 142-148.

11.Методические указания по оценке влияния хозяйственной деятельности на' сток средних и больших рек и восстановлению его характеристик, раздел 2.2, Статистические методы определения влияния хозяйственной деятельности.,Гидрометеоиздат,1986,с. 42-43.

12.Единые рекомендации по оценке влияния водохранилищ на водные ресурсы и режим стока.МГГ социалистических стран Европы. Гл.6, Статистические методы.,София,1985,с 42-60.

13. Пособие по определению расчетных гидрологических характеристик. (приложение к СНиП 2.01.14-83), Л.. Гидрометеоиздат, 1984,

И.Ежов A.B.Выбор функции распределения речного стока на основании принципа максимума энтропии. Тезисы Y симпозиума МАГН по стохастической гидрологии, Бирмингем,1988.

15.Ежов А.В.Опыт применения Байесовых оценок статистических па- ■ •раметров стока. Тезисы II симпозиума по статистике неточных данных, Вена, 1993. '

С.19-21.