автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Методология и программно-математический инструментарий информационного обеспечения точного земледелия
Автореферат диссертации по теме "Методология и программно-математический инструментарий информационного обеспечения точного земледелия"
На правах рукописи
Буре Владимир Мансурович
2 О АЬ! 2009
етодология и программно-математический инструментарий информационного обеспечения точного земледелия
ии^475240
Специальность 05.13.18 - математическое моделирование, численные методы и комплексы программ
Автореферат диссертации на соискание ученой степени доктора технических наук
Санкт-Петербург - 2009
003475240
Работа выполнена в Государственном научном учреждении ордена Трудового Красно Знамени Агрофизическом научно-исследовательском институте Россельхозакадеми.
Научный консультант:
член-корреспондент Россельхозакадемии,
доктор сельскохозяйственных наук, профессо{
Якушев Виктор Петрович
заслуженный деятель науки РФ,
доктор технических наук, профессор
Полузктов Ратмир Александрович
доктор физико-математических наук, профессо
Мазалов Владимир Викторович
доктор физико-математических наук, профессо]
Андрианов Сергей Николаевич
Официальные оппоненты:
Ведущая организация: Российский Государственный Педагогический Университс им. А.И. Герцена, кафедра информационных систем и программного обеспечения.
заседании диссертационного совета Д 006.001.01 при ГНУ Агрофизический научно исследовательский институт Россельхозакадемии по адресу: 195220, г. Санкт-Петербург, Гражданский проспект, д. 14.
С диссертацией можно ознакомиться в библиотеке Агрофизического научно исследовательского института
Автореферат разослан «30 » СОиэл^Я^ 2009 года.
Отзывы на автореферат в двух экземплярах, заверенных печатью, просим направлять по адресу: 195220, г. Санкт-Петербург, Гражданский проспект, д. 14, ГНУ АФИ Россельхозакадемии.
Ученый секретарь диссертационного
Защита состоится
года в
мин. н
совета, доктор биологических наук
Е.В. Канаш
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. В развитии сельскохозяйственного производства растениеводческой продукции переход к дифференцированным технологиям точного земледелия, безусловно, является перспективным направлением. Точное земледелие является новаторским подходом к решению проблем зеленой революции, оно базируется на новейших достижениях не только традиционных областей агрономической науки, но и других областей знаний. В его основе лежит управление продуктивностью посевов, учитывающее пространственно-временную вариабельность среды обитания растений. Точное земледелие рассматривается как неотъемлемая часть ресурсосберегающего экологического сельского хозяйства, которое подразумевает применение интегрированной системы управления, а не отдельных ее разрозненных элементов, и открывает перед производителями новые возможности, особенно в плане обеспечения условий для получения запрограммированного объема продуктов растениеводства высокого качества.
Однако для реализации на практике этой концепции требуется эффективное научное обеспечение. Центральное место в обосновании применения системы точного земледелия занимают вопросы его информационного обеспечения. Особенно велика роль информационного обеспечения земледелия на уровне конкретного хозяйства для решения плановых технологических и оперативных задач по управлению продукционным процессом сельскохозяйственных культур. Объем и качество информационного обеспечения на этом уровне напрямую зависят от наличия и возможностей физико-технических и программных средств.
Цель работы. Целью диссертационной работы является разработка методологии и программно-математического инструментария по развитию информационной базы управленческих решений в точном земледелии. Идея достижения этой цели основана на построении вероятностно-статистических моделей поддержки принятия решений, на применении к анализу натурных данных различных методов прикладной статистики, позволяющих проводить сравнительную оценку полученных выводов и тем самым способствовать повышению их надежности и достоверности.
Задачи исследования. Для достижения указанной цели в диссертации предложена концепция совершенствования информационного обеспечения точного земледелия, в рамках которой было необходимо:
сформулировать постановки и разработать алгоритмы решения актуальных для точного земледелия задач вероятностно-статистического моделирования в условиях стохастической неопределенности и изменчивости. К их числу относятся следующие задачи:
• выбор оптимального момента времени для проведения агротехнологической операции в условиях неопределенности и использование статистической информации для практической реализации оптимальных решений;
• оценка биоэквивалентности двух относительно больших участков сельскохозяйственного поля по урожайности культуры за несколько лет;
• выделение однородных технологических зон на сельскохозяйственном поле по урожайности отдельных небольших участков за один год;
• информационное обеспечение прецизионного внесения удобрений на основе электронных карт урожайности;
• разработка новых методик адаптивного прогнозирования временных рядов и их апробация на примере прогноза временного ряда среднесуточных температур воздуха;
• разработка алгоритмов оценивания логит и пробит моделей и схемы их применения в прогнозировании продуктивности сельскохозяйственных культур;
обосновать и предложить методологию статистического анализа натурных данных, получаемых в экспериментальных исследованиях и прецизионных опытах; разработать методы и модели анализа данных в рамках параметрической и непараметрической статистик, а также рассмотреть вопросы анализа надежности и оценки достоверности полученных результатов;
создать программный комплекс по непараметрической статистике; разработать программное обеспечение задач вероятностно - статистического моделирования, адаптивного прогнозирования, логит и пробит анализов и построения эмпирических зависимостей.
Теоретическим значением и научной новизной обладают:
• Предложенная математическая постановка задачи выбора оптимального момента времени в условиях стохастической неопределённости и её конкретное решение при различных исходных данных являются методологической основой исследования широкого круга оптимизационных задач для процессов, реализация которых носит вероятностный характер. Результаты получены впервые и основаны на трех доказанных теоремах.
• Теоретически обоснованные и программно реализованные алгоритмы оценки степени внутриполевой однородности сельскохозяйственных угодий по интегральной продуктивности за ряд лет на сравниваемых участках, с одной стороны, и по распределению урожайности на заданной территории за конкретный год, с другой стороны, представляют собой в совокупности эффективный инструментарий
автоматизированного определения границ технологических зон для научно-обоснованного планирования работ по дифференцированному применению агроприёмов в системе точного земледелия.
• Программно реализованный новый алгоритм, основанный на разработанной нами модификации метода Брауна по адаптивному прогнозированию временных рядов, характеризующих агрометеорологические условия произрастания сельскохозяйственных культур.
• Предложенная и программно реализованная методика прогнозирования продуктивности сельскохозяйственных культур по выбранному набору агрохимических, агрофизических, агротехнических и других факторов на основе логит и пробит моделей. Впервые исследован вопрос об информативности используемого набора факторов и их достаточности для оценки гарантированного значения вероятности превышения порогового уровня урожайности для заданного поля.
• Предложенная методология и разработанное оригинальное программное обеспечение обработки и анализа натурных данных на основе сопряжённого применения методов параметрической и непараметрической статистик. Впервые выполнена классификация рекомендуемых параметрических и непараметрических методов с указанием условий проведения сравнительного анализа основных статистических гипотез.
Практическая значимость. Полученные в диссертации результаты могут быть использованы в научно-исследовательских организациях страны, где проводятся экспериментальные исследования с биологическими объектами и поэтому возникает необходимость в надежной обработке и достоверном анализе добываемых данных. Для этих целей подготовлены методические материалы, опубликованные в виде двух авторских монографий «Методология статистического анализа опытных данных» (2007) и «Комплекс программ по непараметрической статистике в среде МаЙаЬ» (2008), а также было издано несколько практических пособий по рассматриваемой тематике.
Востребованность в проведенных исследованиях чрезвычайно актуальна для конкретных хозяйств, внедряющих системы точного земледелия, как для анализа накапливаемой информации, так и в части решения оптимизационных и прогностических задач, а также в выявлении внутриполевых границ однородности участков для последующего дифференцированного применения технологических воздействий на заданном сельскохозяйственном поле. Так, например, в рамках государственного контракта с МСХ РФ № 957/13 от 11.08.2006 г., который выполнялся в 2006-2008гг. в рамках Федеральной целевой программы «Сохранение и восстановление плодородия почв земель сельскохозяйственного назначения и агроландшафтов как национального
достояния России на 2006-2012 годы», разработана и произведена опытно-производственная проверка ряда прецизионных технологий внесения минеральных удобрений и мелиорантов. Одна из технологий основана на электронной карте урожайности данного поля. Карта урожайности формируется автоматически с помощью уборочной техники, оснащённой специальными датчиками и приёмником системы глобального позиционирования. Построение электронной карты с автоматизированным выделением границ относительно однородных зон осуществлялось на основе разработанных в диссертации алгоритмов и программ.
Защищаемые положения
• Адекватной методологией математического моделирования объектов и процессов в точном земледелии является методология вероятностно-статистического моделирования и разработанные на этой основе алгоритмы нахождения оптимальных или близких к ним решений в условиях стохастической неопределённости и изменчивости, а также выполненные исследования по решению ряда задач прогнозирования.
• В условиях неизбежного расширения структуры и содержания исходной информационной базы точного земледелия предложена методология анализа экспериментальных данных на основе использования разных методов прикладной статистики и последующей сравнительной оценки полученных результатов, что значительно повышает их надежность и достоверность.
• Созданный и апробированный программный инструментарий и руководство по его применению являются достаточными для организации автоматизированной обработки экспериментальных данных по информационному обеспечению точного земледелия. Особое значение в совершенствовании процесса построения эмпирических моделей, оценки их статистической значимости и степени адаптации играют разработанные и программно реализованные в диссертации методики использования бинарной регрессии и квантильной, в частном случае, медианной регрессии, не требующей для своего практического применения обязательного выполнения многих важных предположений регрессионного анализа.
Личный вклад автора. Автором сформулирована цель работы, разработана концепция совершенствования информационного обеспечения точного земледелия, проанализированы результаты исследований и сделаны выводы. Разработка алгоритмов решения задач, составляющих основные положения, вынесенные на защиту, проведена лично автором. Созданное и апробированное программное обеспечение по обработке и анализу экспериментальных данных на 90% написано автором.
Апробация работы. Диссертация выполнялась в рамках проводимых Агрофизическим институтом исследований по базовым научно-техническим программам «Разработать теорию и методы управления продукционным процессом сельскохозяйственных культур в адаптивно-ландшафтном земледелии» (2001-2005 г.г.) и «Разработать методы и приемы управления продукционным процессом в условиях пространственно-временной неоднородности среды обитания растений с целью повышения адаптивности агротехнологий к условиям окружающей среды и обеспечения высокой продуктивности агроценозов» (2006-2008 г.г.), в ходе выполнения научно-исследовательских работ в соответствии с распоряжением Минпромнауки России № 04.900.43/078 от 15.04.2003 г. по созданию программно-аппаратного комплекса «Компьютерная система генерации и реализации технологических решений в точном земледелии».
Полученные в ходе выполнения работы результаты исследований были рассмотрены и одобрены на заседании Ученого Совета Агрофизического института в феврале 2009 года, а также докладывались и обсуждались на следующих международных и всероссийских научных и научно-технических форумах: на II всероссийской школе-коллоквиуме по стохастическим методам (Москва, 1995 г.); на III всероссийской школе-коллоквиуме по стохастическим методам (Москва, 1996 г.); на IV всероссийской школе-коллоквиуме по стохастическим методам (Москва, 1997 г.); на XXX международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 1999 г.); на I всероссийском симпозиуме по прикладной и промышленной математике (Москва,
2000 г.); на V международной конференции «Вероятностные методы в дискретной математике» (Петрозаводск, 2000 г.); на международной научно-практической конференции «Современные проблемы опытного дела» (Санкт-Петербург, АФИ, 2000 г.); на XXXI международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 2000 г.); на 4 St.Petersburg Workshop on Simulation (St. Petersburg, 2001); на всероссийской научной школе «Математические методы в экологии» (Петрозаводск,
2001 г.); на II всероссийском симпозиуме по прикладной и промышленной математике (Москва, 2001 г.); на международной научно-практической конференции «Агрофизика XXI века (к 70-летию образования Агрофизического института)» (Санкт-Петербург, АФИ,
2002 г.); на ХХХШ международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 2002 г.); на III всероссийском симпозиуме по прикладной и промышленной математике (Москва, 2002 г.); на III всероссийской научной конференции «Проектирование научных и инженерных приложений в среде «Matlab» (Санкт-Петербург, 2007 г.); на международной конференции «Современная агрофизика -
высоким технологиям (к 75-летшо образования Агрофизического института)» ( Санкт-Петербург, АФИ, 2007 г.); на XXXVIII международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 2007 г.); на VI международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания (Смирновские чтения)» (Санкт-Петербург, 2007 г.).
Разработанные программные средства апробированы на Меньковской опытной станции в Гатчинском районе Ленинградской области и входили в состав программно-аппаратного комплекса, демонстрируемого Агрофизическим институтом на трех международных специализированных выставках «Агрорусь» (Санкт-Петербург, 2004, 2007 гг.) и «Золотая осень» (Москва, 2008 г.), где были получены соответственно серебряная, золотая и серебряная медали.
Публикации. По теме диссертации опубликовано 55 научных работ, в том числе 15 статей в ведущих реферируемых научных журналах, рекомендованных в Перечне ВАК и 6 монографий, имеется свидетельство о государственной регистрации программы «Автоматизированная система стохастического выделения однородных технологических зон на сельскохозяйственном поле по данным урожайности» № 2008614663
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения, списка использованной литературы (202 источника, из них 65 источников на иностранных языках), приложения. Общий объем 312 страниц, включая 78 рисунков и 10 таблиц.
Благодарности. Автор выражает искреннюю благодарность своим учителям и коллегам Якушеву В.П., Жуковскому Е.Е., Кирпичникову Б.К., Ковригину А.Б., Котиной С.О., Кузготину В.Ф., Куртенеру Д.А., Лекомцеву П.В., Ломакину B.C., Матвеенко Д.А., Михайленко И.М., Петрушину А.Ф., Седунову Е.В., Семенову В.А., Ускову И.Б., Федоровой A.C., Якушеву В.В. за помощь и поддержку на различных этапах выполнения работы.
СОДЕРЖАНИЕ РАБОТЫ
Глава 1. Состояние, проблемы и задачи информационного обеспечения точного земледелия
В настоящее время Россия, как и все развитые страны, заинтересована в целесообразной научно обоснованной, с учетом экологической безопасности, интенсификации сельскохозяйственного производства с повышенной отдачей от применяемых технических ресурсов. Именно таким требованиям и отвечает развиваемый
в нашей стране адаптивно-ландшафтный подход к землепользованию. Основополагающие работы ученых Россельхозакадемии А.Н. Власенко, В.А. Драгавцева, В.П. Ермоленко,
A.Л.Иванова, А.Н.Каштанова, В.И.Кирюшина, Н.Г.Ковалёва, К.Н. Кулика, А.М. Лыкова, И.М. Михайленко, Н.З. Милащенко, А.Н. Небольсина, Р.А. Полуэктова, Л.Н. Петровой,
B.А. Рожкова, В.А.Семёнова, В.Г. Сычева, И.Б. Ускова и др. определили сущность и отличительные признаки адаптивно-ландшафтных систем земледелия (АЛСЗ). Стратегия такого подхода направлена на максимально полное использование различной информации для обоснования тех или иных решений на различных уровнях их принятия.
Важно отметить, что центральным и наиболее трудоёмким мероприятием при разработке АЛСЗ является выбор оптимальных технологий возделывания сельскохозяйственных культур из множества возможных сценариев. Решение этой задачи не только обеспечивает конечный результат, но, по сути, и является тем управлением режимами агроландшафтов, где компромисс между продуктивностью и устойчивостью получает своё окончательное разрешение. При этом, как показал зарубежный и отечественный опыт, наибольший эффект может быть получен при реализации агроприёмов по технологии точного земледелия.
Точное земледелие базируется на современных научно-технических возможностях общества, информационного и технического обеспечения технологий и строится на основополагающей идее рационального ведения сельского хозяйства в эпоху техногенеза, обоснованного производства количества и качества растениеводческой продукции и сырья для промышленности при неукоснительном соблюдении требований по предотвращению деградации природной среды.
Принципиальная отличительная особенность новой концепции заключается в том, что технология точного земледелия рассматривает каждое сельскохозяйственное поле как неоднородное. Оно разделяется на некоторое количество единиц управления, которые являются однородными (квазиоднородными) участками. Суть точного земледелия заключается в том, что для получения с данного поля максимального количества продукции высокого качества для всех растений этого массива создаются оптимальные условия произрастания с учётом выявленной неоднородности участка.
Национальный исследовательский комитет США (US National Research Council) определяет понятие точного земледелия следующим образом:
"Precisión agriculture is a management strategy that uses information technology to bring data from múltiple sourses to bear on decisions associated with crop production"(«To4Hoe земледелие - стратегия управления, которая использует информационные технологии,
извлекая данные из множественных источников, с тем, чтобы принимать решения по управлению посевами»).
Новые технологии, которые обусловили возможность перехода к концепции точного земледелия, связаны с появлением Географических информационных систем, возможностью использования глобальной системы позиционирования с непосредственным вводом информации в бортовой компьютер, обеспечивающий управление механизмом, проводящим в поле ту или иную операцию. Стоит подчеркнуть, что решающую роль в этом процессе играет информационное обеспечение принятия управленческих решений - моделей, баз данных и знаний, экспертных систем, специальных программ.
Таким образом, развитие точного земледелия стало возможным благодаря беспрецедентному прорыву в разработке специальной техники и информационных технологий, которые были успешно интегрированы в сельское хозяйство.
Концепция точного земледелия предусматривает применение физико-технических и программных средств как для получения и обработки информации в локальных агроэкосистемах, так и для реализации агроприемов непосредственно в поле. Это обстоятельство, в принципе, позволяет более широко в сельскохозяйственной практике использовать методы и средства нового направления для получения полезной и более точной информации о состоянии растений и среды их обитания.
Оценивая перспективы развития нового направления в сельскохозяйственном производстве, важно понимать, что точное земледелие - «информационно-интенсивная» технология. Применение этой технологии может быть эффективным, если используется системный подход в управлении на фоне увеличивающегося информационного потока. Большинство производителей не знают, как эффективно использовать обширное количество данных, и поэтому они сталкиваются с многочисленными проблемами интерпретации этих данных как основы для принятия решений при управлении урожайностью.
Анализ материалов ряда зарубежных исследований в области точного земледелия (ТЗ), результаты которых были представлены на девяти Международных конференциях и шести Европейских конференций по ТЗ, а также собственные исследования, показывают, что особую важность представляют исследования, направленные на совершенствование информационного обеспечения систем точного земледелия и разработку методологии управления ими.
Выработка и реализация агроприемов I по технологии точного земледелия
Динамическая пространственно-атрибутивная база данных хозяйствующего субъекта
Физическая аппаратура и мобильные комплексы сбора данных с навигационным и геоинформационным обеспечением
Эксперимен тальные поля НИИ, поля хозяйствую щих субъектов
Планирование и организация работ по обработке накапливаемой информации
Вероятностно-статистическое моделирование и прогнозирование
Методы и модели нахождения рациональных решений и прогноза уровня урожайности
Анализ данных с помощью методов прикладной статистики
Параметрические и непараметрические методы Обнаружение, построение и анализ эмпирических зависимостей
Накопление и корректировка специальных и нормативных сведений, предназначенных для выработки агротехнологических приемов
Рис. 1. Концептуальная схема совершенствования информационного обеспечения точного земледелия
Концептуальная схема по совершенствованию информационного обеспечения точного земледелия представлена на рис. 1. Для сбора натурных данных, характеризующих условия конкретного хозяйства и специализированных полигонов научно- исследовательских учреждений, предусматривается использование современных технических средств точного земледелия. Центральное место в рассматриваемой концепции занимают вопросы обработки и анализа накапливаемой информации.
Вероятностно-статистическое моделирование предполагает создание математических моделей и разработку методов нахождения оптимальных или близких к ним решений в условиях стохастической неопределенности и изменчивости, а одновременное применение в анализе натурных данных параметрических и непараметрических процедур и последующее их объективное сравнение ведет к существенному улучшению качества статистических выводов. При этом необходимым условием повышения качества информационного обеспечения точного земледелия является современная организация опытного дела по изучению продуктивности агроэкосистем и применение эффективных методов обнаружения, построения и анализа статистических зависимостей, характеризующих разнообразные взаимосвязи между различными факторами в живой природе.
Глава 2. Вероятно-статистическое моделирование в задачах оптимизации агротехнологических решений и оценки пространственной неоднородности сельскохозяйственных угодий по урожайности.
Вероятностно - статистическое моделирование предполагает создание математических моделей и разработку математических методов нахождения оптимальных или близких к оптимальным решений в условиях наличия стохастической неопределенности.
2.1 Математическая постановка и решение оптимизационной задачи выбора сроков проведения агротехнологических операций
Оптимизация сроков проведения агротехнологических операций является важнейшим этапом в реализации точного земледелия. Уже на стадии планировании агротехнологий возникает задача оценки момента времени проведения той или иной операции, при этом, как правило, можно оценить ожидаемые потери за единицу времени, связанные с завышением или, наоборот, с занижением оценки времени проведения необходимого мероприятия. В некоторых случаях эти потери могут быть выражены непосредственно в денежных единицах (например, простой техники; потери, связанные с необходимостью привлечения дополнительной техники, рабочей силы и т.д.). В других случаях величину потерь можно получить в результате экспертной оценки относительной нежелательности ошибки, связанной с завышением оценки момента времени проведения мероприятия по сравнению с ее занижением.
В задачах такого типа часто заранее можно указать временные границы проведения мероприятий. Проблема сводится к оценке момента времени проведения необходимых работ внутри некоторого временного интервала.
Предположим, что в качестве оценки момента времени проведения агротехнологического мероприятия выбран момент времени хе[а,Ь] внутри фиксированного заданного временного промежутка [а,Ь], причем наилучший момент времени проведения этого мероприятия т является случайной величиной с известной функцией распределения F(t) и, вообще говоря, может не принадлежать промежутку [а,Ь]. Предположение о случайности момента времени т моделирует неопределенность, связанную с наличием разнообразных факторов, оказывающих значимое влияние и трудно прогнозируемых на практике. Предположим, что с - величина потерь за единицу времени, связанных с занижением оценки, а I - величина потерь за единицу времени, связанных с завышением оценки. В диссертации показано, что
Ожидаемые средние потери Q(x) составят следующую величину
00 х
Q(x) = с j(min(i, b) - x)dF(t) + / {(х - шах(/, a))dF{t), (2.1)
X -00
Поставим задачу минимизации ожидаемых потерь:
х* = arg min Q(x) (2.2)
If [<v,6]
ПустьХр-решение уравнения: ^ (хр )
с + 1 '
Теорема 1. Если строго возрастающая функция распределения Р(1) непрерывна, то решение задачи (2.2) определяется выражением
Ъ, если х > Ь
х =<
хр, если а<хр <Ь а, если хр < а
Теорема 1 дает решение оптимизационной задачи построения оптимальной оценки момента времени по выбранному критерию оптимальности. Если функция распределения F(t) неизвестна, то следует построить статистическую оценку функции распределения F(t) по имеющимся опытным данным, либо использовать минимаксный подход.
Суть минимаксного подхода заключается в решении следующей оптимизационной задачи:
x"=arg inf supg(x,F) (2.3)
xe{a,h)F£j
где/ - множество всех функций распределения, (¿(х,Р)^(х). Теорема 2. Решение задачи (2.3) дается выражением
** с , I
х =-¿н--а
с + 1 с + 1
Рассмотрим случай, когда функция распределения Р(г) представима в виде
конечной смеси известных непрерывных строго возрастающих функций распределения ....
т
m=zPiW), )=i
т
где весовые множители р,>0, ;'=/..... т и £ Pi ~ ^, то есть весовые множители
/=1
образуют вероятностное распределение.
Рассмотренная вероятностная модель часто встречается на практике и соответствует случаю, когда генеральная совокупность представляет собой смесь нескольких относительно однородных совокупностей. В рассматриваемой задаче можно, например, считать, что т=3. При этом первая совокупность состоит из «хороших» лет, то есть лет с высокой урожайностью данной культуры, вторая совокупность состоит из «средних» лет, то есть лет, когда урожайность соответствует среднему уровню, и третья совокупность состоит из «плохих» лет, когда урожайность оказывается низкой.
Введем дискретную случайную величину с распределением p{\'= i} =-р„ 1---1, 2, ..., т.
Введем следующие определения: х* =arg min Q(x,F),
х e{a,b)
x', =arg min Q(x, Ft),
xe[a,b]
x* = X]* • I{v = 1} + x\ ■ 1{V = 2} +... + x*m ■ l{v = m},
, , fl, если v=i /{v = /} = {o,e™v*i
Здесь x - оптимальное решение для всей смеси F, х, - оптимальное решение, когда точно известен номер совокупностих' - оптимальное решение, когда точно идентифицируются события {\=i}, i=l, ..., т.
Теорема 3. Если строго возрастающие функции распределения Fift), F2(t), ..., Fm(t)
непрерывны, то MQ(t,x }<Q(x ,F).
Возникает задача статистического оценивания теперь уже всех функций распределения Р^), ¡=1, ..., ш или статистического оценивания соответствующих квантилей. Конечно, предпочтительнее построить оценки распределений, так как это позволит варьировать величины возможных потерь и оценить степень изменчивости оптимальной оценки. Этот случай был рассмотрен на конкретном примере. В частности, на опытной станции Агрофизического института была собрана статистика по наилучшим моментам времени посадки картофеля за тридцать пять лет. На основе собранной статистики (в предположении, что компоненты смеси представляют собой нормальные распределения с различными параметрами) найдены оценки параметров смеси и построены оптимальные решения по найденным оценкам.
2.2 Оценка пространственной изменчивости и выделение однородных зон на сельскохозяйственном поле по урожайности.
В основе точного земледелия, являющегося сегодня одним из наиболее перспективных направлений агрономической науки и производства растениеводческой продукции, лежит представление о возможности значительного повышения урожаев, существенной экономии ресурсов и снижения антропогенной нагрузки на окружающую среду путем дифференциации агротехнологий в соответствии с пространственной изменчивостью почвенных и иных факторов продуктивности в пределах отдельного сельскохозяйственного поля. Ключевым понятием этой концепции является адаптация элементов агротехнологии к внутриполевому варьированию условий, т.е. приспособление системы хозяйствования к пространственной неоднородности конкретного поля. Очевидно, что с точки зрения такого подхода первостепенное значение приобретает более глубокое изучение самой пространственной неоднородности сельскохозяйственных угодий, разработка методов ее количественного описания и выделения границ изменчивости на заданной территории.
2.2.1 Оценка биоэквивалентности двух участков на сельскохозяйственном поле.
Предположим, что на некотором поле можно выделить два участка А и В. Требуется принять решение о степени однородности или неоднородности этих участков между собой по уровню средней урожайности некоторой культуры за несколько лет на этих участках. Предполагается, что каждый из участков состоит из большого числа небольших по площади делянок, средняя урожайность представляет собой суммарный урожай всех делянок, поделенный на их количество. Биоэквивалентность этих участков означает совпадение распределений этих случайных величин (средних урожайностей) или
достаточную близость этих распределений. В дальнейшем будем считать эти случайные величины взаимно независимыми. Подобное допущение представляется оправданным, если участки достаточно велики по площади.
Предположим, что имеются две выборки, представляющие собой значения средних урожайностей участков А и В за несколько предыдущих лет: Yt,,...,Ym,...,YBll. Представляется также допустимым предположить, что распределения введенных случайных величин Г, и Ув являются нормальными с параметрами цА,цв (математические ожидания) и а\, а], (дисперсии). В качестве меры сходства случайных величин Ул, У,,, естественно выбрать вероятность
= (2.4)
Если участки А и В биологически эквивалентны, то, как уже отмечалось выше, распределения средних урожайностей должны быть одинаковыми или достаточно близкими, поэтому вероятность (2.4) следует сравнивать с вероятностью
ш=Л liWiM <2-5)
где случайная величина YA независима от УА и имеет такое же распределение. В качестве величины г в формулах (2.4) и (2.5), как это было предложено в работе Shall, R. (Assessment of individual and population bioequivalence using the probability that bioavailabilities are similar. Biometrics 51, 615-626,1995), выберем taA -J2 . Тогда вероятности (2.4) и (2.5) можно переписать, используя функции стандартного нормального распределения, следующим образом
(
Ф
'^А^ + Мв -йл J-^^+fB-^-l
Jo-A+ci J I ^л + сггв
КДО = Р{\Ул -г3| <шл^1г\=Ф(1УФ{ч),
где Ф(0- функция стандартного нормального распределения. Близость функций и свидетельствует о том, что участки А и
В можно считать биоэквивалентными. Более строго биоэквивалентность можно определить в терминах разности или отношения введенных функций, для чего необходимо ввести пороговые значения /4 для разности и fr для отношения. Будем говорить, что участки А и В биоэквивалентны, если РллСУРл(О^Л или (,)>/„ (2.6)
где < О, /г<\.
Очевидно, что большее значение вероятности означает более высокую степень «близости» между средними урожайностями, что говорит о «более высокой биологической эквивалентности участков».
Используя имеющиеся выборки, построим оценки неизвестных параметров /u'A,fjs, <7j',<Tg\ после чего, подставив их в функцию F{S(t), получим статистическую
оценку искомой вероятности: F'lB(t). А далее можно производить сравнение найденной оценки с F,(<). Заметим, что функция Ft (t) полностью известна. Проблема заключается в том, что вместо истинной вероятности F1B(l) в сравнении используется статистическая оценка F\B(t). В связи с этим можно предложить следующий алгоритм, использующий идею статистического моделирования выборок из нормальных распределений с параметрами оА,<тв (отдельно для участка А и участка В).
Алгоритм:
1) По полученным в результате многолетних наблюдений опытным данным строятся оценки /j\,fj'B, а]', ав .
2) Моделируются на компьютере две выборки: выборка YAi,...,Y4n из нормального распределения с параметрами и выборка YB,,...,YB„ из нормального распределения с параметрами /4, ав .
3) По полученным выборкам строится новая оценка F"B(i), после чего для ранее выбранного порогового значения fd (или /г) производится проверка условия биоэквивалентности (2.6) (в форме разности или отношения).
4) Пункты 2 и 3 многократно повторяются и подсчитывается относительная частота выполнения условия биоэквивалентности (2.6).
5) Принимается решение о принятии гипотезы биоэквивалентности участков или об отклонении этой гипотезы.
Все вычисления производятся специальной программой, разработанной в среде Maple. Программная реализация позволяет при задаваемых различных уровнях урожайности проводить компьютерный анализ и оценку степени однородности тех или иных попарно сравниваемых участков на заданном сельскохозяйственном поле.
2.2.2 Выделение однородных зон на сельскохозяйственном поле по урожайности отдельных участков.
Современные технологии точного земледелия позволяют получать данные по урожайности с точной привязкой к координатам каждого отдельного участка на поле. Рассмотрим поле, состоящее из большого числа элементарных участков (размер участка -несколько квадратных метров), по каждому из которых известна урожайность. На основе урожайносгей по отдельным участкам конкретного года требуется произвести разбиение поля на относительно однородные кластеры (зоны). Перенумеровав участки и зафиксировав урожайность на каждом из них, получаем массив данных, в котором содержится потенциальная информация об однородных зонах на поле. Предполагается, что урожайность внутри каждой из зон примерно одинакова, причем полное совпадение урожайностей невозможно.
Предположим, например, что все поле можно условно разделить на пять кластеров (пять зон относительной однородности). Первый кластер соответствует очень благоприятным условиям для произрастания данной культуры; второй кластер включает участки с хорошими условиями произрастания данной культуры; третий кластер соответствует в целом удовлетворительным условиям; четвертый кластер включает неблагоприятные зоны произрастания культуры и, наконец, пятый кластер включает участки с очень плохими условиями. Конечно, в действительности для конкретного поля количество однородных зон может быть меньше пяти, в идеальном случае все поле целиком может представлять собой одну однородную зону.
Общая математическая модель задачи кластеризации урожайности на поле, имеет
вид:
к
/М = •Дх,в{), где: к - число кластеров (зон однородности); /(х,в]) -]=1
плотность нормального распределения (описывает закон распределения урожайности х внутри зоны однородности с номером ])', £>у = (агу,о^)- неизвестные параметры (математическое ожидание и дисперсия) распределения компоненты с номером}; pj -удельный вес зоны однородности (относительная доля наблюдений из этой зоны по отношению к общему числу наблюдений).
Для решения задачи кластеризации разработан алгоритм адаптивного вероятностного обучения, использующий разделение смеси вероятностных распределений, в котором отдельные компоненты моделируются нормальными распределениями с различными параметрами. При этом математическое ожидание
соответствует средней урожайности с участка внутри одной зоны, а дисперсия характеризует разброс внутри зоны однородности. Веса компонент указывают относительный размер соответствующего кластера. Урожайности на первоначально выделенных участках следует использовать для оценки параметров изучаемой смеси распределений. Может оказаться, что в процессе разделения смеси распределений (оценки параметров смеси) количество компонент уменьшится, что повлечет за собой уменьшение количества кластеров на поле. В идеальной ситуации, для однородного поля останется только лишь одна компонента. Алгоритм был реализован в виде программы, которая используется в информационном обеспечении прецизионного внесения удобрений.
2.3 Информационное обеспечение прецизионного внесения удобрений на основе электронных карт урожайности.
Особое место в точном земледелии занимает система применения в севообороте химических мелиорантов, в том числе минеральных удобрений, под возделываемые культуры. Из опыта земледелия этот рычаг воздействия на почвенное плодородие, рост и развитие растений является самым действенным, и поэтому эффективность дифференциации этого агротехнического мероприятия является весьма высокой.
В Агрофизическом институте по контракту с МСХ РФ №957/13 от 11.08.2006 г. разработана и осуществлена опытно-производственная проверка прецизионной технологии внесения минеральных удобрений и мелиорантов, где информационной основой этого агротехнического мероприятия является электронная карта распределения урожайности на заданном поле. Эффективность этого подхода определяется тем, что рассматриваемая карта урожайности отдельных небольших участков формируется автоматически с помощью уборочной техники, оснащённой специальными датчиками и приёмником системы глобального позиционирования.
Исходная электронная карта (рис. 2. - левая часть) обрабатывается программой, рассмотренной выше. В качестве входных данных программа принимает файл, сформированный бортовым компьютером уборочного комбайна, содержащий географические координаты центра каждого элементарного участка, его урожайность и влажность продукции, дату и время получения данных по каждому элементарному участку и в соответствии с фактическим распределением урожайности на локальных участках выделяет на заданном поле однородные технологические зоны - кластеры (рис. 2 - правая часть).
Затем с помощью мобильного комплекса осуществляется агрохимическое обследование поля. С каждого кластера отбирается один объединенный почвенный образец, состоящий из нескольких отдельных проб, взятие которых осуществляется по маршруту следования в максимальной степени равномерно с чёткой фиксацией координат. Почвенные образцы поступают в агрохимическую лабораторию на анализ. В дальнейшем по результатам проведенных анализов для каждого кластера по известным методикам рассчитывается потребность в тех или иных удобрениях для заданной культуры. Норма внесения определяется в зависимости от того, к какой технологической зоне относится тот или иной участок поля. Одновременно формируется электронная карта-задание для этого поля на внесение удобрений, которая записывается на чип-карту, переносится на бортовой компьютер агрегата, который по ходу движения будет автоматически на основании введенного в бортовой компьютер задания и данных вРв-приёмника вносить удобрения в нужных количествах в нужном месте.
Важно отметить, что карты урожайности, как информационная основа внесения удобрений под будущий урожай, широко взяты на вооружение в странах - Германии, США, Дании и др., где точное земледелие давно практикуется, особенно в крупных хозяйствах. Это связано с тем, что существенно сокращается количество анализируемых почвенных образцов. Как правило, их количество не более пяти, что значительно меньше в сравнении с детальным агрохимическим обследованием полей.
Глава 3. Адаптивные методы прогнозирования и методология применения бинарной регрессии в анализе продуктивности сельскохозяйственных культур.
Задачи, связанные с прогнозированием, занимают центральное место в анализе данных в целом. Особенно велика их роль в сельском хозяйстве вследствие наличия высоких рисков в производстве сельскохозяйственной продукции. Высокие риски обусловлены влиянием многочисленных внешних факторов, включая климатические. Влияние погодных условий часто является основным лимитирующим фактором в сельскохозяйственном производстве. Еще одна группа факторов, оказывающих решающее влияние на урожайность культур, связана с почвенной неоднородностью и особенностями рельефа каждого участка. Прогнозирование метеорологических факторов и оценка степени влияния конкретных почвенных условий на продуктивность сельскохозяйственных культур и, как следствие, прогноз урожайности сельскохозяйственных культур представляют собой чрезвычайно важные задачи, решение которых абсолютно необходимо в условиях точного земледелия.
В третьей главе диссертации рассмотрены подходы к решению сформулированных задач на основе метода адаптивного прогнозирования и метода бинарной регрессии -логит и пробит анализов.
3.1. Адаптивное прогнозирование
В настоящее время одним из наиболее перспективных направлений исследования и прогнозирования одномерных временных рядов являются адаптивные методы. При обработке временных рядов, как правило, наиболее ценной является информация последнего периода, так как необходимо знать, как будет развиваться тенденция, существующая в данный момент, а не тенденция, сложившаяся в среднем на всем рассматриваемом периоде. Адаптивные методы позволяют учесть различную информационную ценность уровней временного ряда, степень "устаревания" данных.
Важнейшим достоинством адаптивных методов является построение самокорректирующихся моделей, способных учитывать результат прогноза, сделанного на предыдущем шаге. Пусть модель находится в некотором состоянии, для которого определены текущие значения её коэффициентов. На основе этой модели делается прогноз. При поступлении фактического значения оценивается ошибка прогноза (разница между этим значением и полученным по модели). Ошибка прогнозирования через обратную связь поступает в модель и учитывается в ней в соответствии с принятой процедурой перехода от одного состояния в другое. В результате вырабатывается "компенсирующее" изменение, состоящее в коррекции параметров с целью большего
согласования поведения модели с динамикой ряда. Затем рассчитывается прогнозная оценка на следующий момент времени, и весь процесс повторяется вновь.
Для прогнозирования будем использовать разработанную нами модификацию метода Брауна. Ниже приведен соответствующий алгоритм, представленный следующей формулой прогнозирования на к шагов вперед (горизонт прогнозирования):
= +а(у„ + + (3.1)
где прогноз, который формируется в момент времени на к шагов
вперед, то есть У, =5,<<) формируется по наблюдениям до момента включительно, а - параметр адаптации, Р - параметр коррекции, & - вес, У ¡-к - наблюдение в момент времени '- ^.
Использование слагаемого с коэффициентом коррекции позволяет дополнительно учесть ошибку прогнозов на предыдущих шагах прогнозирования, усилить влияние обратной связи, увеличить управляемость процесса прогнозирования. При применении формулы (3.1) возникает необходимость задания начальных значений прогноза
которые могут быть определены как средние арифметические нескольких первых наблюдений. Выбор параметров адаптации, коррекции и веса, вообще говоря, произволен и зависит от особенностей ряда наблюдений. Подходящий подбор коэффициентов может производиться в режиме поиска в процессе настройки алгоритма, либо в результате предварительных испытаний. Большое по величине значение коэффициента адаптации и малое числовое значение параметра коррекции увеличивают влияние последних наблюдений, повышают гибкость модели, однако при этом повышается чувствительность к случайным флуктуациям, увеличивается дисперсия прогноза. Уменьшение параметра адаптации с одновременным увеличением параметра коррекции повышает инерционность процесса прогнозирования. В целом, набор из трех коэффициентов управления процессом прогнозирования расширяет возможности адаптации, повышает эффективность и качество прогнозирования. Формула (3.1) обобщает метод прогнозирования Брауна в двух направлениях: во-первых, предлагается прогнозирование на несколько шагов вперед, во-вторых, вводится новое слагаемое, усиливающее влияние обратной связи в процессе прогнозирования. Все три параметра принимают значения в промежутке [0,1].
Для тестирования алгоритмов и предварительного подбора управляющих параметров был использован файл \veather_data, содержащий данные среднесуточных температур воздуха на высоте 2 метра на полигоне Агрофизического НИИ в пос. Меньково Ленинградской области за 30 лет с 01.01.1975 по 31.12.2004 г.г,. Временной
ряд использовался для оценки качества алгоритма и написанной программы в среде Ма11аЬ. Испытания программы, написанной на основе алгоритма (3.1), показали, что качество прогноза очень существенно зависит от выбора параметра ^ - горизонта прогноза. Программа позволяет в автоматическом режиме выбирать оптимальные значения всех коэффициентов, определяющих коррекцию и адаптацию прогноза по результатам предыдущих прогнозов, задавать промежуток возможных значений горизонта прогноза, после чего происходит автоматический выбор оптимального значения параметра *.
Для осуществления подбора оптимальных значений коэффициентов и горизонта прогнозирования перед началом работы программы задается количество наблюдений временного ряда, по которым «производится обучение», то есть производится оптимальный выбор параметров алгоритма.
Алгоритм «обучения» заключается в следующем.
1. Производим прогнозирование по формулам (3.1) для разных значений ^из заданного промежутка и разных значений коэффициентов, перебирая с шагом 0,1 значения из интервала (0,1).
2. Выбираем прогноз с наилучшим результатом, то есть найдем оптимальное значение ^ и все коэффициенты модели.
3. Оценка качества прогноза может производиться разными способами, в частности, в данном случае подходит самый простой способ, в котором вычисляется сумма квадратов ошибок прогнозов на «обучающей» совокупности наблюдений: чем меньше сумма, тем лучше прогноз.
После того как оценка наилучшего горизонта прогнозирования к внутри заданного интервала осуществлена и выбраны наилучшие значения коэффициентов, по формуле (3.1) можно производить прогноз.
В процессе тестирования программы исследовались и другие ряды, в которых имелась четко выраженная периодичность. В этом случае при выборе оптимального горизонта прогнозирования, по-существу, производилась статистическая оценка периода, и не всегда в качестве оптимального горизонта программа выбирала наименьшее значение из заданного интервала. Однако в файле среднесуточных температур такой скрытой периодичности (с коротким периодом в несколько дней) обнаружить не удалось, поэтому в качестве оптимального значения горизонта прогнозирования всегда выбиралась нижняя граница заданного промежутка.
Качество прогнозирования в целом следует оценивать не интегральными характеристиками, которые не могут дать в принципе полное представление о качестве прогноза, а выводя на печать графики текущих значений временного ряда и прогнозных значений для выбранных горизонтов прогнозирования. Исчерпывающий набор таких графиков дает полное представление о качестве прогнозирования на предложенном для анализа числовом материале.
Целесообразно вычислять относительные ошибки прогнозов и находить долю прогнозов (в процентах), для которых относительные ошибки не превышают некоторые заранее установленные разумные границы. Что и делается в разработанной программе. Однако важно отметить, что использование относительных ошибок может привести к неверным заключениям о качестве прогнозирования вследствие того, что при делении на маленькие числа относительные ошибки могут оказаться большими, хотя в действительности качество прогнозирования является вполне приемлемым. В связи со сказанным следует еще раз подчеркнуть, что заключения о качестве прогнозов следует делать, главным образом опираясь на вид графиков текущего изменения прогнозируемой характеристики и прогнозов с выбранным горизонтом прогнозирования.
Далее приведены результаты численных экспериментов по прогнозированию изучаемого временного ряда, результаты прогнозов оцениваются, прежде всего, по графикам, а также по относительным ошибкам. Программы написаны на языке МаЛаЬ. В каждой программе строятся графики, позволяющие визуально оценивать качество прогнозов на любом промежутке времени, оценивается наилучший горизонт прогнозирования для временного ряда из заданного промежутка, рассчитываются относительные ошибки прогнозов, вычисляется среднее время формирования одного прогноза, автоматически определяются параметры адаптации.
................... .......forecast
..... ........yUw-Ai
"1iooo
2050
middle time of forecast - 0.00000395 sec error « 10% (or 13.50% elements error < 20% for 26.17% elements error « 30% for 36.78% elements error • 40% for 45.24% elements error « 50% for 51.60% elements error < 60% tor 57.45% elements error * 70% for 62.07% elements error » 100% lor 27.18% elements Sample size: 8105.00
2100
Adaptation: 0 40 Correction: 0.10 Weight: 0.10 Forecast duration 7.00
Рис. 3. Прогноз среднесуточной температуры воздуха на неделю
На рис. 3 приведен прогноз на неделю среднесуточной температуры воздуха (представлены результаты прогнозов с 22.10.1979 по 21.03.1980)
Графики на рисунке позволяют оценивать качество прогнозов на рассматриваемом временном промежутке в целом. В качестве горизонта прогнозирования была выбрана неделя. Программа осуществила автоматический поиск наилучших значений параметров адаптации, коррекции и веса и получила значения, указанные в правом углу (0.4, 0.1 и 0.1), под ними указан выбранный горизонт прогнозирования (7 дней).
На рис. 4 приведен прогноз среднесуточной температуры воздуха на пять дней (представлены результаты прогнозов с 22.10.1979 по 21.03.1980)
middle time of forecast = 0.00000000 sec Adaptation: 0.40
error < 10% for 15.72% elements Correction: 0.10
error - 20% for 29.13% elements Weight: 0.80
error < 30% for 40.04% elements Forecast duration 5.00
error < 40% for 48.23% elements
error * 50% for 54.85% elements
error < 60% for 60.40% elements
error < 70% for 64.93% elements
error >100% for 24.94% elements
Sample sixe: 7105 .00
Рис. 4 Прогноз среднесуточной температуры воздуха на пять дней. В качестве горизонта прогнозирования было выбрано пять дней. Программа осуществила автоматический поиск наилучших значений параметров адаптации, коррекции и веса и получила значения, указанные в правом углу (0.4, 0.1 и 0.8), под ними указан выбранный горизонт прогнозирования (5 дней). В последней строке слева указано общее количество сделанных прогнозов на пять дней вперед (программа тестировалась на существенно большем временном промежутке, составившем несколько лет, выбранная диаграмма является типичной и приведена для примера)
Сравнивая результаты с предыдущим прогнозом, сделанным на неделю вперед, легко заметить, что качество прогнозирования заметно улучшилось. Численные характеристики оказались заметно лучше, и визуально видно, что кривая прогнозов лучше соответствует реальным данным.
Численные эксперименты показали эффективность разработанных алгоритмов адаптивного прогнозирования в задаче краткосрочного прогнозирования метеорологических временных рядов.
3.2. Бинарная регрессия. Логит и пробит анализы.
Во многих прикладных исследованиях зависимыми переменными являются дихотомические или бинарные величины, они принимают значения единица и ноль; например, если урожайность культуры выше некоторого порогового уровня, то переменная принимает значение единица, если ниже, то ноль. Предположим, что необходимо предсказывать вероятности подобных событий. Например, хотелось бы выяснить, чем отличаются поля с урожайностью некоторой культуры выше порогового уровня от полей с урожайностью ниже заданного порогового уровня. В этом случае факт превышения порогового уровня означает, что зависимая бинарная величина принимает значение единица, в противоположном случае - значение ноль, а характеристики почвы выступают в роли факторов.
Логит и пробит анализы применимы в целях прогнозирования урожайности культур по выбранному набору х\агрометеорологических, агрофизических, агротехнологических и других характеристик.
Любой набор факторов не может исчерпывающим образом описать все возможные взаимосвязи, существующие в природе и влияющие на урожайность культуры, поэтому любой прогноз будет носить вероятностный характер.
Выбор факторов, оказывающих значимое влияние на урожайность культуры, не полностью очевиден. В принципе может оказаться, что среди выбранных факторов некоторые не оказывают большого влияния на урожайность и, поэтому могут быть исключены из рассмотрения, тем более в ситуации, когда измерение этих факторов вызывает затруднения. В связи с этим представляет интерес задача определения минимально достаточного набора факторов, по которым возможно удовлетворительное прогнозирование урожайности культуры.
Спрогнозировать числовое значение урожайности на конкретном участке чрезвычайно трудно, даже имея самый исчерпывающий набор факторов. Легче спрогнозировать возможность того, что урожайность превысит или не превысит некоторое фиксированное пороговое значение, определяющее хороший или допустимый уровень урожайности культуры для данного региона,
В такой постановке задачи прогнозирования зависимая переменная является дихотомической или бинарной величиной, она принимает значения единица и ноль. Предположим, что необходимо предсказывать вероятности подобных событий. Попытка решения задачи прогнозирования в такой постановке (даже при неудачном решении) имеет смысл. Действительно, если прогноз окажется неудачным, то есть, например,
Высокой вероятности превышения порогового уровня будет часто соответствовать шротивоположная ситуация - урожайность окажется ниже порогового значения, то можно будет сделать вывод о том, что выбранный набор факторов не включает действительно важных факторов для урожайности данной культуры. И, следовательно, данный набор факторов не является достаточным для прогнозирования. Можно ввести следующие обозначения:
У - бинарная переменная, принимает значение 1, если средняя урожайность на (поле выше заданного уровня, и 0, если ниже; Х1• ■ ■ ■ > хк ~ набор характеристик. В рассматриваемой задаче естественно с самого начала воспользоваться 1 нелинейной моделью для описания математического ожидания бинарной переменной, то есть по существу вероятности того, что бинарная переменная принимает значение равное единице, а именно положим
= + (3.2)
где Я) ~ функция распределения некоторой случайной величины.
При таком подходе не возникает трудностей с интерпретацией значений функции после подстановки в нее оценок неизвестных параметров и значений факторов, так как вычисленное значение представляет собой оценку вероятности того, что бинарная переменная будет равна единице.
В качестве функции П) можно использовать любую непрерывную функцию распределения, соответствующую симметричному распределению, однако на практике принято применять две функции распределения: логистическую
1 + е' 1 + <Гг и функцию стандартного нормального распределения
1 * -Ф(г) = -т= \е 2 ¿и
I
При использовании логистической функции распределения соответствующую модель называют логистической моделью или логит - моделью, а при использовании стандартного нормального распределения модель называют пробит - моделью.
Рассмотрим задачу статистического оценивания неизвестных параметров в общей модели бинарной регрессии. Очевидно, что наблюдения подчиняются распределению
Бернулли с вероятностями
Р{У, =1), Р[у,= 0). Будем предполагать статистическую независимость отдельных наблюдений между собой. В рассматриваемой задаче можно
воспользоваться методом максимального правдоподооия для нахождения точечн: оценок неизвестных параметров.
Пусть имеются наблюдения Л.^.-чЛ, состоящие из нулей и единиц, тог функция правдоподобия имеет вид:
Цу1>уг,...,у„) = П т/Зтх,.)У' [1 - Р(0тх,)Г»
В данном случае ввиду дискретности наблюдений значение функци правдоподобия представляет собой совместную вероятность получить те наблюденш которые имеются в наличии. Согласно методу максимального правдоподобия буде] искать неизвестные параметры, решая задачу ДЛ.Л.-.Л)-
Значения неизвестных параметров, доставляющих максимум функции правдоподобия, будем обозначать а,Ь,,...,Ьк и называть оценками максимального правдоподобия. В диссертации показано существование решений сформулированной оптимизационной задачи, разработан алгоритм нахождения оценок и написана программа в среде МаНаЬ, позволяющая находить оценки метода максимального правдоподобия, строить логит и пробит модели и проводить верификацию построенных моделей на имеющихся статистических данных. На первом этапе в работе с программой необходимо выбрать метод: логит или пробит-анализа (рис.5).
- апа РгоЬй АпаИзуэ-
СЬоозе а ментоа
Рис. 5 Окно выбора метода.
Перед началом работы необходимо сформировать файлы, содержащие начальные анные. Данные формируются в текстовом формате в соответствии с определенными равилами, изложенными в шаблонах.
Пути к файлам выбираются с помощью соответствующих кнопок в главном окне рограммы (рис.6). В качестве начальных данных необходимо указать:
• Имя файла, содержащего значения измерений факторов и показателя;
• Имя файла, в который будет записываться ответ.
Ш
isktop\20.G51JV3iwT и пробмтЩйа_|од)Ш
IDesktopüO.OSVrciUT и пробит toutputtx
¡3 Transfer to Binar variable
О Broadcast QseiBorjnds
Рис, 6 Главное окно. Логит и пробит методы.
Для использования возможности построения трехмерных графиков;
• Имя файла, содержащего значения фиксируемых переменных.
Для построения бинарной регрессии значение показателя должно быть дихотомической величиной. В программе предусмотрена опция сведения показателя к бинарной величине, и она должна быть использована, если файл входных данных содержит вещественные значения показателя, иначе программа выдает ошибку с информацией о невозможности построения бинарной регрессии. В случае выбора опции
сведения показателя к бинарной переменной, программа предлагает задать порогов! уровень, значение которого используется для расчета бинарной переменной.
После ввода входных данных необходимо задать имя файла для записи результа' Затем строится уравнение модели логит или пробит-анализа. На экран выводит уравнение построенной регрессии, результат - уравнение построенной регрессии - таю записывается в текстовый файл. В текстовом выходном файле указывается метод, i которому было построено уравнение, путь и название файла исходных данных. Посх построения уравнения становятся доступными опции построения графика, формировани прогноза и задания интервалов для определения «разброса» наблюдений. Рассчитываете показатель доли успешных прогнозов, т.е. отношение количества значений наблюдений построенных по методу логит или пробит-анализа, определенных как верные по принцип; проверки, изложенному в постановке задачи, к общему количеству наблюдений i выборке.
В заключение, обсудим общую схему применения логит и пробит анализов в точном земледелии, а также задачи, которые могут решаться на основе логит н пробит! моделей. Предположим, что поле было разделено на относительно однородные участки, на которых получены числовые значения выбранных факторов и получено значение бинарной переменной, здесь/ номер участка. Кроме того, предполагается, что значения бинарных переменных, полученных на разных участках, статистически независимы. Вначале собранные данные используются для построения оценок неизвестных параметров и, следовательно, для построения модели, которая в принципе может применяться для прогнозирования. Однако построенную модель следует протестировать на пригодность по собранным статистическим данным. Для этого нужно сравнить значение бинарной переменной для каждого участка и значение построенной эмпирической модели при подстановке в нее значений факторов, соответствующих тому же участку, что и бинарная переменная. Для того, чтобы модель могла быть признана адекватной, как правило, должно наблюдаться следующее соответствие: если бинарная переменная принимает значение 1, то модель должна давать вероятность больше 0,5; при значении бинарной переменной 0, модель должна, как правило, давать вероятность меньше 0,5. Если подобное соответствие в большинстве случаев выполняется, то построенная модель пригодна для прогнозирования, а выбранный набор факторов достаточен. В противном случае модель непригодна. Тогда следует изменить набор объясняющих факторов. Но и в том случае, когда модель показала хорошие результаты при тестировании, можно попробовать уменьшить количество рассматриваемых факторов и для уменьшенного набора произвести все необходимые расчеты для построения оценок неизвестных
¡рамегров и, следовательно, для построения новой более простой модели. Если новая одель окажется хорошей, то это будет означать, что для прогнозирования достаточен меньшенный по сравнению с первой моделью набор факторов. Таким образом, оявляется принципиальная возможность определения минимально достаточного набора )акторов. Определение минимально достаточного набора факторов для прогнозирования южет иметь большое значение, так как измерение некоторых факторов может оказаться ¡лишком трудоемким или точность определения числовых значений факторов слишком шзкой. Кроме того, в любом случае речь идет об экономии ресурсов, что само по себе немаловажно.
Если в результате статистического исследования удается построить модель, пригодную для прогнозирования, можно провести математическое исследование модели с целью определения чувствительности построенной модели по отношению к изменению факторов. На базе подобного исследования можно произвести разбивку поля на относительно однородные кластеры с точки зрения близости вероятностей превышения урожаем заданного порогового уровня.
Еще одна задача, которая может решаться на базе построенной модели, заключается в следующем. Имея различные наборы числовых значений факторов на конкретном поле, можно оценить вероятность превышения порогового уровня урожайности, например, для наихудшего числового набора факторов и тем самым получить оценку гарантированного значения вероятности превышения порогового уровня урожайности для данного поля. Решение перечисленных задач имеет важный методологический смысл, так как позволяет с альтернативных позиций ответить на основные вопросы статистического анализа данных - об информативности выбранных факторов, об их достаточности для адекватного математического описания существующих в природе взаимосвязей в их прикладном аспекте, а также поставить и решить задачу прогнозирования продуктивности сельскохозяйственных культур в условиях точного земледелия.
Глава 4. Экспериментальные исследования и статистические методы обработки и анализа натурных данных в точном земледелии.
В соответствии с концепцией совершенствования информационного обеспечения точного земледелия в разделе 4.1 диссертации подробно обсуждаются методические основы организации опытного дела по интенсификации исследований в земледелии, обеспечивающие изучение агроэкосистем на этапе перехода к новым агротехнологиям и
потенциальные возможности точного земледелия для повышения уровня достоверное получаемых натурных данных с наименьшими затратами.
Как показывают выполненные Агрофизическим институтом работы, проце интенсификации экспериментальных исследований по изучению агроэкосисп достигается наиболее эффективно при реализации трехуровневого моделирован функционирующего почвенно-растительного комплекса: натурного - на биополигонах полевых условиях, физического - на основе регулируемой агроэкосиситемы математического (Ермаков Е.И., Семенов В.А., Полуэктов P.A.). Организацг взаимосвязанных системных исследований с использованием натурного, физического математического моделирования позволяет осуществлять одновременное комплексно изучение почвенно-растительной системы при оптимальных условиях и стрессовы: воздействиях на посевы.
Однако главным методом экспериментальных исследований по изучении агроэкосистем был и остается натурный полевой опыт, позволяющий получат] необходимую для науки и практики информацию, проверять эффективность способов выращивания сельскохозяйственных культур, оценивать влияние на этот процесс и его конечный результат (урожай) условий внешней среды и управляющих воздействий.
Вместе с тем, огромная амплитуда почвенно-климатических различий в нашей стране выдвигает на первый план базовую задачу по созданию комплексной экспериментальной сети, которая репрезентативно охватывала бы все разнообразие природных условий и определяла границы территорий обслуживания для каждого опытного поля со свойственной ему почвенно-климатической характеристикой.
В этой связи наряду с географической сетью с удобрениями новая концепция организации опытного дела в России по изучению агроэкосистем, разработанная в Агрофизическом институте академиком Россельхозакадемии В.А. Семеновым, предусматривает дополнительно создать сеть региональных систем экспериментов по всей стране. Совокупность этих региональных систем экспериментов будет составлять опорный каркас всей опытной работы научно-исследовательских учреждений Россельхозакадемии, ее организационную и информационную базу. Несмотря на практическую сложность реализации этой концепции она дает вектор развития опытного дела в России. В каждом регионе (зоне) предполагается заложить по одному большому балансовому опыту со шлейфом микрополевых, вегетационных, лабораторных экспериментов, помогающими уточнить детали, подробнее рассмотреть отдельные составляющие сложных процессов, протекающих в агроэкосистемах. При этом
Лецизионные опыты займут решающее место в такой среде исследований как разработка Ирименешш удобрений и химических мелиорантов.
I Важно отметить, что с распространением технологии точного земледелия для ■озяйств открываются новые возможности получения достоверных результатов в ■собственных опытах» с наименьшими затратами. Каждый руководитель может заложить |1 провести в своем хозяйстве производственные опыты, используя прецизионную технику е навигационным оборудованием. Исследования могут проводиться на любом сельскохозяйственном поле, имеющем электронный цифровой образ с четкими границами |в пространстве, определенными с помощью глобальных координат. При этом [представляется уникальная возможность изучения гетерогенности почвенных условий всего поля и (или) текущего состояния посева. В обычных же деляночных опытах гетерогенность является помехой при планировании эксперимента, а при такой постановке вопроса она является объектом исследований в системе точного земледелия. Именно выявленная гетерогенность определяет степень необходимой
дифференцируемое™ на сельскохозяйственном поле. Результаты опыта в целом, а также сопутствующие натурные данные наблюдений автоматически фиксируются с помощью специальной техники (местоположение, состояние посева, урожайность) и накапливаются в базе данных конкретного хозяйства. Благодаря этому гарантируется достоверность исходных данных, полученных в прецизионном опыте, и у руководителя появляется возможность определить оптимальную стратегию хозяйствования на основе обработки и последующего анализа экспериментальной информации.
В разделе 4.2 диссертации рассмотрена методология, в соответствии с которой предложено применять параметрические и непараметрические методы статистической обработки натурных данных, получаемых в экспериментальных исследованиях на опытных полях и в производстве с помощью технических средств точного земледелия и уже после этого проводить сравнительный анализ результатов для повышения надежности управленческих решений.
В разделе 4.3 диссертации предложена определенная совокупность параметрических и непараметрических методов прикладной статистики, рекомендуемых к применению в системном анализе натурных данных. Выполнена соответствующая классификация рекомендуемых методов, представленных в таблице, с указанием условий проведения сравнительного анализа статистических гипотез. Важно отметить, что для всех предложенных процедур обработки и анализа данных в диссертации либо разработан специальный программный инструментарий, либо рассмотрены технологии применения стандартного математического обеспечения. Соответствующая тематика, связанная с
программным обеспечением процесса обработки и анализа натурных данных, бо] подробно изложена ниже.
Таблица. Классификация параметрических и непараметрических процедур при проверке статистических гипотез
Проверяемая гипотеза Параметрический метод Непараметрический метод
1)Анализ парных повторных наблюдений (проверяется отсутствие эффекта обработки) Критерий Стьюдента-проверяется равенство нулю математического ожидания разностей парных наблюдений; предполагается, что разности починяются нормальному распределению 1)Непараметрический критерий знаков - проверяется гипотеза о( отсутствии эффекта обработки для парных повторных наблюдений; предполагается, чт распределение разностей непрерывно. 2)Непараметрический критерий Уилкоксона - проверяется гипотеза об отсутствии эффекта обработки для парных повторны) наблюдений; предполагается, что распределение разностей непрерывно
2)Однородность двух выборок или некоторых характеристик исследуемых совокупностей 1)Критерий Стьюдента-проверяется равенство средних двух генеральных совокупностей; предполагается, что выборки взяты из совокупностей, распределенных по нормальному закону. 2)Критерий Фишера -проверяется равенство дисперсий двух генеральных совокупностей; предполагается, что выборки взяты из совокупностей, распределенных по нормальному закону 1)Критерий Уилкоксона проверяется совпадение распределений двух генеральных совокупностей; предполагается, что распределения непрерывны. 2)Критерий Манна-Уитни -проверяется совпадение распределений двух генеральных совокупностей; предполагается, что распределения непрерывны. 3)Критерий Колмогорова Смирнова - проверяется совпадение распределений двух генеральных совокупностей; предполагается, что распределения непрерывны.
3)Однофакторный анализ(проверка однородности нескольких выборок, полученных при разных уровнях фактора) Стандартный дисперсионный анализ - проверяется совпадение средних; предполагается, что все выборки извлечены из нормального распределения 1)Критерий Краскела - Уоллиса (произвольные альтернативы) проверяется отсутствие сдвигов выборок относительно друг друга; предполагается, что распределения непрерывны. 2)Критерий Джонкхиера (альтернативы с упорядочением) -проверяется отсутствие сдвигов выборок относительно друг друга; предполагается, что распределения непрерывны
Двухфакторный 1ализ (проверяется шотеза об гсутствии эффекта бработки при аличии мешающего (актора) Стандартный дисперсионный анализ - проверяется отсутствие эффекта обработки; предполагается, что все наблюдения подчиняются нормальным распределениям. 1)Критерий Фридмана (произвольные альтернативы) -проверяется отсутствие эффекта обработки; предполагается, что распределения наблюдений непрерывны. 2)Критерий Пейджа (альтернативы с упорядочением) - проверяется отсутствие эффекта обработки; предполагается, что распределения наблюдений непрерывны. 3)Критерий Доксама -проверяется отсутствие эффекта обработки; предполагается, что распределения наблюдений непрерывны.
5)Проверка независимости двух и более признаков Стандартный корреляционный анализ (коэффициенты парной корреляции, коэффициенты частной корреляции, коэффициенты множественной корреляции)-проверяется статистическая значимость выборочных коэффициентов корреляции, предполагается, что распределение выборок является совместным нормальным. 1)Критерий независимости Хефдинга -проверяется независимость двух признаков; наблюдения извлечены из непрерывной двумерной совокупности. 2)Критерий независимости Кендэла -проверяется независимость двух признаков;
6)Проверка гипотезы о значении углового коэффициента в парной линейной регрессии Критерий Стьюдента-проверяет гипотезу о возможном значении углового коэффициента; предполагается, что наблюдения распределены нормально. Критерий Тейла- проверяет гипотезу о возможном значении углового коэффициента; предполагается, что распределения наблюдений непрерывны.
Глава 5. Алгоритмические и программные реализации непараметрических методов.
В разделе 5.1 диссертации рассмотрены алгоритмы проверки основных статистических гипотез с помощью непараметрических критериев, а в разделе 5.2 подробно изложена программная реализация рассмотренных критериев в среде МаЙаЬ. Часть программ содержится в статистическом разделе среды МаЙаЬ, остальные программы являются оригинальными разработками. Все они объединены единым интерфейсом с развитой системой справок по каждой статистической процедуре, удобным
способом задания исходных данных, простым способом вызова статистических продед; системой тестовых примеров по каждой статистической процедуре.
При запуске приложения появляется основное окно программного комплеь (рис.7), содержащее список непараметрических тестов, кнопки вызова критерия, справ и закрытия приложения.
Инструменты анализа
Непараметрический критерий знаков
Анализ повторных парных наблюдении. Критерии Уилкоксона. Двухвыборочная задача. Критерий Уилкоксона. Двух выборочная задача. Критерий Манна- Уитни.
Непараметрический однофакторный анализ. Критерий Краскела-Уоллиса (произвольные альт Непараметрический однофакторный анализ. Критерий Джонкхиера (альтернативы с упорядоч« Непараметрический двухфакторный анализ. Критерий Фридмана (произвольные альтернатив Непараметрический двухфакторный анализ. Критерий Пейджа (альтернативы с упорядочение Непараметрический двухфакторный анализ .Асимптотически свободный от распределения кри-Непараметрический критерий однородности двух выборок Колмогорова-Оширнова Непараметрический критерий независимости Хефдинга.
Непараметрический критерий двумерной симметрии Холлендера. ,,
X"
Справка
Рис. 7. Основное окно программного комплекса
Для вызова критерия необходимо выбрать его из списка (по умолчанию выбран! первый критерий) и нажать на кнопку ОК. При этом появляется новое графическое окно (рис. 8.), соответствующее выбранному критерию. Рассмотрим для примера; непараметрический критерий знаков.
^ критерий знаковУВыборка №1 ЛхА Обзор | || критерий знаков'Выборка Nfl2.txt Обзор | Уровень значимости | 0.05
Выборка №1 Выборка N42
(• точный метод С нормальная аппроксимация
- Выходные данные
Отклоняем нулевую гипотезу на уровне значимости 0,05
Рис, 8. Графическое окно критерия знаков
Л Входные данные. Входными данными являются два текстовых файла. Каждый из ■IX должен содержать одну выборку. Выборочные данные в файлах располагаются либо в ■голбце, либо в строке через пробел.
■ Выходные данные. В качестве файла выходных данных можно использовать ■юбой текстовый файл. Если файл существует, то его содержимое будет заменено на Везультат теста. Если файл не существует, то программа создаст файл и запишет в него везультат.
I Для выполнения теста надо:
I Ввести входные данные. Это можно сделать двумя способами: использовать [кнопку Обзор или набрать полный путь к файлу в соответствующем поле. I Ввести уровень значимости в соответствующее поле.
Выбрать метод (по умолчанию выбран точный метод). Для этого требуется поставить флаг в соответствующий чек бокс.
Ввести файл выходных данных. Это также можно сделать двумя способами: использовать кнопку Обзор или набрать полный путь к файлу в соответствующем поле. Нажать кнопку ОК.
После нажатия кнопки ОК открывается текстовый файл выходных данных с результатами теста. Результатом является значение знаковой статистики, значение асимптотически нормальной статистики, если используется приближенный метод, р-значение и вывод о том, принята гипотеза или нет. Также вывод о том, принята гипотеза или нет, выводится на форму:
Результаты работы программы в тестовом примере: Значение знаковой статистики: 3 Значение асимптотически нормальной статистики: нет р-значение: 0.035156 Уровень значимости: 0.05
Результат: Отклоняем нулевую гипотезу на уровне значимости 0.05 При нажатии кнопки Отмена появляется основное окно программы, которое можно использовать для дальнейшего анализа.
Вызов справки. Каждый критерий снабжен справкой, которая содержит описание теста, входных данных и результатов. Для вызова справки надо выбрать критерий из списка и нажать на кнопку Справка. При этом появляется окно со справочной информацией (рис. 9.)
["^Критерий знаков
Непараметрический критерий, основанный на статистике знаков. ^Н
Проверяется нулевая гипотеза о том, что разность между соответствующими значениями наблюдений в выборках принадлежит распределению с медианой, Я
равной 0. |Н
Входные данные: текстовый файл, содержащий выборку N-1, текстовый файл, Я
содержащий выборку №2, уровень значимости. Объемы выборок должны быть В
одинаковы, уровень значимости - число между 0 и 1 Я
Возможен выбор метода: точный или приближенный. Точный метод используется Я
для выборок небольшого объема, приближенный - для больших выборок. В
Результатом является значение знаковой статистики, значение асимптотически Я
нормальной статистики, если используется приближенный метод, р-значение и Я
вывод о том, принята гипотеза или нет. Результат записывается в я
соответствующий текстовый документ и выводится на Форму. ■
Рис. 9. Справочное окно по критерию знаков 1
Глава 6. Процедуры построения и верификации регрессионных зависимостей
Построение и исследование эмпирических зависимостей является основной задачей статистического анализа натурных данных. В настоящее время имеется много различных подходов к решению этой задачи. Наряду с традиционным методом наименьших квадратов для построения эмпирических зависимостей можно использовать альтернативный подход - квантильную, в частном случае, медианную регрессию - не требующий для своей практической реализации обязательного выполнения многих важных предположений классического регрессионного анализа. Метод квантильной регрессии предполагает лишь непрерывность распределения случайной компоненты и в этом смысле он может быть назван непараметрическим методом, то есть свободным от распределения.
В разделе 6.1 диссертации подробно изложена методика построен™ квантильной и медианной регрессий. В классическом линейном регрессионном анализе для оценки неизвестных параметров модели, как правило, коэффициентов при факторах
у = Дхи...,хк) + е, где /(х,,...,хк) = а + Дх, +... + /Зкхк, применяется метод наименьших квадратов (МНК) при предположении, что наблюдения имеют вид у, = /О,.,.., х,к) + е,, где / = 1,..., п, п- объем выборки.
При этом для того, чтобы были выполнены различные свойства оптимальности оценок по методу наименьших квадратов, необходимо выполнение ряда предположений регрессионного анализа. В частности, совместное распределение случайных величин е,
Ллжно быть нормальным. Выполнение гипотезы о том, что случайные компоненты Иблюдений подчиняются нормальному распределению с постоянной дисперсией, дает Изможность построить строгую математическую теорию проверки статистической ■тчимости построенных зависимостей и найденных оценок в рамках метода наименьших Ьадратов.
■ Однако следует заметить, что методов, позволяющих надежно проверить Выполнение выше приведенных условий, не существует, по крайней мере, для выборок Относительно небольшого объема. Кроме того, часто вообще не удается указать какое-■шбо параметрическое семейство, к которому принадлежит распределение случайных компонент. В прикладных задачах нередко встречается ситуация, когда распределение, Характеризующее случайность, меняется в процессе наблюдений, что, конечно, не укладывается в традиционную схему, рассматриваемую в параметрической статистике, в частности в методе наименьших квадратов. Кроме того, в реальных данных могут содержаться наблюдения с другим распределением случайной компоненты, например, так называемые «выбросы» или «аномальные наблюдения». Наличие отдельных выбросов, «загрязняющих» выборку наблюдений, резко ухудшает качество построенных моделей по методу наименьших квадратов. Выводы, сделанные по таким эмпирическим зависимостям, могут содержать грубые ошибки.
Альтернативой традиционному подходу на основе метода наименьших квадратов может служить так называемая квантильная, в частном случае медианная регрессия. Главное отличие в вычислительной части заключается в том, что в методе квантильной регрессии минимизируется сумма асимметрично взвешенных абсолютных погрешностей, а в МНК сумма квадратов отклонений. Среди преимуществ метода квантильной регрессии можно выделить следующие наиболее значимые:
1. Квантильная регрессия устойчива к «выбросам», которые встречаются на практике, что позволяет избежать процедуры сглаживания исходных данных и процедуры цензурирования.
2. С помощью метода квантильной регрессии, можно получить не только хорошие аппроксимации характера зависимости (медианная регрессия), но и сделать выводы о размахе колебаний значений показателей.
Коэффициенты квантильной регрессии в-го порядка определяются как решение задачи линейного программирования.
Алгоритм решения задачи нахождения квантильной регрессии реализован в среде Ма1ЬаЬ. Программа представляет собой комплекс средств, предназначенных для решения
задачи построения квантильнои регрессии и многопланового анализа полученн результатов.
Ввод данных. Перед началом работы необходимо сформировать фай^ содержащие начальные данные. Данные формируются в текстовом формате соответствии с определенными правилами, изложенными в шаблонах.
5т
I----;------1
квантильнои peipeccnMUnput.txt
вантильной perpecCHMtoutput txt
Set Quantile Level
Build Quantile Regression
Make a Forecast
Input File For 3 dim Graph пя квантильнои perpeccnnigraph.txt
Three Dimentlal Graph
Рис. 10. Графический интерфейс
Пути к файлам выбираются с помощью соответствующих кнопок в главном окне программы (рис. 10). В качестве начальных данных необходимо указать:
• имя файла, содержащего значения измерений факторов и показателя;
• имя файла, в который будет записываться ответ;
• значения уровня квантиля.
Для использования возможности построения трехмерных графиков дополнительно указывается имя файла, содержащего значения фиксируемых переменных.
Программа вычисляет значения коэффициентов уравнения квантильнои регрессии для введенных данных и значения квантиля. Строятся три уравнения, два для квантильной регрессии со значениями квантиля в и (1-0) (где 9 - входное значение квантиля, в <1/2). Эти два уравнения представляют собой «коридор», в который будут попадать значения наблюдаемого показателя с вероятностью 1 - 20, с помощью чего можно
||енить размах колебаний значений показателя. Третье уравнение - медианная регрессия, |стный случай квантильной регрессии (в = 1 / 2).
I Результаты в виде уравнений квантильных регрессий и медианной регрессии [писываются в текстовый файл, указанный в качестве файла вывода, а также выводятся в экран. В текстовом файле, помимо уравнений, выводится имя файла входных данных. | Для визуализации полученных данных строятся следующие графики:
1. Диаграмму зависимости показателя от номера наблюдения. На этом графике акже указываются значения наблюдений показателя (для всех трех построенных равнений регрессии).
2. Диаграмму зависимости показателя от номера наблюдения, построенной с омощью МНК. Каждая диаграмма выводится в новое окно с заголовком, содержащим орядковый номер построенного графика, название и значение квантиля, для которого
строились зависимости. Такой способ обозначения окон позволяет проводить анализ более эффективно.
3. Трехмерный график зависимости показателя от факторов (для всех трех построенных уравнений регрессии - см. рис. 11. В случае если факторов больше чем два, данный график представляет собой «сечение», то есть фиксируются значения всех
1 факторов кроме двух. Фиксируемые факторы и их значения задаются в файле начальных | данных, используемом для построения трехмерного графика. Фиксировать можно любые \ факторы.
Графики можно сохранять, например, в формате jpeg, для дальнейц использования в отчетах и исследованиях. С помощью программы реализуется фуню построения прогноза. По заданным значениям факторов с помощью файла вход! данных для прогноза строится прогноз для значений показателя, а также npori интервала колебаний показателя. Результаты прогноза записываются в файл вывода, и которого пользователь задает при построении прогноза.
Важно особо подчеркнуть, что в анализе натурных данных целесообраз применять оба метода построения эмпирических зависимостей одновременно, посколь в случае практического совпадения построенных зависимостей степень доверия эмпирической зависимости значительно возрастает. При наличии значимых различ! появляется дополнительная информация для анализа. Чаще всего значительные различг в эмпирических зависимостях, построенных рассмотренными методами, вызван наличием сильных одиночных выбросов, то есть нарушением основных предположени традиционного регрессионного анализа.
Необходимость совместного применения обоих методов обуславливает содержани раздела 6.2 диссертации, где представлено сжатое изложение множественной регрессии, ^ также включено подробное изложение вопросов выбора функциональных зависимостей оценки их статистической значимости и степени адекватности построенные регрессионных моделей. Проверка статистической значимости при условии совместно!" нормальности всех случайных компонент производится на основе применения t- критерия (проверка значимости коэффициентов) и F-критерия (проверка значимости регрессии в целом). Проверка адекватности осуществляется менее формально, необходимо учесть коэффициент детерминации, а также значения получающихся остатков (отклонений наблюдений от построенной зависимости). Приведена практическая реализация построения регрессионных зависимостей средствами Excel.
В разделе 6.3 диссертации предложена методика проверки однородности нескольких выборок, когда наблюдения подчиняются двухпараметрическому экспоненциальному распределению. Распределения, принадлежащие указанному параметрическому семейству, часто применяются в биологических исследованиях, в частности, они используются для моделирования времени жизни биологических объектов. Предположим, что наблюдения имеют следующий вид
■т, - 0,- с,. i = l,...,к, 7 = 1,...,и,., (6.1)
где номер способа обработки (номер выборки), случайные величины ev, i = \,...,k, j = \,...,ni имеют экспоненциальное распределение с плотностью:
—е к х > О
&(•*) = )Л ' тогда, как нетрудно заметить, наблюдения
[о, х<0
I,/ = 1,...Д, } = 1,...,/!,, определяемые моделью наблюдений (6.1), подчиняются вухпараметрическому экспоненциальному распределению с параметром сдвига в, и Ьраметром масштаба Л.
Влияние способа обработки может сказываться только на величине параметра в,. Проверяемая гипотеза имеет вид:
Н0\в{=в1=... = вк, то есть речь идет об однородности выборок, другими 1ловами, об отсутствии влияния способа обработки.
Опишем методику проверки гипотезы #0. Пусть
к
При справедливости гипотезы #0 статистика:
I к
ХЕц,-^,)^-*)
подчиняется распределению Фишера со степенями свободы 2(к-\) и 2(п-1). При нарушении гипотезы Н0 статистика имеет тенденцию возрастать, поэтому против справедливости гипотезы Н0 говорят большие значения статистики следовательно, целесообразно использовать правостороннюю критическую область. Доказательство того, что статистика Р, подчиняется распределению Фишера со степенями свободы 2(к -1) и 2(и-1), основано на специальных свойствах экспоненциального распределения. Методика проверки гипотезы Н0 с использованием статистики заключается в определении квантили :1_а уровня 1 - а распределения Фишера со степенями свободы 2(к -1) и 2(п -1), после чего проверяется выполнение условия Р > г,_0: если неравенство выполнено, то гипотеза Я0 отклоняется на уровне значимости а, если неравенство нарушается, то проверяемая гипотеза принимается.
Заключение
В ходе выполнения диссертации получены следующие результаты:
1. Выбор оптимального момента времени проведения основн агротехнологических операций приобретает особое значение в точном земледел Предложена математическая постановка оптимизационной задачи выбора оптимальж момента времени для проведения агротехнологической операции в услов! стохастической неопределенности, объективно присутствующей в практике применен агротехнологий и обусловленной действием большого числа разнообразных причин, научно-исследовательских учреждениях сельскохозяйственного профиля накошп многолетний экспериментальный материал, содержащий сведения для получен! статистических и экспертных оценок, которые позволяют обоснованно подойти постановке оптимизационной задачи выбора оптимального момента времени проведени основных агротехнологических операций. В диссертации рассмотрены следующи возможные случаи:
1.1. Для известной функции распределения оптимального момента времен! проведения агротехнологической операции аналитически найдено решение сформулированной оптимизационной математической задачи. Полученный результат довольно просто реализуется на практике для наиболее часто применяемы} вероятностных распределений.
1.2. Для неизвестной функции распределения оптимального момента времени проведения агротехнологической операции предложен минимаксный подход, в рамках которого аналитически найдено оптимальное решение, легко реализуемое на практике.
1.3. С целью уменьшения статистической неопределенности, связанной с выбором момента времени проведения агротехнологической операции, рассмотрена ситуация, когда функция распределения оптимального момента времени проведения агротехнологической операции представима в виде конечной смеси непрерывных строго возрастающих функций распределения, соответствующих различным условиям произрастания сельскохозяйственной культуры. Для этого случая также найдено оптимальное решение.
1.4. В рамках рассматриваемой математической постановки решена задача нахождения оценки оптимального момента времени проведения агротехнологической операции по накопленной многолетней статистической информации. Рассмотрен конкретный пример.
2. На основе биометрического подхода к определению биоэквивалентности двух относительно больших участков на сельскохозяйственном поле по урожайности
^<оторой сельскохозяйственной культуры за несколько лет с использованием Иггистического моделирования выборок из нормальных распределений разработан Игоритм оценки, выполнена его программная реализация.
Н 3. Предложен математико-статистический метод выделения относительно Инородных зон на сельскохозяйственном поле по урожайности отдельных небольших ■{астков на поле за один год и разработан адаптивный вероятностный алгоритм решения Ит>й задачи на основе разделения конечной смеси распределений. Создана программа »деления однородных технологических зон по продуктивности, получаемой ■втоматически с помощью зернового комбайна, оснащенного датчиками урожайности, ■ортовым компьютером и системой GPS, получившая свидетельство о государственной Регистрации.
I 4. Предложен новый алгоритм адаптивного прогнозирования временных зядов, в частности характеризующих агрометеорологические условия произрастания сельскохозяйственных культур. Написана программа, которая была успешно апробирована при прогнозировании среднесуточных температур воздуха по данным, собранным на полигоне Агрофизического НИИ.
5. Разработана методология и алгоритмы применения логит и пробит анализов для прогнозирования урожайности сельскохозяйственной культуры на поле по выбранному набору агрометеорологических, агрофизических, агротехнологических и других характеристик. Поставлены вопросы проверки достаточности выбранного набора факторов для решения задачи прогнозирования урожайности культуры. Создана и апробирована соответствующая компьютерная программа.
6. Разработана методология и предложена схема анализа натурных опытных данных на основе применения методов параметрической и непараметрической статистики. Показано, что только комплексный подход к анализу опытных данных в точном земледелии с учетом принципиальной неполноты статистических данных, вызванной ограниченностью объемов выборок и значительной пространственно-временной изменчивостью данных, с обязательным сравнением выводов, полученных по разным методам анализа данных, позволит обеспечить достаточно высокую надежность и достоверность.
7. Выполнена классификация и проведено сопоставление параметрических и непараметрических методов, предназначенных для решения основных задач анализа данных. Предложенный в работе набор статистических методов и методик является в целом достаточным для проведения обоснованного анализа опытных натурных данных.
8. Разработан и создан комплекс программ по непараметрической статистш среде Matlab, включающий как имеющиеся непараметрические процедуры, так процедуры, прежде нереализованные в среде Matlab. Комплекс программ облад удобным и доступным для непрофессионалов интерфейсом и позволяет с единых позт осуществлять анализ опытных данных.
9. Разработан алгоритм и создана программа построения квантильной и, частном случае, медианной регрессий. Программа позволяет строить стандарта; регрессию методом наименьших квадратов и проводить сравнение построенн зависимостей, в результате чего появляется дополнительная информация, позволяюш делать выводы о наличии отдельных «аномальных наблюдений». В работе подроб обсуждается методика построения регрессионных зависимостей в среде Excel и дают( рекомендации по практическому построению регрессионных зависимостей.
СПИСОК ОСНОВНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ
I. Статьи в изданиях, рекомендованных для публикации результате диссертации на соискание ученой степени доктора наук
1. Буре В.М., Седунов Е.В. Несмещенные в метрике L2 процедурь планирования и анализа регрессионных экспериментов// Вестн. ЛГУ. N 13. 1978. с.53-57
2. Буре В.М. Несмещенные процедуры планирования и анализа регрессионны? и авторегрессионных экспериментов// Вестн. ЛГУ. N 7. 1979. с.71-72
3. Буре В.М., Седунов Е.В. К вопросу об использовании интерполяционны) кубатурных формул для вычисления коэффициентов Фурье// Известия Вузов. N8. 1981.с. 63-65.
4. Буре В.М., Кирпичников Б.К. Деградирующий процесс восстановления как модель нарушения экологического равновесия// Обозрение прикладной и промышленной математики. Москва. Т.1. Вып.6. 1994. с.850-859.
5. Буре В.М., Кирпичников Б.К. Интегральное уравнение и предельная теорема в модифицированной модели процесса восстановления// Вестн.С.-Петерб. ун-та. Сер. 1. 1997. Вып.4. с.3-4.
6. Буре В.М., Смолянская Е.А. Конкурентное прогнозирование// Вестн.С.-Петерб. ун-та. Сер. 1. 2000. Вып.1. с.16-20.
7. Якушев В.П., Буре В.М. Методологические подходы к оценке оптимального момента времени проведения агротехнологических мероприятий//Доклады РАСХН. 2001. №4. с.27-30.
8. Буре В.М. Теоретико-игровая модель одной системы массового обслуживания// Вестн.С.-Петерб. ун-та. Сер. 1. 2002. Вып.2. с.3-5.
9. Якушев В. П., Буре В. М. Статистическая оценка распределения оптимального момента времени проведения агротехнического мероприятия //Доклады РАСХН.2002.№ 3. с.11-13.
10. Буре В.М. Об одном обобщении неравенства Селберга// Вестн. С.-Петерб. ун-та. Сер. 10. 2006.Вып.4. с.125-126
11. Якушев В. П., Буре В. М. Оценка биоэквивалентности двух участков на сельскохозяйственном поле//Доклады РАСХН. 2006. № 5. с.38-40.
12. Якушев В. П., Буре В. М., Якушев В. В. Выделение однородных зон на поле по урожайности отдельных участков//Доклады РАСХН. 2007. № 3. с. 33-36.
Î13. Буре В.M. Методологические аспекты статистического анализа в точном еделии //Доклады РАСХН, 2007, №6. с.54-56.
14. Якушев В. П., Буре В. М., Якушев В. В. Методология и инструментарий иза натурных данных в точном земледелии//Доклады РАСХН. 2008. № 6. с.56-59.
15. Якушев В.П., Якушев В.В., Якушева JI.H., Буре В.М. Электронная карта <айности как информационная основа прецизионного внесения удобрений, шеделие» №3,2009.
II. Статьи в других периодических изданиях и в аналитических сборниках.
16. Якушев В.П., Буре В.М., Брунова Т.М. Статистические методы в физике// Агрофизика от А.Ф. Иоффе до наших дней,- СПб.: АФИ, 2002. с. 319-330.
17. Буре В.М., Петрушин А.Ф., Якушев В.В. Автоматизированная система астического выделения однородных технологических зон на сельскохозяйственном
по данным урожайности. Свидетельство о государственной регистрации программы ЭВМ № 2008614663 от 29 сентября 2008 г.
18. Буре В.М., Плахотник C.B. Адаптивные методы прогнозирование [енных рядов в среде Matlab- Труды III Всероссийской научной конференции актирование научных и инженерных приложений в среде Matlab», СПб, изд. С-:рб. ун-та, 2007. с. 1363-1370.
19. Буре В.М., Котина С.О. Нетрадиционные подходы в регрессионном шализе// Процессы управления и устойчивость: Труды 38-й международной научной сонференции. СПб., 9-12 апреля 2007 г. / Под ред. А. В. Платонова, Н. В. Смирнова. — СПб.: С.-Петерб. ун-т, 2007. с. 530-535.
20. Буре В.М. Равновесие в одной модели массового обслуживания// Второй всероссийский симпозиум по прикладной и промышленной математике. Обозрение прикладной и промышленной математике. T.8. Вып.2. Москва. 2001. с.545-546.
21. Буре В.М., Давыдова Е.А. Теоретико-игровая модель системы обслуживания с тремя обслуживающими устройствами// В кн.: Динамические игры и их приложения. Под редакцией J1.A. Петросяна и А.Ю. Гарнаева. Ф-т прикладной математики - процессов управления С.-Петерб. ун-та. ВВМ. 2006. с.37-39.
22. Белоносова И.Ю., Буре В.М. Оптимальное и компромиссное решения в перестраховании // В кн.: Динамические игры и их приложения. Под редакцией JI.A. Петросяна и А.Ю. Гарнаева. Ф-т прикладной математики - процессов управления С.-Петерб. ун-та. ВВМ. 2006. с.27-29.
23. Boure V.M. An equilibrium design in the location problem of detecting facilities// Prooceedings of the 4th St. Petersburg Workshop on Simulation, 2001. P.169-172
24. Буре B.M., Ковригин А.Б., Седунов E.B. Критерии минимаксного типа в несмещенном планировании регрессионных экспериментов// В кн.: Вопросы кибернетики. Нетрадиционные подходы к планированию эксперимента. - Наука. Москва. 1981. с. 6983.
25. Буре В.М., Ковригин А.Б. Оптимальное планирование эксперимента при оценке параметров авторегрессии// В кн.: Вопросы кибернетики. Нетрадиционные подходы к планированию эксперимента. - Наука. Москва. 1981. с. 83-95.
26. Буре В.М., Седунов Е.В. Некоторые частные постановки задач в теории несмещенного планирования регрессионных экспериментов// В кн.: Вопросы кибернетики. Нетрадиционные подходы к планированию эксперимента. - Наука. Москва. 1981. с. 21-45.
27. Буре В.М. Равновесные планы в задаче слежения// Второй всероссийский симпозиум по прикладной и промышленной математике. Обозрение прикладной и промышленной математике. T.8. Вып.1. Москва. 2001. с.116-117.
28. Буре В.М., Кирпичников Б.К. Математические модели деградирующего процесса в экологии// В кн.: Моделирование природных сисгем и задачи оптимального управления. СО РАН, 1993. с.62-64.
29. Буре В.М., Кирпичников Б.К. Об одном интегральном уравненш модифицированной модели процесса восстановления// Вторая всероссийская шк< коллоквиум по стохастическим методам. Москва. 1995. с.30-31.
30. Буре В.М., Кобзева Е.Г. Перестрахование экспоненциального риска// В Процессы управления и устойчивость. Труды XXX научной конференции. СПб. Петерб. ун-т. 1999. с.420-423.
31. Буре В.М. Критерии случайности для временных рядов с конечн множеством допустимых значений// Четвертая всероссийская школа-коллоквиум стохастическим методам. Обозрение прикладной и промышленной математики. Т.4. Bi 3. Москва. 1997. с.333-334.
32. Буре В.М., Власов С.А. Программная реализация логического анагп данных// В кн.: Процессы управления и устойчивость. Труды ХХХШ научн конференции. СПб. С.-Петерб. ун-т. 2002. с. 340-344.
33. Буре В.М., Власов С.А. Логический анализ данных// Третий всероссийск] симпозиум по прикладной и промышленной математике. Обозрение прикладной промышленной математике. Т.9. Вып.2. Москва. 2002. с.345-346.
34. Якушев В.П., Буре В.М. О задаче оптимальной оценки момента време! проведения агротехнических мероприятий// В сб.: Современные проблемы опытного дел Материалы международной научно - практической конференции. - СПб.: АФИ, 200 с.139-140.
35. Якушев В. П., Буре В. М. Задача оценки момента времени проведени агротехнических мероприятий//Петрозаводск. Математические методы в экологш Тезисы докладов Всероссийской научной школы. 2001. с.197-199.
36. Буре В.М., Степанов A.B. Адаптивное краткосрочное прогнозирование -СПб.: МБИ, в кн. Математические методы исследования экономики, 2004. с. 160-169.
37. Якушев В. П., Буре В. М. Методологические аспекты статистическоп исследования. Непараметрическая статистика//В сб.: Современные проблемы опытноп дела: Материалы международной научно-практической конференции. СПб., 2000. с. 179 184.
38. Якушев В. П., Буре В. М. Методологические основы совершенствования количественного описания изменчивости биологических объектов// В кн.: Методическое и экспериментальное обеспечение адаптивно-ландшафтных систем земледелия. ГНУ АФИ Россельхозакадемии. С.-Петербург. 2007. с.16-34.
39. Буре В. М., Абдураманов Р. А. Квантильная регрессия как альтернатива классическому методу наименьших квадратов: Материалы VI международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания (Смирновские чтения)». Т 2. СПб., 2007. с.123-125.
40. Буре В.М., Федорова A.C. Комплекс программ по непараметрической статистике - Труды III Всероссийской научной конференции «Проектирование научных и инженерных приложений в среде Matlab», СПб, изд. С-Петерб. ун-та, 2007. с.100-105.
41. Буре В. М., Тихонова Н. В. Критерии неоднородности экспоненциально распределенных наблюдений: Труды международной научно-практической конференции «Агрофизика XXI века (к 70-летию образования Агрофизического института)». СПб., 2002. с.313-317.
42. Буре В.М. Стохастический спрос и равновесие по Нэшу// Третья всероссийская школа-коллоквиум по стохастическим методам. Москва. 1996. с.40-41.
43. Bure V.M., Malafeyev O.A. Some game-theoretical models of conflict in finance// Nova j. of mathematics, game theory, and algebra. V. 6. #1. 1996. p. 7-14.
44. Bure V.M. Some game-theorethic models of prediction// Пятая международная Петрозаводская конференция «Вероятностные методы в дискретной математике». Обозрение прикладной и промышленной математике. Т. 7. Вып.1. Москва. 2000. с. 164166.
II 45. Буре B.M., Стрюк E.B Кооперативное решение в задаче перестрахования кка// В кн.: Процессы управления и устойчивость. Труды XXXI научной конференции. Иб. С.-Петерб. ун-т. 2000. с. 396-398. I III. Монографии
46. Буре В.М., Кирпичников Б.К. Вероятностные модели продолжительности акционирования сложных систем. - СПб.: Изд. С.-Петерб. ун-та, 1993. -93с. | 47. Якушев В.П., Буре В.М. Статистический анализ опытных данных, епараметрические критерии. - СПб.: АФИ, 2001. - 61с.
48. Якушев В.П., Буре В.М. Подходы к обнаружению статистических висимостей. - СПб.: Изд. С.-Петерб. ун-та, 2003. -64с.
49. Якушев В.П., Буре В.М., Якушев В.В. Построение и анализ эмпирических висимостей. - СПб.: Изд. С.-Петерб. ун-та, 2005. -39с.
50. Буре В.М. Методология статистического анализа опытных данных.-СПб.: зд. С.-Петерб. ун-та, 2007. 141 с.
51. Буре В.М. Комплекс программ по непараметрической статистике в среде iatlab. С.-Петербург: Изд. С.-Петерб. ун-та, 2007. 84 с.
IV Научно-методические издания
52. Буре В.М., Кирпичников Б.К. Конспект-справочник лекций по теории ¡ероятностей и математической статистике,- СПб.. Ф-т прикладной математики-процессов ^правления С.-Петерб. ун-та. 1999. 143 с.
53. Буре В.М., Кирпичников Б.К. Лекции по теории вероятностей и математической статистике,- СПб. МБИ. 2000. 151 с.
54. Буре В. М., Евсеев Е. А. Основы эконометрики. СПб. Изд. С.-Петерб. ун-та, [2004. 72 с.
55. Буре В. М., Евсеев Е. А. Эконометрика: практикум на ПК. СПб., Изд. С.-Петерб. ун-та, 2003. 60 с.
Оглавление автор диссертации — доктора технических наук Буре, Владимир Мансурович
Введение.
Глава 1. Состояние, проблемы и задачи информационного обеспечения точного земледелия.
1.1. Точное земледелие - новый этап в развитии производства растениеводческой продукции.
1.1.1. Предыстория.
1.1.2. Концепция и подсистемы.
1.1.3. Специфика реализации агротехнологических приемов в поле.
1.2. Проблемы внедрения систем точного земледелия в производство.
1.3. Инструментальные средства информационного обеспечения точного земледелия и перспективы их развития.
1.4. Цели и задачи исследований.
Глава 2. Вероятно-статистическое моделирование в задачах оптимизации агротехнологических решений и оценки пространственной неоднородности сельскохозяйственных угодий по урожайности.
2.1. Математическая постановка и решение оптимизационной задачи выбора сроков проведения агротехнологических операций.
2.1.1. Методические основы.
2.1.2. Алгоритм оценки оптимального момента времени проведения технологических операций с известной функцией распределения.
2.1.3. Минимаксный подход в решении оптимизационной задачи.
2.1.4. Выбор оптимального решения в случаях представления функции распределения в виде конечной смеси.
2.1.5. Статистическая оценка функции распределения по имеющимся натурным данным за предыдущие годы.
2.2. Оценка пространственной изменчивости и выделение однородных зон на сельскохозяйственном поле по урожайности.
2.2.1. Методические основы.
2.2.2. Оценка биоэквивалентности двух участков на сельскохозяйственном поле.
2.2.3. Выделение однородных зон на сельскохозяйственном поле по урожайности отдельных участков.
2.3. Информационное обеспечение прецизионного внесения удобрений на основе электронных карт урожайности.
2.3.1. Технологические основы.
2.3.2. Решение задачи.
Глава 3. Адаптивные методы прогнозирования и методология применения бинарной регрессии в анализе продуктивности сельскохозяйственных культур.
3.1. Адаптивное прогнозирование.
3.1.1. Схема построения адаптивных моделей прогнозирования.
3.1.2. Экспоненциальное сглаживание. Метод Брауна.
3.1.3. Методы прогнозирования, использующие модификацию метода Брауна.
3.1.4. Примеры программной реализации адаптивного прогнозирования временных рядов.
3.2. Бинарная регрессия. Логит и пробит анализы.
3.2.1. Логит и пробит модели.
3.2.2. Оценивание моделей.
3.2.3 Программная реализация логит и пробит анализов.
3.2.4. Схема применения логит и пробит анализов в точном земледелии
Глава 4. Экспериментальные исследования и статистические методы обработки и анализа натурных данных в точном земледелии.
4.1. Методические основы организации экспериментальных исследований по изучению и управлению агроэкосистемами.
4.1.1 Прецизионные эксперименты и современные методы точного земледелия в информационном обеспечении агротехнологий.
4.2. Методология статистической обработки и анализа экспериментальных данных.
4.3. Классификация рекомендуемых к применению параметрических и непараметрических процедур в системном анализе экспериментальных данных.
Глава 5. Алгоритмические и программные реализации нёпараметрических методов.
5.1. Непараметрические процедуры проверки статистических гипотез: алгоритмы.
5.1.1. Схема испытаний Бернулли.
5.1.2. Критерий знаков для одной выборки.
5.1.3. Анализ парных повторных наблюдений. Непараметрический критерий знаков.
5.1.4. Анализ парных повторных наблюдений. Непараметрический критерий Уилкоксона.
5.1.5. Непараметрический критерий Уилкоксона.
5.1.6. Непараметрический критерий Манна-Уитни.
5.1.7. Однофакторный дисперсионный анализ.
5.1.8. Двухфакторные таблицы дисперсионного анализа.
5.1.9. Непараметрический критерий однородности двух выборок Колмогорова-Смирнова.
5.1.10. Непараметрический критерий независимости Хефдинга.
5.1.11. Непараметрический критерий двумерной симметрии (Холлендер)
5.1.12. Непараметрический критерий «новое лучше старого» (Холлендер-Прошан).
5.1.13. Непараметрический критерий независимости Кендэла.
5.1.14. Оценка коэффициента Кендэла г . Доверительный интервал для коэффициента г.
5.1.15. Задача о регрессии и угле наклона.
5.1.16. Непараметрический критерий для углового коэффициента Тейла
5.1.17. Непараметрическая оценка Тейла для углового коэффициента линии регрессии.
5.2. Программный комплекс анализа экспериментальных данных с помощью непараметрических критериев.
5.2.1. Интерфейс реализации программного комплекса.
5.2.2. Описание непараметрических инструментов обработки и анализа данных.
Глава 6. Процедуры построения и верификации регрессионных зависимостей.
6.1. Квантильная регрессия.
6.1.1. Постановка задачи квантильной регрессии.
6.1.2. Алгоритм построения оценок.
6.1.3. Программная реализация и графическое представление результатов.
6.1.4. Численные эксперименты.
6.2. Множественная регрессия.
6.2.1. Спецификация модели множественной регрессии.
6.2.2. Множественная линейная регрессия. Оценка параметров.
6.2.3. Статистические свойства оценок. Проверка статистической значимости в множественной линейной регрессии. Надежность выводов.
6.2.4. Доверительные интервалы для оценок параметров. Доверительные интервалы прогноза в множественной линейной регрессии.
6.2.5. Использование множественной регрессии при изучении нелинейных зависимостей.
6.2.6. Практическое построение регрессионных зависимостей средствами Excel.
6.3. Критерий неоднородности экспоненциально распределенных наблюдений.
Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Буре, Владимир Мансурович
С начала 90-х годов XX столетия мир стал свидетелем рождения новой концепции земледелия, известной как точное земледелие. Возникновение точного земледелия обусловлено требованиями рынка и различными социальными факторами, такими как глобализация торговли, охрана окружающей среды, изменения требований со стороны потребителей сельскохозяйственной продукции. Хотя земледелие никогда не может стать точным настолько, насколько этого бы хотелось, концепция точного земледелия отражает концентрированные усилия учёных в направлении количественного совершенствования этой старейшей в мире профессии.
Точное земледелие предполагает использование различных технологий и базируется на новейших достижениях не только традиционных областей агрономической науки, но также и других областей знаний. Оно является новаторским и всеохватывающим подходом к решению проблем зелёной революции, где до сих пор пространственно-временная вариабельность условий внутри сельскохозяйственного поля не учитывалась. При правильном применении, точное земледелие позволяет фундаментально изменить процесс принятия решений и тем самым добиться кардинального повышения эффективности управления агротехническими мероприятиями, уменьшить загрязнение окружающей среды, повысить доходы сельхозпроизводителей и улучшить качество продукции.
Рассуждая о правильности применения новой концепции в производстве растениеводческой продукции прежде всего нужно иметь в виду проблему решения одного из принципиальных вопросов — обоснования целесообразности дифференциации технологических воздействий с учетом пространственно-временного варьирования условий внутри сельскохозяйственного поля. Центральное место в обосновании применения системы точного земледелия занимают вопросы его информационного обеспечения и использования для этих целей современного измерительного оборудования и новых информационных технологий.
Ключевое место в информационном обеспечении точного земледелия играет анализ натурных данных. Натурные данные включают как опытные наблюдения, получаемые в результате проведения «активных» экспериментов, так и результаты «пассивных» наблюдений за динамикой интересующих исследователя агробиологических показателей. Для биологических исследований характерна высокая степень изменчивости изучаемых показателей, вызванная сложной природой биологических объектов. Как следствие этой изменчивости в биологических исследованиях появляются вероятностные распределения, причем даже в лабораторных экспериментах изменчивость не может быть в принципе устранена. Одна из главных причин подобного явления заключается в наличии латентных факторов, оказывающих воздействие на изучаемые показатели. Присутствие латентных факторов принципиально неустранимо при проведении натурных экспериментов. Возникающая по этой причине неопределенность обычно моделируется введением в рассмотрение идеи случайности, как математической основы для удобного описания непредсказуемой изменчивости числовых характеристик биологических объектов. В соответствии с этой идеей, результат определяется некоторым случайным событием, иначе говоря, природа словно бы бросает «кости», для осуществления окончательного выбора. Вопрос о том, существует ли случайность в природе, носит дискуссионный философский характер. Хорошо известно, что в квантовой механике и статистической физике идея случайности и основанные на ней вероятностно - статистические модели нашли широкое применение. В биологической науке со времен Фишера значимость статистических методов не подвергается сомнению. Напротив, в настоящее время в ведущих мировых издательствах и в научных центрах издаются десятки научных журналов, посвященных совершенствованию статистических методов и методик анализа данных. Достаточно упомянуть журналы по прикладной статистике издательства Springer
1. ADAS Advances in Data Analysis and'Classiflcation
2. AstA Advances in Statistical Analysis
3. Chance: New Directions for Statistics and Computing
4. Annals of the institute of Statistical Mathematics
5. Computational Statistics
6. Enviromental and Ecological Statistics
7. Decisions in Econometrics and Finance
Большое количество статей в этих и во многих других журналах содержат исследования по методам и моделям статистического анализа биологических данных. Некоторые международные научные журналы целиком посвящены применению статистических методов в биологии, упомянем для примера журналы: Biometrika (Publisher: Oxford journal), Biometrics (Publisher: Ajournai of the International Biometrie Society).
Все сказанное свидетельствует, во-первых, об интенсивном развитии статистической науки в последние десятилетия, интерес к которой все более усиливается в связи с развитием вычислительной техники, совершенствованием математического обеспечения современных компьютеров и, самое главное, со значительным расширением информационной базы статистических исследований. Расширение информационной базы связано как с развитием инструментальной базы экспериментальных исследований, так и с развитием геоинформационных систем, с широким исследованием пространственно - временной изменчивости изучаемых объектов и процессов в точном земледелии. Во-вторых, математическое моделирование реальных биологических процессов не может игнорировать высокую изменчивость изучаемых характеристик, вследствие чего наиболее естественной и адекватной методологией математического моделирования в биологии в целом служит методология вероятностно-статистического моделирования.
В этой связи, проведенные исследования и представленные в этой работе результаты были направлены на повышение уровня информационного обеспечения процесса выработки управленческих решений в точном земледелии. Диссертация выполнялась в рамках проводимых Агрофизическим институтом исследований по базовым научно-техническим программам «Разработать теорию и методы управления продукционным процессом сельскохозяйственных культур в адаптивно-ландшафтном земледелии» (2001-2005 г.г.) и «Разработать методы и приемы управления продукционным процессом в условиях пространственно-временной неоднородности среды обитания растений с целью повышения адаптивности агротехнологий к условиям окружающей среды и обеспечения высокой продуктивности агроценозов» (2006-2008 г.г.), в ходе выполнения научно-исследовательских работ по двум государственным контрактам с МСХ РФ в части информационно-технологического сопровождения процесса реализации ФЦП «Сохранение и восстановление плодородия почв земель сельскохозяйственного назначения как национального достояния России на 2006-2010 г.г.», а также в соответствии с распоряжением Минпромнауки России № 04.900.43/078 от 15.04.2003 г. по созданию программно-аппаратного комплекса «Компьютерная система генерации и реализации технологических решений в точном земледелии» осуществлялась информационная поддержка проводимых работ.
Цель выполненных исследований заключалась в разработке методологии и программного инструментария по расширению информационной базы управленческих решений. Идея достижения цели основана на построении вероятностно-статистических моделей поддержки принятия решений в точном земледелии, на применении к анализу натурных данных разных методов прикладной статистики, позволяющих проводить сравнительную оценку полученных выводов, что должно способствовать повышению их надежности и достоверности.
Для достижения указанной цели необходимо было в диссертации:
- разработать концепцию совершенствования информационного обеспечения точного земледелия;
- сформулировать ряд задач, актуальных для точного земледелия, предложить их решение на основе вероятностно-статистического моделирования в условиях стохастической неопределенности и изменчивости;
- разработать методологию статистического анализа натурных данных в точном земледелии, включающую многочисленные непараметрические процедуры, различные методы и модели анализа данных в рамках параметрической и непараметрической статистик, а также вопросы анализа надежности и достоверности полученных результатов;
- создать соответствующее программное обеспечение.
Основные результаты выполненных исследований изложены в шести главах диссертации. В первой главе дан краткий исторический анализ развития систем земледелия в России. Определены понятия, рассмотрены концепция и подсистемы точного земледелия. Отмечено, что точное земледелие может рассматриваться, как новый этап в развитии производства растениеводческой продукции на базе достижений научно-технического прогресса. Показано, что эффективность внедрения точного земледелия в значительной степени зависит от качества его информационного обеспечения. Приведена разработанная нами концептуальная схема совершенствования информационного обеспечения точного земледелия и сформулированы актуальные задачи исследований, результаты которых изложены в последующих главах диссертации.
Полученные в ходе выполнения работы результаты исследований были рассмотрены и одобрены на заседании Ученого Совета Агрофизического института в феврале 2009 года, а также докладывались и обсуждались на следующих международных и всероссийских научных и научно-технических форумах: на II всероссийской школе-коллоквиум по стохастическим методам (Москва, 1995 г.); на III всероссийской школе-коллоквиум по стохастическим методам (Москва, 1996 г.); на IV всероссийской школе-коллоквиум по стохастическим методам (Москва, 1997 г.); на XXX международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 1999 г.); на I всероссийском симпозиуме по прикладной и промышленной математике (Москва, 2000 г.); на V международной конференции «Вероятностные методы в дискретной математике» (Петрозаводск, 2000 г.); на международной научно-практической конференции «Современные проблемы опытного дела» (Санкт-Петербург, АФИ, 2000 г.); на XXXI международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 2000 г.); на 4 St.Petersburg Workshop on Simulation (St. Petersburg, 2001); на всероссийской научной школе «Математические методы в экологии» (Петрозаводск, 2001 г.); на II всероссийском симпозиуме по прикладной и промышленной математике (Москва, 2001 г.); на международной научно-практической конференции «Агрофизика XXI века (к 70-летию образования Агрофизического института)» (Санкт-Петербург, АФИ, 2002 г.); на XXXIII международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 2002 г.); на III всероссийском симпозиуме по прикладной и промышленной математике (Москва, 2002 г.); на III всероссийской научной конференции «Проектирование научных и инженерных приложений в среде «Matlab» (Санкт-Петербург, 2007 г.); на международной конференции «Современная агрофизика - высоким технологиям (к 75-летию образования Агрофизического института)» ( Санкт-Петербург, АФИ, 2007 г.); на XXXVIII международной научной конференции «Процессы управления и устойчивость» (Санкт-Петербург, 2007 г.); на VI международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания (Смирновские чтения)» (Санкт-Петербург, 2007 г.).
Разработанные программные средства апробированы на Меньковской опытной станции в Гатчинском районе Ленинградской области и входили в состав программно-аппаратного комплекса, демонстрируемого
Агрофизическим институтом на трех международных специализированных выставках «Агрорусь» (Санкт-Петербург, 2004, 2007 гг.) и «Золотая осень» (Москва, 2008 г.), где были получены соответственно серебряная, золотая и серебряная медали (Приложения 1-3).
Заключение диссертация на тему "Методология и программно-математический инструментарий информационного обеспечения точного земледелия"
Заключение.
Необходимость адаптации земледелия к новым социально-экономическим условиям в России, повышение его устойчивости, ресурсо-обоснованной интенсификации и экологизации на фоне наблюдаемых глобальных изменений климата во многом определяется состоянием информационного обеспечения. Качество и оперативность информационного обеспечения систем земледелия в значительной степени зависит от возможности применения современного измерительного оборудования и новых информационных технологий.
Успех в решении этой задачи связан с разработкой новых методов и созданием отечественных технических, алгоритмических и программных средств по информационному обеспечению точного земледелия, которое выдвигает на первый план научно-обоснованную технологию решения злободневных задач сельскохозяйственного землепользования поддержание экологической устойчивости агроландшафтов, эффективное использование материальных ресурсов конкретного хозяйства, используемых для получения продукции заданного качества. К настоящему времени в России уже создан определенный физико-технический базис точного земледелия и начаты полевые исследования для отработки методических, технических, информационных и других аспектов, обеспечивающих потенциальную возможность внедрения точного земледелия повсеместно.
Вместе с тем развитие точного земледелия неизменно порождает увеличение информационного потока и поэтому возникла необходимость в разработке методологии и создании соответствующего инструментария по обработке, анализу добываемых данных и их использованию в задачах оптимизации агротехнологических решений и оценки пространственной изменчивости продуктивности сельскохозяйственных угодий.
Проведенные исследования вносят значительный вклад в проблематику совершенствования информационного обеспечения точного земледелия. В ходе выполнения диссертации получены следующие результаты:
1. Выбор оптимального момента времени проведения основных агротехнологических операций приобретает особое значение в точном земледелии. Предложена математическая постановка оптимизационной задачи выбора оптимального момента времени для проведения агротехнологической операции в условиях стохастической неопределенности, объективно присутствующей в практике применения агротехнологий и обусловленной действием большого числа разнообразных причин. В научно-исследовательских учреждениях сельскохозяйственного профиля накоплен многолетний экспериментальный материал, содержащий сведения для получения статистических и экспертных оценок, которые позволяют обоснованно подойти к постановке оптимизационной задачи выбора оптимального момента времени проведения основных агротехнологических операций. В диссертации рассмотрены следующие возможные случаи:
1.1. Для известной функции распределения оптимального момента времени проведения агротехнологической операции аналитически найдено решение сформулированной оптимизационной математической задачи. Полученный результат довольно просто реализуется на практике для наиболее часто применяемых вероятностных распределений.
1.2. Для неизвестной функции распределения оптимального момента времени проведения агротехнологической операции предложен минимаксный подход, в рамках которого аналитически найдено оптимальное решение, легко реализуемое на практике.
1.3. С целью уменьшения статистической неопределенности, связанной с выбором момента времени проведения агротехнологической операции, рассмотрена ситуация, когда функция распределения оптимального момента времени проведения агротехнологической операции представима в виде конечной смеси непрерывных строго возрастающих функций распределения, соответствующих различным условиям произрастания сельскохозяйственной культуры. Для этого случая также найдено оптимальное решение.
1.4. В рамках рассматриваемой математической постановки решена задача нахождения оценки оптимального момента времени проведения агротехнологической операции, по накопленной многолетней статистической информации. Рассмотрен конкретный пример.
2. На основе биометрического подхода к определению биоэквивалентности двух относительно больших участков на сельскохозяйственном поле по урожайности некоторой сельскохозяйственной культуры за несколько лет, и используя идею статистического моделирования выборок из нормальных распределений разработан алгоритм оценки, выполнена его программная реализация.
3. Предложен математико-статистический метод выделения относительно однородных зон на сельскохозяйственном поле по урожайности отдельных небольших участков на поле за один год и разработан адаптивный вероятностный алгоритм решения этой задачи на основе разделения конечной смеси распределений. Создана программа выделения однородных технологических зон по продуктивности получаемой автоматически с помощью зернового комбайна, оснащенного датчиками урожайности, бортовым компьютером и системой GPS, получившая свидетельство о государственной регистрации.
4. Предложен новый алгоритм адаптивного прогнозирования временных рядов, в частности характеризующих агрометеорологические условия произрастания сельскохозяйственных культур. Написана программа, которая была успешно апробирована при прогнозировании среднесуточных температур воздуха по данным, собранным на полигоне Агрофизического НИИ.
5. Разработана методология и алгоритмы применения логит и пробит анализов для прогнозирования урожайности сельскохозяйственной культуры на поле по выбранному набору агрометеорологических, агрофизических, агротехнологических и других характеристик. Поставлены вопросы проверки достаточности выбранного набора факторов для решения задачи прогнозирования урожайности культуры. Создана и апробирована соответствующая компьютерная программа.
6. Разработана методология и предложена схема анализа натурных опытных данных на основе применения методов параметрической и непараметрической статистики. Показано, что только комплексный подход к анализу опытных данных в точном земледелии с учетом принципиальной неполноты статистических данных, вызванной ограниченностью объемов выборок и значительной пространственно-временной изменчивостью данных, с обязательным сравнением выводов, полученных по разным методам анализа данных, позволит обеспечить достаточно высокую надежность и достоверность.
7. Выполнена классификация и проведено сопоставление параметрических и непараметрических методов, предназначенных для решения основных задач анализа данных. Предложенный в работе набор статистических методов и методик является в целом достаточным для проведения обоснованного анализа опытных натурных данных.
8. Разработан и создан комплекс программ по непараметрической статистике в среде Ма^аЬ, включающий как имеющиеся непараметрические процедуры, так и процедуры прежде нереализованные в среде Ма^аЬ. Комплекс программ обладает удобным и доступным для непрофессионалов интерфейсом и позволяет с единых позиций осуществлять анализ опытных данных.
9. Разработан алгоритм и создана программа построения квантильной и, в частном случае, медианной регрессий. Программа позволяет строить стандартную регрессию методом наименьших квадратов и проводить сравнение построенных зависимостей, в результате чего появляется дополнительная информация, позволяющая делать выводы о наличии отдельных «аномальных наблюдений». В работе подробно обсуждается методика построения регрессионных зависимостей в среде Excel и даются рекомендации по практическому построению регрессионных зависимостей.
Библиография Буре, Владимир Мансурович, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Кирюшин В.И., Иванов A.J1. и др. Агроэкологическая оценка земель, проектирование адаптивно-ландшафтных систем земледелия и агротехнологий. Методическое руководство. М.: ФГНУ «Росинформагротех», 2005. 784 с.
2. Якушев В.П., Семенов В.А. и др. Адаптивно-ландшафтные системы земледелия для Северо-Западного региона Российской Федерации (концептуальные основы и методологические аспекты формирования). -СПб., АФИ, 2004, 28с.
3. Болотов А.Т. Избранные сочинения по агрономии, плодоводству, лесоводству, ботанике. М.: Сельхозгиз, 1952.
4. Докучаев В.В. Избранные сочинения. М.: 1948, Т.1.
5. Костычев П.А. Почвоведение. М.: 1940.
6. Вильяме В.Р. Значения органических веществ почвы: избранные сочинения. М.: 1948.
7. Бондаренко Н.Ф. и др. Моделирование продуктивности агроэкосистем. Д.: Гидрометеоиздат, 1982, 264с.
8. Глогов JI.B. Кибернетическая система управления урожайностью сельскохозяйственных культур сущность и структура. - В кн.: «Использование методологии системного анализа управления агроэкосистемами», АФИ, 1987, с. 15-21
9. Жуковский Е.Е., Чудновский А.Ф. Методы оптимального использования метеорологической информации при принятии решений. Л.: Гидрометеоиздат, 1978, 52с.
10. Нерпин C.B., Чудновский А.Ф.Энерго- и массообмен в системе растение почва - воздух. - Л: Гидрометеоиздат, 358 с.
11. Полуэктов P.A. Динамические модели агроэкосистем. -Л.:Гидрометеоиздат, 1991,312с.
12. Полуэктов Р.А., Смоляр Э.И., Терлеев В.В., Топаж А.Г., Моделирование продукционного процесса сельскохозяйственных культут.-СПб.: Изд-во С-.Петерб. ун-та.-396 с.
13. Пых Ю.А. Равновесие и устойчивость в моделях популяционной динамики. М.: Наука, 1983
14. Сиротенко О.Д. Математическое моделирование водно-теплового режима и продуктивность агроэкосистем. Л.: Гидрометеоиздат, 1981, 167с.
15. Тооминг Х.Г. Солнечная радиация и формирование урожая. Л.: Гидрометеоиздат, 1977, 200с.
16. Шатилов И.С. Принципы программирования урожаев -Вестник сельскохозяйственных наук, 1973, №3, с.8-14
17. Шатилов И.С., Чудновский А.Ф. Агрофизические, агрометеорологические и агротехнические основы программирования урожаев. Л., Гидрометеоиздат, 1980, 320с.
18. Blackmore B.S. and Larscheid G. Strategies for Managing Variability. Proc. First European Conf. on Prec. Agric. Ed. J.V.Stafford. Silsoe Res. Inst., UK, 1992, p.851-859.
19. Якушев В.П., Якушев B.B. Информационное обеспечение точного земледелия. СПб.: Изд-во ПИЯФ РАН, 2007. 384 с.
20. Якушев B.B. Программно-технические средства информационного обеспечения и реализации агроприемов в системе точного земледелия. Автореферат диссертации. СПб.: АФИ, 2005.
21. Якушев В.П., Михайленко И.М., Петрушин А.Ф., Якушев В.В. Программно-аппаратный комплекс поддержки принятия технологических решений в точном земледелии. Материалы междун. конф. «Агроинфо-2003», Новосибирск, 2003, ч.1, с.16-23
22. Якушев В.П., Петрушин А.Ф., Якушев В.В. и др. Научно-практические аспекты точного земледелия. Материалы междунар. конф. «Современные проблемы социально-экономического развития и информационные технологии. — Азербайджан, Баку, 2004, с.55-62
23. Якушев В.П., Полуэктов и др. Точное земледелие: состояние исследований и задачи агрофизики. В кн. «Агрофизические и экологические проблемы сельского хозяйства в 21 веке». СПб., SPBISTRO, 2002, т.З, с.26-73
24. Якушев В.П.,Полуэктов P.A. и др. Точное земледелие (аналитический обзор). Агрохимический вестник:№5, 2001, с.28-34; №1, 2002, с.34-39; №2, 2002, с.36-39; №3, 2002, с.36-40
25. Merrit S.J., Meyer G.E., Von Bargen К. and Mortenson D.A. Reflectance Sensor and Control System for Spot Spraying. Presented at the ASAE Summer meeting, American Society of Agricultural Engineers, 1994, Paper#94-1057
26. Дринча В.М. Перспективные направления агроинженерных исследований для непрерывного устойчивого ведения сельского хозяйства. -М., ВИМ, 2004, 80с.
27. Личман Г.И., Марченко Н.М., Дринча В.М. Основные принципы и перспективы применения точного земледелия. М., Россельхозакадемия,2004, 80с.
28. Михайленко И.М. Управление системами точного земледелия. СПб.: Изд-во С.-Петерб. ун-та, 2005. 234 с.
29. Якушев В.П. На пути к точному земледелию. СПб.: Издательство ПИЯФ РАН, 2002, 458 с.
30. Петрушин А.Ф. Комплекс программ формирования и обработки баз данных и знаний в агрономии. Автореферат диссертации. СПб.: АФИ,2005.
31. Полуэктов P.A. и др. Модели продукционного процесса сельскохозяйственных культур. СПб.: Изд-во С.-Петерб. ун-та, 2006. 396 с.
32. Полуэктов P.A. Использование динамических моделей в информационных технологиях точного земледелия. Материалы междунар. конф. «Современные проблемы социально-экономического развития и информацирнные технологии».- Азербайджан, Баку, 2004, с.34-40
33. Михайленко И.М., Молодкин В.Ю. Повышение эффективности производства молока на примере АПК Ленинградской области. Вестник РАСХН, 2005, № 2. С. 80-82.
34. Михайленко И.М., Полуэктов P.A., Якушев В.П. Агромониторинг: структура, функции, реализация. Доклады РАСХН, 2004, №3. с. 66-68.
35. Михайленко И.М., Родин А.И. Экспериментальный мониторинг кормовых культур в 2003 году. Информационно-аналитический бюллетень комитета по АПК Ленингр. обл., 2003, №24-25, с. 11-28
36. Насонов Д.В. Компьютерная система оценки климатической продуктивности агродандшафтов. Автореферат диссертации. СПБ.: АФИ, 2006.
37. Якушев В.П. 70 лет на службе аграрной науке и сельскохозяйственному производству. В кн. «Агрофизика от А.Ф.Иоффе до наших дней», СПб, АФИ, 2002, с. 10-25
38. Якушев В.П., Буре В.М., Брунова Т.М. Статистические методы в агрофизике// Агрофизика от А.Ф. Иоффе до наших дней.- СПб.: АФИ, 2002. с. 319-330.
39. Жуковский Е.Е., Мандельштам С.М., Киселева Т.Л. Статистический анализ случайных процессов в применении к агрофизике и агрометрии. Л. Гидрометеоиздат. 1976.
40. Якушев В.П., Буре В.М., Якушев В.В. Методология и инструментарий анализа натурных данных в точном земледелии. Доклады РАСХН, 2008, №6. с. 56-59.
41. Буре В.М. Комплекс программ по непараметрической статистике в среде Matlab. С.-Петербург: Изд. С.-Петерб. ун-та, 2007. 84 с.
42. Буре В.М., Кумачева С.Ш Модель аудита с использованием статистической информации о доходах налогоплательщиков// Вестн. С.-Петерб. ун-та. Сер. 10. 2005.Вып.2. с. 140-145
43. Буре В.М. Теоретико-игровая модель одной системы массового обслуживания// Вестн.С.-Петерб. ун-та. Сер. 1. 2002. Вып.2. с.3-5.
44. Буре В.М., Смолянская Е.А. Конкурентное прогнозирование// Вестн.С.-Петерб. ун-та. Сер. 1. 2000. Вып.1. с. 16-20.
45. Буре В.М., Малафеев O.A. Согласованная стратегия в повторяющихся конечных играх п лиц// Вестн.С.-Петерб. ун-та. Сер. 1. 1995. Вып. 1. с.120-122.
46. Буре В.М. Стохастический спрос и равновесие по Нэшу// Третья всероссийская школа-коллоквиум по стохастическим методам. Москва. 1996. с. 40-41.
47. Bure V.M., Malafeyev O.A. Some game-theoretical models of conflict in finance// Nova j. of mathematics, game theory, and algebra. V. 6. #1. 1996. p. 7-14.
48. Bure V.M. Some game-theorethic models of prediction// Пятая международная Петрозаводская конференция «Вероятностные методы в дискретной математике». Обозрение прикладной и промышленной математике. Т.7. Вып.1. Москва. 2000. с. 164-166.
49. Буре В.М., Стрюк Е.В Кооперативное решение в задаче перестрахования риска// В кн.: Процессы управления и устойчивость. Труды XXXI научной конференции. СПб. С.-Петерб. ун-т. 2000. с. 396-398.
50. Буре В.М. Равновесие в одной модели массового обслуживания// Второй всероссийский симпозиум по прикладной и промышленной математике. Обозрение прикладной и промышленной математике. Т.8. Вып.2. Москва. 2001. с. 545-546.
51. Boure V.M. An equilibrium design in the location problem of detecting facilities// Prooceedings of the 4th St. Petersburg Workshop on Simulation, 2001. P.169-172
52. Буре B.M., Седунов Е.В. Несмещенные в метрике L2 процедуры планирования и анализа регрессионных экспериментов// Вестн. ЛГУ. N 13. 1978. с.53-57
53. Буре В.М. Несмещенные процедуры планирования и анализа регрессионных и авторегрессионных экспериментов// Вестн. ЛГУ. N 7. 1979. с.71-72
54. Буре В.М., Ковригин А.Б., Седунов Е.В. Критерии минимаксного типа в несмещенном планировании регрессионных экспериментов// В кн.: Вопросы кибернетики. Нетрадиционные подходы к планированию эксперимента. Наука. Москва. 1981. с. 69-83.
55. Буре В.М., Ковригин А.Б. Оптимальное планирование эксперимента при оценке параметров авторегрессии// В кн.: Вопросы кибернетики. Нетрадиционные подходы к планированию эксперимента. -Наука. Москва. 1981. с. 83-95.
56. Буре В.М., Седунов Е.В. Некоторые частные постановки задач в теории несмещенного планирования регрессионных экспериментов// В кн.: Вопросы кибернетики. Нетрадиционные подходы к планированию эксперимента. Наука. Москва. 1981. с. 21-45.
57. Буре В.М. Равновесные планы в задаче слежения// Второй всероссийский симпозиум по прикладной и промышленной математике. Обозрение прикладной и промышленной математике. Т.8. Вып.1. Москва. 2001. с. 116-117.
58. Буре В.М., Кирпичников Б.К. Интегральное уравнение и предельная теорема в модифицированной модели процесса восстановления// Вестн.С.-Петерб. ун-та. Сер. 1. 1997. Вып.4. с.3-4.
59. Буре В.М., Кирпичников Б.К. Математические модели деградирующего процесса в экологии// В кн.: Моделирование природных систем и задачи оптимального управления. СО РАН, 1993. с. 62-64.
60. Буре В.М., Кирпичников Б.К. Вероятностные модели продолжительности функционирования сложных систем. СПб.: Изд. С.-Петерб. ун-та, 1993. - 93с.
61. Буре В.М., Кирпичников Б.К. Деградирующий процесс восстановления как модель нарушения экологического равновесия//
62. Обозрение прикладной и промышленной математики. Москва. Т.1. Вып.6. 1994. с. 850-859.
63. Буре В.М., Кирпичников Б.К. Об одном интегральном уравнении в модифицированной модели процесса восстановления// Вторая всероссийская школа-коллоквиум по стохастическим методам. Москва. 1995. с. 30-31.
64. Буре В.М., Кирпичников Б.К. Конспект-справочник лекций по теории вероятностей и математической статистике.- СПб. Ф-т прикладной математики-процессов управления С.-Петерб. ун-та. 1999. 143 с.
65. Буре В.М., Кирпичников Б.К. Лекции по теории вероятностей и математической статистике.-СПб. МБИ. 2000. 151 с.
66. Буре В.М. Об одном обобщении неравенства Селберга// Вестн. С.-Петерб. ун-та. Сер. 10. 2006.Вып.4. с. 125-126
67. Буре В.М., Седунов Е.В. К вопросу об использовании интерполяционных кубатурных формул для вычисления коэффициентов Фурье// Известия Вузов. N8. 198I.e. 63-65.
68. Буре В.М., Кобзева Е.Г. Перестрахование экспоненциального риска// В кн.: Процессы управления и устойчивость. Труды XXX научной конференции. СПб. С.-Петерб. ун-т. 1999. с. 420-423.
69. Буре В.М. Критерии случайности для временных рядов с конечным множеством допустимых значений// Четвертая всероссийская школа-коллоквиум по стохастическим методам. Обозрение прикладной и промышленной математики. Т.4. Вып. 3. Москва. 1997. с. 333-334.
70. Буре В.М., Власов С.А. Программная реализация логического анализа данных// В кн.: Процессы управления и устойчивость. Труды ХХХШ научной конференции. СПб. С.-Петерб. ун-т. 2002. с. 340-344.
71. Буре В.М., Власов С.А. Логический анализ данных// Третий всероссийский симпозиум по прикладной и промышленной математике. Обозрение прикладной и промышленной математике. Т.9. Вып.2. Москва. 2002. с. 345-346.
72. Буре В. М., Евсеев Е. А. Основы эконометрики. СПб., 2004. 72 с.
73. Буре В. М., Евсеев Е. А. Эконометрика: практикум на ПК. СПб., 2003. 60 с.
74. Якушев В.П., Буре В.М. Методологические подходы к оценке оптимального момента времени проведения агротехнологических мероприятий//Доклады РАСХН. 2001. № 4. с. 27-30.
75. Якушев В. П., Буре В. М. Статистическая оценка распределения оптимального момента времени проведения агротехнического мероприятия //Доклады РАСХН. 2002. № 3. с. 11 -13.
76. Буре В.М. Задача выбора момента времени// Первый всероссийский симпозиум по прикладной и промышленной математике. Обозрение прикладной и промышленной математике. Т.7. Вып.2. Москва. 2000. с. 324-325.
77. Якушев В.П., Буре В.М. О задаче оптимальной оценки момента времени проведения агротехнических мероприятий// В сб.: Современные проблемы опытного дела. Материалы международной научно практической конференции. - СПб.: АФИ, 2000. с. 139-140.
78. Якушев В. П., Буре В. М. Задача оценки момента времени проведения агротехнических мероприятий//Петрозаводск. Математические методы в экологии: Тезисы докладов Всероссийской научной школы. 2001. с. 197-199.
79. Якушев В. П., Буре В. М. Оценка биоэквивалентности двух участков на сельскохозяйственном поле//Доклады РАСХН. 2006. № 5. с.38-40.
80. Якушев В. П., Буре В. М., Якушев В. В. Выделение однородных зон на поле по урожайности отдельных участков//Доклады РАСХН. 2007. № 3. с.33-36.
81. Якушев В.П., Якушев В.В., Якушева JI.H., Буре В.М. Электронная карта урожайности как информационная основа прецизионного внесения удобрений. «Земледелие» №3, 2009.
82. Bouma, J., J.Stoorvogel, В.А. van Alphen, and H.W.G.Boolting. Pedology, Precision Agriculture, and Changing Paradigm of Agricultural Research. Soil Sci. Soc. Am. J. 63, 1763-1768, 1999.
83. Полуэктов P. А. и др. Модели продукционного процесса сельскохозяйственных культур. СПб.: Изд-во С.-Петерб. ун-та, 2006. 396 с.
84. Birrrell S.J., Sudduth К.А. and Borgelt S.C. Crop Yield and Soil Nutrient Mapping. ASAE Paper No.931556, 1993, Am. Soc. of Agricultural Engineers, St. Joseph, MI.
85. Shall, R. Assessment of individual and population bioequivalence using the probability that bioavailabilities are similar. Biometrics 51, 615-626,1995
86. Westlake, W.J. Symmetric confidence intervals for bioequivalence trails. Biometrics 32, 741-744, 1976.
87. Боровков А.А. Теория вероятностей. M.: Наука, 1986. 432 с.
88. Айвазян С.А. и др. Прикладная статистика. Классификация и снижение размерности. (Справочное издание) М.: Финансы и статистика, 1989. 607 с.
89. Ancha Srinivasan, PhD (Ed.) "Handbook of Precision Agriculture: Principles and Applications". Food Product Press. 2006, 656 p.
90. Небольсин А.Н. и др. Научно-методические основы оптимизации доз удобрений под основные сельскохозяйственные культуры по агрономическим, экономическим и экологическим параметрам. СПб., ЛНИИСХ, 2003.
91. Интегрированное применение удобрений в адаптивно-ландшафтном земледелии в Нечерноземной зоне Европейской части России (Практическое руководство). М.: ВНИИА, 2005. 160с.
92. Методика отбора почвенных проб по элементарным участкам поля в целях дифференцированного применения удобрений. М.: ВРЕИИА, 2007.-36с.
93. Буре В.М., Плахотник С. Адаптивные методы прогнозирование временных рядов в среде Matlab- Труды III Всероссийской научной конференции «Проектирование научных и инженерных приложений в среде Matlab», СПб, изд. С-Петерб. ун-та, 2007. с. 1363-1370.
94. Буре В.М., Степанов A.B. Адаптивное краткосрочное прогнозирование СПб.: МБИ, в кн. Математические методы исследования экономики, 2004. с. 160-169.
95. Буре В.М. Методологические аспекты статистического анализа в точном земледелии //Доклады РАСХН, 2007, №6. с. 54-56.
96. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования.-М.: Статистика, 1979
97. Каштанов А. Н., Ермаков Е. И., Якушев В. П. Биологические и агрофизические основы моделирования экологически адаптивных почвенно-растительных систем в агроландшафтном земледелии. Доклады РАСХН, 1999. №3
98. Вернадский В. И. К вопросу о химическом составе почв. М.: Изд-во АН СССР, 1960
99. Ермаков Е. И. Регулируемая агроэкосистема в агрофизике и растениеводстве. В кн.: «Агрофизика от А. Ф. Иоффе до наших дней», АФИ, СПб, 2002
100. Ермаков Е. И. Агрофизические основы экологической гармонизации регулируемой агроэкосистемы. Материалы научной сессии (27-29 октября 1977 года, АФИ), СПб, 1998
101. Ермаков Е. И. Интенсивное растениеводство в техногенных регулируемых агроэкосистемах. Вестник РАСХН, №5, 1999
102. Доспехов Б. А. Методики полевого опыта. — М.: Агропромиздат,1985
103. Ермаков С. М. Математическая теория планирования экспериментов. -М.: Наука, 1983
104. Бюллетень сети опытов с удобрениями. Выпуск 1. -М.: ВНИИА, 2006.-48с.
105. Семенов В.А. Полевой опыт в аграрной науке (новая концепция). -М.: РАСХН, 2004.-32с.
106. Семенов В.А., Ильвес A.JI. Региональная система экспериментов. В кн.: Методическое и экспериментальное обеспечение AJIC3. -СПб.: Изд-во ПИЯФ, 2007, с. 5-15
107. Семенов В.А. Большой балансовый опыт. СПб.: АФИ, 2004.-25с.
108. Шатилов И. С., Бондаренко Н. Ф., Жуковский Е. Е., Каюмов М. К., Нерпин С. В., Полуэктов Р. А. Схема организации научных исследований по программированию урожая. Доклады ВАСХНИЛ, №2, 1976
109. Полуэктов Р. А., Смоляр Э. И., Якушев В. П. Концепция опытного дела и развитие современных методов исследований в агрономии и агрофизике. Вестник РАСХН, 1999. №2117. Отчет АФИ за 2006г.118. Отчет АФИ за 2007г.119. Отчет АФИ за 2008г.
110. Sims D.A., Gamon J.A. Relationships between leaf pigment content and spectral reflectance across a wide range of species, leaf structures and developmental stages // Remote Sensing of Environment. 2002. v. 81 (2-3). P. 337354.
111. Penuelas J., Barret F., Fitella I. Semi-empirical indices to assess carotenoids/chlorophyll a ratio from leaf spectral reflectance. Photosynthetica. 1995. v. 31(2). p. 221-230.
112. Канаш E.B., Осипов Ю.А. Диагностика физиологического состояния и устойчивости растений к действию стрессовых факторов среды (на примере УФ-В радиации). // Методические рекомендации. 2008. СПб. РАСХН/ГНУ АФИ Россельхозакадемии. 2008. 35 с.
113. Канаш Е.В., Осипов Ю.А. Спектральные характеристики отражения листьев и диагностика физиологического состояния растений // Регулируемая агроэкосистема в растениеводстве и экофизиологии. СПб, ПИЯФ РАН, 2007, с. 254-270.
114. А. Бреннинт, П. Лейтхольц. Научные опыты в обычном хозяйстве. Новое сельское хозяйство, №4, 2007, с. 108-110.
115. Якушев В. П., Буре В. М. Методологические аспекты статистического исследования. Непараметрическая статистика//В сб.: Современные проблемы опытного дела: Материалы международной научно-практической конференции. СПб., 2000. с. 179-184.
116. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2 кн. М., 1986, 1987.
117. Pao С. Р. Линейные статистические методы и их применение. М.,1968.
118. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Начальный курс. М., 2001.
119. Якушев В.П., Буре В.М. Статистический анализ опытных данных. Непараметрические критерии. СПб.: АФИ, 2001. - 61с.
120. Холлендер М., Вулф Д. Непараметрические методы статистики. М., 1983. 518 с.
121. Рунион Р. Справочник по непараметрической статистике. М.,1982.
122. Тюрин Ю. Н., Макаров А. А. Статистический анализ данных на компьютере. М., 1997.
123. Поллард Дж. Справочник по вычислительным методам статистики. М., 1982.
124. Благовещенский Ю. Н., Самсонов В. П., Дмитриев Е. А. Непараметрические методы в почвенных исследованиях. М., 1987.
125. Богданов А. И. Методы оценки и прогнозирования рыночной ситуации в регионах. СПб., 2004.
126. Якушев В.П., Буре В.М. Подходы к обнаружению статистических зависимостей. — СПб.: Изд. С.-Петерб. ун-та, 2003. — 64с.
127. Аптон Г. Анализ таблиц сопряженности. М. Статистика. 1975.
128. Cole A.F.W., Katz M. Summer ozone concentrations in southern Ontario in relation to photochemical aspects and vegetation damage. J. Air Poll. Control Ass. 16. 201-206. 1966.
129. Браунли К.А. Статистическая теория и методология в науке и технике. М., 1977.
130. Буре В.М., Федорова А.С. Комплекс программ по непараметрической статистике Труды III Всероссийской научной конференции «Проектирование научных и инженерных приложений в среде Matlab», СПб, изд. С-Петерб. ун-та, 2007. с. 100-105.
131. Болыпев JI. Н., Смирнов Н. В. Таблицы математической статистики. М., 1983.
132. Боровков А. А Теория вероятностей. М., 1986.
133. Ширяев А. Н. Вероятность. М., 1980.
134. Якушев В.П., Буре В.М., Якушев В.В. Построение и анализ эмпирических зависимостей. СПб.: Изд. С.-Петерб. ун-та, 2005. - 39с.
135. Буре В.М. Методология статистического анализа опытных данных.- СПб.: Изд. С.- Петерб. ун-та, 2007. 141 с.
136. Буре В. М., Тихонова Н. В. Критерии неоднородности экспоненциально распределенных наблюдений: Труды международной научно-практической конференции «Агрофизика XXI века (к 70-летию образования Агрофизического института)». СПб., 2002. с. 313-317.
137. Кокс Д. Р., Оукс Д. Анализ данных типа времени жизни. М.,1988.
138. Дэйвид Г. Порядковые статистики. М., 1979.
139. Brown R.G. Statistical forecasting for inventory control. N.Y., 1959.
140. Brown R.G. Smoothing forecasting and prediction of discrete time series. N.Y., 1963.
141. Brown R.G., Meyer R.F. The fundamental theorem of exponential smoothing. Oper. Res., 1961, vol.9, n.5.
142. Brown P.E., Piet De Jong. Nonparametric smoothing using state space techniques. Canadian Journal of Statistics, 2001, vol.29, n. 1.
143. Agnew R.A. Econometric forecasting via discounted least squares.-Naval Research Logistics Quaterly, 1982, vol.29, n. 2.
144. Ameen Jamal R.M. Nonlinear predictor models. Journal of Forecasting, 1992, vol. 11, n. 4.
145. Farnum N.R. Exponential smoothing: Behavior of the ex-post sum of squares near 0 and 1. Journal of Forecasting, 1992, vol. 11, n. 1.
146. Tomas Cipra Robust exponential smoothing. Journal of Forecasting, 1992, vol. 11, n. 1.
147. Ng C.N., Young P.C. Recursive estimation and forecasting of non-stationary time series. Journal of Forecasting, 1990, vol. 9, n.2.
148. Pollock D.S. G. Filters for short non-stationary sequences. Journal of Forecasting, 2001, vol. 20, n. 5.
149. Jianqing Fan, Qiwei Yao, Zongwu Cai Adaptive varying-coefficient linear models. — Journal of the Royal Statistical Society: Series B, 2003, vol. 65, n.
150. Koenker, R., and G. Bassett Regression quantiles. Econometrica, 1978, vol. 46, 33-50.
151. Koenker, R., and V. d'Orey Computing regression quantiles. -Applied Statistics, 1987, vol. 36, 383-393.
152. Machado J.A.F. and Mata J. Box-Cox Quantile regression and distribution of firm size.- Journal of Applied Econometrics, 2000, vol. 15, n. 3.
153. Koenker, R., P. Ng, and S. Portnoy Quantile smoothing splines. -Biometrika, 1994, vol. 81, 673-680.
154. Ali Gannoun, Stephane Girard, Christiane Guinot, Jerome Saracco Reference curves based on non-parametric quantile regression. Statistics in Medicine, 2002, vol. 21, n. 20.
155. Thomas W. Yee Quantile regression via vector generalized additive models. Statistics in Medicine, 2004, vol. 23, n. 14.
156. Peter C. Austin, Jack V. Tu, Paul A. Daly, David A. Alter The use of quantile regression in health care research: a case study examining gender differences in the time liness of thrombolytic therapy. Statistics in Medicine, 2005, vol. 24, n. 5.
157. Henning K. Schroder, Hans Estup Andersen, Kathrin Kiehl Rejecting the mean: Estimating the response of fen plant species to environmental factors by non-linear quantile regression.- Journal of Vegetation Science, 2005, vol. 16, n. 4.
158. Jana Jureckova and Jan Picek Two-step regression quantiles. -Sankhy-a: The Indian Journal of Statistics, 2005, vol.67, 227-252.
159. V. Chernozhukov and Iv'an Fern'andez-Val Subsampling inference on quantile regression processes. Sankhy-a: The Indian Journal of Statistics, 2005, vol.67, 253-276.
160. V. Chernozhukov and Hansen C. An IV model of quantile treatment effects. Econometrica, 2005, vol. 73, 245-261.
161. Min Zhu and You-Gan Wang Quantile Estimation from Ranked Set Sampling Data. Sankhy-a: The Indian Journal of Statistics, 2005, vol.67, 295304.
162. Manuel Landajo, Javier de Andres, Pedro Lorca Measuring firm performance by using linear and non-parametric quantile regressions.- Journal of Royal Statistical Society: Series C, 2008, vol. 57, n. 2.
163. Randies R.H., Wolfe D.A. Introduction to the theory of nonparametric statistics.-N.Y. Wiley, 1979.
164. Pratt J., Gibbons J.D. Concept of nonparametric theory.- Springer ser. In statist., Berlin, 1981.
165. Robinson P.M. Semiparametric econometrics: A survey. Journal of Applied Econometrics, 1988, vol. 3, n. 1.
166. Hardeo Sahai, Satish Chandra Misra, Carios Toro The teaching of statistics in the biological, medical and health science: some comments and a selected bibliography.- Biometrical Journal, 1990, vol. 32 , n. 4.
167. Sin-Ho Jung, John Q. Su Non-parametric estimation for the difference or ratio of median failure times for paired observations.- Statistics in Medicine, 1995, vol. 14, n. 3.
168. Syma R. Esterby Review of methods for the detection and estimation of trends with emphasis on water quality applications. Hydrological Processes, 1996, vol. 10, n. 2.
169. Dong D. Zhang, Xia-Hua Zhou, Daniel H. Freeman Jr., Jean L. Freeman A non-parametric method for the comparison of partial areas under ROC curves and its application to large health care data sets.- Statistics in Medicine, 2002, vol. 21, n. 5.
170. Henrik Rene Cederkvist, Are Halvor Aastveit, Tormod Nas A comparison of methods for testing differences in predictive ability.- Journal of Chemometrics, 2005, vol. 19, n. 9.
171. Helena C. Kraemer Toward non-parametric and clinically meaningful moderators and mediators.- Statistics in Medicine, 2008, vol. 27, n. 10.
172. Chi-Rong Li, Chen-Tuo Liao, Jean-Pei Liu On the exact interval estimation for the difference in paired areas under the ROC curves.- Statistics in Medicine, 2008, vol.27, n.2.
173. Xiao-Hua Zhou, Sierra M. Li, Constantine A. Gatsonis Wilcoxon-based group sequential designs for comparison of areas under two correlated ROC curves.- Statistics in Medicine, 2008, vol. 27, n. 2.
174. Ronald G. Askin Multicollinearity in regression: Review and examples. Journal of Forecasting, 1982, vol. l,n. 3.
175. Geert Verbeke, Emmanuel Lesaffre, L.J. Brant The detection of residual serial correlation in linear mixed models. Statistics in Medicine, 1998, vol. 17, n. 12.
176. Heiko Becher The concept of residual confounding in regression models and some applications. Statistics in Medicine, 1992, vol. 11, n.13.
177. Ronghui Xu Measuring explained variation in linear mixed effects models. Statistics in Medicine, 2003, vol. 17, n. 12.
178. Juvencio Santos Nobre, Julio da Motta Singer Residual Analysis for Linear Mixed Models. Biometrical Journal, 2007, vol. 49, n. 6.
179. Twomey P.J., Kroll M.H. How to use linear regression and correlation in quantitative method comparison studies. International Journal of Clinical Practice, 2008, vol. 62, n. 4.
180. D.J. Slymen, R.F. Woolson, M.G. Myers An Application of the Logistic Distribution to the Analysis of a Measles Epidemic.- Biometrical Journal, 1979, vol. 21, n. 1.
181. Haiganoush K. Preisler Maximum Likelihood Estimates for Binary Data with Random Effects. Biometrical Journal, 1988, vol. 30, n. 3.
182. Gerhard Tutz Compound Regression Models for Ordered Categorical Data. Biometrical Journal, 1989, vol. 31, n. 3.
183. M. A. El-Saidi, E.O. George A Generalized Logistic Model for Quantal Response Bioassay. Biometrical Journal, 1990, vol. 32, n. 8.
184. K. Ulm A statistical method for assessing a threshold in epidemiological studies. Statistics in Medicine, 1991, vol. 10, n. 3.
185. Meenakshi Devidas, E. Olusegun George, Daniel Zelterman Generalized logistic models for low dose response data. - 1993, vol.12, n. 9.
186. T.P.Hutchinson A Guide to Bivariate Ideas of Quantal Response Analysis, as Applied in Biometrics and Econometrics. Biometrical Journal, 1993, vol. 35, n. 1.
187. Mohammed A. El-Saidi A Symmetric Extended Logistic Model with Applications to Experimental Toxicity Data.- Biometrical Journal, 1995, vol. 37, n. 2.
188. Jay Bhattacharya, Dana Goldman, Daniel McCaffrey Estimating probit models with self-selected treatments. Statistics in Medicine, 2006, vol.25, n. 3.
189. Glenn Hoetker The use of logit and probit models in strategic management research: Critical issues. Strategic Management Journal, 2007, vol. 28, n. 4.л кзя оя «ою <иао л
-
Похожие работы
- Комплекс программ формирования и обработки баз данных и знаний в агрономии
- КОМПЛЕКС ПРОГРАММ ФОРМИРОВАНИЯ И ОБРАБОТКИ БАЗ ДАННЫХ И ЗНАНИЙ В АГРОНОМИИ
- Структурный анализ и компьютерное моделирование лингвистической среды информационных ресурсов
- Разработка информационного инструментария САПР организационных структур на основе гармонизации диаграмм Ганта
- Формализация визуальных графоаналитических моделей процессов управления
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность