автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Быстрая иерархическая классификация потоков океанографических наблюдений
Автореферат диссертации по теме "Быстрая иерархическая классификация потоков океанографических наблюдений"
О -/
рсссшйкая шдо'я 1шк
лдшшюстотаюг: <щешш йаяотут автокзтакя я процессов управления
На правах р^'-сгтел ■
ШСгЯШ& О-йта Оюют*:!
6*31.3.053:551 .463
5,ют?м иерархическая 1шсе®:ш1ш?.штоков с1шш>грл«йршсшй швяшжп (на ШШЗ СЕБЕР0-ЭЛШЛ1Ш' ЧАСТИ ТИХОГО 01СШКА)
сп5!Р1альносгь 03.13.16 Прпштпнй гичнелнтежеой
тезшхкп, к&тоиэтггевсхото гадэщзовй*ш1 -л кегеввдггшсотс методов в паучтх- иссжзловоечях (тсштва)
/
Лвгорзфэраг досоертацгк на соясгсаялэ ученой стегого кандидата техническга пзук
Владивосток - 1983
Работа вшолнеиз в Институте автоматика в иродассов управления Двлыюзосточиаго отдаления РДН
Ниуч>ш8 руководитель - доктор физиионмтематтвсяих наук'
II .О. Иванов
Официальные оппоненты доктор физнко-ттекатичосхах наук
Е.А. Нурминский
кандидат физнко-математических. наук A.B. Казанский
Ведущая организация Дальневосточный рэгионашшй научно-исследовательский гвдроиэтеоролош-чзекий гастигут Госкомпщрошта
Защита состоится "__" _ 1993г.
в_час. не заседании специализированного Совэта Д.003.30.01
в Института штоматшш и процессов управления Дальневосточного отделения РАН: 69004t, г. Владивосток-41, ул. Радао, 5.
О дассвртвдаой можно ознакомиться в библиотеке Институт» еш'оматики и процессов управления ДВО РАН
Автореферат разослан "__"___ 1993 г.
»
Учений секретарь
стцша газированного Совета
g^O^^ Б.И.Коган
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Изучение гидрофизической структуры вы-сокодинамичшх районов океана (фронтальных зон) на основе анализа натурных данных связано со следу кщимг традициошшш подходами. Простейший из них заключается в эгдшричвской обработке отдельных съемок. Он выявляет разномасштабные черты вертикальной структуры вод, в той числе и синоптические. Получение климатических характеристик требует осторожных обобщений s вызывает необходимость статистической обработки всего доступного материала.
Для сопоставления многолетних данных используются совместные вероятностные распределения температуры и солености (Гшгар-кин„ 1975), что хотя и позволяет идентифицировать водниз кассы п вычислить их термохалишшэ индексы, однако препятствует выявлению пространственных зависимостей. Для последнего строятся ос-редняемые по пространству п по времени шля. В условиях высокой изменчивости, свойственных фронталышм зона:,?, когда в гидрологических образованиях синоптического масштаба (внутри п вне вихрей, по разные стороны от вторичных фронтов) находятся вода с разными свойствами, а локвлыше тэркохалигаше распре деления мультшодальны, подобные математические осреднения чрэватн потерей полезной физической информации^
б рамках 'Современных представлений о вентиляция термоклина (Luyten, Pedloslcl, Stomel, I9S3) считается, что изопикнкческие водные слои, приобретая свои свойство на поверхности в высоких широтах, углубляются, распространяясь по направлению к экватору. 1£едоэнная трансформация водных слоев в северо-западной часта Тихого океана происходит в пределах всего ареала кх распространения, а сама их эволюция тесно связана с формированном прокэзу-точных водных масс субтропиков (Sverdrup, Johnson, Plemlng, 1942). Для ее изучения необходима детализация климатической изменчивости водных слоев в пределах значительной по протяЕэнности акватории, включащей субарктическую фронтальную зону, по данным наблюдений, распределенных в пространстве и во времени.
Из сказанного вытекает актуальность подходя к классификации многолетнего материала, отражающего реальное распределение тем-
цературы и солености в пространстве и во времени и позволяющего соотнести классы с чертами динамики реальных гидрологических объектов.
Цель работы. Целью диссертационной работы является автоматическая классификация больших массивов срочных профилей гидрофизических параметров, направленная на выявление пространственно-временной изменчивости вертикальной структуры вод океана. Основной задачей является разработка методики классификации данных, обеспечивающей:
- совместную оценку сходства профилей нескольких гидрофизических параметров на долгосрочном материале, не подвергнутом предварительной горизонтальной интерполяция, построение иерархии климатических типов, разновидностей и подтипов вертикальной структуры вод океана на основе алгоритмов быстрой классификации;
- выделение естественных районов и периодов, характерных ситуаций и прослеживание изменений термохалиниых свойств изопик-нических водных слоев в трансфронтальном направлении в их связи со структурными образованиями во фронтальных зонах.
Основные методы исследований. В разработках применены методы многомерного статистического анализа экспериментальных данных (кластерного и корреляционного анализа с элементами теории вероятностного оценивания), методы разработки прикладного программного обеспечения, метода обработки больших потоков информации.
Фактический__материал. Исторические данные за период'1951-
1980 г. получены из Мирового-Центра Данных в г. Обнинске. Массив вертикальных профилей температуры .и солености определен районом' с границами 47°30'~ 35°с.ш., 140°- Х60°в.д.; 35°- 25°с.ш., 125°-160°в.д., глубинами 0 - 500 м летом (август) и 0 - 1000 м зимой (январь - март).
Научная новизна.
1. Разработанная методика позволяет классифицировать большие объемы данных наблюдений в высокодинамичных районах океана с выделением, помимо основных типов вод, структуры самих границ раздела и выявлением черт пространственно-временной изменчивости не только межгодового и сезонного, но и синоптического масштаба.
2. Улучшен быстродействующий алгоритм восходящей иерархической классификации и исследованы ех-о оптимальные свойства-
/
3. Путем анализа статистических зависимостей показан характер влияния меандрировашш Куросио «жнее о. Хонсю на региональную гидрологическую структуру.
Практическая ценность работа. Предложены практические рекомендации по применению быстродействукдэго алгоритма к классификации океанографических данных. Разработанная методика реализована в видо программной систем для Ш.1-совместишх персональных ксяшотеров и мояет быть применена для изучения динамически сложных районов Мирового океана. Статистичесзш значимые характеристики трехмерной ■ пространственной структуры могут использоваться в исследовательских и практических прилоданиях, например, для построения модели среды и восстановления вертикальных проблей по поверхностны?.? данным, а качестве начальных условий для гидродинамического моделирования. Построены мвягодовыо серии карт динамического районирования северо-западной часта Тихого океана. Статистические зависимости, связаннне с чертами динамики района, могут служить в прогностических целях.
На защиту выносятся:
1. Методика быстрой иерархической классификации вертикальных профилей гидрофизических параметров.
2. Экспериментальные оценки оптимальных свойств быстродействующего алгоритма восходяцей иерархической классификации.
3. Статистические- зависимости- изменчивости вертикальной структуры вод северо-западной части Тихого океана.
Апробация__работы. Основные положения и результата работы
обсуздшшсь и докладывались:
- на конференции молода ученых Института автоматики и процессов управления ДВО АН СССР (1989 г.);
- на I советско-китайском симпозиуме по океаногрефш (г. Владивосток, 1990 г.);
- па 6-8 Меадународных симпозиумах по исследованию Охотского моря и морского льда (г. Момбецу, Япония, 1991-1993 г.);
- на I Международной конференции по электронике и автоматическому управлению (г. Тизи-Оузу, Алжир, 1992 г.);
- на семинарах отдела системных исследовагй Института автоматики и процессов управления ДВО РАН (1989-1992 г.), лаборатории исследования Южного океана Арктического и Антарктического
научно-исследовательского института Госкомгидромзта (г. Сш&ъ-Патербург, 1992 г.), кафедры океанологии Дашшвоскишшэ Государственного университета (1992 г.).
Публикации. По результатам исследоваагЗ одуйЕШ5йазо 7 печатных работ.
Структура__и объем диссертьют. Дасшрт®») состоит из введения, четырех глав, заключения и сгкя:а лахарглуры, вклзочавдего 152 наименования. Работа сод&риягШвтршщ текста, 35 рисунков и 4 таблица.
содержание рюту
Во введении обосновала ектушьЕооть темы исследования, определена цель работа й п^чдозг исследования. Указаны научная новизна и пракютзсзшя ея&чгиоаь тазучзнных результатов, а также основше шжмйшая, шзсс&за иа есщаяу, сведения об апробации работы. Кратко шлоаеяо содержание работы. -
Б первой г лат особвьяостя гцгрологги северо-западной части Тихого океана рассисирбна о цель© наработки требований к методика классификации даншх сжаногра^еегса наблюдений. Для адекватной интерпротвцая классов "сиетештизированы известные сведения о структуршх ътмагтх вертикальных профилей разных типов, твриохалииных кодексах кодиих касс и характеристических значениях температуры и сояэиости в точэшш. Рассмотрены промежуточные водные массы: субтропическая-модальная вода - слой с пониженными градиентами температура, солености и плотности между сезонным и главным термоклшом, шднея масса главного термоклина, промежуточная вода пониженной солэзюсти (Мазигауга, 1972).
Вертикальная структура вод пограничных течений северо-запада и субарктической фронтальной эош сопоставляется с основными типами, характеризуется связь динамических особенностей, с вертикальной структурой.Отмечено, что большинство авторов выделяет две разновидности вертикальной структуры вод фронтальной зоны: подобную субтропическому (или тропическому) и подобную субарктическому типам. Их пространственное разграничение зачастую связывается с южной грающей субарктического типа стратификрции солености, называвши субарктическим фронтом (Еоиеп еЬ а!., 1382).
В раздела 1.3 обсуидеш отлпчия гидрологии оубарктшсп Тхко-го океана от других пряполярпнх областей: относительно пэвисоялв значения солености' и плотности поверхностной водной масси дата зимой, а таккэ малая глубина зимней кснв^гацш (Reíd, 1973).
Проведенный анализ работ показал рг лнсобразиэ вертикальной структуры и динамики вод субг;7<тичвсиоЛ ©ронтальноЖ зошх и выявил различия, а иногда и 'про^нворзчлл во взглядах отдельных исследователей. Предяовено детализировать вертикальная структуру вод северо-западной части Тихого окояка и выявить статистические зависимости ее изменчивости на основе глзсигфшгаиш дттт он ее-нографячесних наблюдений, выполненных в течение длительного срока.
Сформулированы следущпо требования :с »гстодпко автсматддас-кой гслассификациа вертикальной структур/ вод шсщюдинеигпшх областей океана:
- совместная класюфпсацнл i'ces доступна наблюдений, рассматриваемых в качестве единой выборки, на основе бнстродойству-пзщх алгоритмов;
- даобходжюсть одновременного учета шсколышх гвдройази-ческих параметров (гегяхзрзтура, солзеость н др.);
- сравнение вертикальных профилей reas но форкз, так и по амплитудным особенностям;
- систематизацгга классов, отракак^ая связи типов, подтипов н разновидностей вертикальной' структура;
- ррослэЕявазиэ проявления какдого класса в прсетрснствен-по-врзкзшшх образованиях как климатического, так и синоптического масштабов;
- прослеживание зависимостей, отразагщкх тршефориацшо характерных водшк слсэв.
1 Вторая глава носвяшна регргбозкэ петодкки классификации гидрологических профилей. В рзздзлэ 2.1 с точки зрения предъявленных требований оценена пзвзстекз подхода к нлйси$икации данных океанографических вгбхэдешй. Идентификация водннх масс как экстремумйв еэ Т.З-кртях и па зтой осяовэ эмпирическая классификация вэртшсалыгЪй структуры вод по отдельным наблюденным кривым позволяет определять основные та и их подтипы н выявить простейшие географические закономерности (Тихий океан, т. 2, 1-963; Степанов, 1983). Недостатки, присущие лжбнм экпири-
ческиы классификациям (субъективность, неполнота, трудоемкость обработки), заставляют развивать белее формализованные подходы. Исследование параметров статистических распределений температуры и солености позволяет связать ядра водных масс с модальными областями (Галеркин, 1981). Однако нензОежноэ при таком подхода обезличивание измерений требует дополнительной географической привязки водннх масс и затрудняет анализ иг: динамики.
Метод опорных точек (йжш и др., 1978), позднее развитая в морфолого-статистической шюдике анализа стратификации - океана (Балхаш, 1991), кодирует форму локального экстремума совокупностью логических условий, относя к одному классу профили с идентичным набором дискретных признаков. Этот принцип, приемлемый для хслесскфшшции сглаяенних, осредненшх дшшух, наеф®акти-вен и применении к рбальным наблюдениям во фронтальных зонах ввиду многообразия форм профплоа.
Оделаы вывод о прэдпогтитэлшостз менее жестких оценок сходства, основанных на ызтраках, для кдасофпсации данных 'во фропталыых еопзх. ВследстБае этого предлагается последователь-нал оценке сходства фор,5 и амплитуд" црофилей на основе метрики корреляционного типа к обычной евклидово.« метрики. Сопоставимость профилей различных щцрофазических параметров обеспечивается вертикальной интерполяцией измэрэний к стандартным горизонтам, в также обезраамериваншм параметров с учетом всеобщих Ьредлих и дисперсий наглого параметра. Размерность признакового пространства,' описывающего профили, определяется произведением . хкшкветва параметров к количества горизонтов.
В разделе 2.2 выработана стратегия классификации. Из первого требования вытекает необходимость обработки больших потоков информации, предусматривающей человеко-машинную процедуру побитной классификации профилей а сегментированием и "перемешиванием". На каздом этапа последовательно выполняются следующие операции: формирование классифицируемой выборки путем сегментирования и "перемешивания" данных; обеспечение сопоставимости данных внутри выборки; вычисление расстояний между станциями; построение иерархии связей; выбор 'уровня иерархии (числа классов); оценка статистических свойств классов; интерпретация классов в нразкаковом пространство; географическая интерпретация
т
классов.
Зегиентированиа исходной выборки является вынужденной мерой а условиях рграннченностл вычислительных ресурсов. На первом этапе для кандого сегаента в отдельности предусматривается получение основнпх классов, содер:::ацях профили сходной форгли, которые в яервсм приблпхепии описывают взаимное расположение водшх .масс по вертикали. Формирование выборок после выполнения первого • этапа ("перемешивание") заключается в эвристическом объединении прсфшй аналогичной формы из разных сег?.:ентсв. Профили каждой фора следует дополнительно разделить согласно in ачашдудпыт особенностям. Полученные классы идентифицируется с тнпа;.ш вертикальной структуры. В детализации подтипов и разновидностей на дальяейзпг: этапах по необходимости используются сегментирование, "гаре?>шавенге", варьируются обе метрики л подбираются kjioccit&i-нлрущие признаки.
Взаимодействие разнотипных вод во фронтальны/, зонах, порождаема разнообразие переходных фор,!, неустойчивость пограничных течений, шсокая синоптическая изменчивость, масштабы которой соЕоставпкы с клпгатэтесгсяет вариациями, приводят к слогвоЗ внутренней структуре данных: отсутствии четких границ мездг скоплениями, налита "мостиков", зон рассеяния, В этих условиях для классигжацил срочных наблюдений, выполненных ео фронтальных зонах,_ обычно используете в 'шеанотрафаческзх приложениях итеративные (вариационные ) алгоритм поиска скоплений точек в приз-паковом пространстве (типа ФОРЭЛЬ я др.) не&ЕфектиЕШ ввиду трудности выбора начального приблинвЕзя и неустойчивости решения.
В качестве базового метода предлагаемой стратегии избран иерархический агломэративЕпа алгоритм класетфзкгщш, нэ требую-ций априорных предположений о количестве классов и сбеспечпваэ-ций наглядное представление иерархии связей мезду наблэдегзиями в Ецдэ дэндрографа. Процедура построения иерархии заключается в агедупг,зм. Вначале исходные объекты рассматриваются как отдельные кластеры. Объединение па h-том шаге двух блихайлих кластеров s и s', назывее?,:ых преемникам, порог-дзет взамен elt новый мастер а^ = s О з', что уменьсаэт количество кластеров на единицу; расстояние d^ = d(s, s') называется кндаксом уровня h.
Пересчет расстояний мсзду новым мастером а,, и другими
кластерами производится на основе связей преемников по формуле Ланса-Уильямса, коэффициенты в которой определяются критерием пересчета. Показано, что -наиболее приемлемыми при классификации океанографических данных является критерии дальнего соседа (максимальное из расстояний мзвду отдельны,и элементами разных кластеров) или средней связи (средневзвешенное расстояние).
Слабым местом классического алгоритма является его недостаточная вычислительная эффективность. Тот факт, что большая часть проводимых операций, связанная с просмотром и пересчетом расстояний, существенно превышающих индекс уровня на данном таге, не влияет на вновь образуемый кластер и может быть опущена, положен в основу быстродействующего алгоритма (Егмба, 1985). Взамен полного перебора всех связей при поиске объединяемых мастеров на каждом уровне иерархии предлагается анализировать подмножество блязкосвязянных кластеров» рассчитывая полную матрицу расстояний только после его исчерпания.
Быстродействующий алгоритм включает три этапа. Этап А: 'выбор порога по заранее заданному- размеру рабочей области на основе гистограмм исходных расстояний и загрузка в рабочую область связей, меньших порога. Этап В: последовательные шаги объедине-кня кластеров с пересчетом связей внутри рабочей области до ее исчерпания. Этап С (наиболее длительный): пересчет всех расстояний ма&ду кластерами'данного уровня иерархии и переход на этап А.
Рабочая область определяется как множество пар близкосвя-заннах кластеров Ц, 3), расстояния d(l, 3) между которыми меньше заданного порога D. Корректность вычислений в рабочей области обеспечивается выполнением свойства сводимости (Bruynooghe, 1977) Пусть s, s*, t - кластеры уровня h. Тогда, если d(s, s') < D, dis, t) < D и d(s', t) < В, то d(3 U 3', t) < D, (ah, t) вютъ чается в рабочую область. Если ке d(s, s') < D, d(s, t) > D и d(3', t) > D, то d(sUs', t) > D, (ah, t) вне рабочей области.
В ситуации, когда d(s, t) < D, но d(s', t) > D, называемой далее случаем неполной связи, заранее неизвестно, попадет ли связь (ah, t) в рабочую область, что при вычислениях по рекуррентной формуле должно вызывать немедленный переход к этапу С, несмотря на неисчерпанность рабочей области. С целью лучшего использования рабочей области в настоящей работе предлагается
слодущая обработка случаев неполной связи: связь d(s, t) исключается из рабочей области путем уменьшения порога до величины D' = d(s, t), что и позволяет продолжить вычисления в рамках этапа В и повысить эффективность алгоритма за счет уменьшения количества выполнений этапа С.
Показано, что пока индекс уровня d^ « D, уменьшение порога q = D - D' будет незначительным (q « D) при условии, что расстояния обладают метрическими свойствами, т.е. подчиняются неравенству треугольника. Это гарантирует наличие высокоэффективной начальной фазы вычислений (фаза-I), характеризуемой длительным этапом В. Когда же значение d11 сравнимо с D, уменьшение порога будет создйейть новые случаи неполных связей, которые таккэ должны быть устранены. Такое, "каскадное" снижение порога должно укорачивать этап В, снижая эффективность алгоритма "(фаза II). Заключительная фаза III наступит, когда число кластеров станет настолько мало, что все расстояния между ними поместятся в рабочую область.
Для повышения эффективности алгоритма предлокено отказаться от использования рекуррентной формулы, если это . возможно, в честности, для критерия дальнего соседа, когда d(ah; t) = max id(s, t), d(s', t)} = d(s', t) > D. Неполная связь d(s, t) исключается из рабочей области без снижения порога, что долзно удлинить фазу I.
Сложность К (количество операций) алгоритма теоретически оценена как 0(№) < К < 0('Р), причом верхняя оценка совпадает с оценкой классического алгоритма, а нижняя сравнима с затратами на вычисление расстояний мвзду N объекты,ni. Конкретное значение К, как и затраты-оперативной памяти, зависит от размера рабочей области, причем максшальная оценка достигается как при слишком большой (0(N2)), так л при слишком малой (0(1)) рабочей области. Показано, что нижняя оценка достигла,':а в предположен!®, что малой рабочей области (0(H)) соответствует малое число выполнений этапа С (к = 0(1 )).
Быстродействующий алгоритм иерархической классификации с предложенной обработкой неполных связей реализован в виде подпрограммы на языке ФОРТРАН. Построенная иерархия упорядспшает кластеры по степени их сходства; визуальное кэ сравнение длины
ребер дендрографа служит для неформального Еыбора вариантов классификации различного уровня детальности, окончательный среди которых определяется содержательной интерпретацией (раздел 2.3).
Интерпретацию в признаковом пространстве предложено проводить ыа основе внутриклассовых статистик, апредэлякщих "трубку" из трех характеристических профилей - среднего и предельных в смысле среднеквадратичного разброса. (Достоверность реиения оценивается стандартными статистическими тестами, проверяющими нормальность внутриклассовых распределений по критерии согласия, а также точность оценки выборочных средних и дисперсий на оснозв I- и нхи-квадрат"-распрэделе1Шй.) Классы идентифицируются сопоставлением структурных элементов характеристических профилей (экстремумов к квазкоднородных слоев) с элементами, присущими типам вертикальной структуры.
Географическая интерпретация классов проводится путем их отображения в географическое пространство с построением как интегрального распределена« классов, так и временной серии карт, соответствующих шбранноыу воженному масштабу. Визуальный анализ такой серии позволяет проследить врамещуа изменчивость пространстьеняых структур, в которых локализованы классы, т. е. провести так называемое динаглиескос районирование.
Сопоставление тер.;охак2кшк свойств иззнккнических водных слоев, характеризующих классы, упгрядэчааныэ в трансфронтальном направлении с учетом динамического районирования, составляет основу для прослекнванкя трансфэрщщщг водных масс.
реализация предложенной схеш раскрывается на примере термохалшшой классификации вод в свЕвро-западаоЗ части Тш.ого океана по зимней и по летней выборкам. Массив дякпнт охарактеризован выше; приведены характеристики освежонности акватории в пространстве к во времени.
В результате первого этапа классификации по фор.« профилей выделено тать основных классов как в летней, так и в зимней выборке, условно названных: (1) - "субарктический"; (2) - "субтропический", характеризуемый толстым верхним перемешанным слоам (зима) или наличием квазиодяородного слоя мззду сезонным и главным термонлином (лото); (3) - подобный "субтропическому" с ума-
ретшм-верхним перемешанным слоем (зима) и отсутствием квззиод-нородного слоя мзпду сезонным и главным термошашом (лето); (4) - переходный, близкий к (1); (5) - переходный, близкий к (3). Показана статистическая значимость внутриклассовых корреляций.
Па втором стане кявсафжащв профялэл по амплитуде выделаны два основных тша - субарктический и субтропический, дзэ промежуточных структуры смешения - "ш*5эись-^арктическая" (КСА) и "квазпсубтропическая" (КОТ), окрзделеяа гортккалышя структура вод течеютй Куросио и Сангарекого, в еоотоотетвьи с чем офорш-ровано 13 шборох, для зк.л ц лете р<!эд<ш.;э. ЙдектЕ^акацяя типов вертикальной структуры проыденв по на^хчет структурны:: сле-мзнтов на характеристических премиях, систематизированных в глаье I.
Детализация регионально." гдзрологичоокой структуры проводится на третьем этапе раздглъной штссифякацкеа сформированных выборок на основе, как правило, евклидовся метрики, вводгаой, в ряде случаев, в подпространствах. Класс!- различаются, в основном, нолнчественшлдз шжазатляп! структурных элементов, а детальность класоишкЕЩП! определяются возможностью географгпеско-го соотнесения классов с гидро.'.оптгэкекка обрз5оваквя.гл как климатического, та;: п синоптического маезтабч н устойчивостью их во времени. Построены характеристические "трубки" профиле» (как для температуры и солености, ж< к для вычисленной по ним шкшюсти). Однородность выделенных классов тадтвяргдзка ста-гаетичешь Сбноруюно, что статистически гначкше классы характеризуется сходство:,5 форм всех трех про^зй трубки. Построено по 30 егэгодкнх и ко две, ■ соотзвтстеуксях ситуациям наличия/отсутствия Меандра Куросио южнее о. Хонсю карт динамического районирования для зимы и лета.
Проведенная обработка большого объема скеааогргтаческйх данных предоставляет ооыпрют! материал для акслзршеитаяьчо/! оценки эффективности быстродействующего алгоритма. Так, оцеьк*!. оптимальнее значение длины рабочей области как 0(Н) оказалось возмозяым на основе анализа гистограмм расстояний ьь-кду исхода'-ми объектамл. Показано, что б общем случае действительно место три фазы вычисления-, высоко аффективная озуа i костью Н,- = 0.2 » N с числом ишолнэний Э58П8 0 1: ~ 0(1 ), клоке-
эффективная фаза II с к = 0.1 * Л; финальная же фаза III коротка ввиду малости оптимального размера рабочей области. При отказе от рекуррентной формулы (критерий дальнего соседа) шзкоэффек-тивная фаза II отсутствует вовсе.
В качестве меры эффективности алгоритма принято отношение времен классификации N объектов и вычисления расстояний между ними Т. Показано, что при расчетах по рекуррентной формуле (критерий средней связи) Т - 5-8, тогда как для классического алгоритма Т -- 14-20; для критерия дальнего соседа Т = 1-1.5, т.е. на практике реализуется нижняя теоретическая оценка.
Предложены практические рекомендации по применению быстродействующего алгоритма к классификации океанографических данных:
- первые этапы ,"разведочной" классификации выборок большого объема следует проводить на основе критерия дальнего соседа, выбирая размер рабочей области, равный объему выборки;
- детализацию вертикальной структуры на последующих этапах желательно проводить на основе критерия средней связи,'выбирая рабочую область в два - три раза больше объема выборки;
- определять вобмоеность применения критерия- средной связи, оценивая онидаеыое враг ля классификации 1;0 = к. - 1И, где
к = С.1 * К - число выполнений этапа С, гш - врекя выполнения этапа С, если число кластеров равно и = 0.8 * Н / 2 = 0.4 » Н, Н - объем выборки.
Четвертая глава посвящена содержательной ' интерпретации классов и динамическому районированию северо-западной части Тихого океана. Полученные результата в (основной согласуются со сложившаяся представления;.!!! о водных кассах и вертикальной структуре вод данного района (Назигау/а, 1972; Булгаков и др., 1972; Похудав и др., 1978). Вместе с тем, предложенный: подход позволяет связать щюстранственно-времэннуа изменчивость гидрологической структуры с изменениями региональной климатической ситуации, а именно с наяичшк/отсутствием Меандра Куросио данее о. Хонсю, а также- прослеживать трансформации водных слоев от класса к классу и от района к району.
Раздел 4.1 посвящен субтропической структуре, северная граница ареала которой выделена в виде одномерного района, протянувшегося вдоль всей акватории и идентифицированного со струей
Кзросю. С правого фланга к нему примыкает лентообразный район, дг^итгфэсфаЕагззЗ с "теиЕПз ядром" Куросио (Kawai, 1972), гид-рззжизская структура которого явггатся промежуточной между е^втрщяческоЗ и водами Куроспо. ЗемоЯ район с такой же гэдроло-гичзскоЗ структурой, идентЕфщированннЗ с Противотечением Курс со, гввяяа&г ккшув часть акватории от 27-28° до. 25°с.ш., объединяясь с "тешим ядром" Куросио около 131 °в. д.
Идентичность вод "теплого ядра" и Противотечения" Куросио, установленная статпстзчзсш, соответствует современна представлениям о наличка цзряулгцгонкоЗ ячейки Куросио - Противотечение Куросио (Hasununa. Yosbida. 1978). Как известно, внутри этой ячейки СТМЗ контактирует с поверхностью (зимой), приобретая сбои свойства под воздействием атмосферы (Hanawa, 1978). В настоящей работе установлено, что в годы существования Меандра Куросио вя-нее о. Хонсю, субтропическая структура размещена в осяозпсм к востоку от 141°в.д., тогда как в западной части ячейка расположен класс, соответствующий Противотечению Куросио. Умзнккняэ в такие периоды области контакта СТШ с поверхностью океана за счет своей западной части не монет не приводить к укавьяеиию объема формирующейся водной массы.
Показано, что КСА и КСТ структуры субарктической фронтальной зоны (раздел 4.2) по-разному размещены в ее западггоЗ (при-брекной) и восточной (основной) частях. Установлено, что граница медцу шаш смещается на восток в периоды развития Моандра Куросио южнее о. Хонсю в сравнении с "безмеендрсвакя" периодами, равно как и летом в сравнении с зимой.
Показано, что вблизи северной границы западной части фронтальной зоны КСТ .структура образует на фоне КСА структуры, компактные районы, окрукенные подковообразной интрузией субарктической структуры. Это образование идентифицировано с антициклоническими вихрями мекду меандрами Ойяско (Kami, 1972). Обнаружено, что для иерархий на КСА и КСТ выборках характерно обилие малых кластеров, представляющих собой их переходные формы и локализованных именно в западной части. Особый КСТ подтип идентифицирован с водами Меандра Куросио юзшее о. Хснсю на основании локализации здесь, соответствующего района в периоды существования Меандра.
ri восточной части субарктической фронтальной зоны "КСА"- и "КСТ"-районы разделены вшротной границей, идентифицированной с субарктическим фронтом (Boden et al., 1982). Три класса, идентифицированные с КСТ подтипами, упорядочены в восточной части с' севера на юг. Полученные характеристики подтипов по температуре, солености и плотности показывают, что в зимний сезон точки, соответствующие поверхностным водным массам, последовательно ложатся на среднюю T.S-кривую субтропического типа, покрывая диапазон плотностей верхней части термоклина. Разница же между плотностями поверхностной водной массы у самого северного КСТ подтипа и КСА структуры покрывает диапазон плотностей нижней части термоклина (зимой). Это соответствует имеющимся представлениям о выходе главного термоклина на поверхность океана в зоне субарктического фронта (Булгаков и др., 1972).
При идентификации Сангарсного течения существенной оказалась географическая интерпретация, а именно, наличие компактного района меаду островами Хоккайдо и Хонсю при выходе из Саягароко-го пролива. Показано, что соответствующие станции рассеяны по всей ширине западной часта фронтальной зоны и локализованы внутри КСА структуры в восточной части; внутри ке КСТ структуры восточной части они не обнаружены вовсе. Этот факт свидетельствует в пользу того, что граница мевду КСА и КСТ структурами в восточной области связана с Еетвьв Куросио.
В разделе 4.3 известное уменьшение вертикальных градиентов солености и плотности и снижение кривизны этих профилей продемонстрировано для классов, упорядоченных от центра субарктического круговорота к его западной окраине. Особый класс идентифицирован с зимней модификацией курильской разновидности субарктической структуры на основании локализации соответствующих районов в курильских проливах Буссоль и Фриза и соответствия его характеристик на поверхности воды известным свойствам подповерхностного холодного слоя летней курильской структуры (Морошкин, 1965).
Незначительный вертикальный гредасшт плотности (менее 0.1 усл. ед./ЮО к) дает основание считать верхний слой (0 - 600 .м) зимней курильской структуры одной из так называемых модальных вод, традиционно связываемых с источниками водных масс (McCart-
пеу, 1977, 1982). Внутриклассовые значения плотности на поверхности океана (26.65 - 26.75 усл. ед.) свидетельствуют в пользу возможной связи курильской модальной вода с промежуточной водной массой пониженной солености, о происховдешш которой до сих пор нет единого мнения. Это предположение подкрепляется характером трансформации изопикнического слоя о плотностью 26.7 усл. ед., прослеженной на основе характеристических профилей температуры, солености и плотности для классов, идентифицированных с курильской структурой, КСА структурой и северным КСТ подтипом, с учетом расположения соответствую^^ районов вдоль периферии субарктического круговорота и в субарктической фронтальной зоне к северу и к югу от субарктического фрозгга.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ Р1Б0ТЫ
1. Разработана методика быстрой иерархической классификации потоков океанографических данных с учетом форм и амплитуд вертикальных профилей гидрофизических параметров, снабженная средствами выявления как пространственных, так и временных зависимостей.
2. Данная методика апробирована на классификации вертикальных профилей температуры и солености, измерзших в северо-западной части Тихого океана в летний и зшяоЛ сезоды. Определены статистические характеристики как основных водных типов региона (субарктического и субтропического) и переходных структур фронтальной зоны (квазисубарктической и квазисубтропической), так и вод струйных течений (Куросио и Сангарского), их разновидностей и подтипов.
3. Усовершенствован и реализован з программном виде быстродействующий алгоритм восходящей иерархической классификации и найдены его оптимальные режимы.
4. Статистически обоснованы черты региональной гидрологической структуры северо-западной части Тихого океана и особенности ее межгодовой изменчивости.
Основные__резу льтатн_ .диссертации__опублтоЕата_п_работах
1. Трусенкова 0.0. -Летняя вертикальная структура вод сои&-ро-западной части Тихого океана: Препринт. Владивосток: КАПУ ДВО
АН СССР. 1989. 18 с.
2. Трусенкова 0.0. О вентилируемости северо-тихоокеанской промежуточной воды: Препринт. Владивосток: НАЛУ ДВО АН СССР. 1990. 37 с.
3. Trousenkova 0.0. On the Connection of the Okhotsk Sea Surface Ytoter with the Intermediate Salinity Minimum// The 1st Soviet-Chinese Symposium on Oceanography: Abstracts. Vladivostok, 1990. P. 73-74.
4. Irousenkova 0.0. The Kuril Subpolar Mode Water and its Relation to the Intermediate Salinity Minimum// The 6th Okhotsk Sea and Cold Ocean Symposium: Abstracts. Hombetsu, Japan, 1991.
5. Trousenkova 0.0. Winter Ventilation of the Intermediate Waters of the North-western Pacific. Preprint. Vladivostok: Inst. Autom. & Contr. Proc., 1991. 44 p.
6. Trousenkova P.O. Studying Variability of Vertical Hydro-physical Structure by Clustering Long-Terra Original Vertical Proiiles/ZProceedlngs of the First International Conference on Electronics and Automatic Control ICEA'92. Vol. 3. Tlzl-Ouzou, Algeria, 1992. P. 20-27.
7. Trousenkova 0.0. An Influence of the Vertical Structure
of the Western Subarctic Pacific upon the Formation of the Inter- . mediate Salinity Minimum// The 8th International Symposium on Okhotsk Sea & Sea Ice and ISY/POLAR Ice Extent Workshop Abstracts. 1-5 Pebrary 1993. Mombetsu, Hokkaido, Japan. 1993. P. 541-545.
-
Похожие работы
- Автономные океанологические информационно-измерительные системы (элементы теории, разработка, применение)
- Алгоритмы и программы интерполяции и экстраполяции геофизических данных наблюдений Мирового океана
- Радиолокационные методы и средства получения информации о состоянии морской поверхности
- Математическое и программное обеспечение центра приема и обработки спутниковых данных
- Программно-аппаратный комплекс обработки спутниковых данных и его применение для задач гидрометеорологии и мониторинга природной среды
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность