автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Повышение эффективности идентификации в социально-правовых исследованиях
Введение 2001 год, диссертация по документальной информации, Дзантиев, Казбек Борисович
данные изменения условий задачи лишь несущественно отражаются на результатах». А видный специалист в области моделирования Р. МакЛоун в 1976 году достаточно актуально заметил, что «. приближённый ответ, который получается быстрее, может оказаться более эффективным, чем более точный, на получение которого уходит больше времени». Он же считал, что эффективность модели в её значительной степени определяется правильным пониманием природы существенных признаков (свойств), а не их количеством.
Абстрагирование условно можно разделить на две фазы. Первая, начальная фаза абстрагирования, это создание качественной (физической) модели идентифицируемого объекта. На этой фазе создают модель, которая приближённо воспроизводит идентифицируемый объект с сохранением его физической природы. При этом между идентифицируемым объектом и его отображением - моделью сохраняются некоторые соотношения подобия, следующие из закономерностей их физической структуры.
Следующей, высшей фазой абстрагирования, является количественное абстрагирование - создание математической модели объекта, подлежащего идентификации. Особо следует отметить, что разработка математической модели возможна не только в естественно-технических отраслях науки, но и во всех других, где есть предмет исследования. (Иммануил Кант (1724 -1804) считал, что «во всякой науке столько истины, сколько в ней математики».)
Принятие математической модели объекта придаёт модели свойства универсальности, освобождая её от тех специфических черт, которые присущи изучаемому объекту. Математическая модель, не привязанная строгим образом к какому-либо физическому или социальному процессу, является средством количественного описания различных по своей природе процессов или по своему назначению объектов. В этом, абстрагированном походе, заключается важнейшее свойство количественной формализации, позволяющей независимо от круга решаемых задач довольствоваться ограниченным количеством математических моделей. Исследователь получает возможность использовать одну и ту же модель в различных частных ситуациях, задавая соответствующие переменные и выбирая конкретные параметры.
Математической моделью идентифицируемого объекта можно считать её описание на одном или нескольких формальных языках, дающее представление о его поведении при помощи выполнения формальных процедур. Математические модели могут иметь вид графиков, таблиц, уравнений и др., исчерпывающим образом доносящих до исследователя требуемую информацию. В качестве примера приведём ситуацию, в которой результатом отражения действия объекта являются признаки, носящие явно осцилляторный характер - то есть в ходе наблюдений зафиксированы периодические колебания. Тогда в качестве формальной количественной модели можно принять линейную консервативную систему, свободные колебания с частотой соо, в которой описываются дифференциальным уравнением второго порядка d2z/dt2 + о\z =0.
2 -1
Если положить, что соо =(LC) , a z = q(t) , то получим конкретное уравнение, описывающее электрический характер колебаний
L d2q(t)/dt2 + q(t) /С =0, где q - заряд; L и С - индуктивность и ёмкость времязадаю-щего контура соответственно; t-текущее время.
Если же есть достаточно оснований считать, что колебания имеют механическую природу, то, считая а>о2 =\\i/m и z = x(t), получим уравнение отклонения центра масс x(t) механической пружинной колебательной системы с жёсткостью т d2x(t)/dt2 +\|/ х(t) =0, где т ■ масса маятникового узла.
Как видно из простого вышеприведённого примера, одно и то же дифференциальное уравнение, заданное в общем виде и лишённое какой-либо физической оболочки, без труда может быть использовано для идентификации различных по природе объектов.
При идентификации динамических объектов, независимо от природы протекающих в них процессов, целесообразно рассматривать эти объекты как проявляющие себя в зависимости от воздействий на них извне - полагать, что они функционируют не замкнуто, а открыты к внешним возмущениям. Такой подход в случае с социальными системами вполне обоснован, если учесть, что действие социальных систем находится под влиянием массы факторов: от чисто политических регуляторов и нравственных установок до принимаемых на законодательном уровне правовых норм. Всё перечисленное, безусловно, оказывает влияние на действия идентифицируемого объекта.
Принимая в расчёт неизбежность внешних управляющих факторов, следующим естественным шагом является определение характера модели, который может быть как детерминированным, так и стохастическим. Детерминированным объектом (детерминированной моделью) следует считать объект, результат функционирования которого можно предсказать однозначно и при необходимости описать регулярными функциями. Такие объекты характеризуются ещё и тем, что результаты наблюдения за ними при многократных наблюдениях детерминированы. Стохастические же объекты в отличие от детерминированных не позволяют точно предсказать конечные результаты, даже если условия наблюдения за ними не меняются. Такие объекты подвержены влиянию комплекса факторов извне, которые учесть, описать и установить для коих однозначную связь в полном объёме крайне сложно даже теоретически, а в практическом смысле и вообще невозможно. Причём, строго говоря, все объекты неискусственной природы являются стохастическими. Однако нередко условия задачи позволяют отказаться от учёта всевозможных внешних факторов и сосредоточиться на нескольких, наиболее существенных и поддающихся детерминированному описанию. Таким образом, исследователь осуществляет условный переход от стохастического объекта к детерминированному, облегчая при этом процедуру решения поставленных перед ним задач. Если же наиболее существенные, процессообразующие факторы действуют по неизвестным для исследователя законам, то приходится принимать именно стохастическую модель. Аналогичным образом следует поступать и в том случае, если кроме внешних факторов детерминированного характера на объект воздействуют ещё и случайные факторы, которые с целью повышения точности идентификации полезно учесть. Кроме того, в таких ситуациях целесообразно априори оценить разницу в весах детерминированной и стохастической составляющих. Здесь небезынтересно привести мнение на этот счёт западного специалиста в области моделирования систем М. Пешеля: «. действительные закономерности всегда суть единство случайности и необходимости, то есть всегда содержат детерминированную часть, которая плотно окружена случайными отклонениями, например, эта детерминированная часть может быть представлена-детерминированным поведением средних величин, детерминированными тенденциями, детерминированными законами управления и т. д.».
При изучении стохастических объектов на смену однозначным связям состояний приходят вероятностные связи, которые устанавливаются путём набора и обработки достаточно большого объёма эмпирического материала. Наблюдая длительное время за поведением объекта, как правило, обнаруживают следующую закономерность: несмотря на то, что отдельные результаты могут отличаться друг от друга, в целом средние значения, относящиеся к длительным наблюдениям, проявляют некоторую устойчивость. Фиксируемая путём набора статистических данных устойчивость и есть вероятностный закон, который является отражением вероятностной природы. При вероятностном описании процессов, явлений предполагается, что ситуация неопределённости характеризуется априори известным множеством случайных событий, каждое из которых имеет определённую вероятность появления.
Учитывая, что математическое моделирование является одним из наиболее значимых этапов процесса идентификации, остановимся на некоторых его особенностях. Исходя из существующих на сегодняшний день в науке положений, следует важная особенность математического моделирования, состоящая в том, что никаких формальных правил для построения модели объекта или процесса не существует. В основе решения подобных задач лежит здравый смысл исследователя, базирующийся на его научной эрудиции и практических наблюдениях. Исследователь стремится при построении модели включить в неё все те переменные величины, которые оказывают на результаты существенное влияние. Если попытаться выделить здесь главную цель, то ею должна быть высокая степень соответствия модели реальному объекту. В качестве таких критериев можно использовать среднеквадратическую погрешность, абсолютную погрешность и др.
В основе построения математической модели лежит теоретический анализ объекта с использованием общих закономерностей его действия. Причём полезно учесть все закономерности, независимо от их природы. Для анализа закономерностей необходимо иметь априорные данные об объекте и, разумеется, чем больше их объём, тем глубже будет ясна природа функционирования объекта. Теоретически для выяснения максимума свойств объекта можно было бы допустить проведение активного эксперимента, когда объект активизируют, заставляя его проявить свои свойства. Однако если такой подход оказывается вполне уместным в технических приложениях, то в практике юридической науки применить активный эксперимент достаточно сложно, а порой и невозможно. Объясняется это тем, что, например, при идентификации личности, совершившей преступление, следует иметь в виду, что под объектом подразумевается человек, имеющий свою стратегию и свои цели, а также способный адаптироваться в своих интересах под навязываемую ему обстановку. Поэтому по большей части приходится рассчитывать на получение информации о моделируемом объекте пассивным путём.
Исходя из вышеприведённых нами рассуждений, будем считать идентификацией процесс определения наиболее значимых свойств или характеристик объекта на основании данных, полученных в результате наблюдения за ним. В практическом смысле это означает, что исследователь, пользуясь априорной информацией, выдвигает гипотезу об общем виде искомого объекта (в виде модели) и далее пытается, исходя из имеющихся у него результатов наблюдения, установить такие параметры в модели, которые бы позволили идентифицировать объект с принятой моделью.
При формализованном описании социальных систем, необходимом для их идентификации, немалый теоретический интерес может представлять соответствующим образом поставленная задача идентификации. Речь идёт о формальной постановке задачи идентификации в виде математических выражений.
Положим, в самом общем виде, что социальная система описывается во временной области входным возмущением x(t), выходным результатом у (t), вектором состояния z(t) и управляющим фактором и (t). Кроме этого введём р (^-вектор неизвестных параметров системы. Тогда оператор системы представим в виде y(t)=At (x(t),z(t), p{t), u(t)).
Задачей идентификации является отыскание оператора А^ по наблюдениям за поведением системы при воздействии на неё процесса x(t).
Определение степени соответствия идентифицируемого объекта его модели
Степень соответствия модели реальному объекту логично определять по одному или нескольким информативным признакам. Наиболее удобным с точки зрения объёма вычислений следует считать вариант, когда исследователю удаётся отыскать один существенный информативный признак, дающий интегральную характеристику об объекте.
Положим, что для оценки значения выбранного информативного признака у исследователя есть возможность обобщить данные, полученные в ходе длительных наблюдений. Тогда, сравнивая в абсолютном выражении значения информативного признака у объекта и модели в течение какого-то периода наблюдений, будет получено распределение вероятностей абсолютных погрешностей А, так как случайный характер отклонений неизбежен. При этом исследователю важно знать закон распределения этих вероятностей. На практике часто полагают, что закон распределения случайных погрешностей является гауссовским (нормальным). Достаточно часто это принимается как априорное допущение, обоснованное теоремой Ляпунова, из которой следует, что если случайная величина ^ представляет собой сумму очень большого числа взаимно независимых случайных величин , влияние каждой из которых на всю сумму ничтожно мало, то величина ^ имеет распределение, близкое к нормальному. Причём нет необходимости знать ни значения величин ни их распределения, главное, чтобы их было достаточно большое количество.
Выражение для плотности вероятности нормального распределения абсолютных погрешностей А имеет вид
-I -1/2 со(Д) = (аД) (2я) ехр[-(А - тА)2/(2аА2)], где ад и шд - соответственно среднеквадратическое отклонение (корень квадратный из дисперсии) и математическое ожидание (среднее значение) погрешности А.
Приведённые в настоящей формуле простейшие числовые характеристики случайных погрешностей: математическое ожидание тд= = М[Л] и среднеквадратическое отклонение Од (од = D[A] ) часто на практике оказываются достаточными характеристиками, позволяющими не вникать в закон распределения случайной величины. Если же известно, что закон распределения является нормальным, то числа 0д и тд вообще полностью определяют его, являясь исчерпывающими характеристиками.
Теоретически вероятностные характеристики погрешностей представляют собой постоянные величины, которые можно получить только при бесконечном числе опытов. В реальности же число полученных результатов всегда ограниченно. Поэтому на практике имеют место числовые характеристики, являющиеся оценками их истинных значений, получить которые можно только теоретически.
Как уже отмечалось в предыдущем параграфе, достаточно распространённым является выбор в качестве критерия близости среднеквадратического отклонения с = (D[AJ) . Найдём далее выражение для вычисления оценочного значения ад. Исходя из определения дисперсии случайной величины А, имеем:
D[A]=DA=M[(A - тЛ)2].
Примем в качестве оценки математического ожидания среднее арифметическое значение
М* [(А - тЛ)2] = ( X/ (At - тА) )/N, i = 1,2,-Л где N- количество результатов, полученных в процессе наблюдения (количество сравнений объекта с моделью).
Учитывая, что с = (DfAJ) , несложно получить выражение для оценки о^:
М*= к Xi (А1 - тА)2) min, i = 1,2,.,N.
Отметим, что в полученной формуле присутствует истинное значение математического ожидания тд, в то время как в реальности можно получить лишь оценочное значение тд * Из соответствующих разделов прикладной теории вероятностей известно, что для замены в вышеприведённой формуле тд на тд * в подкоренное выражение необходимо ввести поправочный множитель N/(N-1). Тогда
ОА*= К Zi (М - mA*f)AN - 1)Г>\ i = 1,2,.,N.
Корреляционная функция как критерий близости идентифицируемого объекта и модели
Критерии близости, основанные на вычислениях абсолютной или среднеквадратической погрешности, не вызывают каких-либо трудностей при их использовании, что связано с их относительной простотой. В то же время эти критерии не всегда оказываются эффективными и даже, более того, могут привести к ошибочным результатам. Безусловно, когда степень близости модели к объекту оценивается по заданному набору дискретных показателей, дающих исчерпывающую информацию об объекте (модели), то вычисление абсолютной или среднеквадратической погрешности вполне оправдано и обосновано. Действительно, нет необходимости отказываться от достаточно простых методов, если исследователю предстоит определить, как разнятся всего лишь соответствующие значения одного существенного информативного признака, зафиксированные при наблюдении за объектом и полученные на модели. Например, при идентификации колебательной системы (осциллятора) самого различного происхождения, как биологического, так и искусственного, достаточно сравнивать значения частоты колебаний, зависящие от параметров объекта и модели. При этом для вполне удовлетворительной оценки степени приближения можно довольствоваться абсолютными погрешностями изменения частоты колебаний от управляемых параметров. Измеряя частоту собственных колебаний в заданные промежутки времени и табулируя значения в пределах определённой выборки, исследователь без труда, по соответствующим друг другу значениям, может определить степень близости объекта и модели (и наоборот).
Рассмотрим далее ситуацию, отличную от вышеприведённого примера. Пусть требуется идентифицировать объект, функционирование которого сопровождается появлением акустических шумов, характеризующихся случайным характером и широким частотным спектром. Шумы являются единственно доступным в данной ситуации измеряемым признаком. Разумеется, перед моделированием исследователь тщательно изучит генерируемые шумы и, опираясь как на теоретическую, так и на эмпирическую базы, вынесет решение о том, что является источником этих сигналов. После чего, по всей вероятности, буцет построена физическая модель объекта. Далее наступает этап сравнения конкретной модели с объектом посредством изучаемых шумов. Применить метод, основанный на вычислении абсолютной или среднеквадратической погрешности, реально в данном примере не удаётся, поскольку речь идёт уже не о заданном наборе измеренных значений, а о совокупности бесконечно большого числа мгновенных значений, образующих шум. Таким образом, необходимо определить степень близости двух случайных процессов или, с другой точки зрения, необходимо идентифицировать случайный процесс.
Для решения поставленной в рассмотренном примере задачи в общем виде автор предлагает метод, основанный на корреляционном анализе процессов. Взаимная корреляционная функция двух случайных процессов x(t) и у (t) определяется выражением
Кху(*1>П) = M[(x(tj) - mx(tj)) (y(t2) - my(t2))], где mxyi m,y - математические ожидания случайных процессов х (t)n у (t) соответственно.
Если случайные процессы отвечают условиям стационарности и эргодичности, которые допускают замену усреднения по ансамблю реализации на усреднение по времени, то их взаимокорреляционная функция уже будет зависеть не от конкретных значений временных сечений tj или , а только от их разности т = - tj. При этом формула для вычисления взаимной корреляции преобразуется к виду, более удобному для практических применений. т
Кху (%)= Urn )[f (x(t) - mx) (y(t+x) - my) dtJ/T. о
Учитывая, что в реальности интервал наблюдения Т(в данной формуле интервал усреднения) ограничен, то вместо истинного значения КХу(t) будет получена оценка
• Кху * (t)= [/ т - тх) (y(t+%) - ту) dt]/T. о
Таким образом, подвергая взаимокорреляционной обработке процессы, один из которых формируется объектом, а другой, например, его физической моделью, определяется степень подобия (или степень взаимосвязи) процессов на протяжении всего интервала наблюдения. Происходит это, как мы уже видели, благодаря интегральной оценке процессов в течение интервала времени, доступного для их изучения. При этом учитываются прежде всего динамические параметры процессов, существенным образом влияющие на их общий характер. Кроме того, важным достоинством корреляционного метода является тот факт, что незначительные огрехи в моделировании ни в коей мере не могут привести к сколько-нибудь весомым ошибкам, поскольку взаимокорреляционная функция по своей природе призвана дать именно общую картину статистической взаимосвязи процессов. Следовательно, при идентификации объектов, систем, процессов или явлений, где информативный признак представляет собой случайную функцию, в качестве критерия близости может быть использована взаимокорреляционная функция.
Заключение
1. Задачи идентификации в социально-правовой сфере решаются частными методами, обладающими невысокой степенью формализации и ограниченными возможностями, что существенным образом отражается на уровне проводимых работ. При этом в первую очередь снижается достоверность идентификации.
2. Для повышения эффективности идентификации в рассматриваемых приложениях необходимо ввести формализованный подход, основанный на абстрагировании, путём построения количественных моделей идентифицируемых объектов.
3. Исследования, связанные с идентификацией объектов, для которых в качестве информативного признака выступают сложные процессы, представляющие собой непрерывные функции, показали высокую эффективность применения взаимокорреляционного анализа для определения степени соответствия модели объекту. В то же время для широкого внедрения метода требуется проведение комплекса работ, направленных на определение конкретных результирующих критериев и, что самое важное, необходимо разработать доступные вычислительные средства, позволяющие на практике проводить корреляционную обработку, и адаптированные к конкретным областям применения.
-
Похожие работы
- Методы и алгоритмы идентификации в системах управления промышленными объектами
- Информационно-аналитическая система поддержки принятия управленческих решений в процессе мониторинга требований пожарной безопасности
- Синтез и применение алгоритмов идентификации как замкнутых динамических систем
- Алгоритм и методика определения параметров многомерной линейной динамической модели тягового энергопотребления участка железной дороги
- Разработка информационно-аналитической системы идентификации спиртных напитков на основе комплекса физико-химических показателей