автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Логико-лингвистические методы и модели в системе оперативного управления органами внутренних дел

кандидата технических наук
Рогова, Наталья Алексеевна
город
Москва
год
2014
специальность ВАК РФ
05.13.10
Автореферат по информатике, вычислительной технике и управлению на тему «Логико-лингвистические методы и модели в системе оперативного управления органами внутренних дел»

Автореферат диссертации по теме "Логико-лингвистические методы и модели в системе оперативного управления органами внутренних дел"

На правах рукописи

РОГОВА Наталья Алексеевна

Логико-лингвистические методы и модели в системе оперативного управления органами внутренних дел

Специальность: 05.13.10 - управление в социальных и экономических системах

(технические науки)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

УЧЕНЫЙ СЕКРЕТАРЬ УЧЕНЫЙ СЕКРЕТАРЬ

Академии управления Академий управления

МВД России МВД России

BX.Ni 117 ММ 7/160

ОТ 24 . 10.2014 ОТ 24. 10. 2014

Москва • 2014

005558138

005558138

Выполнена в Федеральном государственном казенном образовательном учреждении высшего профессионального образования «Академия управления МВД России»

Научный руководитель кандидат физико-математических наук,

доцент,

Лукашов Николай Васильевич

Официальные оппоненты: Дворянкин Сергей Владимирович,

доктор технических наук, профессор, Национальный исследовательский ядерный университет «Московский инженерно-физический институт», профессор кафедры стратегических информационных исследований

Киреева Галина Ивановна,

кандидат технических наук, доцент Российский экономический университет им. Г.В. Плеханова, доцент кафедры информационных технологий и телекоммуникаций

Ведущая организация Федеральное государственное бюджетное

учреждение науки Санкт-Петербургский институт информатики и автоматизации Российской академии наук (СПИИРАН)

Защита состоится 25 декабря 2014 г. в 14 часов 30 минут на заседании диссертационного совета Д 203.002.04, созданного на базе ФГКОУ ВПО «Академия управления МВД России» по адресу: 125171, г. Москва, ул. Зои и Александра Космодемьянских, д. 8, ауд. 415.

С диссертацией можно ознакомиться в библиотеке и на сайте Академии управления МВД России, www.amvd.ru.

Автореферат диссертации разослан 24 октября 2014г.

Ученый секретарь диссертационного совета ГУ/^7

кандидат технических наук /к!!/' Б.А. Торопов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Система органов внутренних дел (ОВД) Российской Федерации является одной из социальных систем, реализующей функции укрепления правопорядка в обществе, обеспечения безопасности граждан от преступных посягательств. По объему решаемых задач и выполняемых функций характеризуется большим количеством составляющих элементов, высокой степенью их связности, многообразием алгоритмов управляющих воздействий и большими объемами перерабатываемой информации. Эффективность деятельности ОВД зависит от качества управленческих решений, принимаемых на разных уровнях управления. Система управления при этом замыкается на руководителей — физических лиц, принимающих решения, возможности которых по восприятию и обработке соответствующей информации существенно ограничены естественными параметрами человеческой психики. Высокая степень насыщенности нормативно-руководящими, нормативно-правовыми и оперативными документами информационной базы поддержки принятия управленческих решений ставит перед лицом, принимающим решение (ЛПР), достаточно сложные задачи по отбору релевантных источников информации, отражающих состояние оперативной обстановки и возможных альтернативных вариантов принятия решений.

Качественно новым подходом к решению данной задачи является логико-лингвистическое моделирование детерминированной предметной области на основе семантического анализа текстовой информации, в том числе выявление логико-семантических связей между основными терминами и устранение выявленных противоречий и неоднозначности смысловых понятий.

Кроме того, важной структурной составляющей ведомственных информационных систем является реализация процесса аутентификации информационных и поисковых массивов, исключающего возможности преднамеренной или случайной модификации как самих информационных документов и сообщений, так и их поисковых предписаний.

Эта задача может быть решена при помощи разработки словаря-тезауруса, особым образом описывающего языковые единицы, составляющие понятия предметной области. Создание такого тезауруса и использование его в лингвистическом обеспечении автоматизированной информационной системы позволит повысить ее эффективность, обеспечить полноту и точность информационного поиска, даст возможность общаться участникам

системы на едином языке, адекватно отражающим объекты предметной области и отношения между ними.

Степень разработанности темы. Следует отметить, что методы формирования словарей-тезаурусов до настоящего времени решались преимущественно в рамках отраслевых научных школ. Основное направление получило создание различного рода тематических справочников, классификаторов (Ю.М. Шемакин). Однако вопросы использования методов теории логико-лингвистического моделирования, разработанной Д.А. Поспеловым еще в 1970—1990 гг., позволяющей создавать и логически связывать лингвистические модели недетерминированных предметных областей для применения в информационно-поисковых системах, ведомственной наукой до настоящего времени не разрабатывались. Применение методов гуманитарных исследований, таких как метод лингвистического конструирования, используемый в теории лингвистики (Д.Г. Лахути, Н.В. Лукашевич, В.А. Архангельская и др.), а также модельного инструментария теории информационного поиска (Г.Г. Белоногов, А.И. Черный, Г. Сэлтон, Р. Хойл, Р.Д. Аветисян и др.) наряду с естественно-научными методами теории множеств (Б.З. Вулих), теории распознавания образов (А. Фор, К. Фу), теории ортогональных рядов и полиномов (С. Качмаж, Г. Штенгауз, В.Ф. Макаров), теории графов (К. Берж), следуя фундаментальным концепциям теории управления организационными системами (Д.А. Новиков, А.Д. Цвиркун), в том числе оперативного (ситуационного) (С.М. Крылов, В.З. Веселый, А.Ф. Майдыков и др.), позволило создать модель предметной области системы оперативного управления органами внутренних дел, описать существующие связи между объектами. Таким образом, соединение гуманитарного и естественно-научного подходов составило теоретическую основу диссертационной работы.

Объект и предмет диссертационного исследования. Объектом исследования является система оперативного управления органами внутренних дел.

Предметом исследования являются методы логико-лингвистической обработки информации и идентификации пользователей, процессов и устройств в информационных инфраструктурах системы оперативного управления органами внутренних дел.

Цель и задачи исследования. Целью исследования является совершенствование системы оперативного управления органами внутренних дел на основе логико-лингвистического моделирования.

Для достижения цели диссертационного исследования были поставлены и решены следующие задачи:

1. Проведен анализ системы оперативного управления органами внутренних дел в структуре логико-лингвистического базиса с целью выявления методов повышения эффективности управления.

2. Проведен логико-семантический анализ понятийно-терминологического аппарата предметной области для формирования логико-лингвистической модели в системе оперативного управления ОВД с целью выявления устойчивых семантических связей.

3. Разработана фасетная классификация лексических единиц предметной области с целью формирования словаря системы оперативного управления, выявлены группы условной эквивалентности терминов, определены дескрипторы и логико-семантические связи между ними.

4. Разработана методика формирования информационно-лингвистического обеспечения (тезауруса) оперативного управления.

5. Разработана математическая модель отбора релевантных источников в автоматизированной информационной системе оперативного управления с использованием базисного опорного словаря (тезауруса).

6. Выработаны количественные критерии оценки эффективности отбора релевантных источников и обоснована необходимость совершенствования информационного обеспечения системы оперативного управления на основе методов логико-лингвистического моделирования.

7. Разработана методика аутентификации электронных документов с использованием модифицированного множества кусочно-постоянных ортогональных функций Уолша и выработаны предложения по индексированию санкционированных пользователей в электронном документообороте системы оперативного управления органами внутренних дел.

Методология и методы исследования. В диссертационной работе применены следующие методы: качественного и количественного анализа систем, математической статистики, логико-лингвистического моделирования, лингвистического конструирования, инструментального проектирования и лингвистического обеспечения автоматизированных информационных систем.

Научная новизна диссертационного исследования состоит в том, что автором впервые предложена методика совершенствования системы поддержки принятия решений в контуре оперативного управления органами внутренних дел средствами информационно-лингвистического обеспечения с

расширенной структурой базисных отношений (прикладного тезауруса) и идентификация/аутентификация процессов, пользователей и устройств на основе ортогонального кодирования и вычисления функции свертки в ортогональном базисе.

Достижение основной цели исследования и связанных с ней задач нашло свое отражение в результатах, имеющих характер научной новизны:

1. Автором впервые определены состав, структура и основные математические и статистические параметры тезауруса оперативного управления органами внутренних дел с использованием математических логико-семантических методов, необходимых для формирования тезауруса предметной области.

2. Предложена методика формирования системы информационно-лингвистического обеспечения как системы с развитой структурой базисных отношений в виде прикладного тезауруса, являющегося формализованным представлением предметной области оперативного управления органами внутренних дел, позволяющая формировать и поддерживать тезаурус в актуальном состоянии.

3. Впервые на основании методов логико-лингвистического моделирования разработан тезаурус информационной системы оперативного управления, позволяющий закрепить имплицитно существующие базисные отношения в предметной области деятельности органов внутренних дел.

4. Разработана методика формирования поисковых образов документа и свободно конструируемого запроса на основе методов дескрипторного индексирования ключевых слов.

5. Разработана модель информационного поиска в автоматизированных системах оперативного управления органов внутренних дел на основе методов инверсной реализации и логико-лингвистического моделирования.

6. Разработана методика идентификации процессов, пользователей и устройств на основе вычисления функции свертки и кодирования исходных сообщений с использованием кусочно-постоянных ортогональных функций Уолша и обработки ортогональных сигналов в метрике Гильбертова пространства.

Новизна сформулированных автором выводов нашла свое отражение в положениях, выносимых на защиту, а именно:

1. Методика формирования тезауруса предметной области -системы оперативного управления органами внутренних дел.

2. Словарь поисковых терминов (тезаурус) системы оперативного управления органами внутренних дел «фасетной» классификации с развитой структурой базисных отношений.

3. Методика формирования поискового образа документа и поискового предписания на основе методов инверсной реализации, логико-лингвистического моделирования и методов дескрипторного индексирования ключевых терминов.

4. Методика критериальной оценки качественных показателей поиска и отбора релевантных источников информации системы оперативного управления органами внутренних дел.

5. Методика идентификации процессов, пользователей и устройств в информационных инфраструктурах с использованием методов ортогонального преобразования при вычислении функции свертки и кодировании идентифицирующих сообщений в корпоративных информационных системах.

Теоретическая и практическая значимость диссертационного исследования. Теоретическая значимость диссертационного исследования определяется тем, что автором впервые в целях совершенствования системы оперативного управления органами внутренних дел разработана методика формирования системы информационно-лингвистического обеспечения с развитой структурой базисных отношений в виде прикладного тезауруса с возможностью включения отдельных тематических фасет.

Практическая значимость работы заключается в том, что положения, содержащие научную новизну, могут быть применены участниками системы оперативного управления органами внутренних дел в информационных системах с целью повышения эффективности использования этих систем, в обеспечении полноты и точности отбора релевантных источников в информационных массивах. Существенно повышается достоверность управленческой информации за счет снижения ее субъективности, обусловленной влиянием человеческого фактора. Обеспечена возможность установления подлинности процессов, пользователей и устройств в корпоративных информационных системах в режиме удаленного доступа к вычислительным ресурсам.

Обоснованность и достоверность результатов диссертационного исследования. Обоснованность диссертационного исследования достигнута корректным применением методологического аппарата следующих теорий: организационных систем, множеств, восприятия и распознавания образов, ортогональных рядов и полиномов.

Достоверность результатов исследования подтверждает внедрение методических рекомендаций по разработке тезауруса предметной области оперативного управления органами внутренних дел и словаря-тезауруса в деятельность оперативных подразделений ОПБ МВД России, дежурной части УМВД России по Калининградской области, а также тот факт, что формирование лексического множества словаря проводилось на основе действующего законодательства и нормативно-правовой базы органов внутренних дел Российской Федерации.

Апробация и внедрение в практику результатов диссертационного исследования. Разработанные автором теоретические положения были доложены на следующих научно-практических конференциях: XVIII международной научной конференции «Информатизация и информационная безопасность правоохранительных органов» (Москва, АУ МВД РФ, 2009); XIX международной научной конференции «Информатизация и информационная безопасность правоохранительных органов» (Москва, АУ МВД РФ, 2010); международном симпозиуме «Специальная связь и безопасность информации (ССБИ-2012)» (Краснодар - Терскол, 2012); XXI всероссийской конференции «Информатизация и информационная безопасность правоохранительных органов» (Москва, Академия управления МВД России, 2012); межвузовской научно-практической конференции «Силовое принуждение и проблемы обеспечения национальной безопасности России» (Москва, Пограничная Академия ФСБ России. 2010).

По результатам диссертационного исследования автором получены пять актов о внедрении результатов исследования в практическую деятельность подразделений МВД России и учебный процесс высших учебных заведений.

Структура и объем диссертации. Диссертационное исследование состоит из введения, трех разделов с выводами по каждому из них, заключения, списка приводимых в тексте сокращений, списка использованной литературы и пяти приложений.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы, формулируются цель и задачи исследования, приводятся основные результаты, выносимые на защиту.

Первый раздел посвящен анализу системы управления органами внутренних дел, роли оперативного управления. Приводится анализ информационных потоков в системе информационного обеспечения оперативного управления органами внутренних дел, обосновывается

целесообразность разработки лингвистического обеспечения для установления однозначности смысловых понятий в системе информационного обеспечения оперативного управления.

Констатируется, что углубление специализации в деятельности органов внутренних дел, возрастание количества взаимодействующих подразделений предопределяют переход на новые технологии управления, основой которых является единое информационное пространство. Совершенствование системы оперативного управления органами внутренних дел на основе современных информационных технологий непосредственно связано с созданием интеллектуальных систем управления, формированием баз знаний об оперативной обстановке.

Комплексные автоматизированные информационные системы, созданные в первую очередь для повышения качества и эффективности управления силами и средствами органов внутренних дел, в настоящее время представляют собой набор подсистем, слабо связанных функционально, что исключает возможность реализации всех преимуществ единого информационного пространства и построения полноценной системы автоматизированного управления. Отсутствие аппарата индексирования процессов, пользователей и устройств в системе оперативного управления органами внутренних дел ставит задачи по оценке доверительности объектов информационного обмена электронными документами в корпоративных информационно-вычислительных сетях. Кроме того, существует объективная трудность ориентации в большом объеме недостаточно упорядоченных информационных материалов, их дублирование, неоднозначность понимания, сопровождающиеся необратимыми потерями времени, материальных и интеллектуальных ресурсов, т.е. проблема эффективного поиска и извлечения информации.

Оценка информационных процессов основана на ряде известных критериев, в соответствии с имеющимися стандартами критериями оценки эффективности информационного поиска являются:

— коэффициент точности Р — определяется как доля истинно релевантных документов в общем числе всех найденных по запросу документов:

р=Ж.. (1)

г |лив|' ;

- коэффициент полноты Я - доля найденных истинно релевантных документов от общего числа всех истинно релевантных документов:

/г=-м-; (2)

— коэффициент шума N — доля нерелевантных документов в общем числе всех найденных по запросу документов:

|в| • (3)

— коэффициент ложной выдачи /<" - доля найденных нерелевантных документов в общем числе всех нерелевантных документов:

/г= _!£!_, (4)

\B\JD\ У '

— коэффициент молчания Б — доля ненайденных нерелевантных документов в общем числе всех релевантных документов:

Л мисГ

где А - количество релевантных документов в выдаче;

В — количество нерелевантных документов в выдаче;

С - количество невиданных релевантных документов;

О — количество невиданных нерелевантных документов.

С использованием перечисленных критериев построена множественная модель отбора релевантных источников информации. Логика поиска отражена с помощью операторов булевой алгебры. В процессе документального поиска операции осуществляются над множествами элементов: множеством ключевых слов или дескрипторов с одной стороны, и множеством документов с другой, т.е. между множеством документов и множеством их поисковых описаний.

Для замены специфических терминов практикуется использование тезаурусов. Тезаурус объединяет группы связанных терминов в классы, после чего такие термины могут быть заменены специальным идентификатором этого класса. Общие термины можно заменить сочетаниями терминов или группами связанных терминов, так называемыми группами условной эквивалентности, типичными представителями которых является множество дескрипторов. Такие множества строго детерминированы и лишены признаков синонимии и полисемии, так как имеют более определенные значения для установления однозначности смысловых понятий. Дополнительно могут вводиться базисные отношения в виде родовидовых отношений, отношений ассоциации и сочетания.

Единицы тезауруса — это термины, представленные словами или словосочетаниями, которые выступают либо в качестве дескриптора, либо в качестве варианта (синонима) дескриптора. Дескриптор в совокупности с его вариантами представляет в тексте определенное понятие предметной области и образует синонимический ряд или так называемую группу (класс) условной эквивалентности.

Во втором разделе предложена методика формирования тезауруса оперативного управления органами внутренних дел, методика формирования поискового образа документа (ПОД) на основе дескрипторного индексирования, методика формирования поискового образа запроса (ПОЗ), модель отбора релевантных источников в автоматизированной информационно-поисковой системе (ИПС) с контролем по тезаурусу, методика идентификации процессов пользователей и устройств с использованием ортогональных преобразований при вычислении функций свертки и кодировании идентифицирующих сообщений.

Пусть М - множество лексических единиц описываемой предметной области, которые могут быть представлены в виде лингвистических переменных:

М-> {тп | п= (6)

где — количество терминов предметной области.

Предположим, что множество М можно разделить на отдельные подмножества - группы условной эквивалентности.

Обозначим = [тц,т12, ш(3, ...,ту}- множество сходных по значению понятий (синонимов) - /-ю группу условной эквивалентности. Выделим из него один элемент - т¡к, который является образом группы синонимов (группы условной эквивалентности), определяемый как дескриптор - (¿¡. Схематично это выражено на рис. 1.

0< =

где

{ТПц т12

Щз ти

Щв

Ль В, = ■

тп т)г "1/3 гл;ч

™У5 УЩт

тк1 ТПк2 ШкЗ тк4

тк5

<1Ь ¿у, йк - дескрипторы ;'-й,у-й, к-й групп условной эквивалентности соответственно.

Рисунок 1. Выделение дескрипторов в группах условной эквивалентности. Определим множество всех групп условной эквивалентности как I):

= (7)

где - количество таких групп.

Рассмотрим множества М и X). Элементы этих двух множеств определенным образом сопоставляются друг с другом, образуя пары (т, с{). Способ такого сопоставления строго детерминирован, т.е. для каждого т еМ указан элемент с1еО. Следуя положениям теории множеств, можно

утверждать, что между множествами М и установлено однозначное соответствие, которое может быть выражено как: д —> {М, Ц

где <2 с М х И - график установления соответствия, определяющий закономерность, по которой осуществляется соответствие.

Сделаем предположение, что все элементы множеств Ми Б участвуют в соответствии. Тогда, если (т,ф с (), это означает, что элемент <1 соответствует элементу т, т.е. для каждого термина предметной области можно определить группу условной эквивалентности.

Все дескрипторы определенные на данной предметной области и являющиеся типичными представителями групп условной эквивалентности, упорядочены по алфавиту, каждому из них присвоен индивидуальный классификационный индекс являющийся одновременно индексом группы условной эквивалентности Нумерация соседних дескрипторов

производится не подряд, а с интервалом в 10 единиц, что обеспечивает возможность введения между ними дополнительных дескрипторов в случае появления таковых.

Индексы дескрипторов (групп условной эквивалентности) составили множество классификационных номеров (7, которое можно определить как:

(8)

где Nt - количество таких групп, равное количеству дескрипторов.

Лексемы ту, входящие в группу условной эквивалентности и являющимся ключевыми словами, также индексируются. Их индексы соответствуют индексу дескриптора.

Порядок следования ключевых слов в дескрипторной статье — алфавитный.

Лексемы, не вошедшие ни в одну из групп условной эквивалентности, определены как самостоятельные дескрипторы, включены в алфавитный список, проиндексированы и добавлены в словарь.

В результате проведения процедуры присвоения классификационных номеров всем группам словаря, (дескрипторам и их статьям) образуется новое множество С. Таким образом, элементам множества Х> — дескрипторам, были сопоставлены элементы множества С — классификационные номера. Из этого утверждения следует, что существует множество Рс БхО — график соответствия множеств йи(?. Полученное соответствие определяется как: Р - {О, аР}. (9)

Тогда утверждение (с1, с Р означает, что всем дескрипторам множества групп условной эквивалентности И присвоены классификационные индексы из множества С.

Таким образом, сформированы два соответствия:

?->/М,Д0,бсА/хО (10)

р-*{0,С,Р},Р сИ хв. (11)

Область значений первого соответствия совпадает с областью определения второго соответствия. Тогда, согласно положениям теории множеств, можно утверждать, что нами определена композиция соответствий:

д(р)^{М,С,доР},з^доРсМхО, (12)

где запись о Р отображает композицию между соответствиями 2 и Р. Анализ предметной области показал, что многие дескрипторы связаны между собой родовидовыми отношениями, которые обозначены в тезаурусе.

Помимо описанных выше отношений между дескрипторами в тезаурус введены отношения ассоциации и сочетания.

Таким образом, по предложенной методике сформирован словарь-тезаурус оперативного управления органами внутренних дел. Словарная часть представляет собой общий алфавитный список дескрипторов (вместе с их словарными статьями) и ключевых слов.

Каждый дескриптор образует словарную статью, которая в определении теории множеств может быть описана следующей схемой:

В1->й1->(М11,Ма.Ма,Мц), (13)

где й\ — «заглавный» дескриптор;

Ми — упорядоченное по алфавиту множество ключевых слов, считающихся синонимами йс,

Мц = {т11,т21, т31.....тп}\ (14)

Множество Мп в совокупности с с!г образует класс условной эквивалентности. Детерминированный представитель данного множества является дескриптором. Данное множество выполняет функцию номинального определения, уточняющего смысл с^.

М,-2 - множество, состоящее из одного элемента — дескриптора, связанного с с^ отношением род — вид:

М12 = {с112}; (15)

М;з - множество элементов-дескрипторов, связанных с отношением вид —род".

М13 = {¿13.^23.^33. -.^из); (1б)

Мц - упорядоченное по алфавиту множество дескрипторов, каждый из которых связан с <11 отношениями ассоциации сочетания:

^¡4 = {¿14. <^24< «¿34, (17)

Любое из перечисленных множеств может быть одноэлементным и даже пустым. Совокупность множеств Мц снимает неопределенность рассматриваемого понятия.

В словаре-тезаурусе оперативного управления ОВД термины в дескрипторных статьях связаны лексикографически.

При выполнении теоретических исследований соискателем было определено и в экспериментальных разработках подтверждено, что сформированное пространство информативных признаков, элементами которого является множество дескрипторов исследуемой предметной области сепарабельно. Сепарабельность дескрипторного множества в свою очередь детерминируется в результате логико-семантического и лингвистического преобразований ключевых слов сформированного тезауруса. Такой подход позволил, наряду с традиционными критериями оценки качества функционирования системы информационного обеспечения для определения критериев смысловых соответствий поисковых образов запросов и поисковых образов документов, использовать теоретические методы восприятия и распознавания образов.

Создание единого комплекса системы информационного обеспечения предполагает построение множеств локальных тезаурусов МТ —> {Г1; Г2,..., Т)} по единой методике, предложенной соискателем. В этом случае поиск и отбор релевантных источников информации по требуемому запросу в полном соответствии с отображением его поискового образа будет осуществляться не только по отдельному оперативному направлению, но и по всем структурным составляющим единой информационной структуры органов внутренних дел. Структурно такой тезаурус может быть реализован по принципу «фасетной» классификации, т.е. он должен быть ориентирован на формирование логических фасет по функциональным признакам в едином логико-семантическом базисе.

Такая логико-семантическая и технологическая организация предполагает поиск и отбор релевантных источников информации по отдельным фасетам, т.е. на уровне локальных фасет будет устанавливаться соответствие между множествами дескрипторов ПОЗ и ПОД, а затем и соответствие между массивами ПОД и информационным массивом по выбранной фасете структуры ОВД.

После установления соответствий по отдельным фасетам для осуществления полноты отбора релевантных источников по объектам оперативного интереса необходимо осуществлять операцию поиска для «связи с другими материалами». Для этого на основании сформированных соответствий М$—>{с1ц} необходимо установить композиции таких соответствий на множествах детерминированных соответствий:

(18)

где (¿1' с- М] х М!3 есть определение правила, по которому устанавливается соответствие, т.е. все элементы множеств М\ и М!. дескрипторов, участвующих в сопоставлении.

Такие правила устанавливаются для всех фасет, сформированных в результате установления соответствий М1,..., М^.

После установления соответствий рекомендуется операция установления композиций по всем фасетам соответствий:

М^{М,1;М|;(?12}, (19)

где (?12 сгМ* хМ|

М1 {М}\ М*; <?34}, (20)

(?34сМ| хМ4

М1к^{М?-,МУ;(1пт}, (21)

<271771 с- М* хМЦ1.

Операция установления композиции соответствий осуществляется последовательно, т.е. изначально устанавливается проекция области значений первого соответствия на второе соответствие, затем определяется проекция двух множеств на третье и т.д. В этом случае область отправления первого соответствия полностью совпадает с областью прибытия (определения) второго соответствия. Затем область определения первого и второго соответствий множеств будет спроектирована на область прибытия третьего соответствия и т.д. Такой подход позволяет реализовать семантико-лингвистическую детерминацию поискового образа запроса по всем фасетам информационной инфраструктуры системы оперативного управления ОВД, а следовательно, максимизировать отбор релевантных источников информации с установлением всех семантических связей, т.е. установления полноты «связи с другими материалами».

Во избежание последовательного просмотра текстов при выполнении каждого запроса, поисковая система заранее составляет инвертированный

индекс (файл). Идея инвертированного индекса заключается в следующем: сначала в память компьютера записывается словарь терминов (тезаурус), затем для каждого термина создается список, в котором указаны документы, содержащие данный термин.

У любого документа Doci, поступающего в ИПС, существует его формализованное описание. Предположим, что в коллекции документов автоматизированной системы каждый <-й документ Doc,- имеет уникальный последовательный номер DoclDi, который присваивается ему системой при первом обращении.

Формализованное описание документа составляется в виде перечня ключевых слов, встречающихся в тексте этого документа после прохождения процедуры морфологического, синтаксического и семантического анализа. Затем происходит процесс индексирования, результатом которого становится формирование поискового образа документа — ПОД. Условимся обозначать поисковый образ /'-го документа — PODt. Множество ПОД обозначим как [POD], его элементы образуют индекс системы.

Таким образом, после проведения всех вышеперечисленных операций, документ представляет собой последовательность нормализованных лексем, отражающих содержание текста и называемых ключевыми словами документа:

DoCi -> (DocIDt |i = TjTd ; LtJ | i = ТЖ, j = ОТ, (22) где DocIDt - уникальный номер документа;

Nd — общее количество документов в информационном массиве; £у - совокупность нормализованных лексем i-то документа; Ki - количество ключевых слов в ;-м документе. Следующим этапом семантического анализа является соотнесение ключевых слов документа терминам словаря — предметного тезауруса. Процедура сопоставления ключевых слов документа терминам словаря (идентификация декларативной базе) является завершением семантического анализа текста документа и началом процесса дескрипторного индексирования.

Поисковый образ /-го документа (ПОД) в поисковой системе можно выразить следующей совокупностью:

PODt -> { Ni( Gt, DoclDi}, (24)

где Wj - уникальный номер ПОД;

PODt ~ поисковый образ (-го документа, массив ПОД (индекс системы):

POD —> {PODi | i = ~I7/Vp}, (25)

где Ыр - общее количество ПОД в индексе;

Оос/О,- - уникальный номер документа в информационном массиве. Информационный массив документов можно представить как:

БосЮ {£осЩ| 1 = 1, Л^}, где — общее количество документов в информационном массиве. Совокупность кодов дескрипторов в /-ом ПОД:

С£->{0» I <=1. ЛЬ, * =1. Л«.

где ^¡к _ К°Д к~т0 дескриптора в г'-м документе;

N1 — общее количество дескрипторов тезауруса поисковой системы.

(27)

(28)

Информационный запрос представляет собой поисковое предписание, отражающее информационную потребность пользователя системы: /—информационная потребность; Е— запрос пользователя;

где Яу — последовательность ключевых слов в запросе;

Ыт — количество пользовательских запросов;

N1 — количество дескрипторов словаря-тезауруса. При поступлении в ИПС пользовательского запроса, вводимые понятия проходят процесс нормализации, результатом которого является образование лексем и приведение их к каноническому виду. Затем каждая лексема анализируется на вхождение в тезаурус, т.е. сопоставляется с единицами тезауруса - терминами, представляющими группы условной эквивалентности. Результатом такого сопоставления является замена ключевых слов запроса соответствующими номерами дескрипторов тезауруса. При этом вводится следующее условие ограничения: любой лексеме запроса всегда найдется соответствие в виде дескриптора тезауруса данной предметной области, так как термины словаря в полной мере описывают строго детерминированную предметную область. В случае отсутствия искомого понятия среди терминов словаря оно может быть либо заменено на родственное, значение которого присутствует в тезаурусе либо внесено в словарь-тезаурус в соответствии с алгоритмом его актуализации.

Таким образом, получается тезаурусная проекция запроса, или поисковый образ запроса (ПОЗ).

POZ — формализованное представление /-го запроса в поисковой системе (ПОЗ) в виде кортежа, элементами которого являются номера (коды) дескрипторов тезауруса поисковой системы:

г->{ 2ц |/=1,Лт>./=1,лу,

(29)

РОг->{ дц |/=1,ЛГт,./ = 1.ЛУ,

где дц -совокупность кодов дескрипторов.

Поисковый образ запроса Р02 представляет множество, элементы которого выстроены в виде кортежа, являются кодами дескрипторов словаря, соединенных между собой знаками булевых операций. Количество элементов ПОЗ Nc определяется возможностями информационно-поискового языка системы - тезауруса.

Дескрипторы словаря являются единицами информационного языка (ИПЯ) и порождают двуместные смысловые отношения. Смысловые отношения могут устанавливаться на множестве дескрипторов и их логико-семантических взаимосвязей. Любое высказывание естественного языка (ЕЯ) переводится на ИПЯ в виде Я ((¿¡, с1;), где с^ и ^ — дескрипторы, а Р - вид отношений между ними.

В булевой модели поиска в поисковом образе запроса эти отношения прежде всего выражены как булевы, позволяя выразить пользовательский запрос, введенный на ЕЯ, в виде совокупности кодов дескрипторов, соединенных знаками булевых функций.

Пусть поисковый образ ¡-го запроса имеет следующий вид:

РОг(= йгЛ й2 А с*3 Л с*4У й5 V Ть . (31)

Семантически это означает, что релевантными документами в информационном массиве будут считаться документы, поисковые образы которых формируются в результате операции пересечения дескрипторов с?!, й2, <23 и операции объединения дескрипторов й4, с15 или отрицанием дескриптора й6.

При выполнении диссертационного исследования автором предложен и разработан метод вычисления функции свертки (хэш-функции) исходного сообщения произвольного размера на основе методов ортогонального кодирования. В данном случае в качестве ортогонального базиса предложено использовать модификацию ортогонального множества кусочно-постоянных ортогональных функций Уолша.

Для распознавания санкционированных пользователей в корпоративном документообороте предлагается использовать метод ортогонального кодирования образов распознавания с использованием корпоративного «Центра доверия». Алгоритм такого распознавания может быть представлен следующим образом:

1. На каждой рабочей станции инсталлируется система ортогонального кодирования, и каждый пользователь (или администратор безопасности) формирует индивидуальные ключи шифрования К„';

2. На компьютере корпоративного «Центра доверия» формируется модуль всех ключей пользователей (БД ключей пользователей);

3. Для распознавания абонента связи (абонента В) абонент-инициатор (абонент А) формирует текстовое сообщение М и шифрует его своим ключом Кпл\

МА^СА, (32)

са = Е*Ш. (33)

где С а - криптограмма сообщения абонента А;

Екл — процесс преобразования открытого сообщения абонента А с помощью индивидуального ключа Кп\

Мл - открытое сообщение абонента А для абонента В;

4. Криптограмму сформированного сообщения М абонент А отправляет в «Центр доверия», на стороне которого производится перешифровка криптограммы СА(МА) ключом абонента-получателя В:

Мл = Окл(Екл (Мл)) (34)

Св=Ев(Ма), (35)

где Св - криптограмма сообщения от абонента А — Ма, сформированная ключом абонента В;

5. «Центр доверия» отправляет криптограмму Сц абоненту В, который, в свою очередь, расшифровывает ее с помощью своего ключа Кпв и восстанавливает сообщение Ма абонента А:

МА=ПКВ(ЕВ(МА)У, (36)

6. Абонент В по полученному сообщению МА вычисляет его хэш-значение по выше приведенной методике в модифицированном ортогональном базисе Ма = ЬВ(МА) и зашифровывает его на своем индивидуальном ключе Кп'-

С в = Ев(Ив(МА)); (37)

7. Криптограмму хэш-значения сообщения МА абонент В отправляет в «Центр доверия» для ее преобразования на ключе абонента А:

Ив(М.д = Окв(Ев0гв(М.д), (38)

САт> = Екл (ЦМд». (39)

Криптограмму хэш-значения С/^ «Центр доверия» передает абоненту А;

8. Абонент А производит дешифрование криптограммы С аМ и восстанавливает хэш-значение ранее сформированного сообщения МА:

Е>к(Ек тШ = ^"(МА); (40)

9. Абонент А из ранее сформированного сообщения МА вычисляет его хэш-значение: МА —► И"''(МЛ). В случае равенства вычисленного и дешифрованного хэш-значений ^'"(Ма) = Н"ч(Ма) делается заключение о

доверительности абонента В, в случае их неравенства делается заключение о фальсификации абонента связи - маскараде.

В третьем разделе исследования приведены результаты экспериментальной оценки качественных показателей отбора релевантных источников в разработанной логико-лингвистической модели системы информационного обеспечения оперативного управления органами внутренних дел, а также реализованы функции аутентификации процессов, пользователей и устройств на основе системы ортогонального кодирования, разработанной автором, с использованием модифицированного множества кусочно-постоянных ортогональных функций Уолша (модификация функций Уолша предложена автором).

В процессе подготовки тезауруса использована служебная лингвистическая база данных, обеспечивающая формирование информационно-поискового тезауруса оперативного управления.

Автором проанализирован документопоток, включающий в себя свыше четырех тысяч документов различных типов, объемом более 160 тысяч лексических единиц, отражающих деятельность субъектов контура оперативного управления органами внутренних дел. Составлены частотные словари встречаемости терминов. В качестве инструмента частотного анализа в диссертационном исследовании использовалось программное средство — утилита URS1.

В лексическом массиве исследуемой предметной области определены единицы тезауруса - термины, выявлены синонимические группы терминов -группы условной эквивалентности, внутри каждой группы выявлен типичный представитель — дескриптор. Сформирован и проиндексирован словарь поисковых терминов — тезаурус оперативного управления органами внутренних дел. Между дескрипторами словаря введены базовые отношения «род — вид», а также отношения ассоциации и сочетания.

Средствами Microsoft Office Excel-2010 создана логико-лингвистическая модель информационно-поисковой системы, с помощью которой произведена количественная оценка качества поиска релевантных источников в тестовом информационном массиве, включающем в себя 1000 документов.

Стандартный подход к оценке функционирования ИПС опирается на понятие релевантных и нерелевантных документов. В соответствии с информационными потребностями пользователей документ из

1 http://www.nooIab.ru

информационного массива проходит бинарную классификацию: релевантный или нерелевантный.

Проанализировано: по наиболее распространенным выборкам - 450 запросов, по индивидуальным, специализированным выборкам-35 запросов. Получены значения коэффициента полноты, коэффициента точности, коэффициента информационного шума.

В соответствии с исходными данными получены следующие результаты для типовых запросов:

1. Количество релевантных документов, выданных по запросу, составило Ар = 436 единиц, количество же релевантных документов в информационном массиве Ар = 450, следовательно, коэффициент информационной полноты

Л|=436

450 ' 4 '

2. Количество релевантных источников выборочной совокупности, выданной по типичным запросам, составило Ср =441 документ; общее количество документов, выданных по запросам Ср = 450, следовательно, коэффициент точности

3. Оценка информационного шума производилась следующим образом:

— в результате экспериментальной оценки по выборочной совокупности было выявлено Вр = 441 релевантных источников информации, количество нерелевантных источников в произведенных выборках составило: Впр = 14. Следовательно, коэффициент информационного шума по типовым информационным запросам

По нетипичным (специализированным) запросам установлены следующие количественные показатели качества функционирования разработанной логико-лингвистической модели:

- при определении коэффициента полноты Л — Ар = 34 — число документов в выборке; Ар = 35 — число документов в массиве, откуда следует, что:

— при определении коэффициента точности Р — = 26; Ср = 27, следовательно,

Р=%~°'97; (45)

- при определении коэффициента информационного шума /У— Вр= 51; Внр = 2, откуда следует, что:

N=^ = 1-0,04. (46)

В р 51

Таким образом, как при анализе типовых запросов, так и специализированных запросов, по логико-лингвистической модели определено, что количественные показатели лежат в пределах 1-го класса требований, предъявляемых системам информационного обеспечения. В соответствии с указанными требованиями эти показатели должны лежать в следующих пределах:

Я > 0,95; Р> 0,95; N<0,05. (47)

Сравнение результатов оценок по критериям информационной полноты, информационной точности, информационного шума с критериями восприятия и распознавания образов (критерий Юла) при отборе релевантных источников показало их высокую сходимость, что свидетельствует об удовлетворительных показателях качества сформированной логико-лингвистической модели тезауруса предметной области. Полученные результаты позволяют рекомендовать предложенную автором методику для создания комплексного тезауруса системы информационного обеспечения органов внутренних дел.

В заключении подводятся итоги диссертационного исследования и формулируются общие выводы:

1. В диссертационной работе проанализирована структура системы управления ОВД Российской Федерации, в том числе система оперативного управления, в которой выявлены основные действующие информационные потоки и команды управления, специализированный лингвистический базис оперативного управления органами внутренних дел, определены методы повышения эффективности управления.

2. Автором проведен логико-семантический анализ лингвистического базиса предметной области, на основании которого выявлены устойчивые семантические связи между отдельными понятиями, определен состав, структура словаря-тезауруса оперативного управления.

3. Проведена фасетная классификация лексических единиц специальной предметной области, выявлены группы условной

эквивалентности терминов, определены дескрипторы, логико-семантические связи межу ними, сформирован тезаурус оперативного управления органами внутренних дел.

4. Автором разработана методика формирования системы информационно-лингвистического обеспечения с развитой структурой базисных отношений в виде прикладного тезауруса, являющегося формализованным представлением предметной области оперативного управления органами внутренних дел, позволяющая формировать и поддерживать тезаурус оперативного управления в актуальном состоянии.

5. Разработана математическая модель отбора релевантных информационных источников в автоматизированной информационной системе оперативного управления органов внутренних дел с использованием базисного опорного словаря (тезауруса) на основе методов инверсной реализации и логико-лингвистического моделирования.

6. Проведены эксперименты, исследующие эффективность поиска с использованием контроля по словарю-тезаурусу, произведена количественная оценка результатов поиска, позволяющая обосновать необходимость совершенствования информационного обеспечения системы оперативного управления органами внутренних дел на основе методов логико-лингвистического моделирования.

7. Разработана методика аутентификации электронных документов и абонентов сетевых компьютерных технологий с использованием модифицированного множества кусочно-постоянных ортогональных функций Уолша, на основе которой выработаны предложения по индексированию санкционированных пользователей в электронном документообороте системы оперативного управления органами внутренних дел в ортогональном базисе.

По материалам диссертационного исследования автором опубликовано 13 печатных работ, общим объемом 3,9 печатных листа.

Научные статьи, опубликованные в рецензируемых научных изданиях, рекомендованных перечнем ВАК Минобрнауки Российской Федерации:

1. Рогова, H.A. Анализ системы информационного обеспечения оперативного управления органами внутренних дел на основе технологий электронного документооборота и делопроизводства / H.A. Рогова // Труды Академии управления МВД России. 2011. № 3. С.110-114. (0,39 пл.).

2. Рогова, H.A. Тезаурус как средство повышения эффективности современных информационно-поисковых систем / H.A. Рогова // Труды Академии управления МВД России. 2012. № 1. С.113-118. (0,4 пл.).

3. Рогова, H.A. Передача информации в компьютерных технологиях на основе ортогональных сигналов / H.A. Рогова, В.Ф. Макаров // Информационные системы и технологии. 2014. №2. С.101—109. (0,41 пл.) (авторство не разделено).

Научные статьи, опубликованные в других изданиях:

4. Рогова, H.A. Аутентификация в оперативном управлении / Н.А.Рогова// Сб. трудов XVIII Международной научной конференции «Информатизация и информационная безопасность правоохранительных органов»: Академия управления МВД России, 2009. С.433-440. (0,25 пл.).

5. Рогова, H.A. О перспективах развития дистанционного образования в органах внутренних дел Российской Федерации / H.A. Рогова // Межвузовский тематический сб. науч. трудов «Использование современных информационных технологий и проблемы информационной безопасности в деятельности правоохранительных органов»: Калининградский юридический институт МВД России, 2009. С. 170-178. (0,04 пл.).

6. Рогова, H.A. Моделирование бизнес-процессов организации на основе CASE-технологий/ Н.А.Рогова// Сб. трудов XIX Международной научной конференции «Информатизация и информационная безопасность правоохранительных органов»: Академия управления МВД России, 2010. С. 126-135. (0,37 пл.).

7. Рогова, H.A. Силовое принуждение в условиях информационного общества/ Н.А.Рогова, Н.В. Лукашов// Сб. науч. трудов межвузовской научно-практической конференции: Пограничная Академия ФСБ России. 2010. С.46-58. (0,41 пл.) (авторство не разделено).

8. Рогова, H.A. Использование результатов информационно-аналитической деятельности органов управления регионов в организации профилактики социальных конфликтов / H.A. Рогова, С.С. Ситников // Сб. материалов XII Международной научно-практической конференции: Академия управления МВД России, 2010. С.176-179. (0,02 пл.) (авторство не разделено).

9. Рогова, H.A. Возможности использования простейших телекоммуникационных и Интернет-технологий для повышения эффективности образовательной и повседневной деятельности Академии управления МВД России / H.A. Рогова, Н.В. Лукашов // Сб. трудов

XXI Всероссийской конференции «Информатизация и информационная безопасность правоохранительных органов»: Академия управления МВД России, 2012. С.213-215. (0,03 п.л.) (авторство не разделено).

10. Рогова, H.A. Методика формирования тезауруса дескрипторного типа в поисковой системе / H.A. Рогова // Сб. трудов XXI Всероссийской конференции «Информатизация и информационная безопасность правоохранительных органов»: Академия управления МВД России, 2012. С.88—95. (0,25 пл.).

11. Рогова, H.A. Специальные сигналы в системах передачи информации / H.A. Рогова, В.Ф. Макаров // Специальная связь и безопасность информации (ССБИ-2012): сб. трудов международного симпозиума. Краснодар: Экоинвест, 2012. С. 26-48. (0,51 п.л.) (авторство не разделено).

12. Рогова, H.A. Формирование тезауруса для системы информационного обеспечения оперативного управления органами внутренних дел / H.A. Рогова// Специальная связь и безопасность информации (ССБИ-2012): сб. трудов международного симпозиума. Краснодар: Экоинвест, 2012. С.71-78. (0,39 пл.).

13. Рогова, H.A. Нормативное правовое и организационно-штатное обеспечение использования современных информационных технологий в оперативном управлении органами внутренних дел России / Б.Е. Власов, А.Н. Кадынцев, Н.В. Лукашов, М.А.Москалев, H.A. Рогова// Методические (практические) рекомендации: Академия управления МВД России, 2013. (0,43 п.л.) (авторство не разделено).

Рогова Наталья Алексеевна

ЛОГИКО-ЛИНГВИСТИЧЕСКИЕ МЕТОДЫ И МОДЕЛИ В СИСТЕМЕ ОПЕРАТИВНОГО УПРАВЛЕНИЯ ОРГАНАМИ ВНУТРЕННИХ ДЕЛ

Подписано в печать 23 октября 2014 г. Формат 60x84 Объем 0,96 п.л.

Тираж 100 экз. Заказ № 363

Отпечатано в ООО «График Технолоджи» 125130, Москва, ул. 3. и А. Космодемьянских, 16-1-22 тел. +7(495)195 02 94