автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Исследование структур и разработка интерактивной экспертно-поисковой системы правовой информации

кандидата технических наук
Толок, Наталия Борисовна
город
Москва
год
2000
специальность ВАК РФ
05.13.13
Диссертация по информатике, вычислительной технике и управлению на тему «Исследование структур и разработка интерактивной экспертно-поисковой системы правовой информации»

Автореферат диссертации по теме "Исследование структур и разработка интерактивной экспертно-поисковой системы правовой информации"

МИНИСТЕРСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ ПО СВЯЗИ И ИНФОРМАТИЗАЦИИ Московский технический университет связи и фрт^х^ма-фДи

-1 мм> да

На правах рукописи

ТОЛОК Наталия Борисовна

УДК 681.324:519.87

ИССЛЕДОВАНИЕ СТРУКТУР И РАЗРАБОТКА ИНТЕРАКТИВНОЙ ЭКСПЕРТНО-ПОИСКОВОЙ СИСТЕМЫ ПРАВОВОЙ ИНФОРМАЦИИ

Специальность 05.13.13 - Вычислительные машины, комплексы,

системы и сети

А ВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 2000

Работа выполнена на кафедре «Вычислительная техника и управляющие системы» Московского технического университета связи и информатики (МТУСИ).

Научный руководитель:

доктор технических наук,

профессор,

Морозов В.К.

Официальные оппоненты:

доктор технических наук, профессор, Глориозов Е.Л.

кандидат технических наук,

доцент,

Мелихов В.О.

Ведущая организация:

Институт Проблем Передачи Информации РАН

Защита состоится «л-3 » /1/Я/&&- 2000 г. в -—часов на заседании

диссертационного совета К118.06.02 при Московском техническом

университете связи и информатики по адресу: 111024, Москва, ул. Авиамоторная, д. 8-А, МТУСИ.

С диссертацией можно ознакомиться в библиотеке МТУСИ. Автореферат разослан «>*£/ » ^с^лу/л 2000 г.

Ученый секретарь

диссертационного совета К 118.06.02 кандидат технических наук, профессор

Е.В. Демина

/ см*

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В 1993 году в утвержденной Указом Президента Российской Федерации от 28.06.93 г. №966 "Концепции правовой информатизации России" отмечалось, что "Стремительное качественное обновление общества, становление рыночной экономики, построение демократического правового государства - эти и многие проблемы выдвигают на первый план решение глобальной задачи - формирования в России единого информационно-правового пространства, обеспечивающего правовую информированность всех структур общества и каждого гражданина в отдельности, ибо правовая образованность необходима, чтобы расти в условиях демократии", и далее: "Проблема в том, что государство не только не предоставляет гражданам возможность получать информацию о действующем законодательстве, но и само не располагает достаточно эффективными системами правовой информации".

Для решения глобальной задачи формирования в России единого информационно-правового пространства Концепцией были сформулированы основные цели правовой информатизации:

- информационно-правовое обеспечение внутренней деятельности органов государства;

- информационно-правовое обеспечение внешних по отношению к государственным органам субъектов, с том числе физических лиц;

- сохранение и структурирование информационного правового поля.

Для достижения указанных выше основных целей правовой

информатизации Концепция предусматривала решение, в частности, таких задач, как развитие индустрии правовой информатизации, обеспечение использования общей коммуникационной среды, единого комплекса взаимосвязанных информационных технологий по ведению эталонных банков правовой информации, а также поддержка развития сферы правовых информационных услуг в условиях рынка.

Положения, закрепленные в Концепции, нашли свое отображение в тенденциях развития рынка информационно-правовых услуг, диктуемых динамичным развитием российского законодательства. В сравнительно <ороткий срок на рынке появились такие правовые системы, как "Эталон", 'Консультант", "Гарант", "Кодекс", "Юсис" и др. При работе с русскоязычными текстами документов разработчики вынуждены :талкиваться с трудностями, связанными с развитой флективностью языка.

В связи с вышеперечисленным возникает необходимость создания шпаратно-программного комплекса для структуризации линейной модели екстовой базы данных блоками, обладающими единой' внутренней :емантикой, что способствует повышению уровня интеллектуальности »тклика автоматизированных информационно-поисковых систем правовой гнформации. Такая задача решается в правовой информатизации России первые.

Цель работы. Целью диссертационной работы является разработка и создание компьютерной системы обработки и хранения данных на базе программно-технологического комплекса «ФОНД», обеспечивающей повышение технико-экономических, семантических, и прагматических показателей эффективности интеллектуального аналитического поиска в массиве документов, накопленных в органах федерального, регионального и местного управления. ■

Для достижения указанной цели в диссертационной работе сформулированы и решены следующие задачи:

- Определена система • параметров' для технико-экономической, семантической и прагматической оценки эффективности информационно-поисковой системы по законодательству.

- Определены основные системологические соотношения для экспертно-технологического модуля автоматизированной системы обработки правовой информации на основе грамматических закономерностей склонения.

- Разработан аппарат автоматизированного экспертного анализа парадигматических связей между элементами функционирующего

. массива базовой справочно-контекстной информации (БСКИ).

- Разработаны модели физической организации данных экспертно-технологического модуля АСПИ, обеспечивающие взаимодействие программно-технологического комплекса «ФОНД» с массивом замкнутых парадигматических контуров.

- Разработана компьютерная математическая модель технологического процесса взаимодействия экспертного модуля системы с базовой справочно-контекстной информацией ПТК «ФОНД».

- Разработан алгоритм объединения эквивалентных словоформ в замкнутые контуры для четких множеств элементов базового справочно-контекстного массива.

- Разработана интерактивная экспертно-поисковая система справочно-правовой информации на базе программно-технологического комплекса «ФОНД».

Методы исследования. Аппарат автоматизированного экспертного анализа парадигматических связей между элементами функционирующего контекстного массива разработан на основе метода исследования грамматических характеристик словоизменения, методов математического моделирования, теории множеств, теории систем, методов организации файлов баз данных.

Объект исследования. Объектом исследования является центральный узел РИВС юстиции, функционирующий в Научном центре правовой информации при Минюсте России.

Научную новизну составляют:

1. Математические модели экспертно-информационного представления объекта как системы грамматических правил. Предложена многомерная матричная модель системы парадигматических связей в виде декартового произведения пяти параметрических множеств, где параметрические множества характеризуют проявления свойств системы и отображаются операторами абстрагирования в индексные последовательности.

2. Аппарат автоматизированного экспертного анализа парадигматических связей между элементами базового справочно-контекстного массива, обеспечивающий выполнение прямой и обратной задачи экспертной оценки. Под прямой задачей понимается структуризация справочно-контекстной информации блоками, обладающими единой внутренней семантикой, посредством экспертного модуля. Обратная задача аппарата состоит в определении гипотетических парадигматических схем для нечётких данных, не вошедших в полный замкнутый парадигматический контур, с принятием решения на уровне внешней экспертизы.

3. Модели физической организации экспертного модуля интерактивной экспертно-поисковой системы, обеспечивающие принятие решений при организации поиска полной парадигмы. К ним относятся: модель схемы парадигмы как экспертного элемента парадигматических замыканий, модель списка схем парадигматических замыканий, модель организации флексий, модель инверсного списка соответствия экспертных кодов парадигматических схем конкретной флексии.

4. Интерактивная экспертно-поисковая система на базе исходной модели предметной области АСПИ ПТК «ФОНД». В отличие от существующих ИПС для полнотекстовых баз данных, базирующихся на морфологическом анализе пользовательского запроса с использованием специализированных словарей, эта система основана на принципах экспертной оценки посредством модулей взаимосвязанных грамматических правил.

5. Математическая модель технологического процесса объединения эквивалентных словоформ в замкнутые контуры. Формально процесс интерактивного экслертно-поискового моделирования (ЭПМ) содержит в себе этап экспертно-поискового моделирования для чётких данных и этап интерактивного ЭПМ для нечётких множеств элементов базовой справочно-контекстной информации.

Личный вклад автора. Все исследования,. изложенные в диссертационной работе, связанные с ними расчеты, теоретические выводы и практические рекомендации, получены лично автором. На основе системологических и математических методов автором разработан интерактивный экспертно-технологический комплекс, предназначенный для функционирования в составе ПТК «ФОНД».

Практическая ценность работы. Разработанные алгоритмы и математические модели позволили создать интерактивную экспертно-поисковую систему, обеспечивающую эффективное решение задач

формирования массива парадигматических замыканий на основе существующей модели данных АСПИ ПТК «ФОНД». При этом система не имеет сугубо правовой ориентации и может быть использована в качестве экспертно-поискового модуля многопрофильных полнотекстовых баз данных с линейной или теоретико-множественной индексацией.

Реализация результатов работы. Результаты работы нашли отражение в научных отчетах научно-технического совета НЦПИ Министерства юстиции РФ. Разработанная интерактивная экспертно-поисковая система функционирует в составе центрального узла РИВС юстиции на базе аппаратно-программного комплекса научного центра правовой информации «ФОНД» - компьютерном многомашинном комплексе для обработки правовой информации. Система «ПАРАДИГМА» используется для реорганизации индексного массива базовой справочно-контекстноЛ информации в замкнутые семантически эквивалентные блоки, позволяющие повысить уровень интеллектуальности отклика системы при обработке запроса к базе данных правовой информации. Реализация результатов работы подтверждена соответствующими актами.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на научно-технической Конференции профессорско-преподавательского, инженерно-технического состава и аспирантов МТУ СИ (Москва, 1997 г.), на XXV Международной конференции «Новые информационные технологии в науке, образовании, телекоммуникации и бизнесе» (г. Гурзуф, 4998 г.), на заседании научно-технического совета НЦПИ при Минюсте России (Москва, 1999 г.), на XXVI Международной конференции «Новые информационные технологии в науке, образовании, телекоммуникации, бизнесе и охране природных ресурсов» (г. Гурзуф, 1999 г.), на научном семинаре кафедры «Математического моделирования и информационных технологий» Запорожского государственного университета (январь, 2000 г.).

Публикации результатов. По теме диссертации опубликовано 6 печатных работ (из них 2 в соавторстве).

Структура и объем работы. Диссертация состоит из введения, трех глав с выводами, заключения, списка используемой литературы. Она включает 145 страниц машинописного текста, 25 рисунков и 27 таблиц. Список литературы включает 143 наименования.

Основные положения, выносимые на защиту.

1. Разработанная многомерная матричная модель системы парадигматических связей, представляющая систему общих экспертно-информационных закономерностей склонения в виде декартового произведения пяти параметрических множеств, позволяет однозначно определить проявления свойств системы для организации замкнутых парадигматических контуров.

2. Разработанный аппарат автоматизированного экспертного анализа парадигматических связей между элементами базового справочно-

контекстного массива, выполняя прямую задачу экспертной оценки, позволяет структурировать массив справочно-контекстной информации блоками, обладающими единой внутренней семантикой, посредством собственного экспертного модуля в случае наличия четких данных.

3. При наличии в базовой справочно-контекстной информации нечетких данных, аппарат позволяет осуществлять обратную задачу экспертной оценки, состоящую в генерации гипотез о возможных парадигматических схемах посредством экспертного модуля.

4. Повышение уровня интеллектуальности системы за счет структуризации теоретико-множественной или линейной модели текстовой базы данных блоками, обладающими единой внутренней семантикой, обеспечивает повышение полноты и точности выдачи информации и уменьшение потерь информации и информационного шума по причине декомпозиции параметров релевантности отклика системы.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, сформулированы цели и задачи исследования, определена практическая ценность работы, приведены область применения результатов и аннотация по главам. Перечислены научные и практические результаты диссертационной работы, выносимые на защиту.

В первой главе на основе анализа информатизации правовой сферы освещена проблема организации и поиска данных в автоматизированных информационно-поисковых системах по законодательству. Выявлены основные тенденции развития правовых информационных систем, проведено исследование существующих подходов к обработке, хранению и поиску документальной информации. Определена система параметров для технико-экономической, семантической и прагматической оценки эффективности ИПС.

На основе проведённого анализа как государственных, так . и коммерческих разработок в сфере создания крупных баз данных по законодательству, определено направление совершенствования правовых АИПС в сторону повышения интеллектуализации самой системы за счет структуризации линейной модели текстовой базы данных блоками, обладающими единой внутренней семантикой.

Покажем эффективность АИПС с внутренней семантической структуризацией данных по отношению к традиционным методам организации АИПС.

Семантические показатели характеризуют качество работы ИПС как семантической системы и основаны на оценке релевантности между документами и запросами. Семантическими показателями являются полнота выдачи (потери информации) и точность выдачи (информационный шум).

В таблице отражены следующие переменные: к - множество релевантных и выданных системой документов;

/ - множество нерелевантных, но выданных Документов; т - множество релевантных, но не выданных документов; п - множество нерелевантных и не выданных документов.

Документы релевантные нерелевантные

Выданные Не выданные к т =5 1=р+г п

Проанализируем причины возникновения множеств т и I. Обозначим;

Л' - множество релевантных запросу документов, не выданных по причине

грамматических особенностей; I - множество релевантных запросу документов, не выданных по

техническим причинам; р - множество нерелевантных запросу документов, выданных по причине частичного совпадения с ПОД при использовании поиска по усечению справа;

г - множество нерелевантных запросу документов, выданных по ост. причинам (технические, омонимия, полисемия и т.п.). За счет введения семантической структуризации ПОД очевиден переход множества 5 во множество выданных документов, а множества р -во множество не выданных документов. Таким образом:

Полнота выдачи (ПВ) = ----100% < . юо%.

•Л + л-Г

Точность выдачи (ТВ) = -—---100% < —- 100%.

к + р + г к + г

Потери информации (ПИ) = • 100% > -—---100%.

Л + 5 + / л + 51 + /

Информационный шум (ИШ) = - р + г— ■ 100% > • 100%.

к + рл-г к + г

Правая часть перечисленных неравенств отображает характеристики

эффективности выбранного подхода по отношению к традиционному и

показывают его преимущества в виде повышения полноты и точности

выдачи информации с понижением потерь информации и информационного

шума.

Вторая глава. Во второй главе изложен разработанный автором аппарат автоматизированного экспертного анализа парадигматических связей между элементами функционирующего в составе ПТК «ФОНД» контекстного массива, предназначенный для решения проблемы флективности.

В качестве исследуемого объекта в работе рассматривается центральный узел РИВС юстиции на базе многокомпьютерного аппаратно-программного комплекса НЦПИ, основная задача которого состоит в

хранении и обработке правовой информации, а также доведения ее до удаленного пользователя.

Комплекс технических, программных, лингвистических и других средств, организационных и научных методов машинной обработки информации, используемых для создания и ведения баз данных нормативных актов субъектов Российской Федерации и взаимоувязанных единой технологией обработки правовой информации, образуют автоматизированную систему обработки правовой информации (АСПИ).

Линейная модель текста, используемая в АСПИ, предусматривает свободное индексирование документа, при котором ключевые слова (КС), извлеченные непосредственно из текста документа без учета всех видоизменений их форм и отношений между ними, заносятся в массив КС, с указателем на их положение (а, Ь, п) в тексте правового акта (ПА) за номером государственной регистрации (НГР) (рис.1). На основе массива КС организуется многоуровневый индекс в виде сбалансированного Р-дерева.

Рис 1. Структура взаимосвязи массива КС с массивом соответствия.

Исследование модели АСПИ показало, что физическая организация массива КС, являющегося основой ПТК «ФОНД», не обеспечивает возможность осуществления интеллектуального аналитического поиска в массиве документов, накопленных в органах федерального и местного управления, по причине отсутствия физических и логических взаимосвязей между эквивалентными по значению элементами.

Отношение эквивалентности существует между элементами, связанными парадигматической связью. С точки зрения лингвистики парадигма есть совокупность всех словоформ исходной формы слова. При этом отличия эквивалентных словоформ выражаются с помощью флексий.

Опираясь на систему общих закономерностей современного русского словоизменения, которые лингвистика представляет табулировано, проведен системологический анализ ,, парадигматических схем с выделением примитивных матричных . модулей, однозначно отражающих парадигматические свойства по отношению к конкретной схеме организации параметров системы.

В результате предложена многомерная матричная модель системы парадигматических связей. Полное параметрическое множество состояний свойств модели предопределяет структуру данных разработанной исходной модели.

Определим полный ряд параметрических множеств, формирующих базу исследуемой системы. Для этого необходимо предварительно рассмотреть свойства, присущие словоформе, которые непосредственно влияют на ее изменение.

Проведенные исследования позволяют однозначно определить базу в виде декартового произведения пяти параметрических множеств:

IV =УУ,х.У1хУгхУ3хУ4,

где И; - характеризует проявление свойства «РОД» как обобщенная переменная для конкретной переменной И,, определяемая с помощью абстрагирующей функции е, : К, -> И,, которая задается последовательным соответствием целого числового ряда (0, 1, 2). При этом У{ определяется вербальным путём и имеет конкретные состояния (мужской, средний, женский);

Уз - характеризует проявление свойства «ЧИСЛО» как обобщенная переменная для конкретной переменной У2 с аналогичным принципом абстрагирования ег : У2 У2 числовой последовательностью (0, 1) для конкретных состояний У2 (единственное, множественное) соответственно;

V} - характеризует проявление свойства «Ударение» и абстрагируется функцией е3 : У3 -+У} к набору соответствия (0, 1) для конкретной переменной с состояниями («на основу», «на окончание»);

У4 - характеризует проявление свойства «ВИД СКЛОНЕНИЯ». Конкретная переменная У4 имеет состояния (субстантивное, адъективное, местоименное, числительное и краткое), соответствующие абстрактным состояниям (0,1,2,3,4);

Щ = {1,2,3,4,5,6,7} - параметрическое множество базы изменений проявления свойства парадигмы (7 типов склонений).

Табулирование интересующего нас свойства «ПАРАДИГМА» и приведение его к абстрактной переменной У не представляется возможным по двум основным причинам. Исходя из закона однозначного соответствия состояний переменной У каждому элементу выбранной базы IV, количество состояний переменной У для базы IV равно 420 (где

IV = Ц/1 х Ух х Уг х Уъ х У4). Вторая причина заключается в том, что конкретное состояние парадигмы рассматривается не как переменная У, а как массив переменных V - {еие2,е3,еА,е5,е6}, где е1,е2,е3,е4,е5,е6 -окончания для падежей: именительного, родительного, дательного, винительного, творительного и предложного соответственно.

Исходя из представленных выше причин, массиву У как абстрактному представлению, описывающему конкретное состояние свойства «ПАРАДИГМА», присваивается базовая индексация ^н.,,«,,»^,^ > которая

позволяет определять соответствие элемента У четырем проекциям 5-ти мерной базы ТУ. , ;

Проведенный системологический анализ закономерностей парадигматических образований показывает существование необходимых и достаточных условий для создания аппарата физической и логической реорганизации БСКИ в массив замкнутых контуров эквивалентности.

Предложенный аппарат реорганизации модели данных включает в себя процесс работы с четкими и нечеткими данными. Поскольку процедура работы с четкими данными позволяет однозначно определять полное парадигматическое замыкание, а нечеткие данные, предполагающие отсутствие полноты информации, требуют внешнего экспертного вмешательства, то процесс завершения полного формирования модели нуждается в организации интерактивного экспертного блока. Таким образом, шпарат формирования парадигматических замыканий предполагает использование принципов решения прямой и обратной задачи экспертной обработки данных.

Прямая задача представляет собой последовательный выбор схемы тарадигмы из экспертного блока и определение в массиве БСКИ всех полных 1арадигм, соответствующих выбранной схеме. Обратная задача аппарата штоматизированного экспертного анализа состоит в определении •ипотетических парадигматических схем на основе экспертного анализа •ловоформы, не вошедшей в полный замкнутый парадигматический контур.

Логическая модель организации замкнутого парадигматического гонтура (рис. 2) включает в себя циклическую структуру указателей квивалентности с единственным входом в цикл на исходном элементе.

Исходная форма

Указатель на представителя в списке вазовых словоформ

Замыкающий указатель эквивалентности

Словоформа О

Словоформа 1

Словоформа 2

Словоформа М

Указатель на следующую эквивалентную словоформу

Рис. 2. Логическая модель полной парадигмы

В результате работы прямой и обратной задачи аппарата формируются: базовый список парадигматических замыканий (БСПЗ), состоящий из полных и неполных парадигм и уникальных словоформ с нулевой парадигмой, а также - массив исходных форм, состоящий из уникальных элементов и представителей парадигматических групп. Элементы списка парадигматических замыканий содержат указатели на массив соответствия, в котором хранится информация о правовых актах, содержащих в своих текстах соответствующие словоформы.

Массив исходных форм, элементы которого содержат указатели на полную парадигму, подвергается сортировке по возрастанию ключа, а затем индексируется, образуя многоуровневую симметричную (5-структуру, позволяющую организовать наиболее оптимальный с точки зрения скорости поиск. Указанный файл является динамическим, поскольку правовая база данных подвергается постоянным изменениям, что может сказаться на составе массива БСПЗ.

Эффект повышения скорости поиска информации достигается за счет уменьшения порядка р-дерева вследствие замены общего списка ключевых слов массивом базовых (исходных) словоформ.

адвокат

власть

Дума

Массив исходных форм

адвокат

адвоката

адвокату

адвокатом

адвокате

Массив парадигм

«о

0

1

£

0

3

а

У

1

Рис. 3. Структура данных Интерактивной экспертно-поисковой системы.

Рис.3, отражает логическую организацию данных, формируемь: интерактивной экспертно-поисковой системой на базе исходной модел предметной области АСПИ ПТК «ФОНД».

На рис. 4 отображено взаимодействие основных структурных элементе интерактивной экспертно-поисковой системы «ПАРАДИГМА».

г

Рис.4. Схема взаимодействия блоков интерактивной экспертно-поисковой системы «ПАРАДИГМА»

БСКИ - базовая справочно-контекстная информация; НД - нечёткие данные;

ППЗ - полные парадигматические замыкания; БСПЗ - базовый список парадигматических замыканий.

Третья глава. В третьей главе рассматриваются проблемы организации данных и алгоритмы, обеспечивающие взаимодействие основных видов моделей, посредством которых реализуются цели повышения уровня интеллектуальности поиска нормативной и ненормативной правовой информации.

Специфика физического блочного формирования данных связана с принципами последовательной организации информации, при которой первому блоку отводится информация о структуре хранения остальных злоков.

В диссертационной работе разработана специальная кодировка флексий на примере склонения, которая позволяет использовать двухзначные 1есятичные коды вместо набора символов для однозначного заполнения элементов модели организации списка схем парадигматических замыканий.

Такая блочная организация данных с фиксированным размером блока юзволяет формализовать поиск необходимого флексического образования с юмощью двузначного кода: первое значение кода несет информацию о юмере искомого блока, где первым элементом является характерная

однобуквенная флексия; второй элемент кода определяет положение искомой | Варианты флексий для первого символа

Вз

Вз

Двух- или трех- символьная флексия Первый символ флексии

Количественные характеристики флексических образований на конкретную букву

Флексическое образование последней буквы

Рис. 5. Модель организации флексий пары элементов в блоке (рис. 5).

Формально процесс определения пары элементов в блоке можно представить как:

ТУ:

А-1

^N¡-1), при 1 = 1, /=!

Yi{2N¡-l)+(t-l)-llnpul>l,

где

N~ общее количество шагов от начала первого блока до искомой пары;

к - номер искомого блока;

/ - номер искомой пары;

Аг, - количество элементов в ¡-ом блоке.

Модель организации списка схем парадигматических замыканий., изображенная на рис. 6., несет в себе необходимую и достаточную информацию об определении конкретного идентификатора схемы парадигматических замыканий на основании пятизначного кода. Она основана на системе, представленной системологически в виде базы данных соответствия }¥ IV, х К, х Уг х У3 х У4.

В первом блоке структуры содержится информация о количественной характеристике размерности проявления 4-х основных свойств словоформы для однозначного определения парадигмы И,,К2,К3,К4. Блочная организация данных с фиксированным размером блока в семь элементов позволяет формализовать поиск необходимого идентификатора парадигмы с помощью пятизначного кода: первое значение кода несет информацию о порядковом номере проявления свойства «РОД»; второй элемент кода определяет

в

в

порядковый номер проявления свойства «ЧИСЛО»; третий - «УДАРЕНИЕ»;

Индекс замкнутой структуры полной парадигмы

Начальный блок индексов парадигматических замыканий 7-ми типов

М, N2 N3 N4 У

V

2.0000

У7.01

V

1.0001

' 7.ООО 1

V7NI.N2.N3.N4 I

Количественная характеристика размерности проявления свойств

Последний элемент Количество проявлений свойства У4 конечного блока

Рис. 6. Модель списка схем парадигм

четвёртый соответственно - «ВИД СКЛОНЕНИЯ».

Формально процесс определения элемента в блоке можно представить следующим образом:

4 4

ыг 1=3

где

/V,' - размерность проявления /-го свойства;

п, т, к, / - значения проявлений свойств /V/, /V?, 1У3, N4 соответственно; V - значение проявления свойства типа склонения IV/.

Модель схемы парадигмы как экспертного элемента содержит необходимую и достаточную информацию об определении конкретного 6-ти элементного множества окончаний склонения по 6-ти падежам на основании идентификатора схемы парадигматических замыканий (в виде порядкового номера IV = {0,1,2,..., 419}), определяемого предыдущей моделью.

Каждый элемент множества содержит двухзначный десятичный код для определения конкретной флексии. Таким образом, рассматриваемая модель является связующей между предложенными ранее моделями, формируя в целом/экспертный семантический блок анализа склонений словоформ.

Вышеперечисленные модели организации данных необходимы и достаточны для использования в предлагаемой интерактивной экспертно-поисковой системе при формировании массива парадигматических замыканий на основе грамматических закономерностей языка.

Модель технологического процесса объединения эквивалентных :ловоформ в замкнутые контуры для четких объединений элементов функционирующего контекстного массива определяется как взаимодействие жспертно-информационного представления объекта (ЭИП) с базовой

справочно-контекстной информацией (БСКИ), результат которого приводит к наполнению нуль-модели М°, т.е. формируется компьютерная математическая модель М:

М = ЭПМ\{ЭИП}, БСКИ, А,М°\.

БСКИ, А и М0 имеют статичный характер в пределах данного ЭПМ.

Под ЭИП подразумевается (ге/М), 1 = 1,..., и - совокупность вспомогательных экспертных моделей-посредников, обеспечивающих текущий этап формирования замкнутых парадигм на основе правил русского языка, где ге- понятие обобщённого оператора наложения экспертных условий к искомой схеме парадигмы.

Под нуль-моделью М° предлагается понимать реализованную до начала процесса интерактивного экспертно-поискового моделирования структуру компьютерной математической модели, подлежащей наполнению.

На основании проведённых системологических исследований предлагаемая модель структуры списка парадигматических замыканий М подразделяется на базовую Мбсп 3 и текущую М тся1 ■ Структуры,

подлежащие наполнению, формируют нуль-модели М°сп] и М°тст.

Текущая модель МтсП] порождается на этапе формирования очередной замкнутой парадигмы. Схемы грамматических правил хранятся в модели массива индексных схем Мст.

Процесс порождения Мтспз, определяющий модель текущего парадигматического замыкания формулируется как

Мтсп = ЭПМ[{ЭИП(СГП)}, БСКИ, А^, М°тст ],

где ЭИП(СГП) - собственно машинная математическая модель (геМап), Лтм ' алгоритм формирования текущей модели Мттз.

Алгоритм А^ заполнения Мйтс„ сводится к выбору из Л/„„ требуемо} схемы окончаний для упорядочения элементов замкнутой парадигмы. Задач; сводится к выбору очередной индексной схемы СГП с последующи« определением набора условий принадлежности к данной индексной схем* словоизменения. На этапе формирования текущей модели Мтсп определяется полнота информации БСКИ для рассматриваемой словоформь:

Создание М6сП] предполагает формирование списка полных парадигм основанного на чётких данных БСКИ. Она включает в себя определени упорядоченного параметрического множества ключевых словоформ топологической привязкой к каждому собственного парадигматическог отношения. По мере формирования и заполнения текущей модели Мтс„ определяется принадлежность рассматриваемого ключевого элемент

базовой модели М6спг, которая формируется путём заполнения базовой нуль-модели М0бспз.

Процесс формирования М6сп представляется как

М6сп = ЭЛМ[{ЭИЩП)},БСКИ, Абм, М°бс„, ], где ЭИП(П) - собственно машинная математическая модель парадигмы

на основе чётких данных (геМтсю); Абм - алгоритм формирования базовой модели М6сП7. Алгоритм Абм заполнения М\ст сводится к определению полноты информации для текущей модели Мйтспи, в позитивном случае, занесению сформированной очередной парадигмы в базовую нуль-модель М°бсп1. При этом, найденные в БСКИ словоформы фиксируются как определённые для уточнения списка неопределённых словоформ (СНС), которые не вошли ни в одну полную парадигму.

Этап интерактивного экспертно-поискового моделирования ИЭПМ является завершающим и позволяет посредством пользователя-эксперта дополнить БСКИ дополнительной информацией.

Формально прбцесс дополнения и корректировки модели М6ст можно записать

Мбсп] = ИЭПМ [{ЭИП (П2)}, БСКИ, А', Мйбспз],

где ЭИП(172) = (геМ6ст,геМтс„), А' - {А„„, Акб,Абм), Ат : Р1(1, РЯ2, Р11 з - алгоритм информационного поиска; Акб : РЛ4, РЯ5 - алгоритм корректировки Мпбс„,; Абм : РЯ6, РЛ7 - алгоритм заполнения Мбсгп. Текущая модель Мтсю переопределяется после каждой процедуры корректировки.

РЯ,- процедура запроса словоформы для поиска её парадигматического замыкания.

РЯ2 - процедура поиска запрашиваемой словоформы в списке существующих

в базовой модели МбсП1. РЯЪ- процедура выдачи искомой информации по ключевому запросу. РЯ4 - процедура поиска необходимой СГП для запрошенной словоформы. РЯ5- процедура определения недостающего словоизменения формируемой

парадигмы на основе соответствующей СГП. РЯ6- процедура заполнения базовой модели списка парадигматических

замыканий Мтекущей моделью Мтст. РЯ-,- процедура фиксации словоформ, задействованных в текущей парадигме в БСКИ.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.

1. Выбрана система параметров для технико-экономической, семантической и прагматической оценки эффективности информационно-поисковой системы по законодательству.

2. Исследована существующая модель предметной области, функционирующая в составе программно-технологического комплекса «ФОНД», выявлены достоинства и недостатки линейной модели организации поисковых образов документальной информации.

3. На основе проведенного системологического анализа парадигматических схем с использованием метода грамматического анализа словоизменения разработана математическая модель экспертно-информационного представления объекта как системы грамматических правил.

4. Разработан аппарат автоматизированного экспертного анализа парадигматических связей между элементами функционирующего массива базовой справочно-контекстной информации, обеспечивающий выполнение прямой и обратной задачи экспертной оценки.

5. Разработаны модели физической и логической организации данных ИЭПС, обеспечивающие взаимодействие ПТК «ФОНД» с системой парадигматических замыканий.

6. Разработана компьютерная математическая модель технологического процесса экспертной оценки и алгоритм объединения эквивалентных словоформ в замкнутые контуры для четких множеств элементов функционирующего массива базовой справочно-контекстной информации.

7. Разработана интерактивная экспертно-поисковая система на базе исходной модели предметной области автоматизированной системы обработки правовой информации ПТК «ФОНД», позволяющая повысить уровень интеллектуальности отклика системы при обработке запроса к базе данных нормативного законодательства.

СПИСОК ПУБЛИКАЦИЙ

1. Резникова Н.Б. «Исследование специфики структуры и функций правовой информации. Выбор системы оценки параметров объекта», тезисы доклада Конференции НИР МТУ СИ, М: МТУ СИ, 1997 г.

2. Резникова Н.Б. «Логико-семантический анализ нормы права» «Информационные технологии в науке, образовании, телекоммуникации, бизнесе и охране природных ресурсов», труды XXVI международной конференции, г. Гурзуф, май 1999 г. - Москва: МАИ, 1999 г. - С 76-78.

5. Резникова Н.Б., Шмелёв A.A. «О некоторых задачах управления потоками информационных запросов», «Правовая информатика», выпуск 4, М.: НЦПИ, 1999 г.

1. Толок Н.Б. «Аппарат автоматического индексирования многопрофильных полнотекстовых баз данных», «Правовая информатика», выпуск 4, М.: НЦПИ, 1999 г.

>. Морозов В.К., Толок Н.Б. «Системологическое определение лингвистических схем грамматических правил русского языка как основа построения математических моделей поисковых аппаратов», Вестник Запорожского государственного университета, №1, 2000 г., Запорожье: ЗГУ, 2000 г.

'. Толок Н.Б. «Математическая модель объединения эквивалентных словоформ в замкнутые контуры для компьютерной интерактивной экспертно-поисковой системы правовой информации», Вестник-Запорожского государственного университета, №1, 2000 г., Запорожье: ЗГУ, 2000 г.

Подписано в печать 17.02.2000 г. Формат 60x84/16. Печать офсетная. Объем 1,1 усл. пл. Тираж 100 экз. Заказ 88.

ЗАО «Информсвязьиздат». Москва, ул. Авиамоторная, 8.

Оглавление автор диссертации — кандидата технических наук Толок, Наталия Борисовна

Введение.

Гпава I. Анализ методов организации и поиска данных в компьютерных информационно-поисковых системах по законодательству. \

1.1. Специфика развития правовой информатики как структурного элемента системы информатизации общества.

1.2. Анализ существующих методов организации и поиска данных в правовых системах.

1.3. Оценка эффективности ИПС. Задача совершенствования поискового аппарата компьютерных систем правовой информации.

1.4. Выводы.

Гпава II. Разработка интерактивной экспертно-поисковой системы правовой информации на основе аппарата автоматизированного экспертного анализа парадигматических связей

2.1. Исследование модели предметной области.

2.2. Разработка основных системологических соотношений для экспертно-технологического модуля АСПИ

2.3. Разработка аппарата автоматизированного экспертного анализа парадигматических связей между элементами массива базовой справочно-контекстной информации.

2.4. Разработка интерактивной экспертно-поисковой системы правовой информации на основе аппарата автоматизированного экспертного анализа парадигматических связей.

2.5. Выводы

Гпава III. Разработка моделей и алгоритмов интерактивной экспертно-поисковой системы справочно-правовой информации.

3.1. Разработка физических моделей организации экспертного модуля интерактивной экспертно-поисковой системы.

3.2. Модель технологического процесса объединения эквивалентных словоформ в замкнутые контуры для четких и нечетких множеств элементов функционирующего контекстного массива

3.3. Исследование эффективности модели организации данных интерактивной экспертно-поисковой системы

3.4. Выводы.

Введение 2000 год, диссертация по информатике, вычислительной технике и управлению, Толок, Наталия Борисовна

Актуальность темы. В 1993 году в утвержденной Указом Президента Российской Федерации от 28.06.93 г. №966 "Концепции правовой информатизации России" отмечалось, что "Стремительное качественное обновление общества, становление рыночной экономики, построение демократического правового государства - эти и многие проблемы выдвигают на первый план решение глобальной задачи - формирования в России единого информационно-правового пространства, обеспечивающего правовую информированность всех структур общества и каждого гражданина в отдельности, ибо правовая образованность необходима, чтобы расти в условиях демократии", и далее: "Проблема в том, что государство не только не предоставляет гражданам возможность получать информацию о действующем законодательстве, но и само не располагает достаточно эффективными системами правовой информации" [115].

Для решения глобальной задачи формирования в России единого информационно-правового пространства Концепцией были сформулированы основные цели правовой информатизации:

- информационно-правовое обеспечение внутренней деятельности органов государства;

- информационно-правовое обеспечение внешних по отношению к государственным органам субъектов, в том числе физических лиц;

- сохранение и структурирование информационного правового поля.

Концепция определила, что государственная политика Российской федерации в области формирования и использования правовых информационных ресурсов и обеспечения этими ресурсами потребностей социального и экономического развития страны осуществляется с учетом реальных возможностей индустрии информатизации в условиях рыночной экономики. Для достижения указанных выше основных целей правовой информатизации Концепция предусматривала решение, в частности, таких задач, как развитие индустрии правовой информатизации, обеспечение использования общей коммуникационной среды, единого комплекса взаимосвязанных информационных технологий по организации и поиску информации в эталонных банках правовой информации, а также поддержка развития сферы правовых информационных услуг в условиях рынка.

Положения, закрепленные в Концепции, на самом деле уже тогда нашли свое отображение в тенденциях развития рынка информационно-правовых услуг, диктуемых возрастающей потребностью в правовой информации в российском обществе, динамичным развитием российского законодательства. Возрастающие объемы правовой информации, динамика развития и изменчивость современного российского законодательства обусловили быстрое развитие и закрепление на рынке поставщиков информационных услуг предприятий и организаций, специализирующихся на создании и распространении крупных компьютерных справочно-информационных массивов - баз данных по законодательству. В сравнительно короткий срок на рынке появились такие правовые системы (базы данных по законодательству), как "Эталон", "Консультант", "Гарант", "Кодекс", "Юсис" и др.

Существующее состояние, уровень исследованности проблемы:

Почти во всех системах поиска текстовой информации, действующих в мире, принят диалоговый порядок общения пользователя с базами данных, когда пользователь многократно корректирует свой запрос при взаимодействии с поисковой системой, чтобы получить нужный результат. При этом используется специальный командный или ориентированный на меню информационно-поисковый язык, позволяющий обрабатывать запрос, составленный из полных или усеченных слов, связанных между собой булевыми и контекстуальными операторами. В результате выясняется, что пользователь не может применять непосредственно для поиска обычные естественно-языковые формулировки запросов, принятые в практике человеческого общения.

По этим причинам общение с традиционными текстовыми информационными системами (в том числе и зарубежными, доступными через международные телекоммуникационные сети, в частности ИНТЕРНЕТ) требует высокой квалификации от потребителя, понимания множества получаемых в процессе диалога команд языка общения с информационной системой, средств формального представления запроса из слов естественного языка, знания правил ведения диалога и т.п.

По существу, от рядового пользователя требуется понимание булевой логики, лингвистических тонкостей падежных окончаний, умение отличать словосочетание от булевого пересечения слов и т.д. Для выявления большей части латентной информации пользователю необходимо будет учесть все вариации синонимов, обозначающих искомое понятие. В результате время поиска значительно превзойдет время обработки тех документов, которые будут найдены поисковой системой. Все допущенные ошибки приведут к ухудшению качества поиска, но рядовой пользователь, фактически не имея механизма реальной оценки ситуации, не знает путей улучшения поиска без определенного специального обучения. Практически качественная диалоговая обработка одного запроса требует от нескольких минут до нескольких десятков минут напряженной работы конечного пользователя или информационного посредника, действующего в его интересах.

Но даже при таких усилиях поиск подходящего варианта редко заканчивается составлением наилучшей формулировки запроса. Чаще всего это некоторый компромиссный вариант, полученный "методом проб и ошибок", на котором оператор останавливается только из соображений экономии времени.

Малейшая неточность с включением в термин запроса "лишнего" слова может привести к нулевому ответу. Если "расширить" запрос, сократив в нем количество терминов, пользователю может грозить слишком объемная выдача документов, среди которых всего несколько десятков записей будет отвечать содержанию запроса. Поэтому высококачественный поиск в диалоговых системах многими специалистами и потребителями рассматривается как подлинное искусство получать то, что нужно за минимальное время.

Широко ведутся исследования по созданию средств поиска на естественном языке (главным образом, в США). В качестве примера таких исследований достаточно упомянуть комплекс поисковых систем, разрабатываемых в рамках американского проекта TREC (Text Retrieval Conference). В этих исследованиях принимают участие несколько десятков крупных исследовательских центров, университетов и фирм США, Европы и Японии. По условиям проекта к участию в исследованиях допускаются только те системы, которые могут самостоятельно обрабатывать свободные наборы терминов или естественно-языковые формулировки и которые на основе интеллектуальной обработки запроса способны генерировать множество наборов записей с их автоматическим ранжированием по уровню релевантности.

Следует заметить, что в проекты ТКЕС в основном рассматриваются разработки, ориентированные на английский или другие европейские языки. При работе с русским языком разработчики вынуждены сталкиваться с очень неприятными трудностями, свойственными русскому языку: развитой флективностью слов и сложностью извлечения терминов (слов и словосочетаний) из текстов из-за многообразия способов построения фраз.

Таким образом, решение проблемы флективности, особенно остро ощущаемой в славяноязычных странах, расширит возможности интеграции с мировым информационным пространством, создаст предпосылки к развитию мультиязычных автоматизированных информационно-поисковых систем, баз и банков данных.

В данной работе в качестве эффективного метода повышения полноты и точности выдачи информации (равно как и уменьшения потери информации и информационного шума) предлагается поиск с использованием парадигматических замыканий эквивалентных словоформ.

В этой связи необходимо отметить, что в системе с неконтролируемой лексикой, задача обработки запроса, включающего объединения эквивалентных словоформ и задаваемого в виде произвольной логической формулы, является достаточно сложной.

Предварительный анализ проблемы позволил сделать вывод о возможности ее практического решения.

Цель работы. Целью диссертационной работы является разработка и создание компьютерной системы обработки и хранения данных на базе программно-технологического комплекса «ФОНД», обеспечивающей повышение технико-экономических, семантических и прагматических показателей эффективности интеллектуального аналитического поиска в массиве документов, накопленных в органах федерального, регионального и местного управления.

Для достижения указанной цели в диссертационной работе сформулированы и решены следующие задачи:

- Определена система параметров для технико-экономической, семантической и прагматической оценки эффективности информационно-поисковой системы по законодательству.

- Определены основные системологические соотношения для экспертно-технологического модуля автоматизированной системы обработки правовой информации на основе грамматических закономерностей склонения.

- Разработан аппарат автоматизированного экспертного анализа парадигматических связей между элементами функционирующего массива базовой справочно-контекстной информации (БСКИ).

- Разработаны модели физической организации данных экспертно-технологического модуля АСПИ, обеспечивающие взаимодействие программно-технологического комплекса «ФОНД» с массивом замкнутых парадигматических контуров.

- Разработана математическая модель технологического процесса взаимодействия экспертного модуля системы с базовой справочно-контекстной информацией ПТК «ФОНД».

- Разработаны алгоритмы объединения эквивалентных словоформ в замкнутые контуры для четких и нечетких множеств элементов базового справочно-контекстного массива.

- Разработана интерактивная экспертно-поисковая система справочно-правовой информации на базе программно-технологического комплекса «ФОНД».

Методы исследования. Аппарат автоматизированного экспертного анализа парадигматических связей между элементами функционирующего контекстного массива разработан на основе метода исследования грамматических характеристик словоизменения, методов математического моделирования, теории множеств, теории систем, методов организации файлов баз данных.

Объект исследования. Объектом исследования является центральный узел РИВС юстиции на базе программно-технологического комплекса "ФОНД", функционирующий в Научном центре правовой информации при Министерстве Юстиции Российской Федерации.

Диссертационная работа состоит из введения, трех глав с выводами, заключения и списка используемой литературы.

Заключение диссертация на тему "Исследование структур и разработка интерактивной экспертно-поисковой системы правовой информации"

Выводы по третьей главе.

Разработанные модели физической организации экспертного модуля интерактивной экспертно-поисковой системы обеспечивают принятие решений при организации поиска полной парадигмы. В результате проведенных исследований, разработаны: модель схемы парадигмы как экспертного элемента парадигматических замыканий, модель списка схем парадигматических замыканий, модель организации флексий, модель инверсного списка соответствия экспертных кодов парадигматических схем конкретной флексии.

Вышеперечисленные модели организации данных необходимы и достаточны для использования в предлагаемой интерактивной экспертно-поисковой системе при формировании массива парадигматических замыканий на основе грамматических закономерностей языка.

Модель технологического процесса интерактивного экспертно-поискового моделирования (ЭПМ) содержит в себе этап экспертно-поискового моделирования для чётких данных и этап интерактивного ЭПМ для нечётких множеств элементов базовой справочно-контекстной информации.

Проведенное исследование эффективности модели организации данных интерактивной экспертно-поисковой системы правовой информации показало уменьшение среднего числа обращений к внешнему устройству при поиске информации за счет сокращения числа элементов симметричного (З-дерева

- 147-ЗАКЛЮЧЕНИЕ

На основе выполненных в диссертации исследований структур и разработки интерактивной экспертно-поисковой системы правовой информации, в соответствии с поставленными задачами получены следующие результаты, обеспечивающие повышение технико-экономических, семантических и прагматических показателей эффективности интеллектуального аналитического поиска:

1. Выбрана система параметров для технико-экономической, семантической и прагматической оценки эффективности информационно-поисковой системы по законодательству.

2. Исследована существующая модель предметной области, функционирующая в составе ПТК «ФОНД», выявлены достоинства и недостатки линейной модели организации поисковых образов документальной информации.

3. На основе проведенного системологического анализа парадигматических схем с использованием метода грамматического анализа словоизменения разработана математическая модель экспертно-информационного представления объекта как системы грамматических правил.

4. Разработан аппарат автоматизированного экспертного анализа парадигматических связей между элементами функционирующего массива базовой справочно-контекстной информации, обеспечивающий выполнение прямой и обратной задачи экспертной оценки.

5. Разработаны модели физической и логической организации данных ИЭПС, обеспечивающие взаимодействие ПТК «ФОНД» с системой парадигматических замыканий.

6. Разработана математическая модель технологического процесса экспертной оценки и алгоритмы объединения эквивалентных словоформ в замкнутые контуры для четких и нечетких множеств элементов функционирующего массива базовой справочно-контекстной информации.

7. Разработана интерактивная экспертно-поисковая система на базе исходной модели предметной области автоматизированной системы обработки правовой информации ПТК «ФОНД», позволяющая повысить уровень интеллектуальности отклика системы при обработке запроса к базе данных нормативного законодательства.

Библиография Толок, Наталия Борисовна, диссертация по теме Телекоммуникационные системы и компьютерные сети

1. Авен О.И., Гурин H.H., Коган Я.А., Оценка качества и оптимизация вычислительных систем, М.: Наука, 1982 г.

2. Аветисян Д.О. "Проблемы информационного поиска", М.: "Финансы и статистика", 1981 г.

3. Автоматизация анализа научного текста, АН УССР, Институт языковедения им. A.A. Потебни, Киев: "Наукова думка", 1984 г., стр. 43-55.

4. Автоматизация проектирования устройств, систем и сетей связи, мет. указания, Беляев С.Н., М.: МТУ СИ, 1994 г.

5. Айламазян А.К., Стась Е.В., "Информатика и теория развития", М.: "Наука", 1989 г.

6. Андреев A.M., Березкин Д.В., Брик A.B. «Лингвистический процессор для информационно-поисковой системы». «Компьютерная хроника», №11, М.: ООО «Интерсоциоинформ», 1998 г., стр. 79-100.

7. Анисимов A.B. "Компьютерная лингвистика для всех. Мифы, алгоритмы, язык", Киев: "Наукова Думка", 1991 г.

8. Атре Ш. Структурный подход к организации баз данных. М.: Финансы и Статистика, 1983 г.

9. Баранов А. Н. "Категории искусственного интеллекта в лингвистической семантике. Фреймы и сценарии", М.: 1987 г.

10. Белов В.П., Спирин О.С. «Распределенный информационно-правовой фонд органов прокуратуры Российской Федерации», Теоретический и научно-практический журнал РАН «Проблемы информатизации», Вып. 2, М.: ТОО «Агат», 1999 г., с. 81-86.

11. Белоногов Г.Г., Новоселов А.П. "Автоматизация процессов накопления, поиска и обобщения информации", М.: "Наука", Гл. Редакция Физико-математической литературы, 1979 г., стр. 106-116.

12. Боботов С.В., Жигачев И.Ю. "Введение в правовую систему США", М.,1997 г.

13. Бондарев П.А., Силкин В.В. «Программная реализация инструментальных средств для построения экспертных систем». Журнал «Информационные технологии» №9, М.: Машиностроение, 1998 г., стр 19-23.

14. Бочаров П.П., Печинкин A.B., "Теория массового обслуживания", М.: Издательство РУДН, 1995 г.

15. Булгак В.Б., Евреинов Э.В., Мамзелев И.А. «Теория и проектирование управляющих систем электросвязи», М.: Радио и связь, 1995 г.

16. Валентинов В.В. "Информационно-поисковая система в АСУ", М.: "Статистика", 1976, стр. 64-67.

17. Вентцель Е.С. "Теория вероятностей", М.: Государственное издательство физико-математической литературы, 1962 г.

18. Виноградов М.М. "Модели данных и отображения моделей данных: алгебраический подход// Теория и приложения систем баз данных", М.: ЦЭМИ, 1984 г., с. 26-40.

19. Вирт Н. "Алгоритмы и структуры данных", М.: Издательство "МИР", 1989 г.

20. Волчинская Е., Карелина М. "Общие проблемы создания и функционирования в России автоматизированных баз правовой информации." «Российские системы правовой информации», М.: Инвента, 1994 г.

21. Гаврилов O.A. "Информатизация правовой системы России". Учебное пособие. М.: Издательство "Юридическая книга", 1998. 144 с.

22. Гаврилов O.A. "Интеллектуальные системы и технологии в правовой сфере", М.: НТИ, серия 1, №11, 1993 г., с. 24-26.

23. Гачечиладзе Т., Криадо Ф. «Нечеткие математические модели лингвистической статистики». Известия Академии Наук, «Теория и системы управления» №5, М.: МАИК «Наука», 1998 г, стр. 81-87.

24. Гегечкори JLA., Сыров Е.М. "Принципы построения автоматизированной системы обработки правовой информации министерства юстиции Российской

25. Федерации", "Правовая информатика", №2, сборник научных трудов, М.: НЦПИ, 1997 г., стр. 108-116.

26. Герцев К.Н. "Об организации многопользовательского режима в распределенной информационно-вычислительной системе юстиции", "Правовая информатика", №2, сборник научных трудов, М.: НЦПИ, 1997 г., стр. 146-150.

27. Горский Г.Р. «Организация разработки информационных систем: анализ методов», журнал «Компьютеры в учебном процессе» №5, М.: ООО «Интерсоциоинформ», 1999 г., стр. 41-58.

28. Грешилов A.A., Стакун В.А., Стакун A.A. "Математические методы построения прогнозов", М.: "Радио и связь", 1997 г.

29. Дейт К. "Введение в системы баз данных", М., Наука, 1980 г.

30. Ерема-Еременко A.A., Михновский С.Д. "Информационная модель для формирования описания предметной области проектируемой базы данных"// УсиМ, 1982 г., №5., стр. 84-88.

31. Жафяров А.Г. «Общее состояние и перспективы развития информационно-правовых систем (баз данных правовой информации) в России», "Правовая информатика", №3, сборник научных трудов, М.: НЦПИ, 1998 г., стр. 7-11.

32. Жданов B.C., Любарский Д.В. «Концептуальные вопросы построения современных информационных систем». «Компьютеры в учебном процессе», №8, М.: ООО «Интерсоциоинформ», 1998 г., стр. 35-62.

33. Зайцев Н.Г. «Технология обработки данных в языковой форме» Киев: «Техника», 1989 г. стр. 5-14, 163-174.

34. Зализняк А. А. Русское именное словоизменение, М., 1967.

35. Зализняк А. А. О понимании термина "падеж" в лингвистических описаниях. I / Проблемы грамматического моделирования. М., 1973.

36. Зализняк A.A. «Грамматический словарь русского языка». Словоизменение. Москва, «Русский язык», 1987 г.

37. Информационный поиск., пер. с англ., под ред. Трофимова К.Н., М.: Воениздат, 1970 г., стр. 53-88.

38. Исаков В.Б. "Информация и информационные технологии в процессе законотворчества", М.: НТИ. Сер.1. "Организация и методика информ. Работы", 1999 г., №8, стр.7-9.

39. Итоги науки и техники. Информатика. Том 12.: «Автоматизированные информационно-поисковые системы». М.: ВИНИТИ, 1988 г., стр 32-35, 134-137.

40. Картавов С. А. «Математические термины» Справочно-библиографический словарь. Под ред. Коваленко B.C., Киев: «Выща школа», 1988 г.

41. Кибрик А.Е. Очерки по общим и прикладным вопросам языкознания, М.: 1992 г.

42. Кириллов В.И., Старченко A.A. "Логика", М., 1996 г.

43. Клир Дж. "Системология", Москва, "Радио и связь", 1990 г.

44. Кнут Д. Искусство программирования для ЭВМ.: в 3 т., Т.З: Сортировка и поиск, М, Мир, 1978 г.

45. Козырева Г.М., Калабеков В.А., Морозов В.К. "Теория вычислительных процессов и структур", М.: МТУ СИ, 1996 г.

46. Компьютерные технологии в юридической деятельности, М., 1994.

47. Кон П. "Универсальная алгебра", М.: МИР, 1968 г.

48. Кристофидес Н. "Теория графов", М.: Издательство "МИР", 1978 г.

49. Ланкастер Ф. "Информационно-поисковые системы", М.: "МИР", 1972 г., стр. 61-74.

50. Лингвистическое обеспечение информационных систем. Сборник научно-аналитических обзоров. Под ред. Березина Ф.М. М.: ИНИОН АН СССР, 1987 г., С. 220.

51. Липаев В.В. «Стандарты, регламентирующие жизненный цикл сложных комплексов программ информационных систем». Журнал «Информационные технологии» №9, М.: Машиностроение, 1998 г., стр 2-8.

52. Литвак Б.Г. Экспертные оценки и принятие решений. М., 1996.

53. Максименков A.B., Селезнев М.Л. "Основы проектирования информационно-вычислительных систем и сетей ЭВМ", М.: "Радио и связь", 1991 г.

54. Мальковский М.Г., Шикин И.Ю. «Нечеткий лингвистический интерфейс», РАН, «Программирование», №4, М.: МАИК «Наука», 1998 г., стр. 50-61.

55. Мартин Дж. "Организация баз данных в вычислительных системах", пер. с англ. М.: МИР, 1980 г.-662с.

56. Мартин Дж. "Планирование развития автоматизированных систем". М.: Финансы и статистика, 1984 г.

57. Мельчук И. А. Опыт построения лингвистических моделей "Смысл Текст". М.1974.

58. Мельчук И. А. Опыт разработки фрагмента системы понятий и терминов для морфологии (к формализации языка лингвистики) // Семиотика и информатика,1975. Вып. 6.

59. Михайлов O.A. "Электронные документы в архивах. По данным международных конференций и публикаций 1998 г. (обзор)". ИНФОРМАТИКА: Экспресс-информ №6, М.: ВИНИТИ, 1999 г, с. 2-12.

60. Морозов A.B. "Введение в правовую информатику", Москва, НЦПИ, 1997.

61. Морозов A.B. "Правовая информатика", М., НЦПИ, 1999

62. Морозов A.B. "Правовые базы данных", М., НЦПИ, 1999

63. Морозов В.К. «Теория вычислительных процессов и структур», М.: МТУ СИ, 1996 г.

64. Морозов В.К., Грузинцева С.О., Барджис Ю.А., Селезнева Ю.А. «Основные тенденции в развитии компьютерных систем правовой информатизации», Сб. Науч. трудов «Правовая информатика», Москва, НЦПИ, 1996 г.

65. Морозов В.К., Долганов A.B. "Основы теории информационных сетей", Москва, "Высшая школа", 1987 г.

66. Найк Дилип "Стандарты и протоколы Интернета" / Пер. с англ. М: Издательский отдел "Русская редакция" ТОО "Channel Trading Ltd.", 1999 г. - 384 е.: ил.

67. Немтинов В.А., Мокрозуб В.Г., Егоров С.Я., Козадаев Д.П. «Создание информационных справочных систем с использованием Internet/Intranet», "Информационные Технологии", №7, 1999 г., М.: Машиностроение, 1999 г., с. 37-39.

68. Никитин П.И. "Автоматизированные системы обработки и поиска документальной информации", М.: "Статистика", 1977 г., стр. 16-27.

69. Новый иллюстрированный энциклопедический словарь, М.: Научное издательство "Большая Российская Энциклопедия", 1999 г., стр. 355,580, 586.

70. Овчаров JI.А., Селетков C.H. "Автоматизированные банки данных" М.: "Финансы и статистика", 1982 г.

71. Организация работы с документами: учебник/ В.А. Кудряев и др. М.: Инфра-М, 1998 г., 575 с.

72. Основы теории государства и права, М.: "Юридическая литература", 1971 г.

73. Падучева Е. В. "О семантике синтаксиса", М., 1974.

74. Падучева Е. В. "О способах представления синтаксической структуры предложения", ВЯ, N 2, 1964 г.

75. Пальчун Б.П., Юсупов P.M. "Оценка надежности программного обеспечения", Санкт-Петербург: "Наука", 1994 г., стр. 14-20, 37-40.

76. Перспективные информационные технологии в правовой сфере, М.: НТЦ "Информсистема", 1993 г.

77. Попов И.И. "Оценка и оптимизация информационных систем", М.: изд. МИФИ, 1981 г.

78. Попов И.И., Храмцов П.Б. "Распределение частоты встречаемости терминов для линейной модели информационного потока", НТИ, Сер.2, № 2, стр. 23-26, 1991 г.

79. Попов Э.Ю., Фридман Г.Р. "Алгоритмические основы интеллектуальных роботов и искусственного интеллекта", М., 1976 г.

80. Правовая информатика и кибернетика, под ред. Полевого Н.С., М.: "Юридическая литература", 1993 г.

81. Проблемы регистрации информации. Вопросы создания систем хранения и обработки компьютерной информации. Сб. науч. трудов. Киев: Наукова Думка, 1991 г., стр. 62-69.

82. Резникова Н.Б. «Исследование специфики структуры и функций правовой информации. Выбор системы оценки параметров объекта», тезисы доклада Конференции НИР МТУ СИ, М: МТУ СИ, 1997 г.

83. Резникова Н.Б. «Логико-семантический анализ нормы права» «Информационные технологии в науке, образовании, телекоммуникации, бизнесе и охране природных ресурсов», труды XXVI международной конференции, г. Гурзуф, май 1999 г. М.: МАИ, 1999 г. - С 76-78.

84. Резникова Н.Б., Шмелёв А.А. «О некоторых задачах управления потоками информационных запросов», «Правовая информатика», выпуск 4, М.: НЦПИ, 1999 г.

85. Решетников В.Н. Алгебраическая теория информационного поиска. Программирование, № 3, 1979 г., стр. 68-73.

86. Российские системы правовой информации, М.: "Инвента", 1994, стр. 55.

87. Рубашкин В.Ш. "Представление и анализ смысла в интеллектуальных информационных системах". Москва, Наука, 1989 г

88. Рыбаков Ф. И. "Системы эффективного взаимодействия человека и ЭВМ", М.: "Радио и связь", 1985 г. стр. 22-28.

89. Рыбаков Ф.И., Руднев Е.А., Петухов В.А. "Автоматическое индексирование на естественном языке", М.: "Энергия", 1980 г., стр. 118-147.

90. Сасскинд Р. "Экспертные системы в праве" М., 1990 г.

91. Словарь по кибернетике, под редакцией акад. Михалевича B.C., Киев: Гл. ред. Укр. Советской энциклопедии им. М.П. Бажана, 1989 г., стр. 235, 236, 239-242, 435-436, 472.

92. Смит Д., Чанг Ш. «Визуальный поиск данных в системе WWW». «Компьютеры + Программы» №2 (44), Киев: TOB «Комиздат», 1998 г., стр. 40-45.

93. Совер Н.Б. "Анализ автоматизированных информационно-поисковых систем: автоматизация аналитико-статистической обработки текстов, стратегия поиска" Обзор, Рига: ЛатИНТИ, 1975 г.

94. Соколов A.B. "Информационно-поисковые системы", М.: "Радио и связь", 1981 г., стр. 37-40, 66-69, 70-77.

95. Соломатин Н.М. "Информационные семантические системы", серия "Перспективы развития вычислительной техники" п/р проф. Смирнова Ю.М., книга 1, М.: "Высшая школа", 1989 г., стр. 81-96.

96. Солтон Дж. "Динамические Библиотечно-информационные системы", М.: издательство "МИР", 1979 г., стр. 91-125.

97. Справочник "Искусственный интеллект" книга 1 "Системы обобщения и экспертные системы", М.:, "Радио и связь", 1990 г.

98. Справочник "Искусственный интеллект", Книга 2 "Модели и методы", М.: "Радио и связь", 1990 г.

99. Справочник "Искусственный интеллект" книга 3 "Программные и аппаратные средства", М.: "Радио и связь", 1990 г.

100. Степанов В.К. «Поисковые средства «Интернет»», «Компьютеры в учебном процессе», №4, М.: ООО «Интерсоциоинформ», 1999 г., стр 49-54.

101. Сыров Е.М., Гегечкори Л.А. "Технология обработки информации в автоматизированной системе обработки правовой информации субъекта Российской Федерации", "Правовая информатика", сборник научных трудов, №2, М.: НЦПИ, 1997 г., стр. 153-161.

102. Талантов М. «Профессиональный поиск в Интернете: полнота, достоверность, скорость». М.: «Компьютер пресс» №7, 1999 г., стр. 170-175.

103. Теньер Л. "Основы структурного синтаксиса", М., 1988.

104. Тиори Т., Фрай Дж. "Проектирование структур баз данных": В 2 кн. М.: МИР, 1985 г.

105. Толок Н.Б. "Аппарат автоматического индексирования многопрофильных полнотекстовых баз данных", "Правовая информатика", выпуск 4, М.: НЦПИ, 1999 г.

106. Трубецкой Н. С. Основы фонологии, М., 1960.

107. Уинстон П. «Искусственный интеллект», М.: МИР, 1980 г., с. 213-243.

108. Ульман Дж. "Основы систем баз данных", М.: "Финансы и статистика", 1983 г.

109. Уотермен Д. "Руководство по экспертным системам", пер. с англ., М.; "МИР", 1989 г., стр. 133-141.

110. Феррари Д. "Оценка производительности вычислительных систем", М.: "МИР", 1981 г.

111. Финько O.A. "Правовое обеспечение государственной информационной политики", Москва, НТИ. Сер.1. Организация и методика информ. работы, №8, 1999 г., стр.2-6.

112. Фитиалов С. Я. Об эквивалентности грамматики НС и грамматики зависимостей// Проблемы структурной лингвистики, М., 1967.

113. Флорес И. Структуры и управление данными. М.:Финансы и статистика, 1982 г.

114. Хаббард Дж. "Автоматизированное проектирование баз данных". М.: МИР, 1984 г.

115. Хропанюк В.Н. «Теория государства и права». М.: 1995 г.

116. Цаленко М.Ш. «Моделирование семантики в базах данных», М.: «Наука», 1989 г., стр. 151-182.

117. Цегелик Г.Г. "Организация и поиск информации в базах данных", Львов, Издательство при ЛГУ ИО "Вища школа", 1987, стр. 5-23, 97-129.

118. Цегелик Г.Г. "Системы распределенных баз данных", Львов, Издательство «СВИТ», 1990 г.

119. Четвериков В.Н., Ревунков Г.И., Самохвалов Э.Н. Базы и банки данных. Учебник для вузов по специальности АСУ, под. Ред. В.Н. Четверикова. М.: Высшая школа, 1987 г.

120. Шаймарданов Р.Б. "Моделирование и автоматизация проектирования структур баз данных", М.: Радио и связь, 1984 г.

121. Шварц Кэнди "Поисковые машины сети WEB", пер. с англ., ИНФОРМАТИКА: Экспресс-информ №8, М.: ВИНИТИ, 1999 г., с. 2-5. Translation to: " WEB search engines"/ Schwartz Candy // J. Amer. Soc. Inf. Sei. 1998,- 49, №11.- pp. 973-982.

122. Шенк P. Обработка концептуальной информации. M., 1980.

123. Шмелев A.A., Гегечкори Л.А. "Задачи совершенствования поискового аппарата автоматизированных информационно-поисковых систем по законодательству", "Правовая информатика", сборник научных трудов, №1, М.: НЦПИ, 1996 г., стр. 63-68.

124. Язык закона. М.: "Юридическая Литература", 1990 г., стр.60, 70.

125. Якушин Б.В. "Алгоритмическое индексирование в информационных системах", М.: Наука, 1978 г., стр. 29-53.

126. Budi Yuwono, Dik L.Lee. Search and Ranking Algorithms for Locating Resources on the World Wide Web. In Proceedings of the Forth International Conference on the World Wide Web, New York, November, 1995.

127. Codd E.F. "An Experimental English Language Query Formulation System for Casual Users of Relational Data Bases"// IBM Research Report R12144/ San Jose: IBM/ -1978.

128. Kahle, В., and Medlar, A., "An Information System for Corporate Users: Wide Area Information Servers," Technical Report TMC-199, Thinking Machines, Inc., April 1991.

129. Koster, M., "ALIWEB: Archie-like Indexing in the Web," Computer Networks and ISDN Systems, 27(2), pp. 175-182, 1994.

130. Ladefoged P. Preliminaries to linguistic phonetics. Chicago, 1971.

131. Liles L. An introductory transformational grammar. 1971.

132. Martin Bartschi. An Overview of Information Retrieval Subjects. IEEE Computer, # 5, 1985, p.67-84

133. Rosenberg A.L., Snyder L. Time- and space-optimality in B-trees // ACM Trans. Database Syst. 1981.Vol.6. N 1. P. 174-193.

134. Tunender Heather, Ervin Jane "How to succeed in promoting your Web site: The impact of search engine registration on retrieval of a World Wide Web site" // Inf. Technol. And libr. 1998. - 17, №3. - pp. 173 - 179.

135. Stiles H.E. "The association factor in information retrieval". Journal of the ACM, 1961, vol.8, N2, p. 271-279

136. Xie M., Wang H., Goh T.N. Quality Dimensions of Internet Search Engines // J. Inf. Sci. 1998. -24, №5. - pp. 365-372.

137. Yu C.T., Lam K., Salton G. "Term Weighting in Information Retrieval Using the Term Precession Model. Communication ACM, V.29, 1982, p. 152-170.

138. Ожидаемый экономический эффект от внедрения результатов научной работы тов. Толок Н.Б. составляет 270 тыс. рублей в год.

139. Председатель комиссии Зам. Директора1. Герцев К.Н.1. Члены комиссии:1. Начальник ОНИ и ПК1. Шмелёв A.A.1. Зам. начальника ОПОСПД1. Логвиненко В.А.

140. Утверждаю Генеральный директор ОАО «Импульс» Ic.t.h. Чахмахчев JI.X. « i«T» -Puia^2000 г.г. Москва1. Акт внедрения

141. Ориентировочный экономический эффект от внедрения результатов вышеуказанной работы составит 30,0 тыс. рублей в год.

142. Гл. инженер , к.т.н/У^^ ^ И.Ю.Китайгородский Нач. отдела, к.^^^^^^А.В. Дьяченко Вед. науч. сотр., к.т.н. Виноградов1. Г/л у \ \1. Утверждаю»

143. Первьш проректор^ЙТСИ Но учебной работе// //¿¿¿р^/и.-СГн.д. козырев<(# » 2000 г1. У! 'А |'|1. АКТ

144. О внедрении в учебный процесс МТУ СИ (г. Москва) результатов диссертационной работы Толок Н.Б. «Исследование структур и разработка интерактивной экспертно-поисковой системы правовой информации»

145. Научный руководитель д.т.н., профессор

146. Зав. Кафедрой ВТ и УС д.т.н., профессор1. Морозов В.К.1. Лазарев Ю.В.ъгшздн&ректор ЗГУ1. АКба^сЯ/ 2000 г.1. АКТ

147. О внедрении в учебный процесс ЗГУ (Украина, г. Запорожье) результатов диссертационной работы Толок Н.Б. «Исследование структур и разработка интерактивной экспертно-поисковой системы правовой информации»