автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Методы организации диалога в информационных системах на языке, близком к естественному

кандидата технических наук
Журавлев, Антон Евгеньевич
город
Санкт-Петербург
год
2012
специальность ВАК РФ
05.25.05
Диссертация по документальной информации на тему «Методы организации диалога в информационных системах на языке, близком к естественному»

Автореферат диссертации по теме "Методы организации диалога в информационных системах на языке, близком к естественному"

На правах рукописи

ЖУРАВЛЕВ АНТОН ЕВГЕНЬЕВИЧ

МЕТОДЫ ОРГАНИЗАЦИИ ДИАЛОГА В ИНФОРМАЦИОННЫХ СИСТЕМАХ НА ЯЗЫКЕ, БЛИЗКОМ К ЕСТЕСТВЕННОМУ

Специальность 05.25.05 «Информационные системы и процессы»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург 2012

005050150

Диссертация выполнена на кафедре «Вычислительных систем и информатики» ФБОУ ВПО «Санкт-Петербургский государственный университет водных коммуникаций».

Научный руководитель:

КРУПЕНИНА Наталия Викторовна, кандидат технических наук, доцент.

Официальные оппоненты:

ВОРОБЬЕВ Владимир Иванович, доктор технических наук, профессор, заведующий лабораторией информационно-вычислительных систем Санкт-Петербургского института информатики и автоматизации РАН (СПИИРАН).

КРИВЦОВ Александр Николаевич, кандидат физико-математических наук, доцент, доцент кафедры информационных систем в экономике экономического факультета ФГБОУ ВПО «Санкт-Петербургский государственный университет».

Ведущая организация:

ФГБОУ ВПО Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина)

Защита состоится «27» декабря 2012 г. в 16.00 часов в ауд. 23 5А на заседании диссертационного совета Д223.009.03 в ФБОУ ВПО «Санкт-Петербургский государственный университет водных коммуникаций» (198035, Россия, г. Санкт-Петербург, ул. Двинская, д. 5/7).

С диссертацией можно ознакомиться в библиотеке ФБОУ ВПО «Санкт-Петербургский государственный университет водных коммуникаций».

Автореферат разослан «26» ноября 2012 г.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Представляемая работа посвящена исследованию и разработке методов и средств создания систем, поддерживающих интеллектуальный доступ к данным автоматизированных информационно-справочных систем (АИСС).

Актуальность темы. В настоящей работе рассматриваются проблемы организации диалога оператора терминала с информационной системой на некотором подмножестве естественного языка, содержащего вопросительные и побудительные предложения. На основе семантического анализатора предлагается транслятор с естественного языка на SQL-подобный язык запросов информационной системы.

Основы методик представления семантики текстов были заложены в публикациях Поспелова Г.С., Поспелова Д.А. (1981), Белоногова Г.Г. (1983), Апресяна Ю.Д. (1967), Минского М. (1979), Хомского Н. (1961-1962), Попова Э.В. (1982), Мильчука И.А. (1982), Тузова В.А. (1970-2007) и др. Результаты их развития излагались в работах Полякова А.О. (1985), Кузнецова И.П. (1986), Леонтьевой H.H. (1986), Рубашкина В.Ш. (1989-2005), Хорошевского В.Ф. (2002), Емельянова Г.М. (1998-2003), Волковой И.А. (2006).

Целью диссертационной работы является расширение функциональности АИСС, включающее элементы искусственного интеллекта за счет организации интеллектуального доступа к базам данных (БД), используя проблемно-ограниченное подмножество естественного языка (ЕЯ), и средства динамической обработки и представления данных.

Достижение сформулированной цели предполагает решение следующих основных задач:

1. Исследование представления внешней информационной модели предметной области с целью выбора модели данных и формирование структуры информационной базы данных на основе выбранной модели данных.

2. Разработка АИСС, поддерживающей сформированную структуру данных.

3. Формализация многокритериальной оптимизационной задачи построения расписания ВУЗа и разработка алгоритма его построения.

4. Разработка формального механизма преобразования запроса к данным на проблемно-ориентированном подмножестве ЕЯ в язык запросов к базе данных АИСС и его реализацию.

Объектом диссертационных исследований является интеллектуальный диалог оператора терминала с АИСС для организации доступа к базе данных и механизм формирования учебного расписания.

Предметом исследования является модельно-алгоритмическое обеспечение автоматизированного формирования и выполнения и анализа результатов запросов, заданных на SQL-подобном классе языков и проблемно-ограниченном подмножестве ЕЯ.

Методы исследования. Для решения поставленных задач в работе используются методы исследования информационных систем, дискретной математики, математической и формальной лингвистики. Научная новизна работы заключается в следующем:

1. Разработано формализованное описание проблемно-ориентированного подмножества ЕЯ.

2. Разработан формальный механизм преобразования запросов к данным на проблемно-ориентированном подмножестве ЕЯ на запросы на языке платформы АИСС.

3. Формально описана постановка многокритериальной оптимизационной задачи построения расписания ВУЗа и предложены алгоритмы построения оптимального расписания учебных занятий ВУЗа.

4. Разработан алгоритм преобразования запросов на проблемно-ориентированном подмножестве ЕЯ на запросы на языке ICQ.

Практическая значимость полученных результатов. Областью непосредственного практического применения теоретических результатов работы является автоматизация процессов учета, хранения, обработки и анализа информации об основных процессах, характеризующих деятельность подразделений высшего учебного заведения.

Обоснованность и достоверность научных положений подтверждена всесторонней апробацией основных теоретических положений диссертации в печатных трудах, докладах на Международных и Всероссийских научных конференциях, положительными результатами практического использования разработанной АИСС в различных отечественных организациях.

Реализация результатов работы. Используя предложенную платформу и разработанный механизм семантического анализатора на проблемно-ограниченном подмножестве ЕЯ разработаны и внедрены следующие АИСС:

1. АИСС «ВУЗ» организации учебного процесса в 2010/2011, 2011/2012 учебных годах в Санкт-Петербургском государственном университете водных коммуникаций в деканате гидротехнического факультета.

2. АИСС «Звездочка» автоматизации учета и контроля хозяйственной деятельности юридического отдела ОАО «ЦС «Звездочка».

3. АИСС «Спектр» обеспечения курсов переподготовки и повышения квалификации учебного центра ОАО «ПО «СЕВМАШ».

4. АИСС «Автошкола» автоматизации комплекса услуг по подготовке специалистов «ДОСААФ России» г. Северодвинска.

Основные положения, выносимые на защиту. Исходя из рассмотренных в предлагаемой работе новых вопросов формируются положения, выносимые на защиту.

1. Формализованное описание проблемно-ориентированного подмножества ЕЯ и формальный механизм преобразования запросов к данным на проблемно-ориентированном подмножестве ЕЯ на запросы на языке платформы АИСС.

2. Алгоритм преобразования запросов на проблемно-ориентированном подмножестве ЕЯ на запросы на языке ICQ.

3. Формальное описание постановки многокритериальной оптимизационной задачи построения расписания ВУЗа.

4. Алгоритмы построения оптимального расписания занятий ВУЗа.

Личный вклад соискателя. Все научные и практические результаты получены соискателем самостоятельно в процессе многолетней научной работы.

Диссертационная работа соответствует формуле, а также следующим пунктам паспорта научной специальности 05.25.05 - Информационные системы и процессы:

• п.З. Информационное обеспечение процессов и систем в части принципов организации и структурирования данных, концептуального, логического, физического проектирования табличных и текстовых баз данных информационных систем;

• п.4. Лингвистическое обеспечение информационных систем и процессов в части методов и средств проектирования словарей данных как лексических комплексов, а также методов семантического, синтаксического и прагматического анализа текстовой информации с целью ее формализации для представления в базах данных и организации интерфейсов информационных систем с пользователями;

• п.б. Сетевые информационные ресурсы и технологии, в том числе разработка и исследование принципов организации и функционирования распределенных информационных систем и баз данных.

Апробация работы. Основные результаты диссертационной работы были представлены на 9 конференциях: V меяедународная научно-техническая конференция «Информатизация процессов формирования открытых систем на основе СУБД, САПР, АСНИ и систем искусственного интеллекта», г. Вологда,

2009 г, IV всероссийская научно-техническая конференции по имитационному моделированию и его применению в науке и промышленности «ИММОД-2009», г. Санкт-Петербург, 2009 г., VII международная научная конференция «Инновации в науке и образовании», г. Калининград, 2009 г., межвузовская научно-практическая конференция молодых ученых, посвященная 200-летию транспортного образования в России «Водный транспорт России: история и современность», г. Санкт-Петербург, 2009 г., VIII всероссийская школа-семинар «Прикладные проблемы управления макросистемами», г. Апатиты,

2010 г., XII Санкт-Петербургская международная конференция «Региональная информатика (РИ-2010)», г. Санкт-Петербург, 2010 г., международная научно-практическая конференция «Информационные и коммуникационные технологии в образовании: ресурсы, опыт, тенденции развития (ИТО)», г. Архангельск, 2011 г., XII международная научно-практическая конференция «Формирование новой информационной среды образовательного учреждения с использованием технологий «1С»», г. Москва, 2011 г., III межвузовская научно-практическая конференция студентов и аспирантов «Современные тенденции и перспективы развития водного транспорта России», г. Санкт-Петербург, 2012 г.

По теме диссертации опубликовано 13 работ, в том числе: 3 статьи в журналах из перечня ВАК Министерства образования РФ («Журнал университета водных коммуникаций», «Вестник Санкт-Петербургского университета»). Публикации отражают основные полученные результаты диссертационной работы.

Структура и объём работы. Диссертационная работа состоит из введения, четырех глав, заключения, изложенных на 137 страницах машинописного текста и списка использованных источников, включающего 131 наименование, содержит 29 рисунков и 6 таблиц.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность выбранной темы, формулируется цель и содержание поставленных задач, а также объект и предмет исследования, обозначается теоретическая значимость и прикладная ценность полученных результатов.

В первой главе диссертационной работы проанализировано современное состояние дел в области автоматизации процессов учета, хранения и обработки информации в БД, исследованы возможности существующих подходов к разработке расширенных моделей данных, определению структур хранения, поддерживающих расширенные модели данных, и методов доступа к хранимой базе данных; определению механизмов интерфейса для взаимодействия с базой данных в терминах предложенной расширенной модели; выбору универсальной инструментальной визуальной среды (СУБД) для построения и использования АИСС, поддерживающей механизмы предложенной расширенной модели.

Рассмотрены основные подходы к реализации механизмов ведения интеллектуального диалога между оператором терминала и АИСС средствами организации семантического анализа запросов на проблемно-ограниченном подмножестве ЕЯ. На основе выполненного анализа сделан вывод, что существующие подходы не дают возможности решения поставленных в работе задач исследования в полном объёме.

Во второй главе предлагаются средства и методы разработки модели данных, лежащие в основе базы данных. Уделяется особое внимание системе управления базами данных (СУБД), как центральной интегрированной среде разработки и, соответственно, основному используемому прикладному механизму.

Описан процесс разработки модели данных, свойства этой модели, ее достоинства и недостатки. Рассмотрено поэтапное проектирование базы данных и последующая разработка АИСС на примере АИСС «ВУЗ», позволяющей автоматизировать работу определенных подразделений высших учебных заведений. Приведены ее особенности и характеристики, а также нюансы внедрения, использования и дальнейшей поддержки.

Используя в качестве СУБД классический SQL-интерпретатор (например, Microsoft SQL Server) и в качестве IDE (интегрированной среды разработки) отечественную ERP-систему «1С ¡Предприятие 8» рассмотрены возможности по интерпретации и представлению семантических моделей данных.

Проблемная ориентированность выбранной среды в достаточной мере отображает семантику (смысловую нагрузку) обрабатываемых данных, что является необходимым качеством для использования семантической модели данных. Совокупность объектов и связей между данными и метаданными

прикладных решений на основе данной среды логично интерпретируется терминами теории семантического моделирования («сущность — связь»),

В свою очередь структура хранения данных средствами SQL Server такова, что любые вхождения данных интерпретируются реляционной формой, таким образом, семантическая модель с точки зрения структуры хранения данных будет представлять собой реляционную таблицу (или набор реляционных таблиц), причем таблицами будут являться не только сами данные, но и их семантика. С точки зрения организации массива данных это означает, что какой бы сложной не была выработанная семантическая модель, на физическом уровне она будет представлять собой классическую реляционную базу данных.

По умолчанию в алгоритмах оперирования данными не предусмотрена возможность преобразования данных напрямую между интерфейсами, т.к. подобный функционал может привести к нарушению целостности данных и снижению быстродействия БД и СУБД. Однако потенциал модели данных таков, что к базе данных могут быть применены сторонние средства и расширения интерфейсов, обеспечивающие прямую связь между системами ввода-вывода минуя контролирующие механизмы СУБД. Таким образом, весь функционал по преодолению нарушений целостности и корректности данных будет возложен на этот сторонний механизм (Рис.1).

Рис. 1. Механизмы АИСС

В рамках процесса разработки АИСС предложены алгоритмы формирования учебного расписания, как одного из основных факторов, определяющих качество подготовки специалистов в вузах и особенно эффективность использования научно-педагогического потенциала.

Технология построения расписания в современных условиях предполагает частичную или полную автоматизацию этого процесса результатом которого является решение многокритериальной оптимизационной задачи.

Формализуем задачу формирования расписания в терминах теории расписаний. Пусть в качестве обслуживающего прибора выступает множество преподавателей Р = {р1; рг, ..., р^}, а в качестве заявок на обслуживание фигурируют множества групп О = {£], ..., и дисциплин О = {(1ь сЬ, ..., ёма}- Ограничениями служат множества аудиторий А = {а|, а2, ..., ама} и временные интервалы Т = {1, 2, ..., п}, где Т=1ч1*6*2 - количество уникальных временных интервалов. Здесь N - количество элементов в 1 рабочем дне (из расчета б рабочих дней в неделю, 2 недели по числителю/знаменателю каждая), соответствующие аудиторным занятиям, формируют выходное множество, каждый элемент которого и является элементом допустимого расписания. Известны времена облуживания этих требований Т. Порядок формирования сетки таблицы расписания может быть произвольным, либо регламентироваться заданными отношениями частичного порядка (иерархия преподавателей). Могут допускаться прерывания в сетке таблицы элементов расписания г(Рп) в обслуживании множества Р„. Необходимо так организовать процесс обслуживания, чтобы г(р;, а, с1т, а8,1к) = Ор^Я). Процесс обслуживания описывается кусочно-постоянной, непрерывной слева функцией г = г^) = к, где к принимает одно из значений {0, 1}, что соответствует пустому или заполненному элементу сетки расписания при 1 < 1 < Т.

Критериями решения многокритериальной оптимизационной задачи построения расписания являются:

• Отсутствие «окон» в сетке расписания для групп студентов; в = {&, ё2, Бы8} и Т = {2, 3}— г(С, Т) ф О

• Распределение показателя оптимальности расписания в соответствии с весами преподавателей (например, от ассистента до профессора); ОрКОр) = г(Р'), Р,=б(Р), где б(Р) - функция сортировки множества Р

• Распределение видов занятий по соответствующим им типам аудиторий, включая прочие (например, профилактические) меры; г(0, А) = х А5 х В, где В - дополнительный бинарный фактор

• Соответствие преподавателей подмножеству ведомых ими дисциплин; г(Р, О) = Р5 х

• Соответствие групп студентов (направления, специальности, профиля) подмножеству дисциплин (учебному и оперативному планам); г(в, О) = С8 х

В соответствии с алгоритмом формирования расписания после первичной сортировки множеств Р = {рь р2, ..., рыР}, б = {§ь ..., О = {(!,, ё2, ..., ¿ш}, по собственным внутренним критериям формируются множества связей «Преподаватель —► дисциплина —► поток» и модели (функции) Р.= РхОхБх А х т, где А = {аь а2, ..., аыа} - множество аудиторий и Т = 12, ..., 1ы1}множество пар (в нашем случае N1 = 4). Т.е. пРхОхБхАхТ—► {0,1}. Затем происходит заполнение перебором с сохранением альтернатив пяти рабочих дней для t2 и 1з (вторая и третья пары соответственно), при помощи разработанного алгоритма, использующего технологии параллельного программирования (МР1 на С++) для обхода дерева допустимых решений. Т.е.

г(р;, а, с1т, а8, у = 1, где к = 2;3, что означает, что занятия по дисциплине (1] для группы а проводится преподавателем рт в аудитории aj во время пары Заполнение таблицы расписания происходит в соответствии с двумя его основными компонентами Я = + - это статическая часть расписания, содержащая элементы таблицы, которые не должны изменяться с течением времени. Она заполняется на основании заранее подготовленных данных. Динамическая часть расписания Яа формируется в процессе работы механизма формирования учебного расписания.

В заключение происходит заполнение элементов допустимого расписания для I, и 14, с соблюдением условий: г(р„ а, <1т, а8,12) = 0 —> г(р„ а, <Зт, а8, = 0 и г(р„ а, dm, а8, = 0 —> г(р^ а> с1т, ак, 14) = 0. Это соответствует условию необходимости отсутствия «окон» в учебном расписании. Также на данном этапе заполняются так называемые «мигающие» пары (т.е. те, для которых планом предусмотрено 17 или 51 ч. в семестр) по числителю/знаменателю и суббота, как день минимальной нагрузки и низкоприоритетных элементов г(р„ а, с1т, а8, у. Каждый элемент гу(р,, а, <1т, ак, полученный в ходе выполнения алгоритма построения допустимого расписания характеризуется несколькими исходными параметрами (преподаватель, поток, наименование, аудитория, номер), а также, дополнительно, присвоенным алгоритмом днем недели

Формирование оптимального расписания происходит на основе допустимого расписания (сохраненных ранее его альтернатив) и заданных критериев. Здесь используется еще один, дополнительно разработанный генетический алгоритм, использующий технологии параллельного программирования для обхода дерева допустимых решений.

АИСС «ВУЗ» разрабатывается со стандартным набором средств визуализации данных, таких как встроенный механизм формирования отчетности. В процессе эксплуатации системы становится ясно, что для наиболее эффективной работы оператора необходим не только расширенный набор отчетности, но и сама возможность оперативно получать различные сведения и формировать отчетную документацию, не входящую в стандартный набор объектов типа «отчет». Такая необходимость возникает, когда необходимо организовать доступ к данным АИСС по студентам для неподготовленного пользователя (например, доступ родителей к сведениям о посещаемости и успеваемости студентов).

Таким образом, становится ясна необходимость реализации такого средства формирования выходной информации, которое бы не зависело от вложенного разработчиком набора отчетов и могло оперативно подстраиваться под текущее состояние информационной базы, ее динамически изменяющуюся структуру и объем. Для этого разрабатвается формальный механизм преобразования запроса к данным на проблемно-ориентированном подмножестве ЕЯ в язык запросов к БД и его реализацию. Далее этот запрос выполняется АИСС и возвращается результат или сообщение об ошибке с осмысленными пояснениями причин ее возникновения.

За взаимодействие между различными модулями программно-аппаратной реализации АИСС отвечает набор механизмов распределенного хранения и

управления данными. Используемая модель данных подразумевает в том числе необходимость применения в АИСС распределенной СУБД, состоящей из группы серверов баз данных и сети пользовательских терминалов, с которых осуществляется диалог опраторов терминала с АИСС.

В третьей главе рассматриваются задачи, возникающие при разработке интеллектуального доступа к БД на основе проблемно-ограниченного подмножества ЕЯ с целью расширения функциональности АИСС. Одним из возможных подходов организации интеллектуального доступа к базе данных является построение анализатора запросов на ЕЯ. Приводится структура анализатора подобных запросов и рассматривается последовательность этапов его реализации.

1. Лексический анализ путем разбиения входной цепочки в виде предложения на ЕЯ на лексемы и формирование таблицы лексем.

2. Синтаксический анализ запроса, результатом которого будет структура лексем и связей, представленная в виде дерева.

3. Семантический анализ, представляющий собой идентификацию смысловых зависимостей между лексемами, формирование внутреннего представления запроса и дополнение его неявными операциями и операндами.

4. Подготовку к генерации текста запроса на внутреннем языке запросов и, непосредственно, сам процесс генерации запроса.

5. Выполнение запроса и представление результатов.

Для интеллектуального взаимодействия оператора терминала с АИСС необходимо реализовать такое средство формирования выходной информации, которое бы не зависело от вложенного разработчиком набора отчетов и могло оперативно подстраиваться под текущее состояние информационной базы, ее динамически изменяющуюся структуру и объем.

Для этого необходимо разработать и реализовать формальный механизм преобразования запроса к данным на проблемно-ориентированном подмножестве ЕЯ в язык запросов к базе данных (БД) или хранилищу данных (ХД) и его реализацию. Далее этот запрос должен быть выполнен АИСС и возвращен результат или сообщение об ошибке с осмысленными пояснениями причин ее возникновения.

ЕЯ выбран благодаря достоинствам, которыми он обладает с точки зрения ОТ.

1. ЕЯ не требует специальной подготовки в освоении ОТ.

2. Языковые конструкции, в т.ч. в их проблемно-ориентированном ограниченном виде, просты и понятны всем участникам процесса обработки данных.

3. Компоненты структуры информационной базы описываются терминами ЕЯ как во внутреннем, так и во внешнем представлении.

Учитывая ограниченность возможных формулировок входных запросов примем допущение, что вся совокупность запросов на ЕЯ ограничена двумя классами предложений: простые вопросительные предложения («какой...?») и побудительные предложения («показать...»). Таким образом, эти ограничения

можно использовать для упрощения механизмов разбора предложения на каждом из этапов. Рассмотрим реализацию этого механизма.

Процесс лексического анализа будем рассматривать с точки зрения аналитического разбора входной последовательности символов русского языка с целью получения на выходе лексем, отражающих различные аспекты структуры и состояния данных АИСС. Лексический анализ производится исходя из определенных допущений и правил русского языка, основными из которых для данного процесса являются:

1. Регистр символов входного и выходного языка не важен. Любой запрос может начинаться как со строчной, так и с прописной буквы, и содержать любое их количество в любом порядке следования.

2. Все слова входного языка отделяются друг от друга пробелами.

3. Предложение оканчивается соответствующим знаком препинания («.», «!», «?»).

4. Весь запрос состоит из одного предложения.

5. Знаки препинания не являются частью лексем.

Следуя данному набору правил, лексический анализ представляет собой процесс определения слов и заполнения на их основе таблицы лексем, где каждой лексеме ставится в соответствие набор характеристик, полученных из соответствующего справочника.

АНАЛИЗАТОР ............................... _ О X

Действия - ?

Запросив ЕЯ і Лексика 1 Синтаксис Семантика Запрос на 1С Параметры

іНо. ..¡Лексема Часть Речи Характеристика

ЦЦ Какой Местоимение Разряд местоимения: вопросительное; Падеж: именит

2| Средний Прилагательное Род: мужской: Число: единственное: Падеж: именител:

3 Балл '-уществительное Одушевленность: неодушевленный; Род. мужской; Чис.

4І Группы существительное Одушевленность: одушевленный; Род: мужской; Число

5| ГТ-21 Существительное Одушевленность: одушевленный; Род: женский; Число:

< >

¡£2 Назад | | Далее

Сформировать Закрыть

Рис. 2. Компонента лексического анализа

Определение свойств и характеристик лексемы становится возможным благодаря сформированному словарю, хранящемуся в системе в виде справочника (рис. 2). Можно сказать что идентификация, средствами которой происходит распознавание лексем в контексте грамматики, осуществляется подбором и сопоставлением значений таблиц анализатора и справочника-словаря. При этом любое слово входного запроса, которое не может быть идентифицировано как лексема, считается ошибкой ввода.

Если в результате работы лексического анализатора была обнаружена отсутствующая характеристика, что означает сбой в работе механизма, то алгоритмом предусмотрено несколько возможных вариантов дальнейшего развития событий, определяемых причиной возникновения ошибки.

1. Причина: допущена орфографическая ошибка в слове запроса. Действие: сообщение оператору терминала с подсказкой о возможных вариантах исправления ошибки.

2. Причина: слово запроса не входит в проблемно-ограниченное подмножество ЕЯ. Действие: сообщение об ошибке с рекомендацией обратиться к технической документации системы с целью уточнения ее функционала и спектра обслуживаемых задач.

3. Причина: для данного слова обнаружено более одного возможного корректного набора характеристик. Действие: сообщение оператору терминала с предложением выбрать одну из возможных характеристик и отложенное сообщение администратору АИСС, содержащее условия возникновения ошибки (исходный запрос и сформированная таблица лексем), действия оператора терминала на событие ее возникновения и рекомендации по устранению возникшей неоднозначности.

После того как устранены все неопределенные характеристики таблицы, модуль передает ее на следующий этап анализа.

Имея линейную последовательность лексем, сопоставим их с формальной грамматикой языка, т.е. проведем синтаксический анализ. Результатом синтаксического анализа будет являться синтаксическая структура предложения, представленная в виде некоторой комбинации дерева зависимостей и дерева составляющих.

На некорректную входную цепочку лексем предусмотрен соответствующий способ реакции - завершение синтаксического анализа и вывод сообщения об ошибке.

Рассмотрим грамматику О, на основе которой выполняется синтаксический анализ запросов «Показать студентов пятого курса.» и «Сколько студентов поступило на первый курс?».

<предложение>::=<псбудительное>.|<вопросительное>?

<побудительное>::=показать<существительноеХчислительноеХсуществительное>!найти <существительноеХчислительноеХсуществительное>|вывести<существительнсеХчислит ельноеХсуществительное> (отобразить <существительноеХчислите ль ноеХсуществительн се> I расчитать<существительноеХчислительноеХсуществительное>

<вопросительное>: : =сколько<существительноеХглаголХоОстоятельство> | как<существи тельноеХглаголХсбстоятельство>

<оОстоятельство>: : =на<числительное><сушествительное> | в<числительноеХсуществител ьное>

<глагол>::=поступило

<существительное>::=студентов|курса|курс <числительное>::=пятогоI первый

Далее выполним построение множеств крайних левых и крайних правых символов для этой грамматики.

________________Таблица 1

8 ь И

<предложение> <побудительное>, <вопрссительное>, показать, найти, вывести, отобразить, сколько, как <существительное>, ., ?, студентов, курса, курс

S к

<побудительное> показать, найти, вывести, отобразить <существительное>, студентов, курса, курс

<вопросительное> сколько, как <обстоятельство>, <существительное>, студентов, курса, курс

<оОстоятельствс> на, в <существительное>, студентов, курса, курс

<глагол> поступило поступило

<существительное> студентов, курса, курс студентов, курса, курс

<числительноо> пятого, первый пятого, первый

Таким же образом построим таблицу для множеств крайних левых и крайних правых терминальных символов.

Таблица 2

S ь и

<предложение> показать, найти, вывести, отобразить, сколько, как, ., ? ., ?, студентов, курса, курс

<побудительное> показать, найти, вывести, отобразить студентов, курса, курс

<вопросительное> сколько, как студентов, курса, курс

<обстоятельство> на, в студентов, курса, курс

<глагол> поступило поступило

<существительное> студентов, курса, курс студентов, курса, курс

<числительное> пятого, первый пятого, первый

Теперь все готово для заполнения матрицы операторного предшествования. Для этого необходимы множества крайних левых и крайних правых терминальных символов (таблица 2) а также правила исходной грамматики й.

Таблица 3

ID Лексема

01 показать

02 студентов

03 пятого

04 курса

05 сколько

06 на

07 первый

08 курс

09

10 ?

11 START

12 END

Таблица 4

01 02 03 04 OS 06 07 08 09 10 12

01 >

02 < <

03 < < >

04 < > >

05 >

06 >

07 < >

08 <

09 >

10 >

11 < <

Далее на основе полученных данных строится синтаксическое дерево (рис.3).

Действия - ?

Запрос на ЕЯ Лексика | Синтаксис | Семантика Запрос на 1С Параметры имекойсіки е | v ' ■ ' ■

Б- Предложение Е-Поалежащее

Й--Существительное

I 1.....БАЛЛ

Й-Определение Й-Местоимение

I.....КАКОЙ

Й-Прилагательное

і.....СРЕДНИЙ

Й-Сказуемое Е- Глагол | 1.....БЫЛ

ЁНПрямое дополнение В ■ Существительное

\.....ГРУППЫ

Й--Парзметр

ЯШЯ

Й Параметр ¡•■■■■ДАТА

Назад ] 1 Далее |Д]

Сформировать Закрыть

Рис. 3. Синтаксическое дерево

Входными данными для семантического анализа запроса на подмножестве ЕЯ, выполняемого на данном этапе работы механизма анализатора, будем считать:

1. Таблицу идентификаторов.

2. Результаты разбора синтаксических конструкций входного языка.

Таблица идентификаторов представляет собой полный двумерный срез базы

данных информационной базы системы. Фактически - это таблица, уникально идентифицирующая весь перечень объектов, используемых в АИСС.

Вторым, необходимым для работы семантического анализатора, объектом данных является синтаксическая конструкция входного запроса на ЕЯ, представленная в виде дерева разбора. Совокупность этих источников позволяет однозначно установить зависимости между сущностями и связями, а также выявить возможные ошибки смысловой модели.

Все лексемы-существительные должны быть однозначно идентифицированы и сопоставлены с объектом метаданных. Все операнды в выражениях и операции должны иметь типы допустимые для данного выражения или операции. Типы переменных в выражениях должны быть согласованы между собой.

На завершающем этапе работы механизма семантического анализатора необходимо произвести генерацию кода, т.е. автоматическое создание программного кода запроса специальным модулем, при котором по заданным условиям полностью формируется исходный код запроса. Назовем этот модуль генератором кода. Фактически получается, что это программа, создающая программный запрос.

Модуль генератора получает на входе информацию о структуре, данных и параметрах предметной области и шаблоны, по которым будет выполняться генерация, а на выходе выводит готовый программный код запроса.

Для того чтобы программный код мог быть создан генератором, необходимо наличие следующих трех ключевых компонентов:

• шаблоны программного кода (образцы по которым будет создан код);

• метаданные предметной области (структура АИСС);

• правила предметной области (правила, которые определяют структуру и поведение метаданных предметной области).

В заключение главы рассмотрены вопросы практической организации диалога оператора терминала с АИСС на некотором подмножестве ЕЯ, содержащего вопросительные и побудительные предложения. На основе семантического анализатора предлагается транслятор с ЕЯ на SQL-подобный язык запросов АИСС. Приводятся примеры работы механизма анализатора с учетом особенностей проблемно-ограниченного подмножества ЕЯ.

В главе предлагается и иллюстрируется механизм, который позволил бы на подмножестве ЕЯ без специализированных знаний получать затребованную оператором терминала информацию из баз данных и OLAP-хранилищ.

Рассмотрены особенности реализации механизма семантического анализатора на примере языка ICQ. Выбор этого языка запросов обусловлен ниже перечисленными причинами:

1.Язык запросов ICQ по синтаксису подобен языку SQL, поэтому не требует глубокой переквалификации программиста. Язык SQL является стандартом для ERP-систем и OLAP-хранилищ, потому что в прочих сферах часто

правила предметной области (например, правила реляционных БД)

Рис. 4. Ключевые составляющие генерации кода

используются ROLAP-системы или Rational OLAP, а многомерные БД пока не так сильно развиты.

2. Запросы на этом языке могут быть записаны как на русском, так и на английском языках, что имеет немаловажное значение для упрощения механизмов семантического анализа.

3. Язык ICQ поддерживается динамично развивающейся в России платформой «1С:Предприятие 8», что обеспечивает широкую востребованность разрабатываемого механизма.

4. На языке платформы разрабатывается экспериментальная АИСС, предоставляющая дополнительные возможности по тестированию разрабатываемого механизма семантического анализа.

Инициализация 6Д

I

Г"!

Автоматическое обновление

1_

Пользовательский ввод

Анализ структуры БД(ХД)

V

Формирование словарей

.......д

_.. Редактировать

■ словари?

Редактирование словарей

і_;

Обновление словарей

При старте управляющей системы

Ввод запроса на

Семантический анализ запроса

" Г"

обрпонп ' _^

Постобработка результатов

Выполнение запроса

Уточнение данных -

- „ л

. Уточнить . запрос?

х

Повторить? .-

Вывод результата

Добавить лексемы?

Возврат Сохранение

управления истории

При вводе пользовательского запроса

Рис. 5. Блок-схема механизма семантического анализатора

1. При инициализации система анализирует БД или ХД и на основе анализа описания данных, представленного либо при помощи XML-файла, либо встроенного механизма платформы АИСС либо строит структуру используемых объектов.

2. На основе построенной структуры объектов и их связей формируется проблемно-ориентированное подмножество ЕЯ.

3. Удаленный пользователь или оператор терминала вводит запрос на ЕЯ на основе заполненных словарей.

4. Используя механизм семантического анализатора выполняется анализ введенного оператором терминала запроса на ЕЯ и строится соответствующий ему запрос на языке ICQ.

5. Если АИСС не поддерживает язык запросов ICQ, то запрос конвертируется в стандарт языка SQL (переводится на английский язык, корректируется синтаксис и т.п.)

6. Имея в распоряжении код на языках запросов ICQ или SQL - машинный запрос, платформа АИС выполняет его и выдает результат оператору терминала.

Рассмотрим механизм работы системы при запросе к совокупности взаимосвязанных таблиц. На ЕЯ пользователь вводит следующий запрос: показать студентов пятого курса и их средние оценки за осенний семестр 2010 года

После предварительной обработки запроса системой получаем синтаксическое дерево, представленное на рис. 6.

і показать !

.і...;.....г.........:.....і

студентов | оценки i

і г-!- 1

курса : средние | і семестр

: пятого ; ¡осенний; 2010года

Рис. 6. Синтаксическое дерево

Для анализа запроса на ЕЯ и генерации текста запроса на языке ICQ система составляет временный список объектов основного глагола действия запроса (лексема «показать»). В данном случае это лексемы: «студентов» и «оценки». Далее перебираются все таблицы в поисках одновременного вхождения объектов «оценка» и «студент». Каждый из внешних ключей в таблицах подвергается особой обработке анализатора. Последний раскрывает поиск сущности, пробегая по описанию таблицы, на которую эти внешние ключи ссылаются. Например, в таблице КЗЭ нет студентов как таковых, но, так как это внешний ключ к таблице студентов, то это обнаружит анализатор. Результатом этого явится выбор полей и записей, удовлетворяющих запросу. Более того, перебрав все таблицы, система установит, что этот вариант является единственным возможным, и не будет применять дополнительную семантическую обработку результата. Затем анализатор объединяет лексемы «средние» и «оценки» на «средние оценки» в связи с совпадением семантики подчинения данного набора лексем со словарной семантикой сущности. Завершающим этапом работы анализатора является добавление условия выборки «за осенний семестр 2010 года». Здесь проблемы не возникает, поскольку система просто заменяет фразу следующей группой условий:

ГДЕ

КЗЭ.Семестр = Перечисления.Семестр.Осенний И Студент.Год = 2010

Сложность для дальнейшего анализа представляет определение того, к чему собственно указанная дата относится. Так как в синтаксическом дереве дата относится к оценкам, а в реляции «КЗЭ» поля даты нет, то система начинает просматривать связанные таблицы, имеющие ключевое поле типа «Дата». В результате, поднимаясь по иерархическому дереву подчиненности таблиц связь с реляцией «Студенты», в которой есть дата. Именно с этой датой начинает работать система, так как дальнейший анализ больше никаких дат не выявил. Однако до конца проблема связи таблиц при построении запросов еще не решена. При соединении таблиц «Факультеты» и «КЗЭ» эти реляции соединяются при помощи полей «КЗЭ.Факультет» и «Факультеты.Код», которые были определены при поиске таблиц.

Для вычисления среднего значения поля «КЗЭ.Оценка» воспользуемся агрегирующей функцией СРЕДНЕЕ. В результате система сформирует следующий запрос:

ВЫБРАТЬ СтудентыСрезПоследних.Студент КАК Студент, СРЕДНЕЕ(КЗЭСрезПоследних.Оценка) КАК Оценка

ИЗ РегистрСведений.КЗЭ.СрезПоследних КАК КЗЭСрезПоследних, РегистрСведений.Студенты.СрезПоследних КАК СтудентыСрезПоследних ГДЕ КЗЭСрезПоследних.Семестр = Перечисления.Семестр.Осенний И КЗЭСрезПоследних.Год = 2010 И СтудентыСрезПоследних.Курс = 5 СГРУППИРОВАТЬ ПО СтудентыСрезПоследних.Студент

Ввиду отсутствия дополнительных условий и альтернативных вариантов запроса сформированный текст запроса на языке 1CQ является окончательным и отправляется его на исполнение серверу управления БД.

Если целевая платформа механизма отлична от «1С:Предприятие 8», то существует возможность преобразования запроса на языке 1CQ в запрос SQL. В этом случае аналогом последнему запросу, т.е. результатом его конвертирования, явится следующий запрос на языке SQL: SELECT TableStudent.StudentName AS Student, AVG(TableRating.Rating) AS Rating FROM TableStudent, TableRating

WHERE TableRating.Term = "A" AND TableRating.Year = 2010 AND

TableStudent.Course = 5

GROUP BY TableStudent.StudentName

В четвертой главе предложены подходы к аппаратной реализации АИСС. Предлагается формирование кластера PC-совместимых серверов и рабочих станций в качестве операторских терминалов. Программная составляющая распределенной СУБД основана на клиент-серверной топологии используемой ERP-системы «1С:Предприятие», серверного обеспечения базы данных Microsoft SQL Server и защищенных каналов передачи данных внутри корпоративных сетей, реализованных средствами технологии виртуальных частных сетей (VPN).

Использование VPN и стандартных протоколов TCP и UDP позволяет ему стать альтернативой IPsec в ситуациях, когда Интернет-провайдер блокирует некоторые стандартные VPN протоколы.

Рассмотрены вопросы повышения эффективности оптимизации расписания учебных занятий, проведена оценка устойчивости учебного раписания с

приведением его основных показателей устойчивости и их формализация. Проанализирована структурная устойчивость расписания средствами математического аппарата моделирования динамических дискретных систем (сетей Петри, рис. 7). Исследованы свойства модели на предмет анализа достижимости - возможности перехода сети из одного заданного состояния (характеризуемого распределением меток) в другое. Обозначены подходы к управлению множественным доступом к интегрированным базам данных в локальных и корпоративных вычислительных сетях.

В заключение диссертационной работы сформулированы основные научные и практические результаты, выделены перспективные направления дальнейших научных исследований.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Осуществлен выбор модели данных, описывающей заданную предметную область, и на ее основе разработана структура хранения данных для АИСС, которая в полной мере позволяет реализовать возможности модели и повысить степень формализации предметной области не усложняя ее понимание.

2. Осуществлена разработка АИСС, реализующей автоматизацию процессов учета, хранения, обработки и анализа информации о результатах текущей и сессионной успеваемости студентов высшего учебного заведения. Программная платформа АИСС, являясь демонстрационным стендом возможностей разрабатываемого механизма, повышает эффективность функционирования автоматизируемого подразделения высшего учебного заведения.

3. Формализована многокритериальная оптимизационная задача, демонстрирующая возможности интерфейсного диалогового механизма по нестандартному анализу и представлению данных информационной системы построения расписания ВУЗа и предложен алгоритм его построения.

4. Разработан, реализован и внедрен формальный механизм преобразования запроса к данным на проблемно-ориентированном подмножестве ЕЯ в язык запросов к базе данных АИСС позволяющий значительно расширить спектр пользователей такой системы и высвободить дополнительные ресурсы, что повышает эффективность ее функционирования.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

В изданиях, предусмотренных «Перечнем изданий ВАК»:

1. Журавлев А.Е. Организация диалога с информационной системой оперативного учета судопропуска в шлюзованной системе на подмножестве естественного языка // Журнал университета водных коммуникаций. СПб.: СПГУВК, 2012. Выпуск 3 (15). 224 с. Стр. 133-140.

2. Журавлев А.Е. Механизм семантического анализатора запросов к базам данных информационных систем // Вестник Санкт-Петербургского университета. Прикладная математика, информатика, процессы управления. Серия 10. Выпуск 4. Декабрь 2012. 135 с. Стр. 93-102.

3. Журавлев А.Е. Диалог с информационной системой оперативного учета судопропуска в шлюзованной системе на усложненных запросах подмножества естественного языка // Журнал университета водных коммуникаций. СПб.: СПГУВК, 2012. Выпуск 4 (16). 142 с. Стр. 121-132.

В других изданиях:

4. Журавлев, А.Е. Оценка параметров масштабируемости корпоративной сети в условиях защищенного канала с использованием аппарата нейронных сетей / А.Е.Журавлев, А.А.Боронкин, Н.В.Крупенина // Информатизация процессов формирования открытых систем на основе СУБД, САПР, АСНИ и систем искусственного интеллекта. Материалы 5-й межд. научно-техн. конф. Вологда. ВоГТУ, 2009. С. 35-39.

5. Журавлев, А.Е. Моделирование корпоративной сети, использующей VPN. Рекомендации по параметрической и структурной оптимизации / А.Е.Журавлев, Н.В.Крупенина // Имитационное моделирование. Теория и практика. ИММОД - 2009. Сборник докладов 4-й всероссийской научно -практической конференции по имитационному моделированию и его применению в науке и промышленности. Том 2. 356 с. СПб, 2009. С. 80-84.

6. Журавлев, А.Е. Формирование модели корпоративной сети с использованием аппарата нейронных сетей / А.Е.Журавлев, А.А.Боронкин, Н.В.Крупенина // Инновации в науке и образовании - 2009. Труды VII международной научной конференции. Часть 2. 355 с. Калининград, 2009. С. 152-155.

7. Журавлев, А.Е. Разработка АИС учета документооборота в деканате / А.Е.Журавлев // Межвузовская научно-практическая конференция молодых ученых, посвященная 200-летию транспортного образования в России. Водный транспорт России: история и современность. Труды конференции СПГУВК. 323 с. СПб, 2009. С. 112-114.

8. Журавлев, А.Е. Разработка подсистемы формирования и сопровождения расписания занятий в ВУЗе / А.Е.Журавлев, Н.В.Крупенина // VIII Всероссийская школа-семинар «Прикладные проблемы управления макросистемами». Материалы докладов. 96 с. Апатиты, КНЦ РАН, 2010. С. 21.

9. Журавлев, А.Е. Иерархические и сетевые модели данных в планировании расписания // А.Е.Журавлев, Н.В.Крупенина // Региональная информатика (РИ-2010). XII Санкт-Петербургская международная конференция «Региональная информатика (РИ-2010)». Санкт-Петербург, 20-22 октября 2010 г.: Материалы конференции \ СПОИСУ. - СПб, 2010. - 407 с. С. 42.

10. Журавлев, А.Е. Формализация и алгоритмизация процесса автоматизированного формирования расписания ВУЗа / А.Е.Журавлев, Н.В.Крупенина, В.А.Стальмаков // Региональная информатика (РИ-2010). XII Санкт-Петербургская международная конференция «Региональная информатика (РИ-2010)». Санкт-Петербург, 20-22 октября 2010 г.: Труды конференции \ СПОИСУ. - СПб, 2011. - 333 с. С. 240-247.

П.Журавлев, А.Е. Автоматизация процесса принятия решений в ERP на примере формирования учебного расписания ВУЗа / А.Е.Журавлев, Н.В.Крупенина // Международная научно-практическая конференция «Информационные и коммуникационные технол- ии в образовании: ресурсы, опыт, тенденции развития (ИТО)». Сборник материалов конференции, 1 часть. 266 с. Архангельск, 2011. С. 34-36.

12. Журавлев, А.Е. АИС учета и мониторинга учебного процесса в ВУЗе в условиях балльно-рейтинговой системы (БРС) / А.Е.Журавлев, А.Н.Егоров, А.К.Чернов, Н.В.Крупенина //«Новые информационные технологии в образовании». Сборник научных трудов XII международной научно-практической конференции «Формирование новой информационной среды образовательного учреждения с использованием технологий «1С»», часть 2. 423 с. р. 105-109.

13. Журавлев, А.Е. Алгоритмы формирования расписания занятий в ВУЗе / А.Е.Журавлев // III межвузовская научно-практическая конференция студентов и аспирантов «Современные тенденции и перспективы развития водного транспорта России». Материалы конференции. - СПб: СПГУВК, 2012. - 453 с.

С. 250-256.

Автор

Журавлев А.Е. /

Подписано в печать 22.11.12 Сдано в производство 22.11.12

Формат 60x84 1/16 Усл.-печ. л. 1,22 Уч.-изд. л. 1,05.

Тираж 60 экз. Заказ № 171

Санкт-Петербургский государственным университет водных коммуникаций 198035, Санкт-Петербург, ул. Двинская, 5/7

Отпечатано в типографии ФБОУ ВПО СПГУВК 198035, Санкт-Петербург, Межевой Канал, 2/*

Оглавление автор диссертации — кандидата технических наук Журавлев, Антон Евгеньевич

ВВЕДЕНИЕ.

Положения, выносимые на защиту.

ГЛАВА 1. АНАЛИЗ СУЩЕСТВУЮЩИХ МЕХАНИЗМОВ И СИСТЕМ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ И ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ.

1.1. Классификация систем и моделей данных.

1.1.1. Реляционные системы и модели данных.

1.1.2. Семантические системы и модели данных.

1.1.3. Иерархические и сетевые системы и модели данных.

1.1.4. Объектно-ориентированные системы и модели данных.

1.1.5. Гибридные системы и модели данных.

1.2. Обзор существующих комплексных систем проектирования и поддержки баз данных.

1.2.1. Функции ERP-систем.

1.2.2. Отечественные разработки.

1.2.3. Зарубежные программные продукты.

1.2.4. Сравнительная характеристика.

1.3. БД и СУБД на основании моделей данных.

1.3.1. Реляционные системы.

1.3.2. Распределенные СУБД.

1.3.3. Отображение семантической модели данных на СУБД.

1.4. Семантика языка, близкого к естественному.

1.5. Постановка задачи исследования.

Выводы по первой главе.

ГЛАВА 2. РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННО-СПРАВОЧНОЙ СИСТЕМЫ.

2.1. Семантическая модель данных и ее интерпретация.

2.1.1. Представление структуры модели данных.

2.1.2. Физическая структура модели БД.

2.1.3. Универсализация модели БД средствами XML.

2.1.4. Технологическая платформа.

2.1.5. Интегрированная среда разработки.

2.2. Проектирование и разработка АИСС.

2.2.1. Функционал АИСС.

2.2.2. Интеллектуальная диалоговая подсистема.

2.2.3. Структура метаданных АИСС.

2.3. Формализация процесса формирования расписания.

2.3.1. Постановка задачи формирования расписания.

2.3.2. Алгоритм формирования расписания.

Введение 2012 год, диссертация по документальной информации, Журавлев, Антон Евгеньевич

Актуальность темы. В настоящей работе рассматриваются проблемы организации диалога оператора терминала с автоматизированной информационно-справочной системой (АИСС) на некотором подмножестве естественного языка (ЕЯ), содержащего вопросительные и побудительные предложения. На основе семантического анализатора предлагается транслятор с естественного языка па SQL-подобный язык запросов информационной системы.

С постоянно растущим уровнем информатизации общества и накоплением знаний возрастает и сложность систем хранения этой информации. На современном этапе развития многие глобальные хранилища данных уже являются частью распределенных систем управления базами данных. Для управления такими хранилищами применяются различные технологии и специализированные средства доступа. Необходимость формирования распределенной базы данных возникает уже на начальной стадии функционирования таких систем, когда, например, необходим синхронизированный доступ к данным территориально распределенных филиалов одного предприятия. Для реализации хранения, обработки и анализа данных в распределенных средах чаще всего используются различные ERP и OLAP системы, которые позволяют визуальными графическими средствами запрашивать данные из хранилища, агрегировать их и визуализировать результаты и т.д. Однако средств, которые предоставляли бы возможность исполнять запросы аналитика, сформулированные на ЕЯ, до сих пор реализовано не было. В полной мере такими средствами нельзя считать и специализированные языки ICQ (язык запросов платформы 1С:Предприятие), SQL (Structured Query Language), MDX (Multidimensional Expressions) и другие, поскольку они, для практического использования, требуют достаточно высокой квалификации специалиста. В работе предлагается и иллюстрируется механизм, который позволил бы на подмножестве ЕЯ без специализированных знаний получать требуемую информацию из баз данных и OLAP-хранилищ.

Целью диссертационной работы является исследование и разработка методов построения АИСС, включающих элементы искусственного интеллекта для расширения функциональности этих систем за счет организации интеллектуального доступа к БД, используя проблемно-ограниченное подмножество ЕЯ.

Для решения поставленных задач в работе используются методы дискретной математики, математической и формальной лингвистики.

Научная новизна работы заключается в следующем:

Формально описана постановка многокритериальной оптимизационной задачи построения расписания ВУЗа и предложены алгоритмы построения оптимального расписания учебных занятий ВУЗа.

Разработано формализованное описание проблемно-ориентированного подмножества ЕЯ.

Разработан формальный механизм преобразования запросов к данным на проблемно-ориентированном подмножестве ЕЯ на запросы на языке платформы АИСС.

Разработан алгоритм преобразования запросов на проблемно-ориентированном подмножестве ЕЯ на запросы на языке ICQ.

Практическая значимость полученных результатов. Областью непосредственного практического применения теоретических результатов работы является автоматизация процессов учета, хранения, обработки и анализа информации об основных процессах, характеризующих деятельность подразделений высшего учебного заведения.

Обоснованность и достоверность научных положений подтверждена всесторонней апробацией основных теоретических положений диссертации в печатных трудах, докладах на Международных и Всероссийских научных конференциях, положительными результатами практического использования разработанной АИСС в различных отечественных организациях.

Реализация результатов работы. Используя предложенную платформу и разработанный механизм семантического анализатора на проблемно-ограниченном подмножестве ЕЯ разработаны и внедрены следующие АИСС:

АИСС «ВУЗ» организации учебного процесса в 2010/2011, 2011/2012 учебных годах в Санкт-Петербургском государственном университете водных коммуникаций в деканате гидротехнического факультета.

АИСС «Звездочка» автоматизации учета и контроля хозяйственной деятельности юридического отдела ОАО «ЦС «Звездочка».

АИСС «Спектр» обеспечения курсов переподготовки и повышения квалификации учебного центра ОАО «ПО «СЕВМАШ».

АИСС «Автошкола» автоматизации комплекса услуг по подготовке специалистов «ДОСААФ России» г. Северодвинска.

Апробация работы. Основные результаты диссертационной работы были представлены на 9 конференциях: V международная научно-техническая конференция «Информатизация процессов формирования открытых систем на основе СУБД, САПР, АСНИ и систем искусственного интеллекта», г. Вологда, 2009 г, IV всероссийская научно-техническая конференции по имитационному моделированию и его применению в науке и промышленности «ИММОД-2009», г. Санкт-Петербург, 2009 г., VII международная научная конференция «Инновации в науке и образовании», г. Калининград, 2009 г., межвузовская научно-практическая конференция молодых ученых, посвященная 200-летию транспортного образования в России «Водный транспорт России: история и современность», г. Санкт-Петербург, 2009 г., VIII всероссийская школа-семинар «Прикладные проблемы управления макросистемами», г. Апатиты, 2010 г., XII Санкт-Петербургская международная конференция «Региональная информатика

РИ-2010)», г. Санкт-Петербург, 2010 г., международная научно-практическая конференция «Информационные и коммуникационные технологии в образовании: ресурсы, опыт, тенденции развития (ИТО)», г. Архангельск, 2011 г., XII международная научно-практическая конференция «Формирование новой информационной среды образовательного учреждения с использованием технологий «1С»», г. Москва, 2011 г., III межвузовская научно-практическая конференция студентов и аспирантов «Современные тенденции и перспективы развития водного транспорта России», г. Санкт-Петербург, 2012 г.

По теме диссертации опубликовано 13 работ, в том числе: 3 статьи в журналах из перечня ВАК Министерства образования РФ («Журнал университета водных коммуникаций», «Вестник Санкт-Петербургского университета»). Публикации отражают все основные полученные результаты диссертационной работы.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, изложенных на 137 страницах машинописного текста и списка использованных источников, включающего 131 наименование, содержит 29 рисунков и б таблиц.

Заключение диссертация на тему "Методы организации диалога в информационных системах на языке, близком к естественному"

ЗАКЛЮЧЕНИЕ

В работе проведен анализ современного состояния разработок в области автоматизации процессов учета, хранения и обработки информации в БД. исследованы возможности существующих моделей данных, и структур хранения, поддерживающих модели данных. На основании анализа осуществлен выбор универсальной инструментальной визуальной среды (СУБД) для построения и использования АИСС, поддерживающей выбранную модель.

Рассмотрены основные подходы к реализации механизмов ведения интеллектуального диалога между оператором и АИСС средствами организации семантического анализа запросов на проблемно-ограниченном подмножестве ЕЯ. На основе выполненного анализа сделан вывод, что существующие подходы не дают возможности решения поставленных в работе задач исследования в полном объёме.

Проведен анализ внешней информационной модели предметной области. Осуществлен выбор модели данных, описывающей заданную предметную область, и на ее основе разработана структура хранения данных для АИСС. Сделан вывод о том, что отличия в основных принципах подходов к разработке отечественных и западных ЕЯР-систем не позволяют адекватно сравнивать их межу собой в условиях отечественных реалий учета деятельности и ресурсов.

Сделан сравнительный анализ отечественных систем класса управления предприятием с зарубежными системами класса МКРИ/ЕЯР. Выделены основные отличия между зарубежными и российскими системами:

• Зарубежные системы ориентированы на хорошо структурированную, иерархическую систему процессов, выполняемых на предприятии.

• Зарубежные системы опираются на наборы стандартов, которым процессы должны удовлетворять (ММАБ).

• Зарубежные системы, направленные на автоматизацию управления, поддерживают полный набор управляющих функций.

• Зарубежные системы включают приложения, использующие методы, позволяющие оптимизировать решение ряда частных управленческих задач.

• Российские системы, как правило, направлены на решение задач учета и генерации бухгалтерской отчетности.

Приведен генетический алгоритм для интеллектуальной аналитической обработки данных базы с возможностью прогнозирования ветвлений, его характеристики и особенности применения к данным предметной области. Рассмотрены различные операции над данными, а также ограничения их обработки и структуры на примере формирования расписания.

Спроектирована база данных, удовлетворяющая разработанной модели данных. Описаны стадии концептуального, логического и физического проектирования БД. Приведены требования разработанной БД к управляющей платформе (СУБД) и программно-аппаратному комплексу разрабатываемой автоматизированной информационной системы. Осуществлена разработка АИСС, реализующей автоматизацию процессов учета, хранения, обработки и анализа информации о результатах текущей и сессионной успеваемости студентов высшего учебного заведения.

В качестве СУБД выбрана платформа 1С:Предприятие 8 как соответствующая требованиям модели данных и спроектированной базы данных на ее основе. Рассмотрены компоненты и модули платформы, основные объекты, средства, особенности, достоинства и недостатки, а также варианты реализации. Представлены системные требования. Рассмотрен процесс проектирования АИСС на выбранной платформе, реализация основных механизмов и особенностей модели данных, генетических алгоритмов. Продемонстрирована реализация механизмов описания структуры данных расширяемым языком разметки данных (XML), формирования пользовательских интерфейсов, интеграции со сторонними информационными системами и компонентами. Формализована многокритериальная оптимизационная задача построения расписания ВУЗа и предложен генетический алгоритм его построения.

В рамках решения задачи организации диалога оператора терминал с АИСС на некотором подмножестве ЕЯ разработан, реализован и внедрен формальный механизм преобразования запроса к данным на проблемно-ориентированном подмножестве ЕЯ в язык запросов к базе данных АИСС. На основе семантического анализатора предложен транслятор с ЕЯ на подобный язык запросов АИСС. Рассмотрены несколько примеров работы семантического анализатора в соответствии с алгоритмом его функционирования с учетом особенностей проблемно-ограниченного подмножества естественного языка.

Проанализированы допустимые варианты архитектуры программно-аппаратного комплекса АИСС. По результатам анализа трехзвенная архитектура принята как наиболее эффективная, т.к. обеспечивает максимальную масштабируемость за счет использования специализированного ПО - сервера приложения, назначением которого является управление потоком запросов от клиентов к серверу БД.

Библиография Журавлев, Антон Евгеньевич, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Алтапов А.П., Прокопчук Ю.А., Костра В.В. Госпитальные информационные системы: архитектура, модели, решения. -Днепропетровск: УГХТУ, 2005. - 257 с

2. Аткинсон М. и др. Манифест систем объектно-ориентированных баз данных. //СУБД, 4/1995. с. 142-155.

3. Ахо А., Сети Р., Ульман Дж. Компиляторы: принципы, технологии и инструменты: Пер. с англ. М.: Издательский дом «Вильяме», 2003. -768 с.

4. Ахо. А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. -М.: Мир, 1978.-Т. 1, 612 с. Т. 2. 487 с.

5. Баргесян A.A. и др. Методы и модели анализа данных: OLAP и Data Mining. СПб.: БХВ-Петербург, 2004. - 336 с.

6. Бесстрашнова Я.К. и др. Информационные технологии в сфере социальной защиты инвалидов. СПб.: 2002. - 128 с.

7. Бесстрашнова Я.К. и др. Федеральный регистр инвалидов. Опыт внедрения. Перспективы развития. СПб.: 2003. - 80 с.

8. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. 2-е изд., перераб. и доп. - М.: Финансы и статистика, 1989.-351 с.

9. Валгина Н. С. Синтаксис современного русского языка: Учебник. — М.: Агар, 2000.— 416с.

10. Валиков А.Н. Технология XSLT СПб.: БХВ-Петебрург, 2002 544 с.

11. Вендров A.M. CASE-технологии. Современные методы и средства проектирования информационных систем. -М.: Финансы и статистика, 1998.- 176 с.

12. Вендров A.M. Проектирование программного обеспечения экономических информационных систем: Учебник. М.: Финансы и статистика, 2002. 352 с.

13. Веселов В.В., Долженков А.Ы. Опыт построения XML-СУБД. // Открытые системы, 6/2002. -http://www.osp.ru/os/2002/06/181590/

14. Веселов В.В., Долженков А.Н. Семантическое сравнение реляционных и XML-языков. // Открытые системы, 2/2001. -http://www.osp.ru/os/2001/02/179944/

15. Воеводин В. В., Воеводин Вл. В., Параллельные вычисления. — СПб.: БХВ-Петербург, 2002. — 608 с.: ил. — ISBN 5-94157-160-7

16. Волков A.A. Тесты ТРС. //СУБД, 2/1995. с. 70-78.

17. Волкова И.А. Введение в компьютерную лингвистику. Практические аспекты создания лингвистических процессоров. Москва: МГУ, 2006. 43 с.

18. Гарсиа-Молина Г., Ульман Дж., Уидом Дж. Системы баз данных. Полный курс. Москва, Санкт-Петербург, Киев, Вильяме, 2003

19. Гессе С., Кирстен В. Введение в язык программирования М. СПб: АОЗТ «СП. АРМ», 1996 - 280с.

20. Грей П. Логика, алгебра и базы данных. М.: Машиностроение, 1989, 368 с.

21. Грейвс М. Проектирование баз данных на основе XML. : Пер. с англ. -М.: Издательский дом «Вильяме», 2002 640 с.

22. Грекул В.И., Денищенко Г.Н., Коровкина Н.Л. Проектирование информационных систем. М.: Интернет-университет информационных технологий, 2005. - 304 с.

23. Грис Д. Конструирование компиляторов для цифровых вычислительных машин. М.: Мир, 1975. 544 с.

24. Дарвен X., Дейт К. Дж. Основы будущих систем баз данных. Третий манифест. Изд. 2-е.: Пер. с англ. М.: Янус-К, 2004. - 656 с.

25. Дарвен X., Дейт К.Дж. Третий манифест. //СУБД, 1/1996. с. 110-123.

26. Дейт К. Дж. Анализ вклада Кодда в Великий Спор. 1999. -http://www.citforum.ru/database/articles/coddl.shtml

27. Дейт К. Дж. Введение в системы баз данных, 7-е издание. : Пер. с англ.- М.: Издательский дом «Вильяме», 2002 1072 с.

28. Дейт К. Дж. Введение в системы баз данных, 8-е издание. : Пер. с англ.- М.: Издательский дом «Вильяме», 2005 1328 с.

29. Дейт К. Дж. Когда расширение не является расширением? 1999. -http://www.citforum.ru/database/articles/codd2.shtml

30. Дейт К. Дж. Один за всех и все за одного. 2006. — http://www.citforum.ru/database/articles/relationships/

31. Дейт К. Дж. Реляционная модель выдержит испытание временем. — 1999. http://www.citforum.ru/database/articles/codd3.shtml

32. Долженков А.Н., Тимофеев Д.В. Семантический инструмент построения баз данных. // Открытые системы, 1/2006. с. 36-41.

33. Зеленков Ю.А. Введение в базы данных. 1997. -http://www.mstu.edu.ru/education/materials/zelenkov/toc.html

34. Иваньчева H.A., Иваньчева Т.А. Постреляционная СУБД Cache 5 (методическое пособие). 2004. -http://intersystems.ru/cache/education/docs/nsutextbook.pdf

35. Кабальнов Ю.С., Шехтман Л.И., Низамова Г.Ф., Земченкова H.A. Композиционный генетический алгоритм составления расписания учебных занятий // Вестник УГАТУ, т.7, №2(15) Уфа, с. 99-107

36. Кантонистов Ю.А. Объектные СУБД па российских просторах. -http://www.citforum.ru/seminars/cbd99/inteltec.shtml

37. Карпова Т.С. Базы данных: модели, разработка, реализация. СПб.: Питер, 2001.-304 с.

38. Киреев А. Деревья в SQL. -http://gsbelarus.com/gs/modules.php?name=News&file=article&sid=314#cO

39. Кирстен В и др. Постреляционная СУБД Cache 5: объектно-ориентированная разработка приложений. 2-е изд., перераб. и дополн. -М: ООО «Бином-Пресс», 2005.-416 с.

40. Кирстен В. От ANS MUMPS к ISO М. СПб: СП.АРМ, 1995 - 277с.

41. Кнут Д.Э. Искусство программирования, том 3. Сортировка и поиск, 2-е изд.: Пер. с англ.: Уч. пос. -М.: Издательский дом «Вильяме», 2000. -832 с.

42. Когаловский М.Р. Абстракции и модели в системах баз данных. //СУБД, 4-5/1998.-с. 73-81.

43. Когаловский М.Р. Энциклопедия технологий баз данных. М.: Финансы и статистика, 2002 - 800 с.

44. Кодд Э.Ф. Расширение реляционной модели для лучшего отражения семантики. //СУБД, 5-6/1996. с. 163-192.

45. Кодд Э.Ф. Реляционная модель данных для больших совместно используемых банков данных.//СУБД, 1/1995.-с. 145-160.

46. Конелли Т., Бегг К. Базы данных. Проектирование, реализация и сопровождение. Теория и практика. 3-е издание. : Пер. с англ. — М. : Издательский дом «Вильяме», 2003. — 1440 с.

47. Кормен Т. X. и др. Часть VI. Алгоритмы для работы с графами // Алгоритмы: построение и анализ = Introduction to Algorithms. — 2-е изд. — М.: Вильяме, 2006. — С. 1296. — ISBN 0-07-013151-1

48. Кормен Т.Х. и др. Алгоритмы: построение и анализ. 2-е издание. : Пер. с англ. М.: Издательский дом «Вильяме», 2005. - 1296 с.

49. Крёнке Д. Теория и практика построения баз данных. 8-е изд. СПб.: Питер, 2003.-800 с.

50. Кречетов Н.Е. и др. Постреляционная технология Cache для реализации объектных приложений. Учебное пособие. М.:МИФИ, 2001 152 с.

51. Кузнецов С.Д. «Объектны» ли объектные расширения языка SQL? -2005. http://www.citforum.ru/database/articles/sqlodmg/

52. Кузнецов С.Д. Базы данных: языки и модели. Учебник. М.: ООО «Бином-Пресс», 2008. - 720 с.

53. Кузнецов С.Д. Методы сортировки и поиска. http://www.citforum.ru/programming/theory/sorting/

54. Кузнецов С.Д. Объектно-реляционные базы данных: прошедший этап или недооцененные возможности? 2007. -http://www.citforum.ru/database/articles/ordbms 10/

55. Кузнецов С.Д. Основы современных баз данных. -http://www.citforum.ru/database/osbd/contents.shtml

56. Кузнецов С.Д. Три манифеста баз данных: ретроспектива и перспективы. 2003. - http://www.citforum.ru/database/articles/manifests/

57. Кэнту М. Delphi 7: Для профессионалов. СПб.: Питер, 2004. - 1101 с.

58. Лапрун И. ИТ в отечественной медицине. Все еще в начале пути? // PC Week/RE, 17/2007. http://www.pcweek.ru/themes/detail.php?ID=82474

59. Леоненков A.B. Самоучитель UML. 2-е изд., перераб. и доп. - СПб.: БХВ-Петербург, 2006. - 432 с.

60. Льюис Ф. Теоретические основы построения компиляторов. М.: Мир, 1979.-483 с.

61. Малыхина М.П. Базы данных: основы, проектирование, использование. 2-е изд. перераб. и доп. СПб.: БХВ-Петербург, 2006 - 528 с.

62. Мартин Дж. Организация баз данных в вычислительных системах. М.: Мир, 1984 г. 120 с.

63. Маслов А. Технология клиент-сервер в корпоративных системах на базе М-технологии. // Открытые Системы, 6/1997. -http://www.osp.ru/os/1997/06/179329/

64. Мельчук И.А. Опыт теории лингвистических моделей «смысл-текст». Москва: Школа «Языки русской культуры», 1999. 346 с.

65. Огбуджи Ч. Проверка допустимости с помощью Schematron. 2000. -http://www.iso.ru/journal/articles/175.html

66. Ope. О. Теория графов. М.: Наука, 1985. - 336 с.

67. Осипов Г. С. Приобретение знаний интеллектуальными системами: Основы теории и технологии. — М.: Наука, 1988 — 440 с.

68. Осипов Г. С., Смирнов И. В., Тихомиров И. А., Реляционно-ситуационный метод поиска и анализа текстов и его приложения / Г. С. Осипов, И. В. Смирнов, И. А. Тихомиров / Искусственный интеллект и принятие решений. — 2008. — № 2. — с. 3-10

69. Постановление Правительства Российской Федерации от 16 декабря 2004 г. N 805 г. Москва О порядке организации и деятельности федеральных государственных учреждений медико-социальной экспертизы, http://www.deafworld.ru/index.php/article/archive/190/

70. Пржиялковский В.В. Абстракции в проектировании баз данных. //СУБД, 1-2/1998. с. 90-97.

71. Пржиялковский В.В. Что объектам здорово и что реляциям смерть, и наоборот, и ещё пол-оборота. // PC Week/RE, 22/1998. -http://www.pcweek.ru/themes/detail. php?ID=47588.

72. Прохоров А. Временной ряд как объект хранения в СУБД. 2001. -http://www.citforum.ru/seminars/cbd2001/day25informix.shtml

73. Райордан Р. Основы реляционных баз данных/Пер. с англ. — М.: Издательско-торговый дом «Русская Редакция», 2001. 384 с.

74. Рузайкин Г.И. Медицинские информационные системы, или МИС. //Мир ПК, 3/2001.

75. Селко Дж. Деревья в SQL http://sdm.viptop.ru/articles/sqltrees.html

76. Смит А.Б. Реляционные, древовидные и объектно-ориентированные базы данных. // MSM-бюллетень, 5/1997. с. 19-28.

77. Смит Дж. М., Смит Д. К. Абстракции баз данных: Агрегация и обобщение. //СУБД, 2/1996. с. 141-160.

78. Стасышин В.М. Лекции по курсу «Базы данных и экспертные системы». http://ami.nstu.ru/~vms/lecture/bd/

79. Стоунбрейкер М. и др. Системы баз данных третьего поколения: Манифест. //СУБД, 2/1995. с. 143-159.

80. Танаев B.C., Сотсков Ю.Н., Струсевич В.А. Теория расписаний. Многостадийные системы. М.: Наука, 1989. - 328 с.

81. Танаев B.C., Шкурба В.В. Введение в теорию расписаний. М.: Наука, 1975.-256 с.

82. Тенцер А. Естественные ключи против искусственных ключей. 1999. - http://www.internet-technologies.ru/articles/article271 .html

83. Тузов В.А. Компьютерная семантика русского языка. СПб: СПбГУ, 2003. 392 с.

84. Усов C.B. Ключ или отмычка. 2001. -http://www.alexus.ru/russian/articles/dbms/keys/index.htm

85. Хабибуллин И.Ш. Самоучитель XML СПб.: БХВ-Петебрург, 2003. 336 с.

86. Хантер Р. Проектирование и конструирование компиляторов. М.: Финансы и статистика, 1984. - 232 с.

87. Харари Ф. Теория графов. М.: Едиториал УРСС, 2003. - 296 с.

88. Харрингтон Дж. Проектирование реляционных баз данных. М.: Лори, 2006. - 240 с.

89. Холзнер С. XML. Энциклопедия, 2-е изд. СПб.: Питер, 2004. 1101 с.

90. Хомепко А.Д., Цыганков В.М., Мальцев М.Г. Базы данных: Учебник для высших учебных заведений / Под ред. проф. А.Д. Хомепко. 5-е изд., доп. - М.: Бином-Пресс; СПб.: КОРОНА принт, 2006. - 736 с.

91. Хомский H.A. Аспекты теории синтаксиса. М.,1972. 259 с.

92. Цаленко М.Ш. Моделирование семантики в базах данных. М., Наука, 1989.-288 с.

93. Цикритзис Д., Лоховски Ф. Модели данных/Пер. с англ. М.: Финансы и статистика, 1985. - 344 с.

94. Чамберлин Д. и др. W3C XML: XQuery от экспертов. Руководство по языку запросов. Пер. с англ. М. КУДИЦ-ОБРАЗ, 2005. - 480 с.

95. Чен П.П. Модель «сущность-связь» шаг к единому представлению о данных.//СУБД, 3/1995.-с. 137-158.

96. Шатохин Н. А., Дмитриева О. А. Семантический анализ информации. // Сборник материалов четвертой международной научно-технической конференции студентов, аспирантов и молодых ученых ИКТ-2008 — Донецк, ДонНТУ — 2008. — с. 350-353

97. Щавелёв Л.В. Оперативная аналитическая обработка данных: концепции и технологии, http://www.citforum.ru/seminars/cis99/sch.shtml

98. Вourret R. XML and Databases. 2005. http://www.i-pboun-et.com/xml/XMLAndDatabases.htm

99. Cache http://www.intersystems.ru/cache/index.html

100. Chart FX http://www.componentsource.com/features/softwarc-fx/index.html

101. Chase N. Understanding RELAX NG. 2003. http://www.ibm.com/developerworks/edu/x-dw-xrelaxng-i.html

102. Date C.J. On Codd's RM/T. 2003. http://www.dbdebunk.com/page/page/806639.htm

103. DB2 http://www.ibm.com/software/ru/db2/

104. Document Object Model (DOM). http://www.w3.org/DOM/

105. Extensible Markup Language (XML) 1.0. http://www.w3.org/TR/PJZC-xml/109. GT.M.http://www.fideHtyinfoservices.com/FNFIS/Markets/Nonfinanciallndustries/ Healthcare/gtm/

106. IDMS http://en.wikipedia.org/wiki/IDMS

107. IMS http://en.wikipedia.org/wiki/InformationManagementSystcm

108. Jack C., Keillor C. Semantic Data Models. ourse. — http://www.soc.napier.ac.uk/module.php3?op=getresource&cloaking=no&re sourceid=7462386

109. MUMPS http://www.mumps.org/

110. ODBMS. http://www.odbms.org/

111. Ogbuji U. A hands-on introduction to Schematron. 2004. -http://www.ibm.com/developerworks/edu/x-dw-xschematron-i.liii.il

112. Oracle http://www.oracle.com/global/ru/index.html

113. Relax NG. http://relaxng.org/

114. SftTree/OCX http://www.soitelvdm.com/treeocx.html

115. SQL Server http://www.microsoft.com/sqlserver/2008/ru/R./de{V.i:!t.aspx

116. SQL: 1999. ISO/IEC 9075-(l-5):1999.

117. SQL:2003. ISO/IEC 9075-(l-4,9-11,13,14):2003.

118. SQL-92. ISO/IEC 9075:1992.

119. Ter Bekke J.H. Semantic Data Modeling. Course. 1999. -http://www.kbs.twi.tudelft.nl/mmdb/terBekke/sheet/

120. Thalhammer T., Schrefl M., Mohania M. Active Data Warehouses: Complementing OLAP With Active Rules. http:/Avv/\v.dke.uni-linz.ac.at/research/publications/TRO 101 .pdf

121. The Schematron. http://xml.ascc.net/resource/sehernatron/

122. Tujarov H., Mihailov I. PER model Semantic data models developing. -2004. - http://ecet.ecs.ru.acad.bg/cst04/Docs/sIIIB/313.pdf

123. XML Path Language (XPath) Version 1.0. http://www.w3.oro/TIl/xpath

124. XML Path Language (XPath) Version 2.0. http://www.w3 .org/TR/xpath20/

125. XQuery 1.0: An XML Query Language. http://www.w3.org/T'!/yquery/

126. XSL Transformations (XSLT) Version 1.0. http://www.w3.org': .

127. XSL Transformations (XSLT) Version 2.0. http://www.w3.org/ : " ' slt20/