автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Модель времени с модальностями для отображения темпоральных структур в базах знаний
Автореферат диссертации по теме "Модель времени с модальностями для отображения темпоральных структур в базах знаний"
АКАДЕМИЯ НАУК ВЫЧИСЛИТЕЛЬНЫЙ
СССР
а в н т р
па права! рукописи
Сикора Эва
УДК 519. 7»
МОДЕЛЬ ВРЕМЕНИ С МОДАЛЬНОСТЯМИ ДЛЯ ОТОБРАЖЕНИЯ ТЕМПОРАЛЬНЫХ СТРУКТУР В ВАЗАХ ЗНАНИЯ
Специальность 05. t3.il Математическое и программное обеспечение вычислительных наоия. комплексов, систем и сетей
АВТОРЕФЕРАТ
диссертации на соискание учено* степени кандидата физико-математических нагк
Москва 1991
Работа выполнена в Вычислительном центре АН СССР
Нагчныя руководитель:
доктор технических нагк профессор Д. А. Поспелов
Официальные оппоненты;
доктор технических нале
В. л. СтеФакюк кандидат «из. -иат. нагк Г. с. Осипов
Ведущая организация:
институт систем Информатики со АН ссср в Новосибирске
Завита состоится 199^г. в•'Шлг' часов
на заседании Специализированного совета коог. зг. 01 при вычислительном Центре АН ОХР (11Т96Т, ГСП-1, Москва. В-335, гл. Вавилова 40).
с диссертацией можно ознакомиться в библиотеке Катена-течиского института им. В. А. Стеклова АН ссср.
Автореферат разослан
1991г.
Ученых секретарь специализированного совета кандидат »из. -нат. наук , " " к. В. Рудаков
общая характеристика работы
Актуальность проблемы. В начале 70-х годов в исследованиях по искусственному .интеллекту (ИИ) выделилось направление, получившее название "обработка естественного языка". Задачей этого направления является исследование методов работы с естественным языком (ЕЯ) и разработка систем, способны* понимать тексты на ЕЯ и приобретать знания, содержащиеся явно или неявно, в текстах. На протяжении последних лет исследователями, занимающимися проблемами автоматической обработки текстов и пониманием ЕЯ с помощью ЭВМ, получен ряд интересных и практически важных результатов. Эти результаты касаются как методов обработки самих текстов (анзлиз и синтез ЕЯ-текстов), так и проблемы соотнесения содержания текстов е моделью мира, .хранящейся в памяти системы (базе знаний), что и составляет4 суть проблемы понимания.
Одной из важнейших функций ЕЯ является функция моделирования действительности. В основе понимания текстов на ЕЯ лежат процедуры выявления определенных логических структур, отражающих те закономерности, которые реализуются в действительности. Одной из таких структур является, в частности, темпоральная структура. На их основе разрабатываются специальные псевдофизические логики. Псевдофизические логики времени это логики отношений, которые в качестве своих аксиом содержат утверждения, вытекающие из особенностей восприятия времени и всех связанных с ним процессов человеком. Подобного рода логики .являются хорошим инструментом для пополнения и ' организации знаний в интеллектуальных система* и понимания ЕЯ-текстов.
Методы понимания ЕЯ на семантическом уровне и приобретения знаний из текстов являются не вполне разработанными. Следует подчеркнуть, что исследования в этой области для польского языка находятся еще в зачаточном состоянии.
Хорошим средством для практической реализации систем понимания ЕЯ является язык логического программирования Пролог, который был создан как инструмент обработки £Я-текстов. После' того, как Министерство внешней торговли и развития Японии объявило о том, что японский проект создания ЭВМ 5-го поколения будет основываться на-методах логического программирования, интерес ч Прологу непрерывно растет.
Учитывая, что время для человека является очень важным аспектом восприятия действительности, представляется, что разработке проекта системы приобретения знаний о иремени из текстов и использование для этих целей логического подхода к представлению знаний и метаязыка, основанного на Прологе, являются актуальными проблемами для исследований.
Цель работы - описание базисных знаний и методов для создания системы, способной приобретать из ЕЯ-текстов все содержащиеся в нем знания о временной структуре (каждому выделенному из текста событию приписывать соответствующую ере. енную структуру (точка, интервал, цель) и все события расставляются во времени).
Основные задачи, поставленные и решенные в работе, заключаются а следующем:
• - дано описание всех грамматических и лексических средств выражения темпоральной информации для польского и русского языков с учетом модальности;
- произведено расширение существующих логик времени путем введения модельных отношений;
- разработан общий проект системы приобретения темпоральной информации из текста;
- разработана модель времени, способная описывать все нужные временные структуры и временные отношения между событиями;
разработан алгоритм анализа текстов (на примере приобретения темпоральной информации из текста на польском языке).
Методы исследования. Исследования осуществлялись на основе методов морфологического, синтаксического и семантического анализа текста, законов грамматики русского и польского языков, теории обработки текста, логик времени, логики предикатов, моделей времени,
логических средств программирования. #
Научная новизна. В диссертации описаны лексико-грамматические средства выражения в польском языке темпоральной информации с целью использовак я их в интеллектуальных системах понимания ЕЯ. Кроме того проанализированы способы выражения модальности с точки зрения вероятности осуществления событий ■ во времени и предло сены формальные модально-временные отношения. Построена модель времени, базирующаяся на языке Турбо Пропс, для приобре1ения временной информации из текстов на польском языке.
Практическая ценность. Результаты работы являются основой для создания интеллектуальных систем понимания ЕЯ-текстов и получения темпоральной информации, источником которой являются тексты на ?Я. Предложенные в работе (с учетом модальности) временные 01н0шем«я и соответствующая модель времени с использованием Турбо Пролога, : зэвопяют реализовать подобные системы.
Внедрение результатов. Результаты исследований будуг использованы в разработках, проводимых- в Отделе Научно-технической информации Силезского Университета (г.Катовице, Польша), при создании интеллектуальных информационных систем.
Апробация работы. Основные результаты работы докладывались и обсуждались на следующих семинарах и конференциях:
II Международный Симпозиум "Применение ЭВМ в научно-технической информации" (г. Катовице, 1989),
I Национальная конференция "Инженерия знаний и экспертные системы" (г. Вроцлав, 1990),
постоянно действующий семинар в ОНТИ СУ (г. Катовице, Польша),
семинар отдела Проблем искусственного интеллекта Вычислительного Центра АН СССР.
Публикации. По теме диссертации опубликовано две работы.
Структура и объем работы. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы. Основной тскст содержит 127 страниц, 4 таблицы, 3 рисунки. Список литературы содержит 116 наименований.
/
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность, определена цель и сформулированы задачи проводимых исследований, рассматривается сущность полученных в ррботе основных результатов, дано краткое изложение содержания работы.
В первой главе описаны все лексические и грамматические средства выражения темпоральной информации с помощью глаголов, существительных, определений, предлогов и союзов в польском и русском языках с учетом выражения модальности событий в будущем.
. лаголы обозначают процесс и выражают те изменения, которые происходят во времени. Значение времени и временной протяженности является характерным признаком любого глагола. Глаголы выражают свое значение в грамматических формах: вид, залог, лицо, число, род, время, наклонение.
Под процессом можно подразумевать разнообразные явления: действие, состояние, перемещение в пространстве, речь, а также ^ ззличные звуковые явления, проявление и изменение признаков, мыслительный процесс, восприятие, взаимоотношение людей.
В предложении все формы глагола выступают в функции простого глагольного сказуемого и только- они способны выражать отношение процесса к действующему лицу.
Точный состав способов действия в русском и польском языках до сих пор не установлен. Поэтому охарактеризованы важнейшие группы глаголов, представляющие способы действия (с точки зрения приобретения временной информации из прегюжения).
Группы глаголов, соответствующие способам действия:
1. "Начинательный" способ действия включает глаголы, обозначающие начало действия.
2. Длительно-ограничительный способ действия охватывает глаголы, которые фиксируют, что действие происходило в течение определенного промежутка времени, но уже закончилось.
3. Финитный способ действия объединяет глаголы, которые обозначают прекращение действия, доведение его до абсолютного конца.
4. Мгновенный. способ действия охватывает глаголы, обозначающие действия, которые происходят в очень коротком промежутке времени..
5. Многократный способ действия охватывает глаголы, обозначающие нгрегулярное или регулярное повторение действия.
Следует заметить, что иногда в тексте повторяемость действия определена не при помощи грамматико-лексических средств, 8 вытекает из контекста. Пример: "Ян читал эту книгу два дня". Из текста мы можем сделать вывод, что событие "Ян читает книгу" происходило непрерывно в течение двух дней. Но мы знаем, что любой человек может читать что-то непрерывно максимально 3-4 часа. На основе текста и знаний о способности чтения человеком предполагается повторяемость действия "чтение" в нерегулярных отрезках ьремени в течение двух дней. С каждым глаголом можно связать его реальное минимальное и максимальное время реализации
Глаголы способны передавать не только информацию о времени протекания действия, но способны характеризировать (как правило, используются префиксные формы) качество процесса протекания действия, т.е. определять уровень нарастания действия во времени, фиксировать ограничения действия во времени и в сте ени проявления, определять, что действие осуществляется время от времени, иногда и слегка, в слабой степени.
Важным признаком глагола является переходность. Переходные глаголы обозначают действие, которое направлено на объект и может на него переходить. Указание на объект определяет время совершения события и делает его более конкретным.
В русском и польском языках можно выделить два основных типа временных значг 1чй: абсолютное и относительное время. Абсолютным временем принято называть время, определяемое по отношению к моменту речи или чацой-лчбо другой точке отсчета, не определяемой содержанием текс.а. Можно выделить три формы абсолютного вр<»»сн«: настоящее, прошедшее и будущее ерем».
Относительное время - это время протекания одного действия по отношенню ко времени другого действия.
Существительные, определения и предлоги образуют компактную группу слов, которая содержит в себе обширную информацию о временных соотношениях и расширяет картину действия, описанную глаголом. В работе выявлены 8 классов существительных со значением времени:
1. названия временных единиц и их частей (секунда, минута, час, месяц, и т.п.);
2. названия неопределенных отрезков времени (время, срок, и т.п.);
3. названия частей суток (утро, ночь, заход и т. п.);
4. названия времен года, месяцев и дней недели (весна, среда, май, и т.п.); . •
5.названия определенных отрезков времени с точки зрения разных отраслей науки, промышленнности, экономии и т.д. (неолит, триас, тысячилетие и т.п.);
6. названия длительных временных периодов ■ по отношению к текущему моменту времени (старина, булущее и т.п.);
7. слова, обозначающие возрастной период и период развития человека - (детство, молодость, старость и. т.п.); ' ,
8. слова, ' не имеющие лексического значения < времени (обед, рождество, и т.п.).
Надо заметить, что для промежутков времени, описанных существительными, можно создавать условные временные структуры, т.е. делить промежуток времени на части, которые можно называть общепринятыми словами-существительными.
Определено. 6 классов пределений со значением времени:
1. определение полного охвата временного отрезка (весь, целый);
2. определение длительности временного отрезка (долгий, короткий, какой-то и т.п.);
3. определение последовательности относительно текущего момента, порядковые числительные и слово "последний" (прошлый, текущий, прежний и т. п.);
4. определения, означающие расположение во времени (поздний, ранный и т. п.);
5. определения, происходящие от существительных (летний, рабочий, дневной и т.п.);
6. лексико-грамматические местоимения (каждый, и т.п.).
В основном, в русском и польском языках полную картину временной информации создают сочетания существительных, определений и предлогов. Существительные и определения со значением времени в сочетаниях с пр'едлогами определяют два важных признака события-, расположение события по отношению к текущему моменту времени или событию-ориентиру, определяют
вид события (точка, интервал, цепь). В случае неточечных событий упомянутые сочетания в состоянии передать информацию о длительности во времени, повторяемости, завершенности и 1.п. событий.
Предлоги конкретизируют время происхождения событий, указывают на их начало, конец и завершение. В работе представлены характеристики предлогов, принимающих участие в создании временных конструкций в русском языке, и их эквивалентов в польском языке.
Временные отношения двух или более' событий часто выражают сложные предложения с временными союзами, среди которых выделяются два вида:
- союзы дифференцированных значений, которые играют роль основного временного указателя и точно определяют отношения между событиями;
- союзы недифференцированных значений, которые указывают лишь на факт временной соотнесенности . (одновременность, очередность), а однозначное определение временного отношения выявляется .• на. основе соотнесения видо-временных значений сказуемых-глаголов или на основе , семантических признаков, уточняющих характер протекания событий во времени.
Союзы дифференцированного значения, выполняют в предложениях функцию квалификатора. Они однозначно определяют временное отношение между событиями а рамках сложного предложения. Способность конкретизации временного отношения с помощью союзов обусловлена их семантикой. Временные специализированные союзы могут не только определять очередность и . одновременность событий, но могут быть носителями таких свойств, как ограничительное^, прерванность, опережение, преждевременность, внезапность. Они могут также указывать на отсутствие интервала времени между событиями или на его минимальность. Союзы этого типа можно разделить на три группы:
1. союзы предшествования, ,
2. сою.'>1 следования,
3. союзы одновременности. у
Союзы, недифференцированных значений могут связывать в предложениях события, которые происходят одновременно или поочередно. Характер отношений можно определить прежде всего по . • идо»ым значением сказуемых-тлэголс , союз не в состоянии передавать информацию такого рода. Самым важным представителем союзов, принедлежащих к этой группе, является союз "когда" (в польском языке "к1ес!у"). На примере этого союза, в работе описаны , прйвилз, когоры I надо ерсполезоваться для определения временных отношений между событиями, которые связаны союзом недифференцированного значения. ' '
Модальность это функционально-семантическая категория, которая выражает различные виды отношения высказывания к действительности, а также разные виды субъективной квалификации. С точки зрения темпоральных знаний к сфере • модальности относится градация значений а' диапазоне реальность-нереальность события. Модальность может быть объективной или субъективной. Объективная модальность выражает отношение сообщаемого к действительности в плане реальности (осуществляемое™ или осуществленностч) и ирреальности (неосущесталенности) события. Она касается общепринятых правил и законов. Субъективная модальность это отношение говарящего к сообщаемому. В отличие от объективной она выражает личное и субъективное мнение человека о реальности события, которое в большинстве случаев кЛэется говорящего и является каким-то элементом его жизни.
Для выражения модальности событий, которая связана с определением возможности реализации события в будущем, существуют разные средства: лексические, морфологические, синтаксические. К ним можно отнести наклонение глагола, так называемый конъюнктив. Предложения с конъюнктивом выражают предположительность события, но к сожалению, невозможно на их основе определить, с какой вероятностью событие осуществится. Это зависит от субъектов и объектов, которых касается событие, и осведомленности автора текста.
Более точным инструментом для определения модальности являются модальные группы слов. Эти слова можно разделить на три группы. Первая содержит слова, которые фиксируют достоверность события, вторая - слова, которые отрицают возможность возникнения события, а третья охватывает слова, которые выражают какую-то вероятность вглиикновени: события в будущем. Неоднократно делались попытки приписать этим словам оценки (например, от 0 до 100), коюрые задают правдоподобность события. Для получения оценок был проведен эксперимент с носителями русского и польского языка (15 человек). Им предлагалось- расположить модальные слова на шкале 0-100, где 0 означает, что события не будет, а 100 -непременное его осуществление. В результате эксперимента получена дискретная функция правдоподобия для событий, характеризуемых модальными словами.
Очень часто оценка реализации события в будущем обусловлена появлением и завершением другого события. Одним из средств для выражения этого типа связи между событиями в ЕЯ-текстах является сложное предложение с условными союзами. В »том случае, если можно определить правдоподобность одного события, то тем самым уточняется правдоподобность другого, зависимого от первого (эти события связаны отношением, например, следования). Надо заметить, что и в русском и польском языках довольно много конструкций такого типа. Пример:"Если, я получу письмо от моей девушки, го сразу поеду к ней."
Часто в предметной области существуют цепи событий, последовательно определенных во времени, и которые можно представить . в виде графа, узлы которого означают промежутки времени, соответствующие событиям, а ^'там приписаны оценки, определяющие возможность реализации данного события. На основе таких последовательно связанных событий можно предсказать события ■ будущем при отсутствии информации о них в тексте.
Если для оценки правдоподобия используются вероятности, то вероятность зависимых событий можно вычислить используя теорему Байеса:
п
(1) Р(В) = P(A¡) Р(В/А;),
¡=1
где Р(В) - вероятность события' В;
Р(В/А) - вероятность В при условии А;
Ач ..... An- события предшествующие, ,|ричины.
(2) Р(А/В)= Р(А В) / Р(В)
Во второй главе представлена общая схема системы анализа ЕЯ-текстов, которая состоит из следующих блоков:
а) Блок предварительной обработки текста. Этот блок осуществляет стандартизацию входного текста, поскольку существует много языковых конструкций, описывающих одинаковые временные структуры при использовании разных грамматических и лексических средств (вечерами - по вечерам, przeczytac w jeden dziert~za jeden dzieft).
Создание своего рода стандартного ЕЯ обеспечивает однозначность лексических средств выражения временной инфор лации.
б) Блок лингвистического процессора (А) осуществляет морфологический . и синтаксический анализ каждого предложения текста. В итоге получается перечень морфологических знаний о конкрсных лексемах. Для морфологического анализа используется специальная информация, хранящаяся в словарях:
перечень частей речи и морфологическая информация, . характеризующая каждую часть речи;
- перечень всех аффиксов и информация об их сочетаемости.
Для получения синтаксических хараг-еристик лексем используемся
также информация из словарей.
перечень синтаксических отношений, устанавливаемых между словами предложения;
- сведения ~ грамматике языка;
синтаксическая компонента модели управления конкретных
лексем,
- лексические функции конкретны« лексем.
в) Блок темпоральных словарии (В). Основную часть этого блока составляют словаря: глаголов, существительных и определений, предлогов, союзов. В этих словарях находятся все слова, имеющие какое-то отношение к определению временной информации.
Словарные статьи содержат следующие поля: '
1. Глаголы:
- толкование,
- тип действия { начинательный,
длительно-ограничительный, финитивный, , мгновенный),
- многоактность,
- *гтп - минимальное время, за которое может происходить действие, описанное глаголом,
■ " " максимальное время, за которое может
происходить действие, описанное глаголом,
- возможная временная структура (точка, интервал, цепь),
- ссылки - на знания, связанные с действием, которое соответствует глаголу, позволяющие определить состав объектов, на которые направлено действие. (В зависимости ог объекта промежутки времени, в которые происходит действие, бывэют разные. Кроме того, действие, описаннсе глаголом, может являться элементом какой-то • типовой последовательности действий. Концептуальные знания помогают найти место действию в такой последовательности и определить правдоподобные предшествующие и последующие действия, т.е. описать возможные модальности).
2. Существительные и определения:
- тоякованк?,
- предложение возможной временной структуры,
- ссылки - на знания, в которых представлены временные структуры (определение возможных , модальных событий, связанных с событием, описанным существительным).
3. Модальные слова:
- значение функции правдоподобия (вероятности) для данного слова,
- возможное модальное отношение.
4. Предлоги:
- определение временной структуры: точка, интервал, цепь,
- временные отношения, которым соответствуют сочетания слов с данным предлогом.
5. Союзы:
- тип союза ( дифференцированных значеий,
недифференцированных, значений),
- определение временного отношения.
г) Блок обработки связного текста (С). Выявляет связи новых знаний с ранее приобретенными, т.е. осуществляет анализ на уровне связного текста.
я) Блок модели времени с меха иямом вывода (0) и темпоральной базой знаний (Е). Осуществляет процесс внутреннего представления темпоральных знаний. Темпоральная база знаний (ТБЗ), в которой фиксируется последовательность фактов (темпоральных отношений между событиями), соответствующая внутреннему представлению знаний из текста (семантическая сеть' во временном аспекте).
Таким образом, анализ текста начинается на уровне предложения с выделения субъектов, объектов и действий, т.е. событий (лингвистический процессор - блок А) и приписывания им соотсетсгвующей временной структуры (темпоральные словари блок В). Затем происходит отнесение их к абсолютной шкале времени (если это возможно), и определение временных отношений (блок О). Одновременно происходит анализ каждого предложения, с целью поиска знаний, которые ему соответствуют. В результате выполнения всех этих процедур получается временная-семантическая сеть, соответствующая данному тексту, которая является- элементом ТБЗ (блок Е).
В работе рассмотрены логики времени, разработанные Алленом, МакДермоттом, Л.В.Литвинцевой и Д.А.Поспеловым, и модель времени Е.Ю.Кандрашмной. Эти логики можно успешно использовать для описания внешнего мира, но без соответствующего модального расширения с их помощью нельзя полностью описать того, что будет происходить в будущем.
В русском и польское языках часто встречаются гипотетические события, факт совершения которых как в прошлом, так и в будущем невозможно точкт определить. С такими событиями связаны модальные слова, которые соотвествуют возможности, необходимости, допустимости, невозможности осуществления события.
Д я .оперирования с модальностями вводятся специальные модальные логики, которые используют специальные операторы над Лоически/Аи формулами. Приведем примеры модальных временных отношений, которыми можно обогатить логику в, емени:
(р) - событие р обязательно произойдет в будущем;
2.Инг(р) " событие р обязательно г оизошло в прошлом;
3-Кц}(р) - событие р возможно произойдет в будущем;
<4^т(р) - событие р возможно произошло в прошлом;
5^н5(р,ч) - событие <| произойдет только тогда, когда произой^ т р, осуществление ц зависит от р.
Применение лишь таких отношений для определения возможности соОытч* ««ляется для ЕЯ недостаточном. Поэтому предлагается определять верояи.осп. события с псощью следующего отношения:
R^P (p^c)- событие p произойдет в будущем с оценкой
правдоподобия <л ,где «<■ t [0,1]. Для системы выявления временной информации из текста удобен логический подход, т.е. логика предикатов первого порядка. Такса решение предполагает использование логического програм. ирования, которое имеет прямыд связи с формальной погикой. Поэтому в работе используется для представления результатов рассуждений я^ык Пролог (версия Турбо), который, как иовестно, был создан для анализа ЕЯ. Сейчас Пролог является одним из основных языков ИИ.
В третьей глаее описан эскиз алгоритма темпорального анализа текста на польском языке, предложена модель времени с модальностями дпя отображения темпоральных структур в D3 для анализа польского языка, схарактеризироьана разработанная системо CZAS.PRO.
Основными шагами алгоритма анализа текстов на польс* >м языке являются следующие:
1. Предварительная обработка текста - получение текста ка стандартном польском языке.
э) Морфологический анализ всех предложений, б) Синтаксический анализ всех предложений. * 8 результате выполнения этих этапов получаем множество предикатов, которые описывают лексико-грамматические знания каждого отдельно взятого слова из анализируемого текста. В случае сложного предложения выделяются простые предложения и соединительные союзы.
2. TeMnopaj .ный анализ предложения.
а) Выделение всех событии и приписывание им названий на ЕЯ.
б) Соотнесение со словами, которые описывают данное событие, всех предикатов, с учетом соответствующих морфологически* и синтаксических знаний (часть речи, чя^и предложения, лицо, время, вид, выделение суффиксов и
т.д.). " .
а) Поиск отих слов в темпоральных словарях н приобретение из них соответствующих знаний.
г) Определение событий как временных структур и наполнение этих структур знаниями
д) Поиск и определение модо/.ьности.
е) Определение временных отношений между событиям* предложения (нз основа морфологических, симтакогчесмм* и приобретенных другим способом знаний), базируирц&х» на предлагаемой модели времени.
ж) В спучг. сложного предложения, определение временных отношений производится так между событиями простых предложений.
з) Соотнесение и присоединение вновь приобретенных знаний к уже находящимся в базе знаний.
Модель времени определяет все временные струхтуры (точка, интервал, цепи) и возможные темпоральные отношения между ними с учетом модальности.
Точка - определяет однократное, мгновенное по отношению к другим событие. Точка (punkt) может быть представлена в виде тексгового описания (siring) или как сложная структура языка Турбо-Пролог и соответстьует следующим сочетаниям: (день недели, число, час), (число, час), (день недели, час), (день недели, число), (число), (час* (день недег.и), (месяц). Пользователь-программист имеет возможность выбора соответствующей структуры для переменной (события) типа точка. punki=ol;reslenie;
dtdg(dzien-tysodnia,data,godz); dtd(dzien~tygodnia.data); dtg(dzien—tygodnia,godz); dg(da*a,godz), d(dafa);
dt(dzien-tygodnia); v
miesiac(m);
rok(r)
data=data( integer, /" день "/
in(eg2r;string, _ /" месяц V
integer) /' год '/
okreslenie,dzier>—tygodnia,mitring godz=godz( integer, /" час "/
integer) /" минуты V
• Интервал - временная структура, которая соответствует действию, совершаемому в определенной промежуток времени. Интервал (interval) декларируется как сложная структура (похожа на запись), в которой выделены четыре поля. Первые два (типа "точка") соответствуют началу и концу интервала, третье (типа integer) определяет длину интервала, че.-вертое (типа string) характеризует ед.жицу измерения длины данного интервала. mterva!=interval( punkt, Г начало V
punkt, /" конец '/
integer, /" длина "/
string) /" единицз измерения"/
Цель - регулярная или нерегулярная последовательность элементов типа точка ипи иктеэЕал. Для упрощения, выделяются только однородные (с точки зрения типа элеменюь) цепи.
Регулярная цепь точек (lan-punkt-1) также задагтся четырьмя полями: первое зто точка, соответствующая элементу цегч, второе (integer) определяет число элементов (точек) в гпи, даа остальных поля определяют расстояние (integer) между дзумя элементами цепи и единицу умеренна (siring).
Структура, соответствующая регулярной цепи интервалов (lancrich—1), имеет поля: начало и конец цепи (точки), длина элементов (integer), расстояние между элементами (integer) и единица измерения (string).
Нерегулярные цепи точек и интервалов определяются списками,ранее определенных структур (punkt-1 дпя точек и intervat-l для интервалов). Структуры типа список я Турбо-Прологе помечаются при помощи звезцочек. Каждая структура типа punkt—1 'остоит из следующих полей: описание отделы >го элемента (точка), расстояние до следующего элел\ентг (integer) и единица измерения (string). В структуру типа interval—1 входят поля: элемент (interval), расстояние до следующего элемента (integer) и единица измерения (string). /" регулярная цепь точек V
lan-punt_i=lan_punkt_1( punkt, /" элемент "/
integer, integer,
/' число элементов "i /' расстояние между
string)
элементами '/ /' единица измерения расстоянии '/
/' нерегулярная цепь течек "/ /' описание одного элемента '/ punkt-1-punkt—1{ punkt,
Г элемент '/ /' расстояние до следующего аяемеитл V
/" единица измерения V
integer.
string) lan—punkt—2=punkt—l' /* регулярная цепь интервалов "1 lar.cuch-1=lancuch( pur.kt.
/" качало-течкя "/
punkt, integer, integer, integer,
/" расстояние м*жду элементами
7
/' коиец~то>»ка "I /' длина элементов У /' число племен roe*/
string)
Г единица щл»ер«м*»>
/ нурегулярная епь интервалов "/ /' описание одного элемента '/ . interval—2=interval-2( interval,
inleger,
Г элемент"/
/" расстояние до следующего элемента^
string) /' единица измерения/1'
/■ цепь '/ lancucli—2-interval~2"
Определено темпоральные множество предикатов-отношений (с учетом модальности в будущем) и клаузул для все* темпоральных струк'ур, что дает возможность создания темпоральной базы знаний и действий в ней.
Предложены следующие модальные отношения: /" отношение "наверно" для всех временных структур V na-pewno-p(punkt) па—pewno-¡(interval) na~pewno—lp!(lan—punkt_1) пз-pewno—Ip2(lan—punkt— 2) na-pcwno~l l(lancuch—t) na-pewno—t2(lancuch—2)
/' отношение "возможноо" для всех временных структур "/
moze —p(punkt)
more—¡(interval)
moze—Ipl (Ian—punkt—1)
more—Ip2(lan—punkt—2)
moze-11 (laucuch-1)
mcze-!2(lancuch_2)
/" отношение "невозможно" для всех временных структур "/ ■ • nie—p(piiiikt) nie—¡(interval) nie—Ipl(lan-punkt-l)
lie—Ip2(lar?—punkt_2) ^
nie—I1(lancuch— f) nie—I2(lancuch—2)
./'отношение ''возможно с вероятностью" для всех временных
структур "/ prawdopodobn!e-p(punkt,real) prawdopodobms—¡(interval,real) prawdopodoisnie-lpl (lan~punkt~l ,real). prawdoDodobnic—lp2(Ian_punkU2,real) prawdopodobriie—11 (lancuch—1 ,real)
prawdopodobnie-l2(lancuch—2,real)
/' отношение "если произойдет событие А то произойдет В, для
событий одинакового типа V jesli-p(punkt,punld) jesli-i(inferval, interval) jesli-lp t (lan_punH—1 .Ian-punk 1—t) ¡esli-lp2(lan-punk1—2,lan_punU—2) jesli-M(lari>.ucfr-1,lancuch-1) jest!—I2(lancuch— 2, lancuch—2).
Проблему представления абсолютных шкал, которые мспо^зуются для определения арменных отношений, можно решить при помощи Пролога. Создавая специальные структуры-шкалы в виде списков, для обработки которых можно использовать такие процедуры языка Пролог, как сцепление списков и проверка принадлежности данного элемента к списку, можно олисыв&ть соотнесение событий с. любой шкалой.
Результатом программной части работы является система на Турбо-Прологе CZAS.PRO. Из многих существующих версий языка Пролог выбргна версия Турбо, т.к. Турбо-среда удобна для пользователя и дает возможность декларирования новых типов •властей значений, чего не дают другие версии.
После лексического анализа с учетом темпоральных словарей формируется темпоральная база знаний (основная ТБЗ). Задачей программы является пополнение знаний в базе с помощью механизмов вывода в модели времени. Программе CZAS.PRO эго часть систг ды анализа текста на польском языке (соответствует блокам D и Е).
Основные переменные в программе соответствуют событиям. Они могут быть' разных типце (в зависимости от темпорального соотнесения: тонка, интервал, цепь).
Программу гостояллют следующие .< одул и:
1. Модуль декларирования глобальных темпоральных типов (global domains) ч глобальных темпоральных предикатов, используемых для создания темпоральной динамической базы знаний (ТДБЗ)(дЗоЬи1 database). Определение тредикэтоэ при помощи Директивы djiabate означает, что они будут использованы при создании фдето* динамической базы знаний, что дзет возмй»жооь полыолегевк», порождагь к удго»:ь эт* факты ••■> ерам» работы прогрЕмм»*. Он* находятся в файле с рзгширением DEF. 3 ха.«дой подпрограмме- не этот файл указысает директива INCLUCE.
В этом модуле декларируются see типы областей- гначеммЬ, использованы* во всех подпрограммах С*1 редел кете* телиюрельн »л ткгы: точка, интервал, р^гуляри*» и иерегул»риья ивпъ точ«* *л*> иитер»?го».
2.Модуль декларации предикатов (predicates, global predicates). Основным элементом в Прологе является предикат. В Турбо-Прологе необходимо определить все нестандартные использования програмистом предикатов и области их значений.
3.Модуль стандартных процедур (clauscs). В этом модуле в виде множества клаузул определ ены все процедуры, использованные в программе.Вызов данной процедуры происходит путем конкретизации аргументов соответствующих предикатов.
4.Модуль темпорального механизма вывода (clauses). Является вместе с ТДБЗ ядром программы. Модуль обеспечивает пополнение знаний в ТД&З. Для этого используются следующие множества клаузул (правил):
- множество клаузул темпоральных отношений между событиями типа:точка-точка, точка-интервал, то ча-(не)регуг.ярна?._цгпь—точек, точка-(не)рцгулярноя—цепь-интгрвалов, интервал-интервал, интер&ал-(не)регулярная—цепь-точек, интервал-(не)регулярная_ цепь—интервалов, (не)регулярная—цепь~точек-(не)регулярная—цепь-точек, (нерегулярная—цепь—точек-(не)регулчрная-цег.ь.-ннтервалсв, (не)регулярная-цепь—интервалов-(не)регулярная-цепь—интервалов,
- множество клаузул модальных темпоральных отношений для всех упомянутых типов событий;
множество клаузул 'обеспечивающих размещение данной переменной (события) на абсолютной «шкале времени.
5.Темпоральная Динамическая База Знаний. Ваза знаний в Турбо-Прологе представляется ь виде множества фактов. Факты могут быть двух видов. Одни содержат информацию о типах переменных и фиксируют их конкретные значения. Другие определяют отношения между этими событиями. Зсе предикаты, которые используются при построении БЗ, должны быть декларированы в модуле - global database. Турбо-Пролог обладает набором стандартных предикатов
- взаимодействия с ТДБЗ.
¿.Модуль управления. Ему соответствует предикат-процедура STEROWANIE. Модуль реализует решение следующих задач:
- определение очередности активизации клаузул;
- назначение активных входных и выходных устройств;
- управление диалогом с пользователем.
7.Модуль диалога с пользователем. Диалог программы с пользователем, может происходить двумя способами:
а) Если существует возможность запуска программы в среде Турбо-Пролога, то пользователь все вопросы к ТДБЗ, может писать в окне лиалога {ОгАЮО)(ояределя-ть свои цепи).
б) В программе активизируются предикаты MENU и DIALOG, которые обеспечивают диалог с пользователем. Ему предлагаются стандартные группы запросов к ТДБЗ, на которые программа способна дать ответ. Поскольку имена переменных и отношений идентичны соответствующим словам используемым а ЕЯ, то пр> шагается использовать для диалога своего рода метаязык.
Начало работы .программы определяет предикат START.
Все модули можно соединить в один так называемый "проект". Файл, который его описывает, указан во всех частях программы, при помощи директивы PROJECT и имеет расширение PRJ.
В заключении приведены основные результаты диссертационной работы, которые состоят в следующем:
1. Для русского и польского языков дан полный анализ всей временной лексики, морфологических и синтаксических характеристик, связанны», с элементами темпоральных ¿временных) структур лежащих в основе связных текстов на естестве..ном языке.
2. Проанализированы средства выражения временной модальности событий, относящихся к прошлому и будущему и предложены способы их выявления. .
3. Построена модель чре»лени для польского языка, которая пер яду с обычными средствами, используемыми во временных логиках, реализует и работу с модальностями событий. Дано полное описание логических средств временной модели.
4. Предложенная модель использована при построении программной системы, предназначенной для выделения во входных текстах на польском языке временной структуры, лежащей в их основе, и для пополнения этой временной структуры за счет логических средств, включенных в модель времени.
Публикацчи по теме диссертации: * •
I.Sikora Е. Zastosowanie mikrokomputerow w iMTE//Met. koH. II Miedzynarodowe Syrnpoijuin, Katowice, 4-6.tl).l?89.
2.Sikora E. Dialog г sksperiem a wiedza о relacjach w czetie I jrzcstizeni miedzy obiektami bary wiedzy//M»t. hoof. I Krejovn <onferencja Haukowo Wrotlaw126-^8.C6.1990.
-
Похожие работы
- Исследование и разработка моделей, методов и программных средств темпорального вывода в динамических интегрированных экспертных системах
- Методика обработки темпоральной реляционной базы данных в миварном пространстве
- Разработка и исследование методов и программных средств имитационного моделирования для построения динамических интегрированных экспертных систем
- Интеллектуальные модели и комплексы программ обработки темпоральной информации в базах данных геодиагностических систем на железнодорожном транспорте
- Нечетко-темпоральные модели структурного анализа и идентификации динамических процессов в слабо формализованных задачах принятия решений
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность