автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.12, диссертация на тему:Методы и средства предикатно-онтологического контроля семантики проектных задач и проектных решений
Автореферат диссертации по теме "Методы и средства предикатно-онтологического контроля семантики проектных задач и проектных решений"
004615496
На правах рукописи
ШАМШЕВ АЛЕКСЕЙ БОРИСОВИЧ
МЕТОДЫ И СРЕДСТВА ПРЕДИКАТНО-ОНТОЛОГИЧЕСКОГО КОНТРОЛЯ СЕМАНТИКИ ПРОЕКТНЫХ ЗАДАЧ И ПРОЕКТНЫХ РЕШЕНИЙ
Специальность: 05.13.12 -«Системы автоматизации проектирования (промышленность)»
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
-2 п£Н 2010
Ульяновск, 2010
004615496
Работа выполнена на кафедре «Вычислительная техника» Ульяновского государственного технического университета
Научный руководитель: доктор технических наук, профессор
СОСНИН Пётр Иванович
Официальные оппоненты: доктор технических наук, профессор
ЕГОРОВ Юрий Петрович; кандидат технических наук, профессор ПОХИЛЬКО Александр Фёдорович
Ведущая организация: ОАО «Ульяновское конструкторское бюро
приборостроения», г. Ульяновск.
Защита состоится 15 декабря 2010 г. в 12:00 на заседании диссертационного Совета Д212.277.01 при Ульяновском государственном техническом университете по адресу: 432027, г. Ульяновск, ул. Северный Венец, д. 32. ауд. 211.
С диссертацией можно ознакомиться в научной библиотеке Ульяновского государственного технического университета.
Автореферат разослан « а» ноября 2010 г.
Ученый секретарь диссертационного совета д.т.н., профессор
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Профессионально зрелые разработки сложных автоматизированных систем (АС) осуществляют в рамках специальных технологий, используя связную совокупность различных инженерий. В такой совокупности особое место занимают системная и программная инженерия, в рамках которых выделяют и, разумеется, применяют инженерию требований, инженерию безопасности и ряд других разновидностей инженерии, учитывающих специфику программных систем.
Отмеченный факт обусловлен тем, что за каждой инженерией стоит (подготовленный для его повторных использований) опыт «творческого применения научных знаний для приемлемого решения определённых практических задач». Заметим, что приемлемость решения определяется предварительно оговоренными или разумными расходами финансов, времени, материалов и/или других ресурсов.
Инженерные формы создания АС вводят в процессы их проектирования дисциплину, включающую в нормативную систему действий меры по предотвращению ошибок проектирования и действия по их выявлению и коррекции. К сожалению, практика разработок сложных АС регулярно демонстрирует, что проблема ошибок проектирования существует и является очень дорогостоящей, на что указывает чрезвычайно низкая степень успешности разработок АС, которые в зарубежной терминологии получили название «систем, интенсивно использующих программное обеспечение». Статистика последних 15ти лет констатирует безоговорочный успех разработок АС только на уровне 30-40%.
Известны и применяются различные подходы к решению проблемы ошибок проектирования, в число которых входят совершенствование технологий и их расширяющаяся автоматизация, формализация особо опасных действий, внедрение логических средств в проверки результатов проектирования.
Под особый контроль теоретиков и практиков попали ранние этапы разработок АС, особенно этап их концептуального проектирования, когда на естественно-профессиональном языке документируется эскизное представление АС, формулируются базовые постановки проектных задач и специфицируются требования, ошибки в которых чаще всего приводят к фатальным для АС последствиям.
Но, как уже выше сказано, успешность разработок АС низка, а значит, что-то очень важное в мерах, действиях и средствах предотвращения и/или выявления ошибок проектирования ещё не найдено, что и указывает на актуальность исследований и разработок, нацеленных на снижение негативных последствий, обусловленных проблемой ошибок проектирования.
В диссертационной работе исследуется возможность снижения количества ошибок проектирования в текстах постановок задач и формулировках проектных решений (по ходу разработок АС) за счёт оперативного контроля их семантики, переход к которой осуществляется по образцу машинного перевода на язык предикатов. Специфику перехода к семантике определяет сопоставление выделенных предикатов с онтологическим эталонами, которые формируются в
предикативном анализе текстовой информации и регистрируются в онтологии проекта.
В диссертационной работе роль области исследований возложена на меры, действия и средства предотвращения ошибок проектирования и/или их выявления и коррекции в концептуальном проектировании АС.
Направление исследований в диссертации связано с инструментально-технологическими методами и средствами, которые введены в процесс разработки АС специально для контроля семантики проектных задач и проектных решений.
Функции объекта исследований в диссертации выполняют методы и инструментально-технологические средства контроля семантики проектных задач и проектных решений, использующие тезаурусы и онтологии проектов.
Роль предмета исследований в диссертации возложена на методы и средства, в которых ошибки проектирования обнаруживаются в процессах предикативного анализа проектной текстовой информации, использующего оперативное сопоставление используемой семантики с онтологическими нормативами, зарегистрированными в текущем (на момент анализа) состоянии онтологии проекта АС.
Цель исследований. Снизить количество семантических ошибок в формулировках проектных задач и проектных решений на концептуальном этапе проектирования АС и, тем самым, повысить степень успешности разработок АС.
Задачи диссертационного исследования:
1. Выявить источники возможных семантических ошибок в объектах контроля семантики, причины их появления и меры по предотвращению ошибок, их выявлению и коррекции.
2. Исследовать и разработать средства извлечения объектов контроля из текстов постановок задач и проектных решений.
3. Исследовать и разработать механизмы построения предикатных моделей объектов контроля.
4. Создать систему прецедентов, обслуживающих процессы предикатно-онтологического контроля, и материализовать её в виде базы прецедентов.
5. Разработать предикатно-онтологический контроль в версии, допускающей комплексирование с инструментально-технологическими средствами разработки АС.
6. Создать методическое обеспечение комплекса средств, обеспечивающего предикатно-онтологический контроль семантики.
7. Провести испытания комплекса средств предикатно-онтологического контроля.
На научную новизну претендуют:
1. Метод предикатно-онтологического контроля постановок проектных задач и формулировок проектных решений, в основу которого положена проверка семантики вариантов употребления понятий на их соответствие нормативным значениям, зарегистрированным в онтологии проекта, что
способствует обнаружению и коррекции семантических ошибок, адекватному пониманию семантики задач и решений, а также вводит в процесс проектирования полезную управляющую составляющую.
2. Метод извлечения предикатов из проектной текстовой информации, в основу которого положены группирование лексем предложений (с возможностью редактирования состава групп проектировщиком) и их синтаксемный анализ, что приводит к визуальному разделению сложных предложений на простые и их автоматическому семантическому контролю, указывающему на ошибки, связанные с синтаксемной семантикой.
3. Псевдофизическая модель предложений текстов постановок задач и формулировок проектных решений, в которой оперативное назначение характеристик словам-псевдообъектам и их группирование производится автоматически с помощью морфологического анализатора, что существенно снижает требования к лингвистической компетенции проектировщиков в обработке текстовой проектной информации.
4. Библиотека моделей синтаксем для анализа семантической согласованности понятий в предикатах, извлеченных из постановок задач и формулировок проектных решений, каждая из моделей которой представляет соответствующую синтаксему в виде прецедента, что существенно повышает степень автоматизации синтаксемного анализа и контроля
Достоверность результатов диссертационной работы подтверждается полнотой и корректностью исходных посылок, логичностью рассуждений (использующих, в том числе, вопросно-ответную формализацию), а также опытной эксплуатацией разработанных средств.
Основные положения, выносимые на защиту, включают:
1. Метод предикатно-онтологического контроля постановок проектных задач и формулировок проектных решений, в основу которого положена проверка семантики вариантов употребления понятий на их соответствие нормативным значениям, зарегистрированным в онтологии проекта.
2. Псевдофизическая модель предложений текстов постановок задач и формулировок проектных решений, в которой оперативное назначение характеристик словам-псевдообъектам производится автоматически с помощью морфологического анализатора.
3. Метод извлечения предикатов из проектной текстовой информации, в основу которого положены псевдофизическое группирование лексем предложений (с возможное™ редактирования состава групп проектировщиком) и их синтаксемный анализ.
Практическая ценность. Разработаны набор базовых средств моделирующего комплекса WIQA.NET, обслуживающего проектирование сложных автоматизированных систем, а также комплекс средств, обеспечивающий реализацию предикатно-онтологического контроля семантики проектных задач и пороектных решений.
Реализация и внедрение результатов работы. Разработанные программные средства и комплекс методик их использования реализованы в рамках НИОКР, выполненной в ФНПЦ ОАО НПО «Марс».
Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на Международной конференции «Intelligent Systems 2009» (г.Дивноморск), на Международной научной конференции «Interactive Systems» (2007 и 2009 г.г.) (г. Ульяновск) и на школе-семинаре аспирантов и молодых ученых «Информатика, моделирование, автоматизация проектирования» ИМАП-2009 и ИМАП-2010 (г.Ульяновск).
Публикации. По материалам диссертационной работы опубликовано 24 печатных работы.
Структура и объём работы. Диссертационная работа состоит из введения, четырёх глав с выводами, заключения, библиографического списка использованной литературы (145 наименований), изложенных на 181 странице машинописного текста, а также 3-х приложений на 27 страницах. Диссертация содержит 54 рисунка и 9 таблиц.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ В первой главе диссертационной работы раскрываются вопросы, связанные с системной инженерией, жизненного АС, роль онтологии в жизненном цикле АС, обосновывается необходимость использования семантического контроля в жизненном цикле АС. Обосновывается необходимость учета коллективной деятельности во время реализации АС. Рассказывается из-за каких причин используется инженерия требований, о её стандартах. Упоминаются вопросы профессиональной зрелости программ, приводится обзор методик работы с требованиями.
Приведён обзор технологии RUP, которую часто называют мастер-методологией разработок АС, а также проведён анализ формальных языков спецификаций трех классов - алгебраические языки, моделе-ориентированные языки, специализированные языки (рис. 1). Приведены примеры языков каждого класса.
Г
Языки формальных спецификаций Алгебраическая семантика OBJ. LOTOS, LARCH. SDL. Estelle. AMN М.оцеле-ориентированная семантика Z. VDM, 8, Сети Петри, Языки исполнимых спецификаций
Estelle, Eiffel Графические языки спецификаций I DFD, ERD, STD, UML _
objPEANOis Г !
sort Nal. op 0;-» Na!, op s_ : Nat->Nat. Op_-_: Nat Nat-»Nat
¡root: W
efe" ' as rte í-:, „ . '
Рис. 1. Базовые языки спецификаций
Рассматриваются прецеденты, их роль и возможности использования во время концептуального проектирования.
Приводятся аргументы, доказывающие целесообразность контроля семантики (предложений) текстов (постановок проектных задач и принимаемых проектных решений) исходя из следующих положений:
1. Функцию базовой единицы, для которой необходимо проводить семантический контроль, целесообразно возложить на простое предложение, экземпляры которого будут извлекаться из текстов постановок проектных задач и проектных решений.
2. Контроль семантики текстовых единиц на рассогласования с онтологией проекта целесообразно совместить и согласовать с развитием онтологии проекта, используя наличие очередного рассогласования как причину развития или коррекции соответствующей составляющей онтологии.
Рассматривается место и роль простого предложения в проектировании АС, предложена его модель (рис. 2) с характеристиками, которые используются при создании АС (в числе важнейших характеристик выделены его истинность, время, модальности). Приводятся обоснования для связи контроля семантики ПП с анализом и проверкой его употребления (на соответствие реальности) проектировщиком. ^
Онтология
Система ценностей (Язык, речь,... , нормы, ...)
Корпоративная инструментально-технологическая
среда (КС",)
Рис. 2. Модель базового объекта контроля
Проведён вопросно-ответный анализ обобщённой постановки задачи с ответами на вопросы: как строится предикатная модель простого предложения, как проверяется предикатная модель простого предложения, кто осуществляет построения и проверки предикатной модели простого предложения, кто и как использует результаты проверок предикатной модели простого предложения, что конкретно в предикатно-онтологическом контроле способствует снижению
ошибок проектировщиков в концептуальном проектировании АС, какие «прецеденты» способны повысить степень автоматизации действий проектировщиков в предикатно-онтологическом контроле семантики, какова структура базы прецедентов (базы опыта) и как она материализована, как осуществляются доступ к прецедентам.
Во второй главе представлены семантические модели лингвистических объектов, предложенные и специфицированные для проведения предикатно-онтологического контроля в процессе автоматизированного перевода проектной текстовой информации на язык логики предикатов.
Раскрыты механизмы, которые используются для предикатной обработки входного потока предложений (рис. 3) из нормативных и рабочих документов, в результате которой выделяются и формируются предикатные представления простых предложений.
Рис. 3. Структура составляющих семантического контроля
Простое предложение выполняет функции базового объекта для предикатно-онтологического контроля. Для выделения таких объектов из проектной текстовой информации (нормативной и рабочей проектной документации) введены и используются средства псевдофизического представления предложений с позиций их лексемного состава.
Псевдофизика помогает распределить лексику сложных предложения на группы слов так, что за каждой группой стоит определённое простое предложение, в котором выделены подлежащее, сказуемое и дополнение (если оно есть), причём словоформы исходного текста сохраняются.
Для достижения такой цели на множестве лексем предложений введено «силовое взаимодействие», в состав которого включены аналоги сил тяготения, кулоновские силы, силы упругости и силы трения. В результате силового взаимодействия «лексемы-псевдообъекты» распределяются в специальной экранной области в группы (рис. 4).
Рис. 4. Псевдофизическая модель предложения
После «отключения» силового взаимодействия проектировщик, используя графическое редактирование, имеет возможность скорректировать автоматическое разбиение сложных предложений на группы. Константы «силовых псевдозаконов» подобраны так, чтобы исключить в динамике процессов колебательность. Более того, проектировщику открыты возможности экспериментирования с псевдообъектами и другими составляющими псевдофизической реальности.
Для того, чтобы проектировщик был освобождён от работ по переходу от исследуемого предложения к его псевдофизической модели разработан и используется морфологический анализатор, одной кз функции которого является определение и спецификация частей речи. Каждой лексеме (как псевдофизическому объекту с определённой «массой» и «зарядом») по результатам морфологического анализа предложения Пу приписываются «масса» и «заряд» в соответствии с нормативами, выбранными экспериментально. В псевдофизической модели используются силы кулона, трения, гравитации, связей (жесткости).
Обобщенная формула, которая описывает движение, для «псевдообъекта-слова» с номером] представлена ниже:
<(')= I
(л;(Г)-д:у(0) фй-*©).
(лвЬДО)
-МО -МО
л /&/)=
I, ест \еж%> 1-й и ]-й пенкой ест, сею, О, шзче
Использование таких уравнений в описании всех элементов системы псевдообъектов приводит к системе дифференциальных уравнений второго порядка, для решения которой используется метод Рунге-Кутта четвертого порядка.
Псевдофизические представления и преобразования, их контроль и коррекция подготавливают формирование общего результата работ с простым предложением в виде предиката, записанного в прологоподобной форме. Названные работы и их целевой результат определяют сущность метода извлечения предикатов, обобщённая схема которого имеет следующий вид:
1. Расположить слова на псевдофизической плоскости.
2. Провести морфологический анализ слов, получив морфологические характеристики и нормальную форму слова.
3. Найти связи между словами на основании результатов морфологического анализа.
4. Назначить псевдохарактеристики на основании результатов морфологического анализа
5. Определить типы синтаксем.
6. Провести уточнение типов синтаксем.
7. Провести псевдофизическое моделирование.
8. Каждое простое предложение выделить на свою закладку.
9. Предоставить возможность пользователю изменить результаты анализа.
10. В случае вмешательства пользователя проверить его корректировки.
11. Для каждого простого предложения:
11.1. Сформировать предикат;
11.2. Проверить предикат на основании морфологических, синтаксических и синтаксемных характеристик;
11.3. В случае обнаруженных ошибок:
11.3.1. Сформировать (}А единицу, которая описывает ошибку;
11.3.2. Вывести сообщение пользователю;
11.3.3. Если пользователь выбрал игнорирование ошибок, то сформировать предикат, иначе - перейти к пункту 9.
12. Сформировать выходные данные и передать их в рабочий словарь.
В схеме метода извлечения предикатов указано, что для автоматического контроля результатов извлечения простых предложений из проектной текстовой информации применяется их синтаксемный анализ. Образцы синтаксем, каждая из которых регистрирует семантико-синтаксическое правило русского языка, реализованы в прецедентной форме (рис. 5) и хранятся в специальном разделе библиотеки прецедентов.
Им Ключи Рейтинг
Рт
pQA
Во время предикатного анализа выявить сиитаксемы типа «Темпоратив» по совокупности морфологических характеристик слов и связей между ними в предложении.
(21. Каковы морфологические
характеристики слов?
А1. Список значений морфологических
характеристик слов ( плагин
«Морфологический анализ»).
(22. Сиитаксемы?
А2. Список синтаксем с их
характеристиками (8т1(< родительный >, <
от>, <педметвое>>); 5ш1(< родительный
>, <до>, <предметное>>);.....).
(33. Типы синтаксем? А. Темпоратив
Р>
РЕ\
Если встречается снптаксема в падеже <родительный> с предлогом <от>, имеющая категориальный класс <предметпое>, а после неё встречается снптаксема в падеже <родителы!Ый> с предлогом <до>, имеющая категориальный класс <предметное>, то полагается, что пепвая синтакссма имеет значение <темпооатнв>.
Q 4. Синтаксема Sml? А4. Значепие_1. Q 5. Снптаксема Sm2? А 5. Значенне_2. Q 6. Синтаксема Sml
var predicate = senLGetPagePredicate(pageIndex, false); if (predicate-SpiitCC. ')').Length < 2) {
return;
N 1
var tempPart = predicate.Split('(', ')')[1I;
if (tempPart.SpIU(Y).Length — 1) { tempPart»""; J else {
tempPart = tempPart.SpIit(V)]tJ;
i
var words = tempPart.SplitC '); for (int i = 0; i < sent-WordListwords-Count; i++) { var word = sent.YVordList.words[i|; if (word.Pagelndex != pagelndex) { continue;
)
if (word.Data.sint != ECHHTaKceMMa^HCTpH6yrHB) {
continue;
if(words.Contains(word.Text)== false) { word.Data.sint = Есинтаксема.Темпоратив;
}
i
Q6. if (значеиие_1 =(< родительный >, < от >, <педметное») & Значение_2 =(< родительный >, < до >, <предметное») then Sml:= < темпоратив >; А6. Sml:= <темпоратив>;
Рис. 5. Прецедентное представление синтаксемных эталонов
Раскрыты позитивы синтаксемного контроля, в число которых входят проверка связей между словами в предикате, проверка корректности связей с предлогами и проверка местоположения слов в предикате.
Так как каждый извлечённый предикат в предикатной обработке прошёл только предварительные семантико-синтаксические проверки, то необходим его контроль на соответствие семантике проекта. Для таких проверок в диссертации предложен и исследован семантический контроль на соответствие онтологии проекта (в текущем состоянии её содержания). Именно по этой причине (использование дополнительного контроля семантики предиката на соответствие онтологии) метод контроля был назван «предикатно-онтологическим».
В проверках предиката на соответствие онтологии осуществляется его сопоставление с «эталонным образцом», который включён в библиотеку «эталонов» проекта АС, то есть в онтологию проекта. Сравнение с эталонами широко используется в процедурах контроля, особенно в измерительной практике.
Для сопоставлений с онтологией в каждом проверяемом предикате выделяются варианты употребления понятий. Так, например, для предиката типа «свойство(объект)» в его записи
Сл,,Сл2)..., Сль Np(Сл',,Сл'2,..., Сл',, Nq), Сл",,Сл"2„.., Сл"5 присутствуют два варианта употрбления понятий
Varc(Np) = СльСлг,..., СльNp= W|,< W2,..., WK,NP Varc(Nq) = W„ W2,..., WK, Varc(Np), Nq, где Np и Nq - имена понятий, а элементы типа Сл] обозначает либо одно слово wif либо группу слов, одно из которых является главным (обозначим Wj), а остальные зависимыми (обозначим gn gi2... g™ ), то есть Сл, = Wi = gu gi2... gi„ Wj. Каждый из этих вариантов является списком слов, нормализованных с помощью морфологического анализатора и каждый из них должен пройти через сопоставление с нормативными списками, зарегистрированными в текущем состоянии онтологии проекта как нормативные употребления понятий Var"(Np) и VarH(Nq).
Проверки на соответствие онтологии, представляющие собой сравнения списков (рис. 6), начинаются с понятия о свойстве Np, после чего проверяется корректность употребления понятия Nq об объекте.
Рис. 6. Сопоставление варианта употребления понятия с онтологией проекта
Сопоставление не составляет труда и при его выполнении, в общем случае, формируются три промежуточных результата 8,ь а,и 6 ч2, где: 6чь - набор
свойств, названных только в ситуативном Var°(Np); <rq - общий для Varcp(Np) и VarH(Np) набор свойств; 8q2 - набор свойств, присутствующий только в нормативе VarH(Np). За положительную оценку соответствия онтологии отвечает состав (и содержание) списка общих признаков ар, который может быть скорректирован за счёт интерактивного визуального анализа списков 8q) и 8Р2- Каждый из них разбивается на 2 списка свойств на основании ответов на вопросы: действительно ли каждое из свойств, входящих в 8q] присутствует в ситуативном варианте Varc(Np) и действительно ли каждое из свойств, входящих в 8q2 отсутствует в Varc(Np)?
Приводятся положительные эффекты от каждого типа рассогласований:
• рассогласование 5+qi указывает на отсутствие в текущем состоянии онтологии O(t) подходящего варианта VarH(Np) употребления понятия Np,4to может соответствовать следующим ситуациям и реакциям на них: если это рассогласование оценивается как несущественное, то им можно пренебречь иначе следует либо модифицировать VarH(Np), если построение VarH(Np) ещё не завершено, либо создать новый нормативный вариант употребления понятия Nq;
• рассогласование S'qi позволяет исправить ситуативное употребление, исключив из него свойства, введенные в описание по ошибке;
• рассогласование S+qi подобно рассогласованию 8+qi, причём, если оно оценивается как несущественное, то им следует пренебречь, в противном случае следует создавать новый нормативный вариант;
• рассогласование 5"q2 подсказывает исполнителю предикации те свойства, которые по тем или иным причинам не были включены в исследуемое предложение (то есть 8"q2 способно выполнять функцию подсказки).
В третьей главе диссертации раскрыта общая алгоритмическая схема предикатно-онтологического контроля и приведены её детали. Для представления деталей используются методики и UML-диаграммы.
С помощью метода, реализация которого обеспечивает его использование в коллективной проектной деятельности, на каждом рабочем (клиентском) месте осуществляется обработка входного потока нормативной и рабочей текстовой проектной информации. В поток включается только существенная текстовая информация, базовыми единицами которой являются постановки проектных задач и формулировки проектных решений, создаваемые на концептуальном этапе проектирования АС.
Поток текстовых единиц может поступать из процесса проектирования, использующего любой инструментарий, например, из процессов, осуществляемых в инструментальной среде Rational Unified Process (RUP). Но для комплек-сирования разработанных средств со средой RUP необходимо создать автоматизированные буферные средства. В диссертационном исследовании в качестве источника оперативной текстовой информации использована инструментальная моделирующая среда WIQA.NET, обслуживающая концептуальное проектирование АС, в разработке которой автор принимал непосредственное участие. Алгоритмическая схема метода, адаптированная к среде WIQA.NET, имеет следующий вид:
1. Действия метода начинаются с выбора текстовой единицы (в разработанном комплексе из дерева задач инструментально-технологической среды \VIQA), семантика которой должна контролироваться.
2. Выбранный текст Т,- преобразуется в список предложений 8р({Пу}), каждому из которых приписывает второй индекс для последующей циклической обработки.
3. Если список 8р({П^}) не пуст, то из него выбирается первое в очереди (и исключается из очереди) предложение Пу для его семантического контроля, иначе Перейти к п. 4.
3.1. Для предложения Пу осуществляется его псевдофизическое моделирование, в результате которого формируется список 8р({П^}) простых предложений Пук.
3.2. Если список 8р({Пук}) не пуст, то из него выбирается первое в очереди предложение Пук для его семантического контроля, иначе Перейти к п. 3.1.
3.2.1. Для предложения Пук осуществляется его проверка на соответствие онтологии и формируется результат проверки ЩПук).
3.2.2. Если ЯСП^) указывает на соответствие онтологии, то Перейти к п. 3.2.6.
3.2.3. Если Я(Пук) указывает,на рассогласование с онтологией, но ошибки отсутствуют и рассогласование можно снять за счёт коррекции онтологии, то Перейти к п. 3.2.10.
3.2.4. Если 11(Пук) указывает на ошибки, то если Ошибки можно исправить, то Исправить ошибки и Перейти к п. 3.2.1 иначе Сформулировать вопросы об ошибках и Включить их в список вопросов 8р({<Зр}), а предложение Пук оставить в списке 8р({Пц1С}) и Перейти к п. 3.2
3.2.5. Если ЩПук) указывает на другие причины (непонимание, неполнота знаний, преждевременная предикация), которые препятствуют квалифицировать ЩП^) соответствующим онтологии, то Перейти к п. 3.2.9.
3.2.6. Провести для П^ синтаксемный анализ и зарегистрировать его результат ввАЩаО.
3.2.7. Если в Пук присутствуют индикаторы вероятностной модальности, то провести анализ вероятностной модальности и зарегистрировать его результат РА(пук)-
3.2.8. Если в П^ присутствуют индикаторы нечёткости (например качественный признак), то провести анализ нечёткости и зарегистрировать его результат РА(Пук).
3.2.9. Если результаты анализов 88А(Пук), РА(Пук) и РА(Пук) приводят к вопросам, то вопросы {С2Г} включить в список вопросов 8р({0р}), а предложение Пук оставить в списке 8п({Пцк}) и перейти к п. 3-2 иначе Предложение П^. исключить из списка 8р({Пук}) и Включить Р-(Пук) в «Рабочий словарь».
3.2.10. Включить ЩПук) в список 8р°({К.(Пук)}) заданий на коррекцию и развитие онтологии.
3.2.11. Проставить в списке 8р({Пук}) и Перейти к п. 3.2.
4. Включить элементы списка вопросов 8р({<Зр}) в дерево задач проекта.
5. Конец
В алгоритмической схеме отражено, что в процессе реализации метода предикатно-онтологического контроля формируются три информационных потока (рис. 7): поток вопросов 8р({(Зр}), лоток 8р°({К(Пук)}) заданий на коррекцию и развитие онтологии и поток предложений 8р({Пук}), подтвердивших свою коррекцию и направленных в статьи Рабочего словаря для сборки более сложных концептуальных конструктов.
¿¡Г, „ -CnHÇQK вопросов, QffiLiопределяющий Чй развитие проекта
Предиката ДЛЯ сборки у формул
«Задания« на; коррекцию и развитие ее гслогии проекта
QA протокол %
| , -- Онтология 1
/ . г \ Ь j Предикатно-
i контроль
База прецедентов 1 виртуальная закладка 1 | рабочего словаря |
Рис. 7. Информационные потоки
В четвёртой главе раскрываются вопросы реализации системы предикатно-онтологического контроля. Так же раскрываются вопросы общей архитектуры WIQA.NET возникающие из-за интеграции предикатно-онтологического контроля с ней. Приводятся результаты использования метода.
Разработанный комплекс LINA (Linguistic In Nominative Activity) включает в себя предикативный анализ, рабочий словарь, логический процессор, онтологию, базу опыта, системы агентов и другие модули WIQA.NET (рис. 8). Система агентов состоит из нескольких слоев — морфологического слоя, слоя контроля по морфологическим признакам, слоя нахождения связей между словами, слоя проверки вмешательства пользователя, слоя, отвечающего за определение типа синтаксем, слоя, контролирующего предложение на основании синтаксем-ных характеристик, слоя, контролирующего формирование предиката.
При взаимодействии между ними был согласован формат передаваемых данных. В силу особенностей реализации WIQA.NET они должны были иметь атрибут [Serializable], Относительная простота взаимодействия между модулями во время проведения предикатно-онтологического контроля объясняется сервис-ориентированной архитектурой WIQA.NET. Реализация взаимодействия между слоями агентов методом доски объявлений реализационно не представляет сложностей. Единственная проблема состояла в выборе универсального формата передаваемых данных. Однако в силу особенностей платформы .NET (в которой все является наследником типа object) в качестве формата был выбран тип object. Следует отметить, что за счет того, что в данных между агентами передается ссылка на сервер WIQA.NET, все агенты имеют общее информационное поле - базу данных на сервере. Благодаря развитой коммуникации между клиентами и серверами агенты могут взаимодействовать с пользователем.
WÍQÁ
. U NA
(Серверная часть)_ ^Сервер рабочего словаря^) [Сервер
онтологии
Сервер предикативного анаг
[Сервер 5flJ<--»^Сервер
Л
рабочий словарь j_^база опыта^
морфологический анализ
ч___
предикативыи анализ Логический процессор
Рис 8. Интеграция LINA с WTQA.NET
Каждый агент в соответствующем слое (за исключением морфологического агента) использует прецедент, который состоит из условия срабатывания, приоритета выполнения, действия и других элементов, необходимых для выполнения задачи. При выполнении этих действий используется динамическая компиляция.
Проведены экспериментальные исследования метода предикатно-онтологического контроля. В экспериментах были использованы два подхода, в одном из которых обнаружение ошибок проводилось на программах, разрабатываемых в рамках финансовых обязательств (5 программных комплексов общим объёмом около 361.000 строк программного кода). В другом подходе эксперименты проводились с группами студентов, выполнявших задания в рамках учебного процесса.
Один из результатов экспериментов представлен диаграммой на рис. 9, на котором показано распределение ошибок по их отношению к классам требований стандарта ИСО/МЕК Р 9126. На диаграмме использована следующая нумерация классов: 1.1 Пригодность; 1.2 Правильность; 1.3 Способность к взаимодействию; 1.4 Согласованность; 1.5 Защищенность; 2.1 Стабильность; 2.2 Устойчивость к ошибке; 2.3 Восстанавливаемость; 3.1 Понятность; 3.2 Обучаемость; 3.3 Простота использования; 4.1 Характер изменения во времени;
4.2 Характер изменения ресурсов; 5.1 Анализируемость; 5.2 Изменяемость; 5.3 Устойчивость; 5.4 Тестируемость; 6.1 Адаптируемость; 6.2 Простота внедрения;
6.3 Соответствие; 6.4 Взаимозаменяемость.
На диаграмме более темный цвет соответствует ошибкам, выявленным с помощью предикатно-онтологического контроля. Такие ошибки приведены в сравнении с ошибками, обнаруженными другими способами, использовавшимися разработчиками программ, а в случае эксперимента со студенческой группой - с той подгруппой, которая не применяла предлагаемый автором метод контроля._____ ____________________
40 5..........—---------------
1.1 1.2 1.3 1.4 1.5 2.1 2.2 2.3 3.1 3.2 3.3 4.1 4.2 5.1 5.2 5.3 5.4 6.1 6.2 6.3 6.4
Рис. 9. Классификация ощибок в экспериментах по их контролю Основные результаты работы
Подводя обобщающий итог диссертационному исследованию и практическим разработкам, реализованным на базе результатов исследований, можно утверждать следующее:
Цель исследований, направленная на снижение количества семантических ошибок в формулировках проектных задач и проектных решений на концептуальном этапе проектирования АС и, тем самым, на повышение степени успешности разработок АС достигнута.
Предложена, исследована и проверена совокупность новых моделей, на базе которых осуществляется анализ ближней надводной обстановки своего судна и оценка опасных сближений с использованием прогнозов развития событий. Получены новые научные результаты:
1. Метод предикатно-онтологического контроля постановок проектных задач и формулировок проектных решений, в основу которого положена проверка семантики вариантов употребления понятий на их соответствие нормативным значениям, зарегистрированным в онтологии проекта, что способствует обнаружению и коррекции семантических ошибок, адекватному пониманию семантики задач и решений, а также вводит в процесс проектирования полезную управляющую составляющую.
2. Метод извлечения предикатов из проектной текстовой информации, в основу которого положены группирование лексем предложений (с возможпо-стю редактирования состава групп проектировщиком) и их синтаксемный анализ, что приводит к визуальному разделению сложных предложений на простые и их автоматическому семантическому контролю, указывающему на ошибки, связанные с синтаксемной семаникой.
3. Псевдофизическая модель предложений текстов постановок задач и формулировок проектных решений, в которой оперативное назначение характеристик словам-псевдообъектам и их группирование производится автоматически с помощью морфологического анализатора, что существенно снижает требования к лингвистической компетенции проектировщиков.
4. Библиотека моделей синтаксем для анализа семантической согласованности понятий в предикатах, извлеченных из постановок задач и формулировок проектных решений, каждая из моделей которой представляет соответствующую синтаксему в виде прецедента, что существенно повышает степень автоматизации синтаксемного анализа и контроля.
Практическую ценность составляют.
Разработанный набор базовых средств моделирующего комплекса WI-QA.NET, обслуживающего проектирование сложных автоматизированных систем, а также комплекс UNA, обеспечивающий реализацию предикатно-онтологического контроля семантики проектных задач и проектных решений. ПУБЛИКАЦИИ
1. Соснин П.И. Шамшев А.Б. Комплекс средств контроля семантики проектных задач и проектных решений. Автоматизация процессов проектирования. № 3. 2010 г. ФНПЦ ОАО «НПО Марс» С. 55-62 (Статья по списку ВАК).
2. Шамшев А.Б. Морфологический анализатор на основе детерминированного ациклического автомата состояний. Актуальные задачи лингвистики, лингводидакти-ки и межкультурный коммуникации: сборник научных статей - Ульяновск, 2006. - С. 119-121.
3. Shamshev А.В. Specificity of question's detection and identification in design documents text. Interactive System and Technologies: the problems of human-computer interaction. - Collection of scientific papers. - Ulyanovsk: ULSTU, 2007. - C. 63-69.
4. Shamshev A.B. Means of detection and identification of questions in design text documents. Information Technologies: proceeding of Russian-german scientific conference devoted to 10-years cooperation of Ulyanovsk State Technical University and Darmstadt University of Applied Science. - Ulyanovsk. ULSTU. 2007, C. 118-121.
5. Шамшев А.Б. О подходах к автоматизированному извлечению вопросов из текстов проектной документации. Вестник ульяновского государственного технического университета, 2/2007, С. 40-43.
6. Shamshev А.В. Inquiring into requirements elicitation for software intensive system. Information Technologies: proceeding of Russian-german scientific conference devoted to 10-years cooperation of Ulyanovsk State Technical University and Darmstadt University of Applied Science. - Ulyanovsk. ULSTU. 2007, C. 67-72.
7. Шамшев А.Б. Препроцессорные средства в обработке вопросов текстов проектных документов. Информационные и интеллектуальные технологии. Труды международной конференции по логике, информатике, науковедению 17-18 мая 2007, том 2. Ульяновск 2007, С. 80-81.
8. Шамшев А.Б. Реинжениринг комплекса вопросно-ответных моделирующих средств. Информационные и интеллектуальные технологии. Труды международной конференции по логике, информатике, науковедению 17-18 мая 2007, том 2. Ульяновск 2007, С. 82-83.
9. Шамшев А.Б. Интеллектуализация процессов предикативной обработки проектной документации. Информационные технологии, Ульяновск, 2008, С. 138-143.
10. Шамшев А.Б. Использование элементов экспертных системы в лингвистическом процессоре. Информатика и вычислительная техника, Ульяновск, 2009, С. 251-255.
11. Шамшев А.Б. Средства обеспечения семиотической определенности в концептуальном проектировании автоматизированных систем. Информатика и вычислительная техника, Ульяновск, 2009, С. 256-260.
12. Соснин П.И. Шамшев А.Б. Предикатно-онтологический контроль семантики проектных задач и проектных решений. Труды конгресса по интеллектуальным системам и информационным технологиям «AIS-IT'09». Научное издание в 4х томах. - М. Физматлит, 2009, том 1. С. 214-221.
13. Шамшев А.Б. О применимости синтаксем во время предикативного анализа. Информатика, моделирование, автоматизация проектирования. Сборник научных трудов Российской школы-семинара аспирантов, студентов и молодых ученых ИМАП-2009, Ульяновск 2009, С. 250-255.
14. Шамшев А.Б. Работа с неопределенностями во времени. Информатика, моделирование, автоматизация проектирования. Сборник научных трудов Российской школы-семинара аспирантов, студентов и молодых ученых ИМАП-2009, Ульяновск
2009, С. 256-261.
15. Shamshev A.B. The methods of semiotic definiteness assurance in conceptual design of computer-bases systems. Interactive Systems and Technologies: the problems of human-computer interaction. Volume III - Collection of scientific papers- Ulyanovsk, 2009, C. 182-185.
16. Shamshev A.B. Expert models in the linguistic processor LINA. Interactive Systems and Technologies: the problems of human-computer interaction. Volume III - Collection of scientific papers- Ulyanovsk, 2009, C. 186-191.
17. Шамшев А.Б. Совершенствование механизмов формирования прецедентов оперативного доступа в режимах их оперативного исполнения. Всероссийская конференция с элементами научной школы для молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации». Сборник научных трудов. Том 2. Ульяновск 2009, С. 130-136.
18. Шамшев А.Б. Использование MANAGED EXTENSIBILITY FRAMEWORK при реализации агентного подхода. Информатика и вычислительная техника. Сборник научных трудов Российской конференции аспирантов, студентов и молодых ученых ИВТ-2010. Ульяновск, 2010, С. 539-541.
19. Шамшев А.Б. Псевдофизическое моделирование в предикатно-онтологическом контроле. Информатика и вычислительная техника. Сборник научных трудов Российской конференции аспирантов, студентов и молодых ученых ИВТ-
2010. Ульяновск, 2010, С. 542-548.
20. Шамшев А.Б. Вопросы предикатно-онтологического контроля. Информатика, моделирование, автоматизация проектирования. Сборник научных трудов Российской школы-семинара аспирантов, студентов и молодых ученых ИМАП-2010, Ульяновск 2010, С. 504-507.
21. Шамшев А.Б. Рассогласования предикатной модели с онтологией. Информатика, моделирование, автоматизация проектирования. Сборник научных трудов Российской школы-семинара аспирантов, студентов и молодых ученых ИМАП-2010, Ульяновск 2010, С 512-516.
ПЕРЕЧЕНЬ ПРИНЯТЫХ СОКРАЩЕНИЙ
АС Автоматизированная система РР План содержания
ГОСТ Государственный стандарт QA Question-Answer
КС Корпоративная инструментально- RUP Rational Unified Process
технологическая среда LINA Linguistic Into Nominative Activity
ПП Простое предложение WIQA.NET Working In Questions and Answers
АВТОРЕФЕРАТ
ШАМШЕВ АЛЕКСЕЙ БОРИСОВИЧ
методы и средства предикатно-онтологического контроля семантики проектных задач и проектных решений
Подписано в печать 11Л 1.2010. Формат 60x84/16. Усл. п. л. 1,17. Уч.-изд.л. 1,00. Тираж 100 экз. Заказ № 1207
Типография УлГТУ. 432027. Ульяновск, Сев. Венец, 32
Оглавление автор диссертации — кандидата технических наук Шамшев, Алексей Борисович
Введение.
Глава первая. КОРРЕКТНОСТЬ СЕМАНТИКИ ПРОЕКТНЫХ ЗАДАЧ И ПРОЕКТНЫХ РЕШЕНИЙ.
1.1. Место и роль семантики в проектировании автоматизированных систем.
1.2. Работы с семантикой проектных задач и проектных решений.
1.2.1.Задачи концептуального проектирования.
1.2.2. Настройка технологических задач на онтологию проекта АС.
1.3. Предикатно-онтологический контроль семантики.
1.3.1. Анализ опыта контроля семантики.
1.3.2. Базовые установки диссертационного исследования.
1.3.3. Механизмы повторного использования в контроле семантики.
1.4. Постановка задачи исследований и разработок.
1.4.1. Обобщённая постановка задачи.
1.4.2. Вопросно-ответный анализ.
1.4.3. Мотивационно-целевые установки задачи исследований.
Выводы по первой главе.
Глава вторая. ЛОГИКО-МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРЕДИКАТНО-ОНТОЛОГИЧЕСКОГО КОНТРОЛЯ.
2.1 .Подход к логико-математическому обеспечению.
2.2. Псевдофизика извлечения простых предложений из текстов.
2.3. Исходное формирование и нормализация предикатных моделей.
2.4.Модели в проверках на соответствие онтологии.
2.4.1. Деятельностный контекст проверок на соответствие онтологии.
2.4.2. Сопоставление вариантов употребления понятий.
2.4.3. Индикаторы развития онтологии.
2.4.4. Прерывания контроля на соответствие онтологии.
2.5. Модели синтаксемного анализа.
2.6. Семантика модальностей.
2.7. Анализ субъективных отношений.
2.7.1. Проблемы с пониманием, отсутствием или недостаточностью знаний.
2.7.2. Преждевременность предикации.
2.8. Контроль в управлении проектированием.
2.8.1. Обнаружение вопросов.
2.8.2. Идентификация и кодирование вопросов.
2.8.3. Обработка вопросов.
Выводы по второй главе.
Глава третья. МЕТОДОЛОГИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРЕДИКАТНО
ОНТОЛОГИЧЕСКОГО КОНТРОЛЯ.
3.1. Метод предикатно-онтологического контроля.
3.1.1. Теория метода.
3.1.2. Стратегия метода.
3.1.3. Тактика метода.
3.1.4. Детализации метода.
3.2 Методики предикатно-онтологического анализа.
3.2.1. Методика выбора предложения, которое проходит предикацию.
3.2.2. Методика синтаксемного анализа.
3.2.3. Pa6oT¿ с виртуальной закладкой рабочего словаря.
3.2.4 Методика развития (взаимодействия с) онтологией.
3.2.5. Обнаружение вероятностной модальности и нечёткости.
Выводы по третьей главе.
Глава четвертая. КОМПЛЕКС СРЕДСТВ ПРЕДИКАТНО-ОНТОЛОГИЧЕСКОГО КОНТРОЛЯ.
4.1. Архитектура, компоненты и механизмы комплекса LINA.
4.1.1. Архитектура.
4.1.2. Морфологический анализатор.
4.1.3. База опыта.
4.1.4. Некоторые вопросы реализации работы с семантикой модальностей.
4.2. Предикатно-онтологический контроль в разработке систем.
Выводы по четвертой главе.
Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Шамшев, Алексей Борисович
Актуальность работы. Профессионально зрелые разработки сложных автоматизированных систем (АС) осуществляют в рамках специальных технологий, используя связную совокупность различных инженерий. В такой совокупности особое место занимают системная и программная инженерия, в рамках которых выделяют и, разумеется, применяют инженерию требований, инженерию безопасности и ряд других разновидностей инженерии, учитывающих специфику программных систем.
Отмеченный факт обусловлен тем, что за каждой инженерией стоит (подготовленный для его повторных использований) опыт «творческого применения научных знаний для приемлемого решения определённых практических задач». Заметим, что приемлемость решения определяется предварительно оговоренными или разумными расходами финансов, времени, материалов и/или других ресурсов.
Инженерные формы создания АС вводят в процессы их проектирования дисциплину, включающую в нормативную систему действий меры по предотвращению ошибок проектирования и действия по их выявлению и коррекции. К сожалению, практика разработок сложных АС регулярно демонстрирует, что проблема ошибок проектирования существует и является очень дорогостоящей, на что указывает чрезвычайно низкая степень успешности разработок АС, которые в зарубежной терминологии получили название «систем, интенсивно использующих программное обеспечение». Статистика последних 15-ти лет констатирует безоговорочный успех разработок АС только на уровне 30-40%.
Известны и применяются различные подходы к решению проблемы ошибок проектирования, в число которых входят совершенствование технологий и их расширяющаяся автоматизация, формализация особо опасных действий, внедрение логических средств в проверки результатов проектирования.
Под особый контроль теоретиков и практиков попали ранние этапы разработок АС, особенно этап их концептуального проектирования, когда на естественно-профессиональном языке документируется эскизное представление АС, формулируются базовые постановки проектных задач и специфицируются требования, ошибки в которых чаще всего приводят к фатальным для АС последствиям.
Но, как уже сказано выше, успешность разработок АС низка, а значит что-то очень важное в мерах, действиях и средствах предотвращения и/или выявления ошибок проектирования ещё не найдено. Это и указывает на актуальность исследований и разработок, нацеленных на снижение негативных последствий, обусловленных проблемой ошибок проектирования.
В диссертационной работе исследуется возможность снижения количества ошибок проектирования в текстах постановок задач и формулировках проектных решений (по ходу разработок АС) за счёт оперативного контроля их семантики, переход к которой осуществляется по образцу машинного перевода на язык предикатов. Специфику перехода к семантике определяет сопоставление выделенных предикатов с онтологическим эталонами, которые формируются в предикативном анализе текстовой информации и регистрируются в онтологии проекта.
В диссертационной работе роль области исследований возложена на меры, действия и средства предотвращения ошибок проектирования и/или их выявления и коррекции в концептуальном проектировании АС.
Направление исследований в диссертации связано с инструментально-технологическими методами и средствами, которые введены в процесс разработки АС специально для контроля семантики проектных задач и проектных решений.
Функции объекта исследований в диссертации выполняют методы и инструментально-технологические средства контроля семантики проектных задач и проектных решений, использующие тезаурусы и онтологии проектов.
Роль предмета исследований в диссертации возложена на методы и средства, в которых ошибки проектирования обнаруживаются в процессах предикативного анализа проектной текстовой информации, использующего оперативное сопоставление используемой семантики с онтологическими нормативами, зарегистрированными в текущем (на момент анализа) состоянии онтологии проекта АС.
Целью исследований является снижение количества семантических ошибок в формулировках проектных задач и проектных решений на концептуальном этапе проектирования АС и, тем самым, повышение степени успешности разработок АС.
Сущность диссертационной работы связана с решением следующих научно-технических задач:
1. Выявить источники возможных семантических ошибок в объектах контроля семантики, причины их появления и меры по предотвращению ошибок, их выявлению и коррекции.
2. Исследовать и разработать средства извлечения объектов контроля из текстов постановок задач и проектных решений.
3. Исследовать и разработать механизмы построения предикатных моделей объектов контроля.
4. Создать систему прецедентов, обслуживающих процессы предикатно-онтологического контроля, и материализовать её в виде базы прецедентов.
5. Разработать предикатно-онтологический контроль в версии, допускающей комплексирование с инструментально-технологическими средствами разработки АС.
6. Создать методическое обеспечение комплекса средств, обеспечивающего предикатно-онтологический контроль семантики.
7. Провести испытания комплекса средств предикатно-онтологического контроля.
Научную новизну составляют:
1. Метод предикатно-онтологического контроля постановок проектных задач и формулировок проектных решений, в основу которого положена проверка семантики вариантов употребления понятий на их соответствие нормативным значениям, зарегистрированным в онтологии проекта, что способствует обнаружению и коррекции семантических ошибок, адекватному пониманию семантики задач и решений, а также вводит в процесс проектирования полезную управляющую составляющую.
2. Метод извлечения предикатов из проектной текстовой информации, в основу которого положены группирование лексем предложений (с возможностью редактирования состава групп проектировщиком) и их синтаксемный анализ, что приводит к визуальному разделению сложных предложений на простые и их автоматическому семантическому контролю, указывающему на ошибки, связанные с синтаксемной семантикой.
3. Псевдофизическая модель предложений текстов постановок задач и формулировок проектных решений, в которой оперативное назначение характеристик словам-псевдообъектам и их группирование производится автоматически с помощью морфологического анализатора, что существенно снижает требования к лингвистической компетенции проектировщиков в обработке текстовой проектной информации.
4. Библиотека моделей синтаксем для анализа семантики предикатов, извлеченных из постановок задач и формулировок проектных решений, каждая из моделей которой представляет соответствующую синтаксему в виде прецедента, что существенно повышает степень автоматизации синтаксемного анализа и контроля
Достоверность результатов диссертационной работы подтверждается полнотой и корректностью исходных посылок, логичностью рассуждений (использующих, в том числе, вопросно-ответную формализацию), а также опытной эксплуатацией разработанных средств.
Основные положения, выносимые на защиту, включают:
1. Метод предикатно-онтологического контроля постановок проектных задач и формулировок проектных решений, в основу которого положена проверка семантики вариантов употребления понятий на их соответствие нормативным значениям, зарегистрированным в онтологии проекта.
2. Псевдофизическая модель предложений текстов постановок задач и формулировок проектных решений, в которой оперативное назначение характеристик словам-псевдообъектам производится автоматически с помощью морфологического анализатора.
3. Метод извлечения предикатов из проектной текстовой информации, в основу которого положены псевдофизическое группирование лексем предложений (с возможностью редактирования состава групп проектировщиком) и их синтаксемный анализ.
Практическая ценность. Разработаны набор базовых средств моделирующего комплекса WIQA.NET, обслуживающего проектирование сложных автоматизированных систем, а также комплекс средств, обеспечивающий реализацию предикатно-онтологического контроля семантики проектных задач и проектных решений.
Реализация и внедрение результатов работы. Разработанные программные средства и комплекс методик их использования реализованы в рамках НИОКР, выполненной в ФНПЦ ОАО НПО «Марс».
В первой главе диссертационной работы раскрываются вопросы, связанные с системной инженерией, жизненного АС, роль онтологии в жизненном цикле АС, обосновывается необходимость использования семантического контроля в жизненном цикле АС. Обосновывается необходимость учета коллективной деятельности во время реализации АС. Показывается, по каким причинам используется инженерия требований, и её стандарты. Упоминаются вопросы профессиональной зрелости программ, приводится обзор методик работы с требованиями.
Во второй главе представлены модели, предложенные и специфицированные для проведения предикатно-онтологического контроля. Также представлены установки подхода:
1. Стратегически формализмы должны обслуживать автоматизированный (машинный) перевод с естественно-профессионального языка проекта Ьр на этот же язык Ьр, но с обязательным переходом через язык семантики.
2. Тактика действий по машинному переводу должна быть нацелена на формализмы, помогающие в обнаружении семантических ошибок.
3. Любые оперативные действия проектировщика, если они связаны с лингвистикой текстов, а также сложных и простых предложений, должны относиться к прецедентам, формальные «условия» каждого из которых легко понять и проверить, а формализованную «реакцию» -автоматизировано выполнить по заданной методике.
4. Формализмы, которые проектировщикам приходится использовать в их части автоматизированных действий, должны носить теоретико-множественный характер и/или относиться к логикам классов (акцентирующих внимание на объектах, их свойствах и отношениях между объектами).
5. Главным требованием к формализмам, которые вложены в компьютерную часть автоматизированных действий и могут быть скрыты от проектировщиков, является их полезность в оперативных действиях проектировщиков, в первую очередь, в действиях с визуальными представлениями.
В третьей главе диссертации раскрыты механизмы предикатно-онтологического контроля, приведены их детали. В основу метода положен автоматизированный (машинный) перевод с естественно-профессионального
Р Р языка проекта Ь на этот же язык Ь , но с обязательным переходом через язык семантики. Функции языка семантики возложены на язык предикатов. Процесс перевода осуществляется с помощью прецедентов. В реализацию метода предикатно-онтологического контроля входит псевдофизическое моделирование, проверка на соответствие онтологии, синтаксемный анализа, анализ модальностей, обнаружение, кодирование и обработка вопросов, база опыта, протокол.
В четвёртой главе раскрываются вопросы реализации системы предикатно-онтологического контроля. Так же раскрываются вопросы общей архитектуры \VIQA из-за интеграции предикатно-онтологического контроля с ней. Приводятся результаты использования метода.
В приложение к диссертационной работе вынесены библиотека синтаксем и библиотека прецедентов, использованных во время использования разработанного программного решения.
Заключение диссертация на тему "Методы и средства предикатно-онтологического контроля семантики проектных задач и проектных решений"
Выводы по четвертой главе
1. На рациональность реализации комплекса средств предикатно-онтологического контроля LINA существенное воздействие оказало использование паттернов (образцов) проектирования.
2. Реализацию комплекса LINA существенно упростило использование агентных механизмов (серверные и клиентские программные агенты) и прецедентов, представляющих лингвистические правила.
3. Эксперименты с методом предикатно-онтологического контроля подтвердили его результативность. Семантические ошибки обнаруживались даже в тех проектах, к которым уже были применены традиционные методы обнаружения ошибок.
ЗАКЛЮЧЕНИЕ
Подводя обобщающий итог диссертационному исследованию и практическим разработкам, реализованным на базе результатов исследований, можно утверждать следующее:
Цель исследований, направленная на снижение количества семантических ошибок в формулировках проектных задач и проектных решений на концептуальном этапе проектирования АС и, тем самым, повышение степени успешности разработок АС, достигнута.
Получены научные результаты:
1. Метод предикатно-онтологического контроля постановок . проектных задач и формулировок проектных решений, в основу которого положена проверка семантики вариантов употребления понятий на их соответствие нормативным значениям, зарегистрированным в онтологии проекта, что способствует обнаружению и коррекции семантических ошибок, адекватному пониманию семантики задач и решений, а также вводит в процесс проектирования полезную управляющую составляющую.
2. Метод извлечения предикатов из проектной текстовой информации, в основу которого положены группирование лексем предложений (с возможностью редактирования состава групп проектировщиком) и их синтаксемный анализ, что приводит к визуальному разделению сложных предложений на простые и их автоматическому семантическому контролю, указывающему на ошибки, связанные с синтаксемной семантикой.
3. Псевдофизическая модель предложений текстов постановок задач и формулировок проектных решений, в которой оперативное назначение характеристик словам-псевдообъектам и их группирование производится автоматически с помощью морфологического анализатора, что существенно снижает требования к лингвистической компетенции проектировщиков в обработке текстовой проектной информации.
4. Библиотека моделей синтаксем для анализа семантики предикатов, извлеченных из постановок задач и формулировок проектных решений, каждая из моделей которой представляет соответствующую синтаксему в виде прецедента, что существенно повышает степень автоматизации синтаксемного анализа и контроля
Практическую ценность работы составляет разработанный набор базовых средств моделирующего комплекса WIQA.NET, обслуживающего проектирование сложных автоматизированных систем, а также комплекс средств, обеспечивающий реализацию предикатно-онтологического контроля семантики проектных задач и проектных решений.
Библиография Шамшев, Алексей Борисович, диссертация по теме Системы автоматизации проектирования (по отраслям)
1. Соммервилл И., инженерия программного обеспечения. М. : Вильяме, 2002 623 с.
2. Липаев В.В., Программная инженерия. Методологические основы. М. : ТЕИС, 2006 606 с.
3. Девятков В.В., Системы искусственного интеллекта. Москва : Издательство МГТУ имени Н.Э.1. Баумана, 2001 -351 с.
4. Rational Unified Process. Электронный ресурс. — Режим доступа: http://www.rational.com/.
5. Бергстрём С., Роберг Л. Rational Unified Process Путь к успеху. Руководство по внедрению
6. RUP. Пер. с англ. М. Бином, 2004, 256 с.
7. Крачтен Ф. Введение в Rational Unified Process. M.: Вильяме, 2002, 240 с.
8. Кролл П., Крачтен Ф. Rational Unified Process это легко: Руководство по RUP для практиков.
9. Пер. с англ. М.: КУДИЦ-Образ, 2004 - 427 с.
10. Поллис Г., Огастин Л., Лоу К., Мадхар Дж. Разработка программных проектов на основе
11. Rational Unified Process (RUP). M.: Бином, 2005 - 256 с.
12. Clirzaszcz J., Jouannaud J.P. From OBJ to ML to Coq: Статья. Электронный ресурс.- Режимдоступа: http://ww\v.lix.polytechnique.fr/~jouannaud/articlcs/objmlcoq.pdf.
13. Telelogic Tau.: Официальный сайт. Электронный ресурс.— Режим доступа:vvww.telelogic/corp/products/
14. Budkovvski S., Deinbinski P., Diaz M. ISO standardized description technique ESTELLE.: Статья.
15. Электронный ресурс.- Режим доступа: ■http://www.cs.uga.edu/~kochut/Teaching/8060/presentations/papers/protocols.
16. IEEE Std 1233-1996, IEEE Guide for Developing of System Requirements Specifications.:
17. Официальный сайт. Электронный ресурс. Режим доступа: http://standards.ieee.org/. .
18. The B-Toolkit.: Сайт разработчика. Электронный ресурс. — Режим доступа: http://www.bcore.com/ONLINEDOC/BToolkit.html.
19. CZT проект: Официальный сайт. Электронный ресурс. — Режим доступа:http://czt.sourceforge.net/
20. Elementary-REAL.: Официальный сайт. Электронный ресурс. — Режим доступа:http://www.ict.nsc.ru/ru/sci/rep98/mnf.litml.
21. Paige R. An Overview of Eiffel.: Руководство. Электронный ресурс. Режим доступа:http://docs.happycoders.org/orgadoc/dev/eiffel/eiffel-overvievv.pdf.
22. SmartEiffel The GNU Eiffel Compiler, Tools and Libraries.: Официальный сайт. Электронныйресурс. Режим доступа: http://smarteiffel.loria.fr/.
23. Ануреев И.С. Язык спецификаций SIMPLE: Статья. Электронный ресурс. Режим доступа:http://www. ict.nsc.ru/vvs/Lyap2001/2201/.
24. Земцов H.A., Ступников С.А. Формальное моделирование спецификаций процессов длякомпозиционного проектирования потоков работ.: Статья. Электронный ресурс.-Режим доступа: http://synthesis.ipi.ac.ru/synthesis/publications.
25. Simon S, Sankar К. Foundations of Soft Case-Based Reasoning . 2004 274 c.
26. Джексон П. Введение в экспертные системы. M. : Вильяме, 2001 624 с.
27. Джарратано Д. Экспертные системы. Принципы разработки и программирование. М. :1. Вильяме, 2007 1152с.
28. Соснин П.И., Шамшев А.Б., Комплекс средств контроля семантики проектных задач ипроектных решений, б.м. : Автоматизация процессов проектирования. № 3(21). 2010 г. ФНПЦ ОАО «НПО Марс» с. 55-62.
29. Соснин П.И. Вопросно-ответное моделирование в разработке автоматизированных систем.
30. Ульяновск : изд-во УлГТУ, 2007 г.
31. Скобликова Е.С. Современный русский язык: Синтаксис сложного предложения
32. Теоретический курс). Изд-во СамГПИ Изд-во «Самарский университет», Самара, 1993 -226с. .
33. Волков Е.А. Численные методы: Учебное пособие. 4-е изд., стер. СПб.: Издательство «Лань»,2007.-256 с.
34. Лапчик, М.И. Рагулина, Хеннер Е.К.;Численные методы:. Учеб. Пособие дл етуд. Вузов/М.П.
35. Под ред. М.П. Лапчика. 2-е изд., стер. - М.: Издательский центр «Акажемия», 2005 - 384 с.
36. Вержбицкий В.М. Основы численных методов: Учебник для вузов. М.: Высш. шк., 2002. -840с.29
-
Похожие работы
- Исследование и разработка методов и средств предикативной обработки проектной документации САПР
- Исследование средств и методов продукционно-предикатного моделирования в процессах принятия решения
- Исследование свойств и методов продукционно-предикатного моделирования в процессах принятия решения
- Ускоренное символьно-предикатное моделирование организационно-технических систем предприятий
- Предикатно-матричные сети в задачах анализа и синтеза систем управления
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность