автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Продукционно-сетевой подход к моделированию смысла научно-технического текста
Автореферат диссертации по теме "Продукционно-сетевой подход к моделированию смысла научно-технического текста"
Ш1ШЦ1ШЙ ПОЛИТЕХНИЧЕСКИЙ ИНСТИШ
На правах руиопкея
ПОПЕСКУЛ Анатолий Никитович
М-
/
ПРОДУКЩЮШЮ-СЕТЕБОЙ подход К МОДЕЛИРОВАНИЯ СМЫСЛА НЛУ'ПЮ-ТБХИЙЧЗИКОГО ТЕИСТА
05.13.16 - ПрХШЗПОЕИО ЕЫЧИ0ЛИТ8ЛЫЮП юхяики, игзтсиаглчзокого моделирования и иагаь-ахглоских иотсдов в научных ¡'сслодованипх
АВТОРЕФЕРАТ
длоооргащш на сонскпнио ученой сгапоин докгора ¡готических наук
Вппнпда 1991
Работа выполнена в. Кишиневской политехнической института iui. С.Лазо
Од^ци&лыша оппоненты; доктор технических наук, профеооор
A.A.ВОЛКОВ
докгор технических наук, профессор А.А.ПАВЛОВ
. доктор технических наук, профессор М.Ф.БОВДАЕШКО
Ведущая организация - Ленинградский институт информатики
и автоцатизации АН СССР
8ащлта. диссертации состоиток и & " p с / у 19>Ч i; {О часов в аудитории 210 главного корпуса на заедании специализированного совета Д 068.3^.01 Винницкого пелитах-нического института (286021, Винница, Хмвлыгицноо aoccc,S'5).
С диссертацией иояно ознакомиться в библиотеке Винницкого политехнического иксгитута.
Автореферат разослан " " 1991 г.
Учений секретарь специализированного совета
Д 068.34.01 Г^У
кандидат технических- наук--v^
у' г
¿у-
в.в.колодный
ОБЩАЯ'ХАРАКТЕРИСТИКА ПРОБЛЕМЫ
S . •
Г. Акстальиооть проблени.. Ускорение научно-технического прогресса современного общества во многом опирается на стремительный рост ресурсов вычислительной техники, связанный о появлением персональных 334, суперкомпьютеров, а такав «ей-рсиоподобиой вычислительной техники. Эти революционные изменения в вичислигельной технике создают условия для решения одной sis центральных задач современной цивилизации, состоящая в компьвторпгацил интеллектуальной и гворчзской деятель-, «спти человека, з частности, з автоматизации функций ии^ор-пацпснпого сбесисчзния, сзпзанаых со сныслогой переработкой долоьых и н ау > j â c-ï о хин че с кп х токстов на естественной языке.
Проблемы сяоовреиопяого получения новых, полных и реле-г,глг;'1е< сбздошШ о научных достижениях, изобретениях, козых технологиях и прспзводатБонных процессах осложняются следую-n'.'.ïï'i йакгбрамп:
I) поя.ьлыглец огромных потоков публикаций по различны?! научкш областям; зигчявольныа увеличением объемов документации, поподьзгоцоЯ л производстве и управлении;
£) оэреыигеяьнка развргаоа Евадународных связей в ебце-сгя и вссйюдгяссяьэ прзодоленлл лпыковнх барьеров с аффек-ролоняеч пзг^фупвдиональной переработки ияоязыч-поИ на^оргация» вкяочакцой з себя но- только перевод научно- • тэг-аачоской яаюразуеы я iiosyueasaiam, но п рубрикацию, сн-попрогаяяо я pcf.sF:ïpoE4H!î5 sesesaj •
j) цзеогэрпанзааои .сасгеа автоматической порорабогга cokoïoso.1 аяфораацкк, 'слабо яояольсукзях пряшуым организация м <*УЯйДпспзрозсапя даекви псЕуссгвзпаого интеллекта, ос-ncrr^ryîeea пз яр:>,?,в2Эияозяи и ыапипуязроЕачии данными к гяагпямг. сб слоЗ прдкойюй обяасга;
-':) Hescarawrast испсяь-озагясм з спсзгу '''œScpuiriKChno-го sarca3 гсорэдрзкш: кгыкоэасшп з аранаадяоВ
а) ревлпзп'да гйгдг'Г'пгеусльтЕ: промер с-брабоиет яя-дня доезгаорпя ногсс зсггсзнесгсА
гэтаеаавазык* заюш я crçsea;
б) выбор универсальных методов моделирования не только языковых сущностей, но lause речевых процессов и явлений, воплощенных в вероятностной, структурно-коицуникашвног.:, социальном и других аспектах текста;
в), разработку иногофункциональной системы моделирования смысла текста (МОТ) универсального назначения или иначе -лингвистического автомата (ЛА), представляющего собой коьы-лекс специализированной или универсальной ЭШ совместно о лингвистической информационной базой и программным (специальный к сервисным) обеспеченней.
В качестве концептуальной основы теоретических исследований и методологических разработок в области азгоаамизации функций инфорыацкошюго обеспечения в настоящей работе прод-, лсгаотся продукционно-сетевой подход к IÍCT, основанный на эффективном поиске правил взаимодействия лингвистических сущностей и речевых явлений в ходе выражения средствами естественного языка (ЕЯ) заданного содержания, что позволкет учесть вциапорочислетше факторы.
Иелью диссортацчопноИ p«6os:i является реиекяе задачи эффективного моделирования смысла научно-технического кокоха на основе продукциглшо-сетового подхода к распознавании языковых сущностей, а ша:е речевых явлений и процессов.
Задачи исследования,, Для достижения цосхшшншои цедк необходимо решение следуюцих более частных задач:
1) разработка хоорахйче.ских основ продукционно-оомвого подхода к исдолкровацив лиигвисгкчеокйх структур и нвлегшП к процессе языкового выросшая содержания токсга;
2) исследование и разработка ново" иотодякп иоделирога-няя продукционно-сетевого авгомасе, обусиав-ШБаяцей, в оглл-чие от иовесшых, более полиса и точное прздсгаалспйа лингвистического обьекхц. пак сложной иногоуровзаБОй поякфуккцн-ональиой системы ИХ; ■
2) иоделарогакио паыкэвогс гаршшпаояя и квршшооиохоцы, a иаэ» рэчових процессов носаодуеыого семантического проох-ранства с поиоцью предикатных динамических сетей;
4) распознавание леисико-граииагичвоких, а также оинта-ксико-сзкангичзских и прагиатических структур ка основе под-я oh п нзпрокйворэчивой системы продукционных правил;
5) разработка продукционно-сетевой «одоли лингвистического знака и исследований процесса моделирования речевого analta в акта коммуникации;
6) практическая реализация теории я методов моделирования смысла тозссга при разработке систем своевременно!! и качественной переработки научно-технической информации.
Объектом исследования являются процессы взаимодействия различных уровней «одели сложного лингвистического знака, а такга эксплицитные и имплицитные языкобыо пиления.
Метода исследования основывались к а применении алгебры предпкатоз, автоцатно-липгвисзнческих моделей, построеиних па основа теории <|орналы:цх грамматик, теории множеств, тео-v;í.: вероятностей и матеиатической статистики, теории графов, зосряя систем искусственного интеллекта.
Научная новизна рабокг состоит в создании и проверке методологии продукгшснно-сстевого моделирования смысла текста, включающей:
- разрабстгу и теореткчвекоэ обоснование продукционно-сатезого подхода к моделирования лингвистических структур и явлений в прсцоссо распознавания содержания текста;
- разработку иотодлки уровневого моделирования продукционно-сотового ЛД з форма дескриптивной, дедизишгой я стдек-ууряо-^ун'кадсгнальгшй подели;
- разработку нзгодов моделирования процессов знакообра-аозаикя, распсзнззапкя и г-оспроизведони:? лингвистически
• сусшосзсбй, реповых процессов и концептуально-ралпторных стщз-fjp, a такзз ^уакциоиирозяизя продукционно-сетевого автомата (ПС-авзгснага) па оскозз полных а непротиворечивых наборез продуглиошне: правил и првдинрд'яых динамических сетей:
- принципы кссгрсония.яро,цукцкояио-свт8Еьа систем авго-азгачоояогз кодеяярегаз»! сазсла псучио-твзонгсеского текста.
азгерз состоя® а поотрсош:« и раздояш хе-оряя аодеязрозютя саысла узкеха; ггзтодаза уровневого пода-якреюяяя ПС-аг,успеха; ггегс-доз рзяеаия сетсадцдскйх и лкиг-зясяпееавх *лдаз ёо сеиогз золакх и нэпроч-авсрсчившс шбо-р«з адедекцдоших ирзгйя а яредзкагннх гшшачеозах сетей; прг.пцдпов построения лродугазкшо-сегзкгз: аяеюа иодвяяро-
вания смысла научно-технического текста.
Связь с государственными программами и НИР. Результаты, изложенные в диссертации, подучены в процессе исследований и разработок, осуществлявшее в соответствии с координационный планом научных исследований секции "Вычислительная техника" Научно-технического Совета Минвуза СССР на 1987-1990 гг. os 17.03.87 № 200 по теме 05.04.02: "Разработка комплекса программ семантической обработки и перевода о помощью ЭВМ технических текстов о английского нзыка", а также хоздоговорными НИР (№ ГР 78022693, fe ГР 01.83.0055579, fö ГР 01.85.092237, te ГР 01.89.0006541, Ш ГР 79008754).
Практическая ценность диссертационной работы. На основе теории и методов, предложенных и обоснованных в диссертационной работе, определены перспективные направления развитии систем моделирования смысла текста и приложения их в виде систем машинного перевода (МП), автоматического индексирования (АН) и автоматического реферирования (АР). Разработанный комплекс средств ÜCT, объединяющий ряд програышшх систем моделирования, позволяет повысить быстродействие а точность индексирования и перевода текстов, уменьшить время поиска необходимых сведений, а также увеличить производительность труда исследователей в различных областях науки и техники за счет обеспечения их своевременной и релевантной научно-технической информацией. Пакеты програшд продукционно-сетевого моделирования процессов знанообраэования, распознавания и воспроизведения лингвистических объектов и языковых процессов попользуются для проведения научных исследований в области языкознания.
Реализация результатов диссертационной работы. Результаты теоретических исследований были использованы при разработке методического, лингвистического и программного обеспечения системы автоматического индексирования научно-технических документов, комплекса автоматизированных снстси информационного обеспечения, фактографической автоматизированной информационно-поисковой.сийтекы, диалогового языка управленческого персонала, внедренных на предприятии п/я P-67IQ (гЛонингряд) и позволяющих увеличить в полтора раза скоросзъ индонсироватшп текстов и уменьиитъ а два и болоз раза громл
поиска документальных и фактографических сведений в базах данных. Фактический экономический эффект, подтвержденный актом о внедрении, составляет 100 тысяч рублей. •
Сформулированные теоретические положения и практические рекомендации испольэованы в учебном процессе Кишиневского политехнического института при постановке курсов "Программирование" и "Прикладная математика" для студентов специальности 22.01 - "Электронные вычислительные машины, комплексы, системы и сети", а также при обучении аспирантов и студентов иностранным языкам.
Апробация работы. Основные положения и результаты диссертационной работы представлены и одобрены на семинарах отдела прикладной лингвистики Ленинградского госпединститута им. Д.И.Герцена и на кафодре математической лингвистики филологического факультета Ленинградского госуниверситета, на научно-техническом Совете предприятия п/я Р-6710, а также на трох'международных семинарах по машинному переводу (Москва, 1975, 1979 и 1983 гг.), на международной .конференции "Теория и практика научно-технического перевода" (Москва, 1985), на 12 всесоюзных симпозиумах, конференциях и семинарах, в том число "Диалог "чоповак-ЭВМ." (Ленинград, 1982), "Интерактивные системы" (Сухуми, 19Р2), "Методы ц средства обработки сложной графической информации" (П Всесоюзная конференция, Горький, 1935), "Проблемы создания и развития общесистемных средств АСУ" (Кишинев, 1?8г(-), "Лингвистическое обеспечение автоматизированных систем управления п информационно-поисковых систам" (Тюмень, Махачкала, 1974), "Семантика естественных и искусственны^ языков э специализированных олстзмах" (Ленинград, 1979), "Систеш н средства интегрированной обработки информация" (Кишшов, 1981), "Автоматическая переработка текста методами пршсдадгЕой' ишгвнсянки" (Кишинев, 1571, 1977 гг.), "Иорзработка ¡гзпега котодаш! инженерной лингвистика" (Минск, 1982), "Симпозиумы по лингвистическим проблемам искусственного интеллекта" (Ленинград, 1982, 1934, 1988 гг.), а такго ряде республиканских и зональных форумов.
По 401Ш диссертаций опубликовано 70 научных работ, включая две монографии (одна в соавторстве, вышедшая в ФРГ), 35
- О -
статей (из них 21 - в центральных журналах), 6 отчетов НИР, одно авторское свидетельство СССР но изобретение, 26 тезисов докладов на международных, всесоюзных и республиканских конференциях и семинарах.
Объем и структура диссертации. Диссертации содерзнт 2Э7 страниц ¡основного текста, состоит из введения, шести глав, заключения, списка литературы и приложений, содержащих року-иенты о внедрении диссертационной работы к результаты работа систем МОТ.
Автор вырагает искреннюю благодарность заслуненноау до-ятелю науки РСФСР, д.фил.н., профессору ПИОТРОВСКОМУ Р.Г. а члену-корреспонденту АН CCPU, заслуженному дзятелб науки ССРМ, д.т.н., профоссору КЛИСТОРИНУ И.Ф. аа конструкгаваув критику результатов научных исследований, а также за поддэрг-"' ку, оказанную ими в процессе работы над формированием концепции продукционно-сетевого подхода.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТУ
Во введении обоснована актуальность теаы, с£орму<л'роБа-на цель работы и определен перечень пеиаемнх задач, указана их новизна, теоретическая и практическая ценность полученных рзшо.чпй и результатов, приведзны ссиошьгр защищазшё иодожо-ния. •* ,
В первой главе, посвященной анализу оущес-твующах пробкам, методов и средств моделирования смысла тексга, рассматриваются основные стратегии, применяешь в области построения систем МСТ, и прилокенин их в виде енотом ЯП, АН и АР. Показано, что дойс?:вуэдце системы LiCJ:
а) не основаны на едином теоретическом подходе к рэаа- ■ низ класса задач переработки неструктурированных данных;
б) но используют идеи полной незавзегшоо^ моделирования анализа признаков входного яэука и синтеза лингвистических структур выходного языка;
в) в процесса распознавания и воспроизведения языковых сущностей и рочэвых явлений не ословываюЕсп на четком разделении локопкс-грамматических, синтаксических, семинтичеоких и прогнатических уровней;
г) не учитывают условия многовариантности на всех уров-■з нях моделирования текста; ^
д) строятся в основном на индуктивной или итеративной идее.и основаны на предположении об иерархичности и избыточности информационных структур текста;-
е) основаны на размытом представлении декларативных и процедурных лингвистических знаний;
;¡0 эпизодически используют энциклопедические знания в процессе решения задп перераоотя1 текстовых данных.
Совершенствование полученных результатов требует испскь-зо~ания в новых системах более оптимальных приемов представления лингвистических и энциклопедических знаний (фактов я правил), управления последовательностью обработки этих знаний (управляющих структур). Требуется эффективный сетевой аппарат, позволявций моделировать болзо глубокие и неявно выраженные структуры, заложенные в ЕЯ.
Однако, попытка формализации ЕЯ с присущими ему многозначностью и подесермшшрозанноотыэ зго элементов наталкиваются на существующий менду естественными и искусственней языками спроделенный барьор отторжения. Источником этого барьера слунзт следующие известно противоречия, иначе называемые генетическими парадоксами ÜCT, которые возникают при попытка машинной интерпретации процессов обработки данных:
1) парадокс иозду нечеткостью ЕЯ и дзтерминпровакностъэ искусственного языка;
2) противоречия иеяду лингвистическими знаками, икеищи-ни нноЕзстзешшо к пачозкиа смысловые границы, и знаками ис-кусстзонных языков) имовдага зостко фиксированное значение (парадоко окзуаяизащш);
3) парадокс синхронии и диахрониипроявляющийся з тем, что за время формализации некоторого синхронного описания ЕЯ сам ЕЯ, как открытая система, продолжает диахропно развязаться;
k) -лроткворзчяя языка п идиолекта, то асть конфронтация ивдду коляокгакаа.и индивидуальнш владением языком.
В течение последнего десятилетия для ослабления этих парадоксов, а такае для мшзинкой интерпретаций интеллектуаль-нкх процессов обработ:-! коязно ¿нраненних (имплицитных) лингвистических яблонейприменялось так называемое воспроизводи-
цее инженерно-лингвистическое моделирование. Однако, по меро моделирования все более сложных процессов и объектов, вследствие чего приходится решать не только лингвистические задачи, но также математические и кибернетические вопросы, появляется необходимость использовать более мощный аппарат моделирования.
Такая же потребность возникает и в отношении новых методов построения многоцелевых систем ИСТ с последовательной и параллельной схемой функционирования, поскольку известные способы, в силу присущих им особенностей, пригодны для реализации лишь многофункциональных одноаспектных систем, не соответствующих понятию эффективного ЛА.
Построение ЛА, .направленного на ликвидацию или гначыто.«-, льное ослабление действий указанных парадоксов, на моделирование последовательных и параллельных процессов многоцелевое* систем переработки текста /13/, а также на моделирование сложных имитационных языковых явлений, возможно на основе продукционно-сетевого подхода. Лингвистический автомат такого вида назовем продукционно-сетевым автоматом.
Сущность продукционно-сетевого подхода состоит в:
а) соблюдении сформулированных ранее принципов построения ЛА, предполагающих создание уровневой, модульной и эволюционирующей системы МСТ, функционирующей в "аимракхпвпкГ* режиме /II/;
б) сочетании вероятностного подхода к моделированию смысла текста, распространяющегося на более протяаешшо дистанции текста /3, 5, б/, с детерминистским подходом, действующим на коротких участках текста /7, 10, 17/j
в) развитии новых принципов детерминистского моделирования языковых сущностей, .речевых явлений и процессов систем переработки текста с помощью предикатных динамических сетел, основанных на лингвистических и епциклопздичвских знаниях, представленных правилами продукций со сяоаниии сломами их управления".
ПС-автомат, построении.! на основе: а) баз данных и знаний, включающих сведения об отдельном фрагменте реальной действительности и лиигвистичеокую компетенцию; б) логического блока, использующе-о данные и знания для реализации о nor лцью логических выводов различных заключений; в) последо-
нательного интерфейса," обеспечивающего ыеханизы комфортного взаимодействия с внешней оредой, - позволяет на интеллектуальном уровне моделировать смысл научно-технического текста. •
ПС-автоиат использует в качества данных лингвистические объекты (ЛО) жесткой и плавающей структуры, а также объекты с адресноГх и иерархической структурой. В качестве наиболее эффективных моделей представления знаний о языке и речи ис-'пользуются продукционные правила.
Формат правила продукции имеет вид: 'антецедент—*-кон-соквент».
Антецедент представляет собой сложную коиъюнктивно-дизмакгивную формулу, компонентами которой являются лекси-ко-гражатическяе, синтаксические, семантические и прагматические предикаты. Ко всей антецедентной части правила, а ташке к каядой ого компоненте подключены критерии их приме- ' шшсстк, и, в случае истинности их значений, распознаются ЛО и речевые явления моделируемого текста.
Консекзентная часть представляет со.бой логическое внра-аезша, вклвчаздее в качестве логически: езязок конъюнкция и отрицания, а тают з качестве компонент - предикаты.
Для установлении истинности этих предикато'в выполняются такие преобразования текста, как
1) раздел ели о сло^шгх предложений на простые с ио.'/огцп споцкатих разделителей;
2) включение выделенных язнковнх.стру^гур в распознании ясксико-грашгаспчоскиэ, синтаксические. со-гоатичоскио и 'прагматические классы; .
3} установление различных типоз сяязой (сиагаксичоских, семантических к т.п.-) пе-гду ог.с знанием язкковыыи структурами;
4) поиск и гыделе:-шо в сдулао гранеялцпй предложений 2НХ0ДНЫХ зквизаясясоз Н-З.д. •
• ; Эти преобразования представляаг собой последователгнозть дойстшй единого процесса моделированпл синсла текста.
•• Каядоо продукциопнео правило ПС-автоцата формально представляется в виде предикатной динамической сети1 \ состоящей
I) Питорсоп Дз. Тоория сотой Петри и моделирование систси . : Пер. о англ.41.: !1ир. 1285.-264 о.
из конечного множества позиций антецедента и консоквента, конечного множества переходов от посылок к заключениям, множеств цветов ЛО, функционирующих в сети, функции иаркировк», определяющей количество объектов во входных и выходных позициях, а такжо входных и выходных функций, задающих для перехода множество позиций антецедента и консоквента.
Во второй глава, посвященной развитию-ЛА и формальному описанию его лингвистических процедур, предлагается новая уровневая методика моделирования ПС-автомата /II, 26, 36/.
ПС-автоматы, воплощающие в себе решение ыногочислашшх проблем вычислительной техники, обработки данных и искусственного интеллекта, относятся к классу сложных енотом. Для таких систем более полное и точное отражение основных О свойств их функциональных характеристик может быть достигнуто применением шшгоаопектного способа описания. Многоаспектное моделирование ПС-автомата позволяет.представить объект в виде семейства моделей, каждая иа которых наиболее полно списывает оригинал в соответствип са свока характерный набором компонент, связей и принципов поведения. В работе предлагаются три формы моделирования ЛА: дескриптивная, децизивная и о®1уктурно-функциональная модели.
Дескриптивная модель ЛА задается посредством четырех иерархически организованных уровней - подиодолей. Таюш образом, .описание ПС-автомата в.виде дескриптивной модели есть описание его на основе теории и методологии языкознания (вербальная подмодель), иатеаатики (катсшатичоская подмодель), информатики (подиодель данных), электроники ц 2ичисии1*бльпой• техники (физическая подмодель). Ззо значит, что одна к та ео система описаваое о помешьа различав агконов ц принципов» . отлпчающихоя наэду собой жбрашшы критераса цодедцровашш, и детально ою^рааает сосгввтствувдий воп8К£ обьекга исследования. При втои сущаотвует обратная зависимость в отвошз-нии дзтаякзьиик описаний н стенопы вксплицигясегл каадой из подисдалей, оаредеяяеиоя использованной оео£20£«5.вуюЕ;его языка моделирования.
Доцививная цодоль ПС-автомата обусловлена .1Г0 функционированием в условиях недетериинированкости, присущей речевой деятельности. В С1»1у згого ЛА можно рассматривать как
лчогоуровновую ксрархическуп систему принятия решений, которая с!'ро*1Тз>1 ли аналогии с системами управления. Тогда дияи-аиЕнал модель ЛА представляется иерархией следующих уровней: самоорганизации (выбора стратегия решений), адаптации я реальным текстам (обучения в процессе распознавания текстов), выбора способа действий.
Уровень самоорганизации (верхний) выбираем структуру, ¿уптецш: ¡1 стратегии ^мотоды), '¡тсби достичь реденим глобальней зздачя. Назн-лчоя'-е уровня адептацка состой? в сужении мнозестза неопределенностей, зозиакаших ка уровне выбора способа действий.
В работе представлена дэксипозиция процессов прини'ия рог-жзя лингвяоюпвекам автоматом, дозволяющая точнее оценить н распределите решаемо ЛЛ задачи между 'гункциональны-■т злзментоми.
Сгру ктурно-^ияуюнальиая модель, отразавцая третий аспект скисания ПС-автомата, представляет собой обязатзльнуп для проектируемого объекта систему взаимосвязей его коилз-цент. Согласно этой модели ПС-автомат представляется хсак трехуровневая иор.^рхичзская ц-унхциопалзная оисхсаа, построение,н з виде ззеимодействующих ¿юдсястем МП, АН, АР и т.п. Каадая яг яодсистеч на киянок уровне иерархии состоят из . опр8Д(зл2кнсго набора <$уш\циоизльиых модулей (нор^одоглчсско-го, сянтаксичеспего и т.д.) анализа и синтеза (лексического, слнхаксичеспого и ■г.д.) текста. Указакина модули непосредственно сбрзбатывсаг исходный такст, распознавая в нем язи-кокдо явления, сущности а процессы. Подсистемам (модуршО на каддоа из урозноЯ -яродсставяяотся зог:?окзость самостоятельно праяттть роЕеняя. Если яодопвгеш (модули) аиавях урозпей ас негу» принята рей<»вяв жхл прашитемое репзкио являзгея гйодаогвзчааа, 5» раопологзякиа знво лодеиохюги передаются параметра дна яркая пш о:»нчамяьаого уесокия. При этом су-цзегвуег гасгай зреггаь управления; котором является челове-котказишш ::о.-с:!схе'т. пр':мат!Г? репзкяй.
Посколагу рсаешя, прашиаекыз пз ггазашх уровнях, могут и кз совпадать с репоакаиз, иоторуэ могла бы выбрать система на верхнем урс-зыо угразлеакя, з работе' определены условия яэордшшроганяого гзаииодейстг/я модулей и подсистем всох .
- ЗА -
уровней, решающих собственное множество задач с целью успешного решения глобальной задачи автомата для некоторого ограниченного подмножества текстов. При этом предполагается возможность преобразования глобальной задачи .в ее модификаций в случае отсутствия решения этой задачи для данного токста. Последнее необходимо, чтобы избенать тупиковых ситуаций и сохранить работоспособность ЛА.
Таким образом, представленная структурно-¿»ушщиональт ная модель ЛА почностыо отвечает ранео сформулированной ког-цепции ПС-автомата, поскольку допускает но только его последовательное развитие и совершенствование за счет модальной структуры, ио и обеспечивает параллелькуя обработку текота на основе продукциошю-сетезых модулей в соответствии с урэх^ нями его анализа - синтеза. Проектирование ПС-автомата осу-"' ществляется на основе всех трех рассмотренных выше моделей его многоаспектного описания.
В третьей главе рассмотрен сетевой подход к моделированию научно-технического текста.
Введено определение позиционно-переходной статической сети, формально представляемой конечными множествами позиций и переходов, а также входной и выходной функциями. Введены понятия простых позиций, позиций очередей и разрешавши:: позиций. Показано, что модифицируемые и оинтезируоыыа признаки лингвистических объектов формируются на ооново разрешающих процедур, вычисляющих состояние разрешающих позиций в период их активности,'задаваемых и контролируемых п р о ц о д ур а м и временной з а д е р ж к и. Разрешающие процэдурм ориентированы па установление истинности сложных логических выражений и компонуются из правил продукции: антецедентов и'консеквентов.
Вводится также определение предикатной динамической сети (Д-оети), состоящей из мнокества позиций, переходов и цветов, а такке входной, выходной функций и функции маркировки.
Введенные определения используются для построения непротиворечивого и полного базового набора элементарных ыикросе-тей (см. табл.1). В работе рассмотрены свойства базового набора никросетей, а таккг необходимые и достаточные условия
Таблица I
Базовый набор элементарных сетей
лп Название сети Условные обозначения • Графические обозначения
I Простая сеть
2 Сеть активизации -р,чл Рс + к-и
3 Сеть объединения //НЕкЛ- " ' (7) Рс-цг+2
4. Сеть приори -тотной выборки //Жк^
5 Сеть условного перо— влечения УСЛЛ Т«, V«, ..., У* У р.- Сху^-—
б Сеть вставки У,,Уг,...У«,Уг*0 и (ЖкЛ' . р«*+< «ч, ©—Р. Р<ЧК V**/
7 Сеть трансфера ТС^ЛЛ-,**, я X/ Оуг ^
срабатывания переходов ^ этих сетей. Предстаглш краткие характеристики введенного базового набора глемецзарных ссз&Ц,
1. В случае истинности разрешакдзй процедуры ^ (процедур Ц к , обозначенных ) переход срабатывает, и Ш'.кросеть типа 5 осуществляет копирование с возиожикип модификациями ЛО X из входной позиции Р^ в выходною Рс+1 .
2. Истинность процедур ¡у и и наличие объекта X в позиции Р^ является условием срабатывания перехода Ь\ сета Д , в результате чего в выходные позиции , , ...,
; перссыломтсп объект / я выявленные К классов аканий ^ из позиции .
Ъ. Сеть тина и. осуществляет в слу;ао истинности процедур и Х> , наличия объектов в позициях Рс , , А'*/«-»/ и срабатывания перехода £/ объединение объектов Х^ , Хг ' я едвный «акрообъект и перемещение его к пози-
цию Рим , Заметим, что в зегисииоотл от процедуры ¡у пойду объектами могут устанавливаться п-арные отношения (например, линейного порядка, синтаксические отиоигашт и т.п.).
В случае выполнение условий срабатывания соти V вычисляется состояние разрешающей позиции [у , которое приникает одно из значений нногества 2, ...,[(}, укаЕ^ваедзе на номер входной позиции р£ , ...» }, ие
которой перемещается ло (£-/ ,/() в выходную позиций Рс+к+г.
. 1 Г-. Ь шпсросохн I б случаи Ъшоянзшш ьозх условий 00 срабатывания определимся состояние позяцап $ , кояороз адвккатйо коиору выходной псаицаяа по которой иеремевдсгсй
ЛО из позиции р,: е 0д11,у из шчисдоинш: позиций р,^! , г'
6. Ооть типа I в случае оа срабатывания осуцоо^вллаг вставку нового сгенерированного 10 е т.ичпслв1щр позащш, рзенаяогэннуп до ;:йи после одного из 10 входных позиций, которая гшоте со сгодорвровдшю! сЗьгкхс-у кзроиетавьзя в ВЫходим» позиций , . » p£•^2k+i•
?. Рэзулыатои срабатывания пзрзхода ¿/ сети X является перевод лянгвистичас1а1х объектов Х< » ••« Хк- ка основе кингЕкотнчееках и знцккяопэднчоскнх зиакий 3? кз одного алфавита ь другой (ич одного состояния в другое) к пере аы; .<а их в соотватзтзувщие позиции Я1+к+г,
На основе базового набора сетей конструируются модифицированные сети, а такие предикатные Д-соти, необходимые для моделирования языковых сущностей, речевых явлений и процессов.
Б процессе моделирования смысла текста исследованы пра-зала изменения маркировок залх сетей и основные критерии функционирования микросзтей базового набора.
Оки вгапачиат;
- празила ниициироэаиия (возбуждения) и срабатывания (запуска) инициированных переходоз ;
- сгрукяуры (модаЁчцировекных или интегрированиях) -10, .азромоцаемих в выходпио позиции в случае срабатывания Ъ ;
- формулы изменения маркировок запускаемых переходоз
.1. ! • "</ '
- период активности предикатной Д-сета, построенной на основа базових кикросетей.
В работе продсхазлены определения построены поеледо-вахеаыкго и параллельные Д-соги (на рис.. I предотавлона параллельна» Д-сеть). Сети такого класса используются для мо-дзгарлзаниа' распознавания и воспроизведения лингвистических обьакхов.
В результата провеянных исследований выведены олодую-г»чз основные дринцяпн моделирования.
1. Оснозиьм хяшокентом рассматриваемого класса сотей шляется _базо^>± набор элементарных сетей типов <5 , А , 0., }/„ У, ] а Т а их модификаций.
2. Входная позиция Р1 содержа /У ЛО, подготовленных для моделирозощш»« а позиция Д, ~ Ц объектов, являющихся сосгсшаши ка-еюненто-'ш лингвистических а энциклопедических
3. ЛО, паргсылаэмнй з позицию Рг , книциируех переходы 4, „ , ассоциированные, например, с процедурен рефэрирозанчя» индексирования, синтаксического анализа гзягга»- свааигячзсйо'й обрабокм лингвястичсских структур, етк'теза текста н т.д. Соохззхсгвуззщиэ разргпаэдив позиции /г » Г* г •*•* 2опло?»вх разрезающие функции, о помощью которых гкхивизкруазся и пересылавхся из Ро лингвистические и 'эшдеклопедичэскив знания, необходимые для решения
Параллельная Д-сеть распознавания и воспроизведения ДО
- 19 -
соответствующих задач" моделирования смысла ¡текста.
Д-сети о мпкропореходами , , 2 моде-
лируют лингвистические обьекти в рамках рассматриваемых за- • дач переработки текста.. Входные позиции P¡ , Ps , ..., Pn-z, f¿ , fs , ...» fn-z содержат ЛО с лёксико-грамматичесюши, сиитаксическнни, семантическими и прагматическими значениями признаков, а также продукционные правила и управляющие структуры. Б результате срабатывания переходов ¿«, , ís , ..., ín-z в позшцш Р-* , Р6 , ..., Рл?-/ поресылаются ЛО, содер-зацие вместе с нх исходными атрибутами таксе и атрибуты, по-роядошше в процессо моделирования.
. 5. Элементарная сеть типа Q. (переход Ln-i ) на ochoeq правил разрокаюяей процедура fn-j анализирует ЛО позиций
j Pt- , а объединяет их общие компоненты з один
блок, а остальные - з другой блок. Таким образом, в позицию Л» паросЕГгаогсл распознанный и воспроизведенный лингвисти-пзоклй обгекг, воплсцащий в собо результаты моделирования асанярошгах вродикатнкх сетей. . .
5.-Исслэдуеная.предикатная Д-сзть моделируот распознавание' и порождение языковых сущностей и речевых явлений. Уотапавлонао сходства «езду воспроизведенными искусственными ЛО я реальншн ЛО осуществляется либо формально разрешающей процедурой потащи f'n (сета типа У)« экспертом. Если ыеаду сопоогазла&Н1:ыи обьоктааа согласно установленному приторна доотигауго сходство, то переход in срабатывает, а ЛО из Рц пзракегкеггея в Рг.-ц . Если степень сходстза между еаодоларазааа?.:д а реальным ЛО mza 'допустимой пороговой величины, so сzzh условного переклвчеикя У передает упрзвяе-ш;з гегзи о aottopoa- 2,а искусствошшй объект перемещается в погшеэ Ра • какому промежуточному ЛО приписываются значения вр"заокоз,'позволяющие актагизарола'ть дополнительные данные и вгоняя из • Ро »"которио на поолодупдах nars:i процесса моде-Езрэвапиа спосоо'стзуат увеличения точности и полноты содер-ншиш воспроизводимых языковых сущностей и речевых явлений.
В работе исояодозапы попаговые схемы изменения маркаро-вок предикатной Д-сетп, нодеяаруюдей процесс перевода текстов с одного языка на другой. •
Рассмотрены такгз правила окраски ЛО в процессе моделирования. характеристик 'ЛО/..согласно мнонества цветов С =
={С1 , Ср_ » Сц\ • Эти исследования позволили выяветь сптаыалыше структуры лингвистических объектов, необходимые для решения задачи анализа и синтеза текста в условиях двуязычных ситуаций.
Большое вникание в работе уделено процедуре временной задеркки Т. Для всех шагов моделирования ЛО о помощью последовательных и параллельных предикатных Д-сетей выведена формулы временного периода возбуждения кандого из пароходов активной Д-сети.
С помощью выведенных формул инициирования ооущоотвляег-сп оптимальное управление процессами моделирования языковых сущностей и речевых явлений.
Четвертая глава посвящена продуктшцпо-сотсвому подходу' к семиотической модели лингвистического знака.
Проведан краткий анализ четырох базовых социогкческах теорий лингвистического знака: л сейчас, ко!; (Г.^рсге) к. лзну-Биотической (0. де Соссюр), теорзтико-ирагыаткчсской (Ч.С.-Пирс, Ч.Морис, Г.П.Нольшп;ов), иииецорно-прагкатич'лзкбй (Р.Г,Пиотровский, Б.А.Шингорова); вЗедепц необходимые определения и идеальные компоненты знака: означаемой (донорах', двекгнае, коинотат), означающее (имя), а тагле материальные компоненты: референт и сигнальный референт.
Анализ перечисленных базовых теорий вскрывает следующие их недостатки: '
1) одностороннее описание природы знака;
2) каадая из первых 1рэх теорий ькака сосредоточивает своо внимание лн";ъ на кг.коы-лкбо одном статусе знака (семиотическом, лингвистическом чли коммуййкалиспом) тмбо на про--водят границы аакду шиш; • "
5) знак продставляотаа в виде геоткей статической структуры, кз позволяема!! моделировать процесс знакообразовання окозпцх аиакоызс структур;
К) го веше рассмотренных кес-раях ног чзткого разделения между моделью знака и моделью знакообразования;
5) но до конца эксплицировано представление прагматика.
Рассмотренное недостатки устраняются на основе продук-ционно-сотевой модели знака, опирающейся на схему Пиотров-скоп , б основа которой неаат ооссврианский постулат, соглаз-
но которому знак рассматривается в качества двустороннего психнчоского единства о з н ч а е и ого, состоящего из денотата (с£>/;), десигната и коннотата (С*), и означающего (ииеии), соотнесенного о референтом (Г) и сигнальным референтом (5г).
Для этого вначале вводятся следующие понятия и обозначения: р = ] /(}, £■ = 1,11— ынолество референтов; ЛЯ = об- 0 ласть интерпретации; Д3!^;)- миопеотло сигнальных референтов; Л = №ц~ алфавит ЕП-Ж^^Щ^-Ш! » | СД*> -множество денотатов, десигнатов и коннотатов; (3 , Р - соответственно отправитель и получатель сообщения; - лингвистический знак; отноаеиия: /?1 - "отракаотся в"; - "семантизируется в"; - "воплощается в"; - "отношение сз»гаитизацик"; /?5 - "отношеикз денотативной коннотации"; /ч-5 _ "отношение дэсигнативиой коннотации"; - "связь мзггду отправителем сообщения б и идеальными образами знака"; Р-3 - "связь ыеяду идеальными образами знага и получателем сообщения Р "; - "отношение ¡¿езду О и Р ".
Затеи строится Д-сеть, моделирующая в акте коммуникации знак и осиоЕЫЕавзе.ясп на определении знака как двусторонней сущности, состоящей из означаемого (декотата-десигна*а-кон-нотата» психического образа референта) и означающего (имени, т.зг психического образа сигнала). Означаемые представляются з виде области интзрпретащш, а означающие рассматриваются как некоторый алфавит; введены гакно множества референтов и сигнальных референтов.'
Разработанная Д-сеть состоит из элементарных сетей типа О и Й . Проведенный опэлиз Д-сети,"включенной ь ант коммуникации, позволяем на-начальной этапе 'Исследования смоделировать:
- функцию отражения или рецепторную функцию;
- оемиозис;
- отпоаения отражения, семанти оции и воплощения;
- узуальные и окказиональные связи иечду идеальными объектами;
- асимметрию,знака (синонимию и омонимию (многознач- . ность));
- схемы конструирования узуальных и окказиональных знаков, а также любые лингвистические структуры, гюдгммгуакые ь
процессе первичного семиозиса.
Представление и исследование Д-оети позволяет ввести следукцсе определение предикатной динамической модели знака *
Определение. Динамическая сеть, иоделирукцая речевой зиа:: в акта коммуникации (рис.2), прадставша взстеркой '
д - (р,т, г, о, м, о ,
где р-1Д- ,1°' | - ь'нокссгво позиций; Т~ (мнонество Ги переходов; } и О - соответственно входная и выходная функции; М = | .функция маркировки; множество цветов; ¿= 1~П = 1,б.
В работе прздлохсека и исследована дцнаиячзская сои. дл:: процесса анакообразования. В результат ее функционирования иаосново введенных понятий ¿¿,/г , , , оС; ,5)';,,
• С«» Q » Р ^ отноиешШ * Ко иодолкруехия киояося-во заадж зависимостей ролягорцр-поцптнШюго типа. Представим общий вид такой зависимости, зоплоцащеИ 'всо рассмотрея-иыо компоненты ¿1 устанавливахздой отношения ¡ленду отправителем и получателей сэобцеиип;
Х-{(А" я, Аг<5 с1н ДО
Г®/ /?е Г4 я, Р)г-(с<р.£ & с<*«• /?у /?*Р}} Я*
(о& а & а аягр{$0))ял Зн.Ш
При отсутствии 'у лингвистического знака тех или щда сжсг-иий моделируются знаковые заш:симос2и, представдкздг.а саСо'1 ^ частные случаи полученной формулы (I).
Моделируете и цсслздуеше соыаотемше ввакогао аэ£й-си^остк используктса далее для'построения полного п всяяозя-' ворочивого набора продукционна правил.
Б пг.той главе исследован продукционный подход к кокета-ровашш сшола научно-техничоскогл яскога.
Сиокона продукциояиых правил для иодспированаа сшгогз токсга определяется как сгориемьпгш сзштотичаскал сиахозд прав;;;: продукций и сароикок ка основа исчисления прздиказеов»
- исходные ая^ашы фораальаой свсгоиа (гершги операции); ' ' '. ■ - '•/« '' • .. - правила конструирования правильно-построенных формул ' (ПЙ-форггул); .-/•;.;.' . V."""' • •■
- систему аксиом исчисления предикатов;
- множество правил вывода.
Вводится основной класс U = {UltU2........J»
= / » S » Е » R } предикатов ПС-автомата, реализующих принадлежность предметных констант и переменных к следующим классам:
- лексико-грамматичоскоыу G- 3 z, J, ¡¡"cTj г, - синтаксическому S = {Sf,Sz, S£,...}
-семантическому £ a { Eir£i}..., i-S'j
- прагматическому /?7... / , ?<? Для основного класса U предикатов и свободной переменной W вводятся слетающие типы ПП-фораул, на основе которых строятся для моделирования языковых сущностей и речевых явлений правила продукций, представляющие собой правила вывода.
1. Формулы дизъюнктивно-конъюнктивного -ипа
V(*>) =» (6,(со)& ...8, Gxl")) v (Sj £r S€ (»)) V
Ер (<•>)) V( RK (Ы)) . (2)
2. Формулы КОНЪЮНКТИЕНО-ДИЗЪЮНКТИВНОГО типа UM - V... V (»)) Sr
(E,C»)V.r vR^o)). (3)
3. Формулы отрицания
а) для. = -? (GC)v 5(ео) VEV R(u))e
• . i6(o?)S-j S<a)Sl CO
б) для ~ U(<■>) =•-t C&M&SWä'
n G (io)VnS (") Ml ЕС») Rt0)- (5) Импликация формул.
Здесь, наприизр, для перемонных О) и , принадлежащих разным ЕЯ, рассматривают ПП-фэрмулы вида
ад V 5 С") V ЕМ у
коделируюцие языковые структуры в многоязычных ситуациях, пп-фюрмула £,' i«; v <?е V... v —-G"^) V ¿¿(vi) \/V моделирует такую языко-
вую суЕцНость, как омонимию (многозначность).
5) Еванторные ПП-фораулы. Рассматривается языкозэя сущность формул
1/й^ I/ . .. I/ и СО* , ..., ) и
зг сос.э и с
для подмножеств ¿«V, , , ..., переменных £1),, сог ,
(У,,, ИСТИННОСТЬ которых 383ИСИТ ТОЛЬКО ОТ свободных П8-ремонных, входящих в эти формулы.
На основа базового набора элементарных сетей типов 5 , 0, V , А « V• / » Т и их модификаций строится предикатная0 Д-сеть, воплощающая рассмотренные ПЛ-формулн и-моделирующая языковые сущности и рочовые процессы на примерах одно- и ■ многоязычиях словарей.
В результате исследования данной интегрированной сети выявляются:
- необходимые к достаточные условия срабатывания всех пароходов сети;
- динамика маркировка и раскраски ЛО Д-сзчл, появлнкэдаг ясп з процесса запуска переходов;
- структуры и принципы функционирования разрешавших функций входных разрешающих позиций; .
- структуры лингвистических объектов, моделируемые ка?:.11 дой из Ш-фориул, а такав-всей Д-сехьо, вклачаккциэ првдмвх-ныо константы (слова, словосочетания, устойчивые словосочетания), дязыснкхм, конъюнкты, а хакдэ слсдлые зчеказыканип, зопяоцавдчо Д!1Э31С'Ш:ТИБ:10-КС2!ЪЕИ:сТИВ1Шв (КОНЬКИКТЯВНО-ДИЗ!-
кштдошэ) форъ-укн предметных пснсгаят.
В работе иа осиозо рсссиогрзшшх элементов, ПП-фор-гул и акс:<оц внгадагш пкдукхивыш спссобо!! три полных и нопротпво-рочивцх класса р , Ф к У продукционных правил (правил еы-вода) для иодскароваюхя смысла «вкога».,
Отличие прав:'.?: перечисленных классов состоит в следующем;
■ч а) правила класса Г используют в процессе моделирования текста предикаты одного из видов класса и*1&, 5 ,/?} и значение одного из атрибутов ЛО (¿1, и>г , ..., н Ос, .,»,
г*
б) в класс <*/ включены правила, моде лиру одно т;»кст нп основе такзо правил одного из видов V а значен»;) З.С атрибутов ЛО СО.-, т.о. значений О)/, и)К .... (ОУ' :
лГ
в) класс т включает ира: ¡ла продукций, моделлрукицие
- - 26 -
текст иа осново двух и более предикатов класса и, а такке на основе двух и более значений атрибутов ¿-го ЛО.
Для примера рассмотрим антецедент правила типа Ра в общем виде:
М'Аь • ¿о-»о & •• . & 4е %>С —■. (7)
Оно включает опорный дизъюнкт и отстоявде от него справа компоненты-дизъюнкты, с(а, ..., с1с - предусловия соот-'■ и взтствующих дизъюнктов, а Во- консеквент.
Для моделирования лингвистических структур применяется правило Fí , представленное в виде
А7- Зн З'сЗ^% ...( * « ¿.</,<■ ... ьп )'. 3 ь>£ ЬСыо&ЗЬ, (и ;5 ">/, 2)(«>;
и в1У1ючающеа формулы:
-префиксные уоловая; - опорный дизълакт;
^. У^Л), С - плававдий дизьанкг;
<3-1~ (^ А* £ Л - префиксное условно.
Представим в об^м виде выведанный полный и непротиворечивый набор продукционных правил класса Т»
1. Если компоненты 31 с находятся справа от опорного ДГо 8 Ю '
2. Если компоненты слева от опорного
5. Если компоненты ^/.¿(»Ч^2»~»К) - слева от опорной цопочки комлонеак^ то
Л. Еслк существует о(йдай опорный компонентЛ" к конь-
шктивно-дязъюинздшшо формулы (), связанные дизъюнкцией 5 го ^
—(12)
5. Если существует обднй опорный компонент Ж* и конъ-юпктавяо-дизгюнкишше формулы А^ связанные дизъюнкцией (з А^ компоненты располагаются слева от спорного компонента), то
,7/>Г<, .'ЛГ, У^^Л/... \fd_y'Л ^)~ д5-
6. Введем обобщение правила (13), включив опорное выражение <3д •• Я" & с1< • Я? $ : •• 5 Ые: Ск'е
3 аозультата получим <3д •' & ... 8, с{е: 3{е о-
В*. (И)
7. В следующем правиле (15) первые I ( 1=0,1, коипояенз соответствуют правилу (9), а (Сн )-ый компонент .. огяаая логической связкой-отрицанием (-?): '
Од * ¿г : 3 ...Ы, : . (15)
О. Есян первые К компонент следующего правила соответп сэзукз правилу (10), а )~нй.компонент связан отрицанием (-»). го „
9. Воли'в правиле (17) первые €•*■ к компонент соответствует правилу (II), а {¡-С+к-И й компонент дополняется о от-рицаняок, го 6?А: Л*' <, & Ф ^-е ^г
а_кГК Х^о "Во. а?)
Продукциошше правила (18}-(20) являются расширением правил (12)-(14) путан добазлеЯип соответственно в и •¿а/Тт компонент о отрицанием.
" 10. аА — в» (18)
12. ЙД •* ^ '-¿Ч г- • 3 С>г :
КонсеяБвитшо части 6^ (1! ~ ) гнгэдеиных продукциок-аак правил представляют собой ?сокъвнкции предикатов, реали-
зуюцих действия, выполняемые при решении задач моделирования смысла текста.
Приведем примеры некоторых предикатов.
1. Предикат, реализующий генерацию, синтез, а такке вставку новых ЛО вместо, до или поело анализируемо:! цепочки объектов.
2. Предикат включения анализируемой или синтезируемой
г цепочки лингвистических объектов (структур) в классы С, 5 , Ей/?, который используется при организации синтаксических классов снятия различных видов омонимии, редекия вопросов многозначности и т.п.
3. Предикат установления синтаксических связзй ио:кду. различными видами сегментов (пленных, глагольных, предложных и т.п.). о
Б работе построены предикатные Д-сетп, моделирувдис продукционные правила представленных классов, ксследозаны свойства эти;, сстей к представлены алгоритмы моделирования эксплчцитных и имплицитных языковых выражений.
Прзддодено такяе множество реализаций продукционных правил классов Р , ф и -Г, применяемых для анализа и синтеза тнксха в задаче маишшого перевода.
Шестая глава посвящала моделированию смысла текста на основе понятийных (концептуальных) графов. На-начальном этапе генерации концептуального графа в тексте распознаются "Именные, глагольные, адвербиалышо. и другие группы понятий. В дальнойпем задача реааатся с„яокозьэ продукщкшо-сатового подхода. Затем строится и исследуется мноесство рслясоров, о помои;!-» которых конструируЕгся лонягийиыо графы, моделирув-цво лингвистические структуры.
В работе введена понятия к рассмотрены примеры концеп-, туальных графов, иляюстрарущих декартово произведение множеств концептов, бинарных отношений, определяемых справа и слева, однозначных слева и справа.
Предложено и исследовано конструирование концептуальных графов на основе такта.операций над роляторамя, как ^-соединенна, обгздчненио, переезчепие^ разность, симметричность, рефлексивность, траззкгивность и т.п.
Исследованы прэдаоаениыа автором следующие типы логико-
падеяных реляторов: АГЕНТ, ТЕМА, ИНСТРУМЕНТ, КАЧЕСТВО, ЦЕЛЬ, ИМПЛИКАЦИИ,,ДИЗЪЮНКЦИЯ, ШЬЮШЩИЯ, АТРИБУТ, РОД-ВИД, КОЛИЧЕСТВЕННАЯ ХАРАКТЕРИСТИКА, КАЧЕСТВЕННАЯ ХАРАКТЕРИСТИКА, ЧАСТЬ-ЦЕЛОЕ, ЗНАЧЕНИЕ, СПОСОБ и т.п.
На основе данных реляторов, а также с помощью распознанных классов понятий предложены схемы синтеза концептуальных графов, представляющих собой модели смысловых струк- ' тур текста.
Рассмотрим в качестве примера предложение: "Трансмиссия . - это устройство для передачи вращения от двигателя к потребителю энергии." и автоматически построенным концептуальный граф:
[ИП: "трансмиссия"]-—(е)-«-[НП: "устройство"]
(ЕСТЬ)
[ГП: ^"передавать"ЗгггШЮТР)—-[йП: "устройство"] (ТЕМА)
\ ' • [ 1
[ИП: "вращение"] [ИП: "двигатель"] [ИП: "потреби® ль
энергии"]
'ПРИЛОЖЕНИЯ. В прилогениях представлены акты внедрения результатов диссертационной работы на предприятии п/я Р-6710 Кг.Ленинград) и в учебном процессе Киииневского политехнического института. Предотавленн саняо фрагменгы результатов работы системы автоматического индексирования научно-технических документов, документальной и фактографической автоматизированных информационно-поисковых систем, системы машинного перевода и реализации продукционных правил.
ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ РАБОТЫ
I. Разработано и теоретически обоснована концепция продукционно-сетевого подхода к моделированию смысла научно-технического текста как конструктивная мера, позволяющая разрешть имеюцее место противоречие между современной потребностью п системах моделирования смысла текста и отсутствием достаточных ресурсов их ргализации.
Предложенная концепция продукционно-оотзвоз'о аптимш-а
основана на новых принципах моделирования лингвистических сущностей, явлений и процессов с помощью предикатных динамических сетей, использующих лингвистические и энциклопедические знания, представленные правилами продукций со слогнымп схемами управления. Построенная продукционно-сетевая теория позволяет достаточно адекватно моделировать ночетко-мнолест-венную по своей природе речевую деятельность человека, то '«сть систему языка, а также распознавать смысл текста как на ЭВМ фон-неймановской структуры, так и на цейрокоподобной (параллельной) вычислительной технике нових поколений.
2. Предложена аффективная методика многоаспектного моделирования ПС-автомата, реализованного с помочью: а) дескриптивной моделивоплощающей вербальную и математическую подмодели, подмодель данных и физическую подмодель; б) децп-вивной модели > которая выступает в виде аналога ко1шуиш:а-тивно-прагматического опоратора человеческого сознания, управляющего порождением и восприятием сообщения, эта модель включает три уровня: самоорганизации, адаптации к реаяглши текстам и выбора способа действий? в) структурно-функциональной модели, построенной ь виде взаЕкодеИствуицхх систем моделировании смысла текста.
3. Для ращения задач ¿'СТ разработан оптииалышй базовый набор элементарных сетей, включающий: простую-сеть, соен активизации, объединения, приоритетной выбора, условного не-
'реключеиия, вставки » трансфера; на основе базового набора . микросетой построены последовательнее к параллельные предикатные Д-сзтк, коделкрущна пзшговие сущности и рсчовпо явления; в результате ш: исследовш:'.!я выявлены: нразняа вгг- . бундиаия и срабатывания шшдинроигшинх переходов,'структура •ЛО, пвреиещаеаыо в вшеодашо иазпда* в случаз срабатывают » переходов; форауля вашшешзд иаркиравок закусиьэаиж порого-ДОВ, оценки. шгервилоз ншвдшроваккш; к
зспуск&зиых пароходов, а гакга периоды активности соей ¡¡рз-дккаткой Д-сстау построенной на осиовс багоьак кзкросетей; «юсдедошш озкозкш вранцзгш «здвлерозшш сшгзэд текста на осасвз предикатных Д-сетей, основанных.па свойствах и кркто-риях распознавания и воспроизведения ЛО базовый набором элементарных сетэй.
Л. Разработана продукционно-сетевая.теория лингвнегиче-
окого знака, воплощаюцая моделирование в акте коммуникации процесса знакообразования о помощью;Д-сети или маркированной и раскрапенной сети, представииой множеством позиций адекватных материальным компонентам знака: референту и сигнальному референту и идеальным: денотату, десигнату и коннотату, а также миоаестзом переходов, входными и выходными функциями, функцией маркировки и множеством цветов; в результате функционирования Д-соти смоделированы знаковые зависимости, представленные аналитически з виде понятийно-ре ля торных графов.
5. Моделирование языкоеых сущностей и речевых явлений осуществляется с помощью полных! и непротиворечивых классов продукционных правил на основа: а) лексико-грамматических, синтаксических, семантических и прагматических предикатов; с) дийъенктиено-конъюнктивных и коньюнктивно-дизьюнктивных формул, формул отрицания, импликации формул и кванторных формул; в) системы аксиом исчисления предикатов; г) исходных эаа:;.антоз» Разработанные классы правил продукций включают: правила с опорными компонентами и плавающими компонентами как слеза, так и справа от опорных компонент, опорные компоа центы о конйгнктявно-дазъюнктизнымц ц дизьвиктивно-коиъкнк-тивпыми формулами, а такие опорные компоненту с днзъкнктив-но-копайактишжт' (конзгтгацвцо-диашшаившш) фориуяаиа, зклгнапдгши •со'шонаптп, связанные логической связкой-отрнца-
6.- Продлоаеиа методика продукционно-сетевого моделирования анализа и синтеза текста, основывающаяся на принципах функц-юнпроззаия :|яеаягср'Л2Ш1чесиого" продукционно-сетевого автомата о недетершишроваанкм поведением, которая использована для ПСТ на основе концептуальных графов, воплощающих р?дяц:1санЬ-попя5ийи?/п коицвпциэ, и позволяет автоматически <&ро«гь бпзи дзняэрэьязймх оццакяопедачеояих знаний.
7. !!а езнэгэ разработанной методологии лиигветачоокого :• программного сбзспзчзп:*я посгрзелы система азтоиатичвсяого пп'апсироэйняя научиз-гехкич-зешзх документов, комплекс авю-.•аахдзарогавзкх систса ир'£ораацяскаого обеспечения, фактографическая автоматизированная н.тформационно-поиокезан о»юхсч?», гйвдрсняиэ на предприятии п/я Р-6710 (г.Ленинград) и позэо-лк5зм:э уваличигь в полтора ра^а скорость индексирирпния тек-
стов и уменьшить в два и более раза время поиска документальных и фактографических сведений в базах данных. Фактический экономический эффект от внедрения результатов работы составляет 100 тысяч рублей.
Разработана система машинного перевода на основе моделирования анализа и синтеза текста о помощью продукционных правил.
Сформулированные теоретические и практические рекомендации использованы в учебном процессе Кишиневского политехнического института при постановке курсов "Программирование" и "Прикладная математика", а также при обучении, аспирантов и студентов иностранным языкам. ,
По теме диссертации опубликовано 70 печатных работ.
Наиболее важными о точки зрения отракешш содержания диссертации являются следующие работы;
А. Ц О Н ОТ РАФИИ
1. Погескул А.Н. Автоматическое индексирование научно-технических текстов//Всосоюзный семинар по ЙЯ.. Вып.^Москва, 1972.-23 с.
2. Piotrcmski R.G., Popeskul Л.П., CbazlBskaja M.S., НасЬиЪа N.P. Autorsatische Wortschatzomlyze//Studlenverlag Dr. U.Broctooyer.-Boohua (ФРГ), 1985.-187 с. -
Б. СТАТЬИ
"3. Попескул ¿.И. Последовательный анализ при автоматической атрибуции токста//Частные вопросы автоматического анализа текста: Сб.науч.ст.-Шшск, 1972.-G.24-35.
4. Попескул А.Н. Редятори тезаурусноЙ сети и их свойства// Структурно-оемантачоокао ы прикладные исследования: Uos-вуа.сб.-Кишнев, 1990 .-С.125-133.
5. Попескул А.Н. Госакуле функция дал задач распознавания содэржания текота//Иоследования по прикладной и сиотеино-структурной лингвистике:Ыеавуа.сб.-Еииинез, 1980.-С.102-III. .
6. Попескул А.К., Трофимова Т.В. Алгоритм сопоставления статистических методов автоматического реферирования//Вопро» сы проектирования УолдАСНТИ:Сб.науч.тр.-Кишинев, 1976.-С.35-41.
7. Арзикулов X.t Пиотровский Р.Г., Лопескул А.Н., Хажияская М.С. Автоматизированная система тезаурусного аннотирования н/г докуцеита//Научно-тех1шиеокая информация, серия 2. -Москва, 1978,-К? I2.-C.I2-20.
0. Арзикулов X., Пиотровский P.P., Псяескул А.Н. и др. Автоматизированная система тезаурусного аннотирования научно-технического докуиента//Вояросы кибернетики. Статистика с рзчи а автоматический аналцз текста.-Bun.W.-Москва, Ленинград, I979.-C.II-30.
9. Аполлонская Т.А., Колибан В.В., Пиотровский Р.Г., Пояео-куд А.Н. Машинное реферирование фраизузских патентных до-йуконтов о помощью фраймов//Научно-техничесная информация, оерия 2.-Москва, 1983.-» 5.-С.23-29.
10. Apolloaakaya (P.A., Koliban V.V., Piotrowoki B.Q., Рорэа-cul А.Я. Ü я Iiis ^гатоз for Autocatic Abstracting c.f French. Pabonfca//Aatcaattc Eocimanbation and Mathematical Linguistics.-Vol.17.-II 5.-1983.-Рр.'Ю-53 (США).
11. Пиотровский P.P., Беляева Л.Н., Лопескул A.H., Шингарева S.A. Двуязычное аннотирование и реферирование//Итоги науки и техники, серия "Информатика", той 7.-Москва, 1983.-C.I65-2W.
12. Хают Б.Н., Николаев Т.Н., Попескуя А.Н. Реализация лингвистической база данных для задач иапгакого перевода иноязычных текстов средствами СУБД ИНЗС//Справка & 299 о де-
1 яонировшши рукописи. Библ.укаэ.: "Депонированные научные работы" te 9.-Москва, 1933.-25 с.
13. Попесь7Л А.Н., Прокуп A.B. Системы обработки текстов па базе параллельных процассоров/УНадешоеть я диагностика полупроводниковых приборов: Сб.иауч^тр.-Кишинев, I9ß'v.~ С.109-113.
I/t. Попескул А.Н., Тарасова Е.С., Хваинокап М.С. Некоторые вопросы разработки лингвистического оо'еснечания двуязычных (многоязычных) АИС//Теоретичйвкие и прикладные исследования по романским и герсанским языкаигМежвуз.сб.-Кишинев, 1985.-С Л29-137.
15. Понескул А.Н.,-Трофимова Т.В. Установление г-зксту^льных смысловых отношений монду понптнлми в фразо/УТшиттичао-' кио и прикладные исследования пс романским и i'f.рманским языкам:Мвжвуз.сб.-Кишинев, I985.-C Л37-ГА5.
16. Карча Л.Ц., Косгаш И.В., Попескул А.Н., Траур И.Т. Автоматическое индексирование неформализованной документации в АСУ//Модвлирование информационных систем:Сб.науч.тр.-Кишинев, 1986.-С.80-87.
17. Ыаякова Р.Н., Приходько Л.Ф., Николаев Г.И., Попескул А.Н., Гольдфарб Л.М. Система автоматического индексирования и поиска патентной информации по ходовым системам
r„t гусеничных тракторов//Экспресс-инфорыация. Серия 4. Эком номика и управление.-Выл.14.-Москва, I987.-8 о.
18. Павлова Л.С., Попескул А.Н. К вопросу о практическом решении задач семантики при автоматической переработка научно-технических документов (на материале английского языка)//Структурно-сеыантическио и прикладные исследования: Ыежвуз.сб.-Кишкнев, I99G.-C.I22-I25.
19. ВолоховВ.С., Попескул А.Н. Метод автоматического разбиения семантического пространства ва компактные области// Методы анчлиза текстов: Сб.иауч.ст.-Минск, I975.-C.I79-197.
20. Арзикулов X., Попескул А.Н. и др. Тозаурусное распознавание смысла французских научно-технических текстов// Вопросы лексикологии, лексикографии и прикладной лингвистики: Лингв.иослед.-Москва, 1976.-С.13-27.
21. Пиотровский Р.Г., Арзикулов X., Попескул А.Н. и др. Тер-мин-терминополо-терм1шосисгеиа//Структурнап н матеиати-
. . ческая лингвистика: Сб.науч.тр.-Вып.6.-Киев, 1978.-С.73- • 81.
22. Арзикулов X., Марашлец Б.Ф.у Попескул А.Н. О тезаурусном
■ моделировании терциносистош//Проблемы яексикологин, пек-сикографии и прикладное лгшгкютикп: Лингв.исслод.-Москва, I978.-C.3-9.
23. Попескул А.Н., Рахубо Н.П., Хаккпокак Ы.С. Диалоговая система тезаурусного аннотирования научыо-гзхначеокого документа (ТАНД)//£сшросй маауровнового анализа языков различных типов: Лингв.исслед.-Москва, 19 .-0,183-197.
24. Лалеьиц C.D., Попескугх А.Н., Оуднизцз Я.О.^ Шангарева
Сценарный подход к отшоанаа сспантпьп текстов фиксированного классс//Ин£оперная'лингвистика и оптимизация преподавания шюстраккых языков в вузе: Сб.науч.тр.-Ленинград, I23S.-C.46-53.
25. Аполлонокая Т. А ., Уарашлец 8.Ф.,; Попоскул А.Н. Устранение омонимии при АПТ//Там не.- С.92-102.
26. Попеокул А.Н., Прекуп A.B. Принципы моделирования и построения интеллектуальных систем переработки текстов// Справка № 809-li о депонировании рукописи. Библ.указ.: "Депонированные научные труды" ft 8.-Москва, 1987.-26 о.
27. Попеокул А.Н., Ботнару Р.В. Построение тезаур^сных, расширенных сетей на основе^понятий, ролпторов и признаков //Справка Й 942-Н о депонировании рукописи. Библ.укаа.» "Депонированные научные труды" fö 5.-Москва, 1908»-22 о.
28. Попеокул А.Н., Ботнару Р.В., Рахубо Н.П. Принципы и методы noospccHitn поксико-терминологичеоких семантических ойс9ои//Справка Ьз 1016 о депонировании рукописи. Библ. уйаэ.1 "Депонированные научные труды" te II,- Москва, 1938.-12 с.
В. ОТЧЕТЫ ПО HUP
29. Попеокул А.Н., Марэалец З.Ф., Прекуп A.B. и др. Развитие автоматического а лингвистического обеспечения комплекса автоматизированных састеи информационного обеспечения»-' Отчет по НИР,.иав.й 02860083252, IÖ гос.рог. 0I.83.Q0555ÍÜ. - М.s 1983, - 98 о".
30. ^ончаренко В.В., Попеокул А.Н., Марашлец' З.Ф. и др. Про» ведение исследования и разработка диалогового языка
1 управленческого персонала.-Отчет по НИР, инв.й Б80831?, , й гос.per. 78022693.-М., I978.-I6I с.
31. Попеокул А.Н., Маразлоц З.Ф., Хааинская И.С. и др. Разработка системы автоматического аннексирования научйо-технических документов на басе ЕС-ЮЗЗ.-Отчет по НИР, инв.й Б902592, $ reo.рог. 79008754.--М., 1979.-172 е.
33. Пспясяул А.Н., .'Сарча Л.У., Савельева А.П. и др. Развито фактографической аггоаатаэарозанпой информационно-яоис-ковсЯ скотеаи.-Отчег по ¡1ПР, аав.-й 02CSOOT0700, № roo. per. Ol.05.0092237.-М., 1985.-59 о.
33. Псазскуя Л.П., Хсдовсвм! Ü.C., Xap-sa А .'4. и др. Развитие фунгадсаалг-ншс -гоэмоашоотей пакета программ АФ>:ЛС. -Отчо* по HliP, пнвЛй 02800COOI67'', М? гос.per. Ol .By.OO'.'WI М., ИлЭ.-г9 о.
-36Г. ИЗОБРЕТЕНИЯ
34. Авторское свидетельство I3288I7 (СССР). Устройство для контроля текстовой информации//Авт. Пиотровский Р.Г., Шингарова Е.А., Попескул А.Н. и др. - опубл. 1987. Б.И. fe 29.-2 о.
Д. ТЕЗИСЫ ДОКЛАДОВ
'35. Попескул А.Н., Трофимова Т.В. Расплывчатые множества и распознавание смысла текота//Автоыатическая переработка текста методами прикладной лингвистики: Тоз.докл.П Всо-союзн.конф.-Кишинев, 1977.-С.5-6.
36. Попескул Л.Н. Система автоматической обработки докуыен-тов//Статпстическап оптимизация преподавания языков и инженерная лингвистика: Материалы семинара.- Чимкент, I980.-C.105-107.
37. Ботнару Р.В., Колибан В.В., Попескул.А.Н. Метод концептуальных полей в задачах автоматического реферирования текста//Систоны и средства интегральной обработки информации: Тез.докл.ресаубл. семинара.-Кишинев, I28I.-C.55-40.
38. Колибан В.В., Попескул А.Н. Сегментирование текстовой информации на концептуальные поля и ее перевод методой сцонариев//ИнтврактиЕцыз системы: Tea.докл. 4 школы-сс-минара.-Сухуми, Ï982.-С.310-311.
ЗУ, Колибан В.В., Попескул А.Н., Тарасова Е.С., Хаиинокап U.C. Аз^оматичзскоо обнаружение и коррокцип ошибок в информационно-поисковой систоио//Прсблоны создания и рас-вития общесистемных срсдств АСУ: Тез.докл.роспубл. сёна-нара.-Кишинев, 1984.-С.67-68.
40. Гончаранко В.В.,.Карча Л.Н., Попескул А.Н. Обработка нз-формалиасьашшх текстов к создание автоматических словарей для САП?//Зисгсмы автоматизированного проектирована.*! в кашико- и приборостроении: Таз.рзспубл. сошшара.-Ки-аинев, I98S.-C.I2c-î27,
41. Аполлонокеп Т.A.¡ Колибан В.В., Пиотровский Р.Г.г Попес-гул А.Н. Диалоговая система гезаурусного анкетирования научно-технического документа (ТДИД-Е)/'/Диалог "человек-Ш~Лп: Тез.дога.Вазсоюза.конф.-Лсщшград, 1982.-С.46- ,
42. Попескул А.Н. Програмкное обеспечение длн решении аадцч автоматической переработки текстовой инфориации//Теория и практика научно-технического перевода: Тез.докл.Мекду-народ.конф.-Москва, 1985.43.181-183.
43. Ботнару Р.В., Ковибан В.В., Нарэшлец З.Ф., Цузалевоная В.М., Попеокул А.Н. и др. Агрегированная система автоматической переработки научно-технических докуыантов//Там
ОД. Хр.е1? Б.М., Николаев Г.П., Попеокул А.Н. Реализация лингвистической базы данных для задач машинного перевода иноязычных текстов средствами СУБД ИНБС//Таи же.-0.236-237.
-
Похожие работы
- Продукционный метод анализа и синтеза автоматических регуляторов в непрерывно-дискретных системах управления
- Модели и алгоритмы получения оценки живучести систем с нечеткой информационной структурой, обеспечивающие сокращение времени расчета
- Сетевые модели оперативного управления процессом принятия решений в САПР
- Разработка и исследование продукционных графов операции как инструмента моделирования гибких производственных комплексов
- Математические модели и алгоритмы функционирования продукционных баз знаний
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность