автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Методология проектирования средств взаимодействия с лингвистической базой данных в АСНТИ
Автореферат диссертации по теме "Методология проектирования средств взаимодействия с лингвистической базой данных в АСНТИ"
ВСЕРОССИЙСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ р С Г, Си МЕЖОТРАСЛЕВОЙ ИНФОРМАЦИИ
1 5 1533
1 ° ' На правах рукописи
УДК 002.63:801.001.365
Сливницина Наталья Александровна
МЕТОДОЛОГИЯ ПРОЕКТИРОВАНИЯ СРЕДСТВ ВЗАИМОДЕЙСТВИЯ С ЛИНГВИСТИЧЕСКОЙ БАЗОЙ ДАННЫХ В АСНТИ
05.13.17 Теоретические основы информатики
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
МОСКВА 1993
Работа выполнена во Всероссийском научно-исследовательском институте межотраслевой информации.
Научные руководители - кандидат Филологических наук,
Антопольский Александр Борисович
доктор технических наук, профессор
Большаков Игорь Алексеевич
ОФФициальные оппоненты - доктор Филологических наук,
профессор
Городецкий Борис Юрьевич
кандидат технических наук Кузнецов Борис Антонович
Ведущая организация - ИнФормэлектро
Автореферат разослан "___" ___________ 1993 г.
Зашита диссертации состоится м___" __________ 1993 г.
в часов на заседании специализированного совета Н Д048. 0301 при Всероссийском научно-исследовательском институте межотраслевой информации.
С диссертацией можно ознакомиться в справочно-информацион-ном Фонде ВИНИ.
Адрес института: Москва, 123584, ВИНИ.
Ученый секретарь специализированного совета, кандидат технических наук,
доцент Б. Н. Герасинов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Настоящая диссертация посвяиена теоретическим и практическим вопросам разработки лингвистического обеспечения (ЛО) информационных сетей, конкретно автоматическим и автоматизированным средствам взаимодействия с лингвистической базой данных (ЛБД). Для обозначения этих средств в диссертации используется термин "лингвистические процессоры".
Актуальность исследования лингвистических процессоров (ЛП) определяется рядом Факторов. Наиболее важными из них являются тенденции развития отечественной информатики.
за последние десять лет в связи с внедрением новых информационных технологий обработки и поиска информации (автоматическое индексирование, обмен информацией в сетях, использование полнотекстовых БД) значительно расширились наши представления о видах языковых средств в ИПС. Появились новые языковые средства - естественный язык, обьектографический язык, различного рода операционные языки (языки обшения с СУБД) и т. п. , сформировалось представление о лингвистическом банке данных (ЛБД) АС как машиночитаемом хранилище языковых средств системы, обеспечивающем единство лексической информации, а также единство процедур, обеспечивающих их ведение и эксплуатацию.
Кроме того, в настоящее время идет активная интеграция понятий об отдельных видах информационных систем в единое
- з-
представление на базе такого понятия как "базы (банки) данных". В связи с этим Форнируется и представление о едином ЛО баз (банков) данных и УШД как его компоненте. В практике создания информационных систем этот процесс находит отражение в том, что расширяется сфера использования УШД, включая кроме традиционных АСНТИ разновидности АСУ, САПР, экспертные системы.
Обмен информацией в сетях, а также обмен БД на НЛ, ведет к тому, что возникают распределенные или интегрированные БД большого объема, комплектуемые как за счет систем, входящих в сеть, так и за счет разнообразных внешних источников.
Как для распределенных БД в сетях, так и для интегрированных БД важнейшей задачей становится обеспечение информационной и лингвистической совместимости БД, входящих в распределенную или интегрированную БД.
Одним из направлений, обеспечивающих лингвистическую совместимость, является использование единых внутрисистемных языков.
Примерами таких сетей являются АСНТИ "Электротехника". "Реферат" и ИИАС, в рамках которой разрабатывалась практическая часть диссертации.
Очевидно, что для систем указанного типа жизненно важными являются проблемы, связанные с разработкой автоматических и автоматизированных средств создания и ведения языков системы, а также вопросы, связанные с автоматическим преобразованием внешних БД, представленных на внешних, по отношению к системе» языках.
С другой стороны, отечественная информатика находится сейчас в таком периоде развития, когда осуществляется массовое внедрение персональных компьютеров в различные сферы деятельности. В этих условиях огромное число необученных
-4-
пользователей получает возможность обращения к различным базам и банкам данных. Это ставит проблему создания удобных интерфейсов - диалоговых систем общения конечного пользователя как непосредственно с тематической БД. так и с ЛБД, ее обслуживающей.
Кроме того, круг явлений, которые мы в ранках АСНТИ предлагаем обозначить термином "ЛП", не исследован в теоретическом плане. Это обстоятельство является еше одним Фактором, определяющим актуальность исследования, проведенного в диссертации.
Таким образом, актуальность темы диссертации определяется такими тенденциями и потребностями развития отечественной информатики как:
появлением новых представлений о едином АО баз и банков данных и необходимостью их теоретического обобщения; расширением сферы применения ЛБД;
разработкой ЛО для информационных сетей, Функционирующих на основе лингвистической совместимости ее звеньев;
разработкой удобных диалоговых систем общения с ЛБД и тематической БД.
Цель настоящей работы - создание нетодологии проектирования ЛП, базирующейся на специально разработанной типологии ЛП, и ее экспериментальная отработка в ходе проектирования комплекса взаимосвязанных ЛП, обеспечивающих все функции ЛБД КИАС.
Методика проведения диссертационного исследования включает следующие методы:
анализа существующего опыта в типологии и практических разработках лингвистических процессоров;
применения теоретических результатов в проектно-конструкторских разработках;
разработки содержательных алгоритмов.
Научная новизна работы заключается в том, что впервые систематизировались представления о лингвистических процессорах как части лингвистического обеспечения АСНТИ. В результате систематизации предложена первая типология ЛП АСНТИ. На базе типологии ЛП АСНТИ разработана методология построения ЛП в рамках АСНТИ.
Предметом исследования в диссертации являются средства взаимодействия с ЛЕД АСНТИ (лингвистические процессоры), их типология и проектирование в условиях взаимодействия информационных центров.
Практическая значимость работы заключается в том, что создан ряд промышленных программных средств пакетного и диалогового типов (по нашей терминологии - "ЛП"), с помощью которых задачи обработки лексики в НИАС решаются оптимальным образом.
Автор диссертации занимался разработкой модальной части ЛП - сценариев диалога, включая алгоритмы обработки.
Разработанные ЛП находятся в промышленной эксплуатации с 1985 года.
За это время с их помощью созданы:
терминологический словарь НИАС объемом 150 тис. ЛЕ;
фактографический словарь объемом 10 тыс. ЛЕ.
Апробация работ Основние положения диссертации докладывались автором на IV Всесоюзной конференции "Проблемы автоматизированной обработки научно-технической информации" (Суздаль, 1984 г. ), XV и XVI всесоюзных научных сешшарах "Системные исследования ГАСНТИ" (Рига, 1985 г., Ярославль,
1987 г.). Межотраслевом научном семинаре "Проблемы автоматизированной обработки информации (Косква, 1985 г. ), V Межотраслевой конференции молодых ученых ЕСНТИ (Москва, 1987 г. ), всесоюзной конференции "Базы производственно-экономических данных межотраслевого применения" (Суздаль, 1990 г. >.
По теме диссертации опубликовано 9 работ, из них 3 статьи, остальные - тезисы докладов. Диссертация состоит из введения, трех глав, заключения и приложений. Список литературы содержит 70 наименований.
Общий объем работы - 178 страниц, основной текст -141 страницы.
СОДЕРЖАНИЕ РАБОТЫ
В первой главе диссертации проводится анализ существующих пониманий термина "лингвистический процессор", рассматриваются различные подходы к классификации ЛП, анализируются свойства ЛП АСНТИ и на их основе разрабатывается многоаспектная типология ЛП.
В диссертации показано, что существуют различные подходы к пониманию термина ЛП. Одни исследователи связывают "ЛП" только с обработкой текста на естественном языке, другие - с языковыми средствами АСНТИ.
В диссертации термин "лингвистический процессор" используется в понимании А. Б. Антопольского, который определяет его как "алгоритмы и программы, обеспечивающие автоматизированные процедуры Формирования, ведения и применения языковых средств ЛО АСНТИ. "
Это понимание отвечает цели диссертационной работы исследовать автоматические средства взаимодействия с ЛБД в
рамках АСНТИ, а также удовлетворяет предпосылке о том. что исследуемые средства являются частью ЛО АСНТИ.
Изучение литературы показало, что вопросы классификации "/ИТ в рамках АСНТИ исследователями не ставятся.
В работах по проблемам общения с ЭВМ на ЕЯ выделение видов ЛП осуществляется на основе методов исследования естественного языка, используемых при моделировании ЛП. например:
ЛП. использующие НС-грамматику;
ЛП. использующие трансформационную грамматику;
ЛП. использующие падежные структуры типа "ролей" филлмо-ра и т. а.
Опыт классификации ЛП диалогового типа более разнообразен. ЛП диалогового типа являются представителями обширного класса диалоговых систем общения человека с ЭБН. К настоящему времени общая теория описания диалоговых средств общения еще не сложилась. Можно выделить следующие различные подходы к классификации диалоговых средств общения:
1) классификации, всесторонне учитывающие разные аспекты диалоговых систем общения;
2) классификации, построенные по преимуществу на основе видов моделей анализа ЕЯ или ОЕЯ. используемых в системе диалога;
3) классификации, построенные на основе структурных характеристик диалогового компонента систем общения с ЭВН.
Наибольший интерес в плане использования при разработке собственной типологии представляют классификации диалоговых систем общения с ЭВН (подходы 1 и 3), так как отражают черты, общие для всех видов диалогов, независимо от области их применения.
В целом существующие подхода к классификации ЛП характеризуются неполнотой и непоследовательностью в использовании признаков выделения классов ЛП.
Типология, разработанная автором диссертации, включает признаки, характеризующие ЛП в следующих аспектах:
характеристику его по отношению к другим объектам; характеристику его с точки зрения внутреннего устройства; характеристику его с точки зрения способа, метода его создания.
Поэтому все признаки, существенные для типологии "ЛП", удобно разделить на три группы. К первой группе относятся признаки, оценивающие ЛП в плане его соотношения с реалией, которая включает в себя ЛП, т. е. с АСНТИ, а также с другими реалиями, входящими в состав АСНТИ. Поскольку эти признаки, как будет показано ниже, являются одновременно и характеристикой процесса функционирования ЛП, то они называются "функциональными".
Вторая группа включает признаки, оценивающие внутреннюю логико-лингвистическую сущность ЛП. Эти признаки называются "структурными". И наконец, к третьей группе относятся признаки, оценивающие "ЛП" с точки зрения метода его реализации.
В число функциональных признаков входят: принадлежность ЛП к функциональной или обеспечивающей подсистеме АСНТИ:
объект действия ЛП; результат действия ЛП;
связь с определенным классом пользователей (связь с пользователем).
В число структурных признаков входят:
лингвистическая задача;
метод моделирования;
тип локальной структуры диалога;
Форма общения;
язык общения.
Способ реализации УШ АСНТИ описывается признаком "метод программной реализации".
Дадим краткое пояснение относительно содержания некоторых признаков.
функциональные признаки.
Признаки "объект действия" и "результат действия" характеризует положение ЛП в составе /Ю, т. е. определяют! с какими из языковых- средств АСНТИ связан ЛП.
ЛП является моделью (алгоритмом). которая осуществляет обработку (преобразование) языковых средств АСНТИ в виде алфавита. лексики или текста.
Таким образом, в качестве объекта ЛП и значений признака "объект действия", по определению, выступают языковые средства АСНТИ.
В результате преобразования, осуществляемого ЛП, т. е. на выходе ЛП также Формируется некоторое языковое средство или его реализация в виде текста.
Для дальнейшего уточнения содержания признаков "объект действия" и "результат действия" необходимо иметь представление о видах языковых средств АСНТИ.
В качестве типологии языковых средств в диссертации используется типология, разработанная А. Б. Антопольскин. В основу типологии положен способ (уровень) отображения информации, вводимой в систему. Всего выделено сень уровней.
которым соответствуют различные типы языковых средств и которые суть следующие:
средства для представления плана выражения (алфавит); четыре типа языковых средств для представления плана содержания, в тон числе: язык библиографических данных, классификационный язык, дескрипторный язык, объектно-признаковый язык;
правила представления текстов на ЕЯ; языки операционального уровня (язык манипулирования данными, язык запросов). Структурные признаки.
Лингвистическая задача - задача, реализуемая в ходе работы ЛП и заключающаяся в преобразовании языковых средств ЛСНТИ в виде алфавита, лексики или текста.
Лингвистическая задача решается на основании наших представлений о структуре языковых средств, которые воплокены в тех или иных методах исследования языка. При разработке алгоритмов ЛП методы исследования языков реализуются в виде соответствующих методов моделирования. Таким образом, "метод моделирования" определяется как реализованный в алгоритмах ЛП, метод исследования ЕЯ или ИЯ.
ЛП как модель, имеющая реализацию в виде программы (комплекса программ), может быть реализован в виде пакетного или диалогового программного средства. Признак, указывающеий йа способ реализации ЛП, называется "режим программной реализации" и имеет три параметра: диалоговый, пакетный и сочетание пакетной обработки с интеллектуальным постредактированием.
Локальную структуру диалога (ее называют еще "шаг диалога") можно определить как такую часть диалога, которая
включает одно действие инициатора диалога и последующую реакцию пассивного участника диалога.
Признак "Форма общения" (пользователя с ЭВМ) характеризует наиболее общие свойства и структурные особенности внешнего выражения высказываний участников диалога и имеет значения "текстовая и "табличная".
Язык общения пользователя с ЭВМ представляет собой набор
подъязыков, в том числе: язык выражения информационной потребности пользователя, язык управления диалогом (со стороны
пользователя), язык систены.
Язык выражения информационной потребности пользователя служит для Формулировки заданий пользователя, выбора вариантов по меню и ввода ответов на запрос.
Язык управления диалогом служит для выполнения разных технологических действий и перехвата инициативы в диалоге.
Язык системы включает диагностические сообщения, тексты запросов, меню.
Таким образом одно значение признака "язык общения" пред полагает характеристику всех языков, входящих в его состав.
На основе многоаспектного анализа свойств ЛП предложена типология ЛП. которая является первой попыткой этого рода в области ЛП АСНТИ.
Описание каждого отдельного ЛП в соответствии с предложенной типологией должно представлять собой набор значений, всех выделенных признакоз. Причем для некоторых ЛП разные значения одного признака не являются взаимоисключающими, например, значения признака "метод моделирования".
Разработанная типология ЛП АСНТИ используется как средство систематизации в обзоре существующих разработок ЛП в главе 2, а также как методологическая основа при практических разработках ЛП НЯЛС . -12-
Во второй главе1 диссертации осуществлен обзор разработок и исследований, связанных с классон ЛИ АСНТИ, обеспечивающим создание и ведение дескрипторных языков. Рассматриваются также исследования, связанные с задачей построения словарей для морфологического анализа (в целях последующего автоматического индексирования), так как этот вид УШ используется и для построения словарей дескрипторного типа.
В обзоре осуществлена непротиворечивая систематизация разработок и исследований в области анализируемого класса ЯП на основе типологических признаков "результат действия", "способ реализации", "лингвистическая задача". Тем самым показана применимость разработанной типологии для анализа соответствующих явлений.
В обзоре показано, что специфику ЛП определяют такие их признаки как "объект действия", "лингвистическая задача" и "метод моделирования". Для лп диалогового типа Факторами, определяющими специфику ЛП. являются такие структурные характеристики диалога, как тип локальной структуры диалога, Форма общения и языки общения. Очевидно, что особенности частных лингвистических задач и методы моделирования, применяемые для их решения в ЛП, являются производнь'ми как от особенностей структуры информационного языка, построение или ведение которого обеспечивает ЛП, так и от объекта действия ЛП, т. е. тех исходных данных, с которыми они работают.
На основе анализа разработок с использованием типологии Формулируются следующие принципы, которыми следует руководствоваться при проектировании ЛП в АСНТИ:
1. При проектировании ЛП (будь то собственные разработки или проблема выбора из набора имеющихся средств) принципиальное значение имеет всесторонний анализ объекта действия
ЛП. состава и структуры лингвистических задач, для решения которых проектируется ЛП. а также методов их решения;
2. Правильный выбор структурных характеристик диалога должен учитывать характер пользователя, и только в этом случае обеспечивает удобство диалога для пользователя. Поэтому при проектировании диалоговых Ш исследование потенциального пользователя является необходимом.
Анализ средств ведения традиционного ИПТ в ряде информационных центров показал, что используются весьма разнообразные средства, в том числе пакетные программы (80/.). диалоговые общесистемные средства общения с БД и специальные диалоговые ЛП.
Для ЛП пакетного типа, обеспечивающих ведение ИПТ, выделен ряд обязательных частных лингвистических задач, которые связаны с той или иной Формой контроля вводимых данных и на которые следует ориентироваться при проектировании ЛП для ведения дескрипторных словарей.
Это такие задачи, как контроль на длину вводимых данных, контроль на дублирование, контроль синтаксиса команд пользователя, контроль на наличие обязательных данных, а также контроль непротиворечивости вводимых данных.
Диалоговые средства ведения ИПТ применяются не очень широко, а то немногое, что есть, представляет собой довольно пеструю картину в плане структурных характеристик диалога и достаточно единообразную в плане частных лингвистических задач, инея в виду отсутствие какого-либо контроля непротиворечивости вводимых данных.
Исследование средств ведения ИПТ позволяет сделать следующие выводы о соотношении интеллектуальных и Формальных лингвистических задач ори решении облей задачи ведения
словаря. Задача автоматизации интеллектуального процесса установления смысловых отношений между "новыми" и "старыми" ЛЕ ИПТ не ставится. Эта интеллектуальная процедура осуществляется до выхода на машину как в случае использования пакетных» так и диалоговых средств ведения ИПТ. Интеллект ЛП осуществляет в основном проверку качества установленных связей» причем в диалоговых ЛП не реализована и эта задача. Это связано, вероятно, с незначительным потокон лексики на этапе ведения ИПТ и вследствии этого с "легкостью" внесения изменений в ИПТ при вводе ошибочных связей.
Эти же причины обуславливают и то. что на этапе ведения традиционного ИПТ проблема удобства пользователя не ставится перед проектировщиком ЛП. Изменения вносятся в словарь достаточно редко, в небольших объемах, и. как правило, одним человеком, специально занимающимся коррекцией словаря.
Третья глава диссертации посвящена теоретическим и практическим вопросам проектирования ЛП для НИАС. В третьей главе дается характеристика концепции и функциональных задач НИАС. описание языковых средств НИАС, особенностей их структуры и реализации в виде ЛЕД; конкретизируется методология проектирования ЛП и демонстрируется ее применение на примере проектирования комплекса ЛП НИАС для задач создания и ведения дескрипторных и объектно-признаковых языков НИАС.
Особенностью НИАС в плане ее функциональных задач являются задачи адаптации внешних БД и задачи создания словарей-трансляторов для проведения лексической адаптации внешних БД.
Разработанная методология проектирования включает следуйте составные части:
определение основных этапов проектирования;
направление предпроектного анализа и методические инструменты проектирования на каждом этапе.
В диссертации показано, что проектирование /Ш НИАС осуществляется по следующим этапам: выбор основных классов ЛП;
уточнение состава ЛП НИАС и способа реализации отдельных ЛП:
проектирование содержательных алгоритмов ЛП; проектирование диалоговых характерстик ЛП. Выбор основных классов ЛП для НИАС осуществляется путем анализа особенностей ее функциональных задач и состава языковых средств. На этом этапе проектирования Функциональные признаки типологии ЛП ("связь с подсистемой АСНТИ", "результат действия"). а также типология языковых средств АСНТИ имеют методологическое значение. Для НИАС определяется перечень основных классов ЛП, включающий типичные и специфические ЛП. Типичные ЛП, обеспечивают:
автоматический контроль по словарям библиографического, тематического и предметного описания документов;
задачи создания и ведения языковых средств НИАС, в том числе языков библиографического, классификационного, дескрип-торного и объектно-признакового типов.
Для осуществления специфических Функциональных задач в НИАС необходимо разработать широкий спектр ЛП, осуществляющий следующие преобразования:
внешнего библиографического описания документа в термины внутрисистемных словарей библиографических данных;
внешнего ПОД в термины внутрисистемного дескрипторного словаря;
внешнего объектографического описания в термины внутрисистемного фактографического словаря.
Кроме того необходимо создать ЛП. дающие возможность автоматизировать процесс создания словарей-трансляторов разных уровней.
Уточнение состава выделенных классов ЛП МИАС осуществляется на основе анализа, направление которого задают типологические признаки "объект действия", "лингвистическая задача", "метод моделирования", "связь с пользователем".
Объектом действия проектируемых ЛП ИИАС в основном является лексика ИПЯ различных типов, ключевые слова, а также тексты на ИПЯ различных видов. Рассмотрение особенностей лексики и потенциального пользователя дает возможность уточнить состав и содержание лингвистических задач (ЛЗ), включая частные ЛЗ, соотносимых с классами проектируемых ЛП.
Специфической задачей по созданию и ведению ИЯ МИАС являются задачи "перевода" значений ЛЕ одного ИЯ в ЛЕ другого ИЯ.
В качестве основы при определении состава и содержания ЛЗ по созданию и ведению ИЯ НИАС используется типичный набор ЛЗ первого уровня, включающий:
составление словника словаря:
установление смысловых отношений между ЛЕ словника, которое, в частности, выражается в построении словарной статьи;
ведение словаря;
получение производных словарей.
Анализ содержания ЛЗ дает возможность определить возможные методы их решения и соответственно методы моделирования ЛП,
Спецификой ЛЗ МИАС в плане методов решения является необходимость широкого применения экспертных методов с целью осуществления семантического анализа лексики в том числе в Форме компонентного анализа.
В результате исследования, проведеного на втором этапе, осуществляется следующее:
составляется перечень лингвистических подзадач, соответствующих отдельному ЛП и в сумме обеспечивающих более общие задачи по созданию и ведению ИЯ НИАС разного уровня;
принимается решение о целесообразности автоматизировать ту или иную подзадачу и выбирается способ реализации ЛП.
Решение о разработке новых ЛП принимается с учетом возможности использовать средства системы-предшественницы НИАС.
Способ реализации ЛП определяется на основе возможных методов решения соответствующих ЛЗ. Экспертные методы решения ЛЗ требуют диалоговой реализации ЛП.
Результатом данного этапа проектирования является принятие решения о разработке в МИАС:
ряда диалоговых систем, рассчитанных на пользователя-непрограммиста, с помощью которых должна осуществляться семантическая обработка лексики ИЯ предметного и обьектогра-Фического уровней с целью создания языков-трансляторов соответствующих уровней и фактографического словаря МИАС;
ряда пакетных ЛП, также осбеспечнвающих задачи создания и ведения языков-трансляторов, в части подзадач, допускающих решение без участия человека на промежуточных этапах.
Проектирование содержательных алгоритмов становится возможным в результате рассмотрения специфики лингвистических задач МИАС по созданию и ведению ИПЯ, произведенное на
предыдущей этапе проектирования; Оно позволяет построить тематическую структуру отдельного ЛП, на основании которой проектируется содержательный алгоритм ЛП пакетного вида.
Понятие "содержательный алгоритм" трактуется (в рабочем порядке как "схематическое представление действий (операций) по решению задачи, которое монет быть использовано программистом для построения уточненного алгоритма применительно к конкретному языку программирования. "
Для диалоговых ЛП проектирование содержательного алгоритма состоит из проектирования тематической структуры и проектирования диалоговых характеристик. При построепии тематической структуры диалоговых ЛП в качестве мотодологической основы используются ЛЗ первого уровня по созданию и ведению ИПЯ.
При проектировании диалоговых характерстик лп киле в качестве методологической основы используется ряд понятий, в число которых входят типологические признаки, выделенные в главе 1. а также понятия "тематическая структура диалога", "Функции диалога" (абстрактные, общего назначения, обработки, командные, некомандные), "способ спецификации Функций диалога", "сценарий диалога", "содержательный алгоритм Функций диалога", "экран-шаблон".
Предложенные признаки и понятия используются следующим образом:
1) в качестве инструмента для выделения этапов проектирования диалоговых яаратеристнк. Проектирование диалоговых характеристик ЛП ШАС осуществляется по следующим этапам:
выбор типов локальной структуры диалога и Формы обгаения; проектирование языка управления диалогом; проектирование сценария диалога.
Проектирование сценария диалога, в свою очередь, включает:
проектирование набора экранов-шаблонов и логики перехода с экрана на экран;
проектирование содержательных алгоритмов Функций диалога;
2) в качестве инструмента анализа при осуществлении выбора типов локальной структуры диалога для ЛП НИАС и Формы общения.
На основе анализа характера потенциального пользователя и тематической структуры диалога для ЛП НИАС, обеспечивающих создание и ведение ИПЯ, выбраны простой запрос и предложения для выбора, а также табличная форма общения;
3) в качестве инструмента для проектирования языка управления диалогом. На основе состава абстрактных Функций диалога с учетом типов локальной структуры и тенатической структуры отдельных ЛП для них проектируется набор функций общего назначения и Функций обработки.
Для "командных" функций проектируется набор мнемонических команд. Для "некомандных" Функций способ спецификации определяется на этапе проектирования сценария диалога, когда определяется распределение Функций диалога по экранам-шаблонам;
4) в качестве инструмента для проектирования сценария диалога, в ходе которого:
осуществляется распределение Функций диалога по экранам-шаблонам и определение вида спецификации для "некомандных" функций;
определяется совокупность высказываний на языке системы в виде "меню" на экране и набора диагностических сообщений;
проектируется состав и содержание алгоритмов функций диалога.
Состав и содержание диагностических сообщений определяются на основе состава функций обработки и с учетом эмоционального Фактора.
В состав алгоритмов Функций диалога, являющихся компетенцией лингвиста-проектировщика, входят функции обработки и Функции вывода, которые обеспечивают "идеологию" просмотра лингвистических данных.
В заключении изложены основные результаты работы, которые сводятся к следующему:
1. Практические вопросы разработки средств создания и ведения /ШД в межотраслевом информационном центре (ВИНИ) поставили задачу теоретического осмысления места и роли этих средств в составе /Ю АСНТИ.
На основе изучения существующих подходов к пониманию проблемы для обозначения этих средств предложен термин "лингвистические процессоры" и разработана их типология, включающая функциональные признаки ("принадлежность к подсистеме АСНТИ", "объект действия", "результат действия", "связь с определенным классом пользователей"), структурные признаки ("лингвистическая задача", "метод моделирования", "тип локальной структуры диалога", "язык общения") и признак, характеризующий способ реализации ЛП.
2. Показано, что разработанная типология может служить методологической основой при исследовании явлений, обозначаемых термином "ЛП". в частности, разработанная типология обеспечила четкое выделение и структуризацию класса ЛП, представляющего интерес для теоретического исследования, имея в виду практические задачи, стоящие в НйАС. Это - класс ЛП,
обеспечивающих автоматизацию процедур создания и ведения словарей дескрипторного типа.
Анализ исследований в области обозкаченого класса ЛП показал следующее:
специфику ЛП в данном классе определяют значения признаков "объект действия", "лингвистическая задача", "метод моделирования"; для ЛП диалогового типа - также значения признаков "тип локальной структуры диалога", "язык общения". Поэтому при проектировании ЛП особое значение инеет исследование характера объекта действия ЛП, лингвистических задач и методов их решения, т. е. методов моделирования, применяемых при разработке алгоритмов ЛП;
лингвистические задачи при ведении традиционных дескриптор-ных языков таковы, что не требуют автоматизации процедур интеллектуальной обработки лексики; также не ставится задача достижения удобства пользователя.
3. На примере проектирования лп в ИИАС показано, что разработанная типология может служить методологической основой при разработке ЛП в АСНТИ.
Типологические признаки задают направление предпроектного исследования и дают возможность выделить следующие этапы в проектировании:
выбор основных классов ЛП для ИИАС на основе присущих ей функциональных и обеспечивающих подсистем;
уточнение состава ЛП НИАС и способа реализации отдельных ЛП на основе исследования объекта действия ЛП и лингвистических задач, стоящих в НИАС, а также характера потенциального пользователя проектируемых ЛП;
проектирование содержательных алгоритмов ЛП на основе структур их лингвистических задач (тематических структур»;
проектирование диалоговых характеристик в тон числе выбор типов локальной структуры диалога, проектирование языка управления диалогом, проектирование сценария диалога.
Ч. с использованием предложенной методологии в НИАС разработан комплекс ЛП, включающий:
ряд диалоговых систем, рассчитанных на пользователя-непрограммиста, с помощью которых осуществляется автоматизация процедур интеллектуальной обработки лексики с целью создания языков-трансляторов дескрипторного и объектно-признакового уровней;
ряд пакетных ЛП, обеспечивающих задачи создания и ведения ЛП в части подзадач алгоритмического характера.
В приложениях приведены алгоритмы и сценарии диалогов задач ведения словарей НИАС, акт о внедрении результатов диссертационной работы.
Основные положения диссертации отражены в следующих публикациях:
1. Сливницина Н. А. Обеспечение эффективного использования лингвистических средств НАСНТИ в процессе диалога. Тезисы докладов 14 Всесоюзной научно-технической конференции. (Суздаль). - Н. , 1984. - С. 81-83.
2. Сливницина Н. А. Система диалоговой обработки лексики НАСНТИ. Тезисы докладов 15 Всесоюзной научно-технической конференции. (Носква). - Н. , 1985. - С. 65-67.
3. Сливницина н. А. , Дмитриева О. И. и др. Основные
J
принципы процедуры конвертирования документальных БД в НАСНТИ. //Системные исследования ГАСНТИ. Тезисы докладов 15 Всесоюзного научного семинара. (Рига). -Н., 1985 . - С. 92-95.
4. Антопольский А. Б. , Сливницина Н. А. . Учуваткин И. И. Анализ использования контролируемой и свободной лексики при диалоговом поиске в зарубежных БД. // НТИ. - Сер. 2. - 1987. - Н 1.
5. Сливницина Н. А. . Стрельников А. КХ фактографический словарь. Материалы АСВИЯ. 1987. Вып. 1.
6. Сливницина Н. А. Проблемы обработки лексики при создании фактографической базы данных Межотраслевой автоматизированной системы. // Тезисы докладов 16 Всесоюзного научного семинара "Системные исследования ГАСНТИ" (Ярославль). - М. , 1987.
7. Сливницина Н. А. Лингвистические задачи и методы их решения в автоматизированных информационных системах. //Информационно-экономические проблемы обеспечения научно-производственной деятельности. Тезисы докладов межотраслевых научных конференций, совещаний, семинаров. - М. . 1987.
8. Сливницина Н. А. Процедуры обработки лексики при адаптации внешних ОВД в ЦЗ НИАС. // Межотраслевая информационная служба. - М.. ВИНИ. - 1989. - Ы 3.
9. Сливницина Н. А. Принципы проектирования лингвистических процессоров в НИАС. // Тезисы докладов Всесоюзной конференции "Базы производственно-экономических данных межотраслевого применения". (Суздаль). - И. , 1990
Тир. 80 экз. Зак. 3081. ШШ.
-
Похожие работы
- Эффективность и концепция развития документальных АСНТИ
- Проблемно-ориентированные базы данных научно-технической информации в НИИ
- Функциональный анализ лингвистических средств библиотечной технологии
- Исследование и разработка языка библиографических данных сети информационных центров и его использование для адаптации данных
- Развитие семантических технологий информационно-аналитических служб в корпоративном и административном управлении
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность