автореферат диссертации по документальной информации, 05.25.03, диссертация на тему:Исследование и разработка методов автоматического реферирования научных статей по экономике

кандидата педагогических наук
Биро Юлия
город
Ленинград
год
1990
специальность ВАК РФ
05.25.03
Автореферат по документальной информации на тему «Исследование и разработка методов автоматического реферирования научных статей по экономике»

Автореферат диссертации по теме "Исследование и разработка методов автоматического реферирования научных статей по экономике"

Министерство культуры РСФСР

Ленинградский ордена Дружбы народов государственны;: институт культуры имени Н.К.Крупской

На правах рукописи УДК 025.4 + С01.814

ШРО.Юлдя

ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ АВТаЛАТНЧЕЖОП) РБЖШШШЯ НАУЧ1ШХ СТАТЕЙ ПО ЭКОКОМЖЕ

Специальность 05.25.03 "Библиотековедение и библиографоведение"

АВТОРЕФЕРАТ

диссертации на соискание учёной степени кандидата педагогических наук

Ленинград 1990

Работа выполнена на кафедре информатики и технических средств Ленинградского ордена Друабы народов государственного института культуры м.Н.К.Крупской.

Научный руководитель - доктор педагогических наук

В.П.ЛЕОНОВ

Официальные оппоненты - доктор экономических наук,

профессор Ф.Ф.ШБАКОВ

кандидат педагогических наук, доцент Н.И.ШЩНА

Ведущая организация - Институт научной инфорлации по общественным наукам АН СССР.

»7 Защита состоится И 9" ЪШИиА 1990 г. в часов на заседании специализированного совета К 092.01.01 по присуждению учёной степени кандидата наук в Ленинградском ордена Дружбы народов государственном институте культуры им.Н.К.Крупской по адресу: 191014, Ленинград, Дворцовая наб., 2.

С диссертацией молено ознакомиться в библиотеке Ленинградского ордена Друкбы народов государственного института

культура ем.Н.К.Крупской.

Автореферат разослан/'! 1990 г.

Учёный секретарь специализированного совета/' )■'!»' Г.И.ПОЗДНЯКОВА

к-зг-лш I - з -

' Уде?" | X»ШНИЯИИ РАШШ

ссортаций )

Актуальность проблема. Разработка библиографоведческих проблем автоматизации ввода и переработки документальной информации прямо соотносится с установками государственных материалов на повышение эффективности научных исследований и в целом интенсификации научно-технического прогресса. В условиях преобладания; градационных средств поиска и низкой оперативности доставка информации проявляется неблагополучие уровня организация информатизации процессов в обществе. Особенно слонно протекают она в сфере экономики.

Внедрение современной вычислительной техники создаёт рэ-альнуи возможность моделировать с помощью ЭШ интеллектуальный труд библиотечного работника, в частности, ту его важную часть, которая связана со смыслом обрабатываемой информации. Подтверждением этому служит всё увеличивающееся количество разнообразных машиночитаемых баз данных (Щ), содержащих не только биб-. лиографпческую информации (библиографические описания, дополненные списками ключевых слов,предметных рубрик, аннотациями' • а рефератами), но и полные тексты первичных документов. Причёл всё отчетливее наблвдается тенденция Еыхода за предала литератур! по естественным и точным дисциплинам в сферу общественных наук, и презде всего в экономику й правоведение.

Так, ИНИОН АН СССР в рамках программы ШСОН (Меидуаарод-. ной информационной системы по общественным наукам) в течение ряда лет активно ведёт работы по автоматизации библиографических процессоз совместно о Венгрией, ГДР, Польшей а другими странами. Накопленный опыт, в частности, по индексированию, аннотированию, реферировании используется з практике работы этих стран при подготовке реферативных сборников, составлении поис-. коеого аппарата, при обучении а повышенна квалификации кадров.

В Венгрии, начиная о 1986 г., активно внедряеЯся новая прогрелиа по автоматизации информационной деятельности, разработанная Комитетом по научной политике. В ней участвуют академические библиотека (Библиотека Венгерской Академии наук ЕЗАЯ), института (Институт экономических наук ВАН), вузы (Экономите-. скнй.университет вд.КЛЛаркса);-примечательно, , что донная про-грЕмма является составной частью Комплексной программы СЭВ •

(п.1.2.1) по информационному развитии. К её реализации привлечены также многие редакции специальных журналов, большой коллектив научных работников и педагогов.

Представляемся, что поэтапное решение задач автоматизации информационной деятельности расширит теоретическое и методическое поле исследований в библиографоведении.

Разработанность проблемы. Б советском библиографоведении наиболее рййЩйОТрайённой является концепция реферирования и аннотирования, разработанная в 70 - 80-е года коллективов сотрудников ДГЙК ш.Н.К.Крупской совместно с ИяформзлектрО (Д.И.Елшенау, Н.И.Гендана, И.С.Добронравов, Д.Г.Лахутй, В.П.Леонов, Н.Э.Сергеева). Усилиями других исследователей (О.А.Арбатская, А.И.ЕЬлкова, К.Перевозчикова, H.A. Яцевич) был проведён дополнительный комплекс полезных экспериментальных работ, направленных на совершенствование лингвистического аппарата экстрагирования и методов его оценки.

Осуществлённые в этих исследованиях подходы к формализованному анализу первичных документов создала необходимые предпосылки для целостного описания процесса реферирования Kai: объекта автоматизации. Ход и результаты проведённых работ получила нолояштельнуа оценку в отечественной и зарубежной литература, в частности, со стороны венгерских учёных. ^

Вместе с тем, в указанных исследованиях рассматриваются преимущественно научно-технические тексты, анализ жв литературы по общественный наукам специально не проводился. При всей актуальности и перспективности подобных исследований результаты их, по нашему шшгщэ,. не иогут быть ыеханичешсц распростра-. нены на литературу ло общественны:,! наук&л.

.Например, для Венгрии, как и для других стран Восточной Европы в.условиях происходящей перестройки, характерно яркое обновление общественной в экономической. яизне, проявлэяи-о по- ■ вишенного дифференцированного интереса к обдаегвешю-полцвд^з-ской литература. Удовлетворение этого интереса связано как с возможность!) расширения существущзх глездународнш: библиотечных связей, так е с обменом одфрмодш в папино читаемой gojko.

* Колтаи Т. Рефоратн-зкстраты и будущее реферирования // НТК. Сер.2. 1989. ПО. С.ЗЗ. ■

В создании повой информационной инфраструктуры - Венгрия, отражённой в национальной программе ОТКА (Государственного научно-исследовательского фонда), крупны?,1 библиотекам отводятся роль посредника мевду зарубежным центрами Щ и местными службами информация. Совершенно очевидно, что машиночитаемая информация в таких.ВД должна удовлетворять условиям совместимости и требованиям соответствующих стандартов представления, поэтому вопросы её создания нуждаются в специальном изучении.

Таким образом, в основу настоящей диссертации положены, о одной стороны, исследования, проводимые ИНИОН АН СССР по- созданию автоматичировашшх инфорлационных систем (АИС) ШСОН для стран-членов -СЭВ, а с другой - результаты работ по формализованному реферированию, осуществлённые ЛШК шл.Н.К.Крупской совместно с Информэлектро.

Цель исследования. В настоящей работе поставлена цель рассмотреть библиографоведчэские проблемы, связанные с автоматизацией реферирования (экстрагирования) экономической литературы, и подтвердить их экспериментально.

Указанная цель обусловила решение следующих задач:

1. Изучить наиболее перспективные методики библиографического анализа текстов с использованием средств.автоматизации

( в частности, реферирования);

2. Обосновать теоретически и обеспечить пргкз^ескя воз-моаность реферирования экономической литературы о убогом полного цикла автоматизации, начиная от звода первичного документа

п заканчивая получением его реферата-экстракта;

3. Разработать методику оценки ннфорлагивности полученных рефератов-экстрактов;

4. Адаптировать предложенную методик экстрагирования в репках реферирования экономической литературы на венгерском язьт.о.

Тапш образом, з качестве объекта данного исследования ■ выступает автоматизация реферирования экономической, литературы. Прэртвтом йо исследования является теоретическое обоснование иотодов автоматизации экстрагирования .экономической литературы и.возглозаюстл практического использования полученных результатов. V

Общая мотолика исследования. При разработке темы диссертационного исследования в сочетании с логическими методами ' (анализ, синтез, аналогия, обобщение, метод сопоставительного анализа) применялся категориальный метод, а такке экспериментальные специальные методы оценки информативности полученных формализованных рефератов-экстрактов.

Иоточниковая база. Б процессе работы над диссертацией использовались различные документы по вопросам экономики, библиотечного деле., библиографии и научно-информационной деятельности; изучалась советская и заруоелсная литература по библиотековедению, библиографоведению, информатике, материалы национальных и мездународашх совещаний; привлекались библиографические пособия, реферативные издания, методические материалы, имеющиеся в фондах ИНИОН АН СССР, ВИНИТИ АН СССР, ЕЛН СССР, ЕЗАН.

Нпуччая новизна исследования состоит в том, что в нём впервые сделана попытка применить и усовершенствовать методику реферирования (экстрагирования) научно-технических текстов для библиографического анализа экономической литературы. С этой целью использована технология ввода первичных документов (оп-тикочитаищие устройства) для обеспечения полного цикла автоматизации.

Автором разрабоган и экспериментально проворен подход г. оценке информативности рефератов-экстрактов на основе сравнения аспектов экстракта и статьи.

Предложена возможность применения разработанной методики к ргфорпрованию экономических текстов на венгерском языка.

Ппггстдч:.чокпя ррт-■'ооть работы заключается в тол, что разработанной подход к реферированию экономической литературы ориентирован па реальную автоматизированную систему ИПСОН, фушщпопнрущуи как г СССР, так и в страпах-члопах СЭВ. Предложенная методика монет бить попользовала* в качество типовой при её внедрении.

Автоматизированное состазленпе рефератов-экстрактов будеа способствовать более иптенсяваому использованию споцаалксгегк библиографических пособий.

Педагогическая направленность диссертации состоит в то:,:, что 'её материал углубляет и обогащает проблематику курса "Впб-

лиография общественно-политической литературы", ¿эк как автор рассматривает как одно из возмонннх направлений применение методика библиографирования для автоматизированной подготовка библиографической информации в виде рефератов-экстрактов.

Апробапия работы. Результаты диссертационного исследования неоднократно обсуздались в ИНИОН АН СССР и прошли апробации при разработке методика библиографического анализа экономической литературы. Отдельные результаты излагались яа научных конференция!: ЖИК ш.Н.К.Крупской (Н конференция аспирантов, 1987); ЕАН СССР ("Автоматизация процессов аяалитико-. синтетической обработка литературы", 1987); яа ежегодных совещаниях Екслертов Постоянной рабочей группы АИС МИСОН (Москва, 1988; Будапешт, 1989).

На защиту выносятся следувдие положения:

1. Теоретическое и практическое обоснованна автоматизации реферирования (экстрагирования) экономической литературы.

2. Методика оценки эффективности полученных вторичных документов.

3. Исследование возможностей и рекомендации по использованию полного цикла автоматизированной подготовка рефератов-экстрактов экономической литературы.

4. Рекомендации по применении данной методика для бгбляо-графичзскох'о анализа экономической литературы на венгерском языке.

Структура я обьк.т работы. В соответствии с основными задачами исследования определена и структура диссертации. Ока состоит из влодояия, доух глав, заключения, блйшзографачэското списка и прилозгшядй. Общий объём работы составляет • Ос-

новной материал а заключенно излогеш на 1(оО с- Енблиографз- ^ •адский список вклачаар^ф названий. Количество приложения (о.

ОСНОВНОЕ СОДЕРКАНИЕ' РАБОТЫ

Во ввегеним обоснована актуальность и значение проблемы в условиях активного внедрения вычислительной техники в процессы библиографирования, проанализирована степень разработанности темы, определены цели, задачи, методика, база исследования, изложена научная новизна и практическая значимость, педагогическая направленность диссертации, её апробация, раскрыта структура представленного материала.

В первой главе "Современное состояние аналитико-синтетд-ческой обработки документов по экономике" рассматривается информационная деятельность по экономической науке б Советским Союзе п Венгрии. Дан подробный обзор состояния аналитйко-спя-тетической обраиоткл экономической литературы в вздувдх цент-ральшх информационных органах.

В Советском Союзе таким информационным центром в со сошного значения является КШОН АН СССР. Из всех общественнонаучных дисциплин в _автоматизированную базу данных Института первой, начиная с 1981 года, стала вводиться экономическая литература. Накошюшшй аксиорацоатальиай опыт, а гакзо сошостноо учаезяо в разработка АИС î.THCOH позволили автору сделать выводы о до~ стегнутом уровне содержательного анализе всего документального потока.

Именно в данной области науки оказались наиболее продвинутыми мвюдичосюи разработки. Действующий словарь нормализованной локекка (CIÍJI) по экономике шззл пятым ¿¡зданием. В доработке ЭТОГО ОСНОВНОГО ЛШОТЙСГИЧОС1ЯГО сродства учтён ОПЫТ ЕОДГО- . товкц дауязычкых CIÍJI ц результаты обратной свягц а^орюцгоЕ-ного^поиска в АИС МИСОН.

Споцигшсгелц высоко оценены возможности CHJ1 при обработке документов. Оптимальная глубина индексирования составляет з среднем 7 дескрипторов на документ. При этом выявляются специфические для экономической науки содержательные харкгеордсиаа. Обосяовиваотся представление о том, что мчогоасгхиктность,-проявляемая на разных уровнях, при суда самой науке,- что, в cldij очарздь, отраыа-зтея в поисковых запросах окоеоглсхов.

Исходя кз спогшфлга работы, особое вяпмсяпо в илсгоя^ой диссертации уделено способа,1,: раскрытия аслокхоз содердангл до,-

ел

кумента.

В диссертации выявлены недостатка существующего реферативного уровня анализа экономической литературы. На основе отчётных данных ШШОН АП СССР и ЕВАН делается вывод, что большая доля периодических изданий остаётся в этой сфере бей рефератов. Вместе с тем неотложная задача оперативной передачи актуальной информации ставит вопросы о внедрении ноеых методов обработки литературы на реферативном уровне. Среди новых тенденций обращает на себя внимание появление тагах нетрадиционных яан-ров как поисковый реферат и сводный реферат. В диссертации рассмотрены вопросы о Еводе реферативной информации в Щ ИНИСН АН СССР. Подчёркивается, что в этой области по все аспекты отражения информационного содержания реферативных изданий получают должное решение.

Автором предлагается проведение подготовительного анализа текстов первичных документов с целью их автоматизации. Для этого изучались структура и лексика реферативного текста, выделялись вводные фразы и оценочные элементы рефератов, которые относятся к тем или иным аспектам содержания документа. Для выявления аспектной структуры интеллектуально (вручную) составленных рефератов были изучены существующие советские и зарубежные методические рекомендации.

В диссертации приводится обзорный материал о состоянии экономической информации з Венгрии. Ведущим учрездопием по сбору я распространению экономической информации является Центральная библиотека Экономического университета игл.К.ГЛаркса (МККЕК). Венгерская экономическая литература обрабатывается з основном на уровне библиографического описания. Реферативная информация даётся только о зарубежных публикациях. Возрастающие финансовые затруднения прязели к разработке "новой информационной политики" и ускорили подготовительные работы по автоматизации ряда интеллектуальных процоссоз по подготовке изданий, например, по составлению предметных указателей. Намечено создание яеегллыах Щ в соответствии с разными видами документов, а именно: диссертаций и периодических изданий.

Сущосгвуттщаз лингвистические средства - списки предметных слоэ, другие элементы вспомогательного аппарата, а такге фасеты, созданные при участии автора, сравнивались с аналогичными

средствами, разработанным в венгерских учреждениях, а такке с вышеупомянутым СНЯ, созданным ИНИОН АН СССР.

Цри анализе реферативной деятельности венгерских учреэде-кий подчёркивается, что из-за большой трудоёмкости такого рода работы и языкоеого барьера обрабатывается лишь три процента всех поступающих зарубекных публикаций. Б рамках проблематики диссертации подробно рассматривается вопрос об отражении экономической литературы из советских нурналов в аналогичных венгерских изданиях МККЕК. Результаты анализа свидетельствуют о ядерном характере публикаций куриала "Вопросы экономики".

В целях улучшения информационного обслуживания венгерских экономистов МККЕК находит пути предоставления библиографической информации в режиме теледоступа из Щ, в частности, обеспечивает возможность получения более полной информации об экономической литературе стран-членов СЭВ через ЦЦ АИС ШСОН.

На современном этапе международного сотрудничества основное внимание уделяется вопросам комплектования периодической литературы, готовится общий список местонахождения периодики экономического профиля всех стран Восточной Европы.

Во втолой главе "Теоретическое и практическое обоснование метода экстрагирования научных статей по экономике" из существующих формализованных методов экстрагировали.., разработанных в основном в области гехничзасих наук, автором работы выбрала по-аспоктная методика, основанная на лингвосемантическом анализе первойсгочкиков. Названная методика экстрагирования разработана под руководством В.П.Леонова группой БИС ЛЗЖ плЛ1.К. Крупской совместно с Инфог-мэлзктро.

На базе действующей системы "Экстракт" с использованием ШС "Скобки ' в течение последпих 15 лот ведутся работы ко обработке документов по электротехнике. Ползязтельпио результаты, достигнутые в стой области, дшзг основу .дат допьяойгзго раези- • гяя концепции автоматизированного экстрагирования- с учетом переноса полных текстов порзглных документов па шикгшйкш гасители . .

liai; известно, экстрагирование - ото дословное извлочонпо отдельных слов, словосочетаний и фраз (прздлэгзнкй) из токсил первичного докуцояга шгторцтичэскг. с помоев ББ.'.1. ПЬяучзизкэ в результате оксграгарованпя вторичные докумаяи: пришло пазиг

зать автоматическими экстрактами.

Детальный анализ соответствующих методических документов тозволил автору работы «'формулировать требования к экстрагпро-занпю экономической литературы. Гипотеза экстрагирования под-зергалесь практической проверке на массиве куриальных статей ю экономике. При этом разрабатывался и обосновывался оелек-гпвный г.одход к формированию массива и структурному анализу первичного текста.

Для эксперимента были взяты тексты, адекьатные по длине 30-тц статьст научно-технической литературы. Сфорг.яровакный массив включил как первичные, так и вторичные виды документов, 20 статей из разных научных журналов и 10 рефератов из РЛ ЖОН АН СССР. Пять статей било обработано с помощью ЭШ и с использованием оптико-чигающих устройств (047) на базе АШП "Скобки".

Одной из глазных задач анализа первичных документов было определение характерных особенностей текстов экономической тематики. Структурный анализ текстов осуществлялся с помощью разных количественных показателей. За единицу отсчёта было выбрано предложение как структурно-семантическая единица изложения.

Зурнальные статьи но экономике по среднему физическому объёму в два о половиной раза превышают статьи по электротехнике, при этом среднее количество предложений составляет 160.

В исследовании применялся наукометрический подход с целью выявления данных о цитатах и ссылках внутри текста. Анализ 15 статей из журнала "Вопросы экономики" показал тесную связь вопросов П0ЛИТЭК0П01ПИ с партийными документами. Экономические статья. слабо структурированы, стиль и язык их язлозенпя разнообразен, хотя авторский состав довольно однороден.

Выявление гдоршровшшх предложений осуществлялось с помощью Словаря маркеров, индикаторов д коннекторов, составленного з НИС ЛПК нм.Н.К.Крупской, в соответствии с принципами лрэгргслх "Экстракт". Процодура проводилась з ручном рэжнме с гг'дтадисй работ прогргг:.:и ЗЕ.1 в оледуЕщсЗ по следовательно ста: сначала йот отмечены все предложения, содержащие слова-марке-рц и вдтжавора о копязясоршга связялз, затем из них выбирались предложения но формула выбора (ФЗ), содержащей лексичэ-cr.no части по наиболее информативным аспектам изложения.

- 1г -

Б результате были получены рефераты-экстракты, включающие в среднем от семи до восьми маркированных предложений. Часть статей (13^) не поддалась формализованному анализу. Такие документы следует обрабатывать традиционным способом.

С учётом специфики экономической литературы автором была предложена иная формула выбора, основанная яа семантических расхождениях слов-г..аркеров и оппеделзнии частоты встречаемости отдельных лексических единиц. В неё вошли четыре аспекта содер-яакия, соотнесённые с соответствующими лексическими статьями и индикаторами.

Е результате проверка оказалось, что рефераты-экстракты, составленные по новой ©,в среднем включали до двенадцати маркированных предложений - это примерно в полтора раза больше, чем по общепринятой для технической литературы форглуле выбора.

Кроме того, выяснилось, что её применение позволило проводить формализованный анализ текстов. Новая ФВ была подвергнута проверке на нескольких куриальных статьях. В то яо врегля необходимо подчеркнуть, что дальнейшая проверка результатов эксперимента должна быть осуществлена на более представительном массиве документов и с помощью ЭШ.

Особенность предложенной в диссертации методики эксперимента состоит и в том, что словарь маркеров и индикаторов был применён к текстам интеллектуально (вручную) составленных рефератов из Р2 ШЕОН Ш СССР "Общественные наука за рубежом. Серия Экономика". Среднее количество экстрагированных предложений оказалось равно четырём, что соответствует объёму поискового' реферата.

Оценка полученных рефератов осуществлялась экспертами (экономистами-библиотекарями). Полагаясь яа заключение, моено . сделать вывод, что в новой ФВ половина экстрактов . оценена положительно.. Зто свидетельствует о её достаточной работоспособности и пригодности для дальнейшего применения в целях экстрагирования экономических ^гатей. Такую же оценку получили и рэ-фераты-экстракты, составленные яа рефераты статей из РЕ ЖИОН /Л СССР. Среда них, например, две. трети были признаны пригодными для передачи основного содержания документа.

Преимуществом метода экстрагирования,. по сравнении с дру-. гимн методами,' .является то,' что реальный результат получается при небе -л>вдх временных затратах. Другие'подхода - такпе как

собственно лингвистический, создание экспертных систем и систем искусственного интеллекта - находятся в стадии экспериментальных разработок. Предлагаемый информационно-библиографический подход нацелен на ренение комплекса задач - с одной стороны, создать реферат-экстракт оптимального объёма, а с друю" стороны, сделать активным его использование для обычных поисковых задач в промышленном регхиме.

Оригинальность обоснованной в диссертации методики заклэ-чается в том, что реферат-экстракт, составленный ка текстах традиционных рефератов по экономике, успешно выполняет поисковую функцию. Его могаго использовать в качестве традиционного реферата, содержащего в среднем четыре предложения.

• В работе подтверждена гипотеза, что методика экстрагирования, применяемая : массивах научно-технической литературы, но всегда мо~ет быть механически использована для реферирования экономической литературы.

В частности необходимо пересмотреть лексический состав словаря маркеров и индикаторов, некоторые индикаторы соотнести с аспектст: изложения наравне о маркера®, а такие разработать лингвистические контрольные алхорлтш для постредактирования рефератов-экстрактов. В будущем целесообразно осуществить проверку рефератов-экстрактов с точки зрения их поисковой эффективности. Вместе с тем дальнейшие работы по совершенствования методики, предложенной в диссертации, могут сделать её более утончённой и универсальной.

В диссертации нами но ставилась конкретная задача дать поисковую оценку полученным экстрактам. Она заключалась з тем, чтобы построить модель гоемомного применения метода экстрагирования в одной из областей общественных наук.

В качество результатов проведённой работы момно констатировать:

а) получены количественные данные о структуре оконемиче-окаг статей, а токмо даннзю об их физич сксм объёме, что даст зосмо-:::ость планировать объёмы иолнотекстовых Щ по экономике;

б) аз подтвердился положительно дс •ясршггорпкй поиск, по текстам рефератов для нахождения првдлэ..?езп2, выражающих основ-:оо содэргаяно первичного документа. Совпадав-тих предложений -гаокрипторшЕ: и маркированных оказалось очень пало. Предлонз-

ния же, выявленные методом экстрагирования, дали удовлетворительный результат по экспертным оценкам;

в) выяснилось, что в общестЕеннонаучных текстах (по сравнению с техническими) большее значение приобретают слова-индикаторы и слова, выражающие коннекторные связи. Последние выступают в качестве указывающих на маркированные предложения. Благодаря коннекторнш связям, в рефератах-экстрактах число маркированных предложений почти удваивается;

г) полученные результаты были использованы для построения типовой структуры рефератов-экстрактов по экономике. Обязательными их элементами являются: слова-маркеры, индикаторы и коннекторы. Индикаторы и коннекторы представлены в экстрактах по экономике в большем соотноиеяии, чем в текстах по электротехнике, где, наоборот, приоритет принадлежит словам-маркерам. В основу типовой структуры рефератов-экстрактов по экономике положена разработанная автором новая формула выбора предложений.

Таким образом, результаты эксперимента и экспертные оценки позволили определить некоторые преимущества, а также недо- , статки методики экстрагирования и сформулир^ать конкретные предложения для дальнейшего использования различпых методов раскрытия содержания документа.

Принципиально важным является и то обстоятельство, что в качестве одного из перспективных направлений подобного рода работ изучалась технологическая возможность использования оптико-читающих устройств со скаяяером для ввода первичных документов по экономике и создания полнотекстовой базы данных. Ввод производился на технической базе ВНИИ Информзлектро с применением пакетов прикладных программ (ППП) "Spot - и » Miorosoft») а последующее сжатие с помощью АШЮ "Скобки". При проведении экспериментального ввода журнальных статей были обнаружены определённые полиграфические недостатки и ограниченные технологические возможности апробированных ППП.

В целом автор пришёл к выводу, что в настоящее время с помощью 047 возможно формировать полно текстовые базы даяяшс. Предложенную методику целесообразно рекомендовать' для получения рефератов-экстрактов первичных документов по экономике в резке промышленной эксплуатации. '

В диссертации рассматривалась и возможность применения

разработанной методики экстрагирования для экономических текстов на венгерском языке. С целью её применения в качестве подготовительной работы сделано:

- изучен документальный поток экономической периодической литературы, издаваемой на венгерском языке, с применением науко-л библиомотрического анализа; '

- составлена первая редакция - перевода словаря маркеров, индикаторов и коннекторов с русского на венгерский язык;

- осуществлено обучение предлагаемой методике.

Для успешного применения методики экстрагирования текстов на других языках, по мнению автора, должен быть составлено словарь маркеров и индикаторов на основе частоты их встречаемости в венгерских статьях. В дальнейшем необходимо сопоставление с переводной версией эталонного русского словаря для выявления расхождений и соответствующей доработки.

В заключении охарактеризованы перспективные направления применения данной методики в рамках новой технологии по созданию гипертекста и подчёркнута необходимость активного использо-г ва1Шя результатов теоретических п практических исследований других областей знания.

Основные поло-епня диссертации лзлойены а работах;

1. Информация на службе ойцосизеявнх наук. О третьей научной конференции ШЯШ-а (Будапешт, май 1985 г.).

1пГогпас£<$ а 1.'гяш^а1сгг.!игг.йпуо1с яяЫзгйагёЪап, А М13гОИ ИкгпииШ;

1и:101г.гГпуО9 копГегспс! ',}Хгб1Ц1С8пуч1еН ВДсуегёг- 1900«-Мо.1.-о.0-1-90.

2. "Л1С0Н. Доуязтнпй ехшеок лексики по скономлко. Введение з методику состазлогсп.

ГЛ1~ЗСМ кЛпусЫ* = 1->з:11гч]кг>угк1(и-Пис1сроси;

3. Роль ко ординатора ЕНО как по сродника иоцду нацноналыш-:г:л ппфогмаи-'.опп'г::: спстсмгли // Роль научной информации в осу-пзсгвлзшш соодально-экопомлчоской и вдеологячоской §уякцаД об-цоогзопЕих паук: йагвряали Третьей науч.кокф.К11С0Н, Будапешт, 23 -'25 моя 1335 г. - Будапешт, 1963. - С.220 - 223.

4. Технорабочий проект на дальнейшее развитие совершенствования АИС МИСОН. Том 2. Лингвистическое обеспечение АИС МИСОН (в 3-х частях). - М.: МИСОН, 1989. - Часть I. - 53 о.

5. Одноразовая обработка, многократное использование (Интервью сотрудниками группы МИСОН ЕВАН).

ЕёуахвН («Помогав, 1дЬЬегйг1 (вШаагп&1аа, Воог&дг^а а МТАК М1520Ь' споро« типкй1аг»аК'а1, Gr9gorovi.cz А. ¿а В1го .1.Шр0110г ВаЬи-аопоу Бг^/Бгоу^вШЫо, 1983*-Ыо.7,-о.37.

Подписано в печать 10,05.90. Зак. 377п Тпрпи 100 гка. Фори«т 30x42 йбъси 1,0 п. л. Бумага офсетная. Беоплатпр.

Ш БАН СССР, Ровалрсна (1990^2,Ленингрвд, Биржевая,I)