автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.07, диссертация на тему:Исследование и разработка сетевой технологии в автоматизированных системах патентной информации (на примере международной системы патентной информации)

кандидата технических наук
Эрлих, Инна Абрамовна
город
Москва
год
1990
специальность ВАК РФ
05.13.07
Автореферат по информатике, вычислительной технике и управлению на тему «Исследование и разработка сетевой технологии в автоматизированных системах патентной информации (на примере международной системы патентной информации)»

Автореферат диссертации по теме "Исследование и разработка сетевой технологии в автоматизированных системах патентной информации (на примере международной системы патентной информации)"

мССлОЗСи'й ОРДЕНА "ЗНАК ПОЧЕТА" IX С: ДАРСТВЕННЫЙ ИСГСИКО-АРХИВНЫЙ КНСШЕТ

Кз прозах рукописи

ЭРИК Инна Абрамовна

УДК 606.3.СО?

ИССЛЕДОВАНИЕ И РАЗРАБОТКА СЕТЕЕОЙ ТЕХНОЛОГИИ В АВТОМАТИЗИРОВАННЫХ СИСТЕМАХ ПА1ЕНТЮЙ ШСЕЛАДОИ (КА ПРИМЕРЕ ЖВДу НАРОДНОЙ СИСТЕМ ПАТЕНТНОЙ ИНФОРМАЦИИ .

05.13,17 - Теоретические основы информатики

.Автореферат; диссертации На соискание ученой степени кандидата технических наук

МОСКВА.- 1990

Работа выполнена во Всесоюзном научно-исследовательском институте патентной информация, г.Москва

Научны^ руководитель - кандидат технических наук,

доцент. Романешсо. А .Г.

Официальные оппоненты; . - доктор технических наук,

профессор Герасименко В.А., - кандидат технических наук, доцент Попов И.И. ,

Ведущая организация - Всесоюзный научио-исследовьтельский институт системных исследованкй АН СССР.

Защита состоится "25" января 1991 г. в 13 часов на заседании специализированного совета К 053.75.01 в Московском ордена "Знак Почета" Государственном у.сторико-архивном институте по адресу: Москва, ул.Кп^яевская, 37. .

С диссертацией можно ознакомиться в. библиотеке Московского • Государственного исторнко-архивного института.

Автореферат разослан г. " ' ■

Ученый секретарь специализированного Совета

В. II. Меркулов

СБЩАЯ ХАРАКТЕРИСТИКА. РАБОТЫ

Актуальность тепы определяется проявлявшейся а настоящее враыл тенденцией повышения эффективности информационных систем и сагой за счет выбранной сетевой информационной технологии. Для автоматизированных систем патентно.! инфориации (АС Л Л) характерны сложные инфориационно-технэлагичзскиз связи между потоками, больиое число функциональных задач, а такке .значительные интенсивность и обьоиы пополнения инфориацион.чых массивов. Поэтог)у вопросы создания эффективной технологии функционирования . АСПЛ являются первоочередными.

Целью работы является исследование и разработка методов и модели проектирования сетевой технологии я системах автоматизированной обработки патентной информации, обеспечивающих элективное функционирование АСЛЛ.

Для описания объентов исследования и взаимодействия ыекду информационными потоками АСПИ в работе используется аппарат теории нечетких множеств. При решении задачи распределения функций первичной обработки информации иезиду информационными центрами и задачи контроля латентной информации в АСЛЛ использованы методы системного программирования. Задача формирования патентно-информационных фондов в узлах АСПИ решена с пршенениеи ыетодоз.теории вероятностей и целочисленного линейного программирования.

Научная новизна. В работа получены следующие научные результата:

- предложен новый подход к реиониа проблеиы разработки сетевой технологии АСПИ, состоящий в декомпозиции обще" задачи оптимизации на несколько решаемых в определенной последовательности подзадач;

поставлена и решена задача оптимизации распределения функций обработки первичной патентной информации между информационными центрами;

- поставлена и решена задача формирования оптимального состава патентно-информационных фондов в узлах АСПЯ;

- разработана технология обработки информации в АС!III с момента ее поступления в ЗВИ до использования в конкретных задачах науки

и техники;

- получены экспериментальные данные, характеризующие качество библиографической патентной информации по фонду пятидесяти пяти стран и трех международных организаций, поставляемой фирмой ИНПАДСК.

Практическая ценность

Разработка сетевой информационной технологии АСПИ и ее внедрение в практику работь Международной системы латентной информации (13СПИ) обеспечивает существенное повышение эффективности функционв рования ДОЛИ,'в том числа: ,

Г. Оптимизация распределения функций обработки первичной информации обеспечивает снижение затрат на обработку информации и пс лишение оперативности поступления ин^ориации к потребителю.

2. Оптимизация состава латеятно-ан^ориационных фондов в узлах АСПИ сникает совокупные по всей узлам АСПИ экономические затраты на ведение массивов и обслуживание, заявок.

3. Выделение и оптимизация состава функцирнальных подсистем обеспечивает унификацию технологических процедур, существенным образом уяроцая разработку програииных средств отдельных технологи' ческих.служб.

Оптимизация состава и параметров технологических процедур уменьшает расход машинного зрецени на технологическую поддержку ШШ и упроцаот подготовку обслуживающего персонала.

5. Разработка и реализация програияно-технолагическях средств контроля и коррекции информация позыааот целостность и непротиворечивость патентной ин£ориации, поступающей к потребителю, а также снижав? экономические ззтрата на повторную обработку записей,, в которых обнаружены овибки.'

6. Сформулированные в рас г те показатели эффективности технологии функционирования АСПИ позволят проводить сравнительный анализ проектных решений, обеспечивая выбор наиболее эффективных технологи

Внедрение работы. Созданный в результате исследования кокпленс программно-технологических средств является существенной частью техно^-рабочего проекта Автоматизированной системы патентной информации. Разработанная методика контроля библиографической патентной информации рекомендована для распространения по патентным ведомства: стран-членов СЭЗ.

Апробация работы. Основные результаты работы докладывались на Всесоюзном сешнаре во ЗЕЛЛ прикладных автоматизированных систем в 1986 г.-, на Всесоюзной соиинаре по патептнсй информации в 1983 г., на научно-технической конференции "Системные исследования ГАСКТИ" в 1989 г.

■ Публикации. Основные результаты диссертации опубликованы в 6 печатных работах.

Структура работы. Диссертация состоит из зведения, трех глаз, заключения, списка литературы из 93 наименований, содерзшт 130 страниц печатного текста, 14- рисунков, 3 таблицы, прилонений.

СОДЕРЯИЩ РАБОТЫ

Во введении дана общая характеристика работы, показана актуальность рассматриваемо*! проблемы, сформулирована цель работы, приведены полученные научные результаты, описана практическая ценность работы.

3 перзоЛ главе проводится анализ сетевой технологии АСЛИ, в ходе которого заявляется комплекс проблем, связанных с носовараен-стзоы технологических процессов, а такие формулируются характеристики сетеээл технологии АСЯЯ, Анализ технологии АСПИ позволяет перейти в дальнейшей к вопросам совершенствования сетевой технологии АСЛИ путей создания соответствующей модели.

Разбирается круг рассматриваемых вопросов, приводятся характеристики крупнеЯиих АСЯЯ.

Потребности пользователей! АСЯЯ характеризуются: высокими требованиями к оперативности передаваемой информации и к качеству выходной продукции; необходимостью в политецатичзсдой информации с большой глубиной ретроспективы.

В настояцез вреия потребности пользователей в полной мере не удовлетворена, в связи с чем АСПЙ можно рассматривать только как дополнительный инструмент при -проведении патентного поиска. Основная причина этого - отсутствие достаточно представительных баз данных патентных документов. -

Иежду теи возможности автоматизации обработки патентной информация икра, чем других видов НТИ, так как предпосылки к формализации заложены уда в саиих особенностях лексикографической фиксации цанных на языке патентных документов. Кроме того, технологическая поддеркка АСПИ упрощается в связи с тем, что для АСПИ больший удельный Зес, чей для других АИС, имеют- базы данных.патентных документов, содержащие только библиографические данные.

В ходе анализа, проводииаго в первой главе, выявлены основные характеристики сетевой технологии АСЛИ; основным каналом передачи патентной информации, предназначенной для пополнения баз данных 1атентных докуиантоз, является почтовая связь, а носителей этой мфориации - магнитные ленты; для патентного поиска характерен

пакетный режим обработки; время ожидания ответа на запрос локального пользователя Ш1И значительно пеньке времени передачи шторма ции мззду узлами АСЯИ по почтовому каналу свнзи; затраты на переда чу информации значительно ниже затрат на хранение массивов и обработку залроеоз в узлах АСШ1.

Рассматривается технология функционирования Меацународной системы патентной информации (liCilii), созданной как специализирован' ,ная сеть Ш1ТЙ. (организационные элементы ЫСПИ - выделенные национальные органы стран-членов СЭВ). Приводится содераательное описание сетевой технологии liGQil, в ходе которого рассматриваются все основные технологические процессы обработки патентной ии^ораации. Анализ технологии ::СПЯ используется при постановке задачи моделирования сетевой технологии АСПЛ,

КСПИ является характерный представителей АСПИ, включая все их основные компоненты (информационные, праграшшые, кошуникацион-ныв, лингвистические и др.). Поэтому результаты, полученные в ходе анализа технология функционирования КСПИ, достаточно представительны.

Одной иа основных функций ГаШЛ является сбор, предкааинная обработка и ввод сведений об изобретениях для последующего комплексного использования этих сведений в АСПИ. В частности, выделенные национальные органы (ВНО) стран-членов СЭЗ подготавливав! патентную информацию на магнитных лентах. Эти ЛЛ (называемые обменными) передаются по почтовый канаяак в г шовной орган (ГО) МС1И Госкошзобрв-тений.

Обменные И с библиографическими данными предоставляются ВНО ШШ для отправки в международный центр ¡11ШАДСК. Таким образом, на Г О ¡¿СПИ ( в лице ВШГШ НПО "Поиск") воз логе на задача обработки обивнных UJI, лоступаюцих из ВНО Ш1Н.

. В работе приводятся статистические данные, характеризующие технологии обработки обменных ИЛ ИСПК: процент ошибок в спецификациях, метках обменных МЛ, собственно патентной информация для каждого ВНО ИСПй; процент технологических сбоев при выполнении отдельных технологических процедур обработки информации ЫЛ ¡-СПИ в НПО "Поиск", процент записей, отсутствующих на ¡Я МСйШ" ( по сравнению с информацией, публикуемой в официальных патентных бюллетенях), графики получения в HLIO "Поиск" обменных ЭД ряда ВНО ШШ.

. Важной составляющей информационного обеспечения ШШ является информация, я случайная из Мевдународн сто центра патентной документации в Вене Щ1АДСЕС. Сбор, накопление, обработку и предоставление

комплекса различных информационных услуг на основе библиографической информации по опубликованный патентным документам ИНПАДОК осу-цествляет посредством заключения соглаазниЛ об обмене с патентными ведомствами или международными организациями. По патентным документам девяти стран-членоз СЭЗ ШШДСК получает библиографическую информацию через Г оскоыиз обре гений СССР в райках соглаиений ИШ1АДСК и ШПИ.

Одной из услуг ИЯЛАДЖ является еасзнед^льнг- генерация магнитной ленты с информацией по текущим поступлениям - эта информация используется в 15СПЛ.

Записи на 1!Л ИКПАДСК имеют формат который отличается от стандарта 150 - 2709 наличием в начале записи сортировочного ключа. По формату Г50 - 2709 в запаси предусмотрено наличие мзтки, в которой наряду с другой информацией помещается специальный атрибут» называемый статусоц записи. Для статуса записи используются следующие обозначения:!! - новая запись;]? - замена записи на совершенно новую в целях исправления ила дополнения; А - полная старая (оригинальная) запись, которая заменяется записью К или уничтояа-ется.

В запись на МЛ ИНПАДШ включены следующие библиографические данные: код страны публикации, код вида документа, номер международной заявки по договору о патентно'! документации РСТ, номер документа, регистрационный номер заявки, номер приоритетной заявки, дата подачи заязки, дата публикации документа, дата приоритетной заявки, дата публикации патентного документа-аналога, индекс МКИ, имя изобретателя, наименование заявителя, стандартизованное, имя изобретателя, стандартизованное наименование заявителя, код страны яродизаяйя изобретателя, код страна проживания заявителя и другие.

В работе проводится анализ информации, содержащейся на Ш1 ИНПАДСК за 1988 г. В частности, приводятся статистические данные, характеризующие динамику поступления из ИНПАДШ корректирующих записей, а такяе качество библиографической Патентной информации по отдельным странам и международным организациям.

Проведенный анализ обмена библиографической патентной информацией странами-членами СЭВ и ИНПАДСК позволил выявить следующие основные недостатки такого обмена:

- основными причинами технологических сбоев при обработке обменных МЛ МСПИ является несовершенство'программно-технологических средств и* обработки, разнородность форматов данных, представленных на ИЛ; при контроле обменных МЛ ЬЮПЙ часть ошибок не обнаруживается - их выявляет только ИНПАДШ; .

- в информации на ИЛ ШПАЛ (К ряд ошибок нз распознается; корректуры к ошибочным записям присылаются из ИНЛАДСК недостаточно оперативно.

В процессе анализа сетевой технологии .'..'СШ1 определена созокуп-. ность показателей, характеризующих уровень совершенства технологии АСПИ, как то: среднее врепп доступа в АСПИ (т.е. среднее время ответа на запрос потребителя) средняя скорость поступления информации к потребителю (характеризующаяся средним временным интервалом между первичным вводом поискового образа документа з ЭВМ и поступлением его в базы данных, предназначенные непосредственно для патентного поиска), целостность и непротиворечивость выходной продукции АСПИ. Показана необходимость совершенствования сетевой технологии МСПИ, в частности, репения задач оптимизации тематического комплектования патентных фондов по рубрикам 1Ш и оптимизации распределения функций обработки первично,; информации меаду ВНО 11СПЛ.

Вторая глава посвящена разработке сетевой технологии АСПИ.

Рассматривается задача проектирования сетевой технологии АСИ, когда средняя скорость поступления информации к потребителю и средняя скорость доступа в сети не должны превышать заданные критические значения, а совокупные по всем узлам АСЛП экономические затраты стремятся к минимуму.

Предлагается схема проектирования сетевой технологии АСПИ, состоящая в том, что общая задача проектирования разбивается на несколько подзадач. При такой д°ко)отозицаи используется обобщенная модель информационного обмена, применяемая в диссертации для ото- -брагения взаимодействия элементов АСПИ в процессе их функционировав ния. В диссертации показано, что в этом случае критерии, по которым проводится оптимизация, монно перенести на уровень тех подзадач, для которых они характерны.

В результате такого подхода проектирование сетевой технологии АСПИ сводится к выполнению нескольких последовательно выполняемых этапов проектирования.

Автоматизированную систему патентно.! информации с количеством организационных элементов, равным .мояно определить как организационную систему Е в [е^, Е2,..., Ец]. Дйя описания структур информационных объектов в диссертации используются операции умнояеяия (х) и сцепления (#), определенные в теории нечетких множеств. Основные потоки, образующиеся при взаимодействии организационных элементов (Ш), следующие (рис. I).

-б -

1. Информационный ресурс, по^лвкаций распространению (исходный поток): У," 3 С У*,,..., У*.,...» У^ ].

Здесь - классы докуиентоз. Принципы разбиения документов

ва такие классы и их состав описаны нннз.

2. Совокупная информационная потребность, ожидаемая выходными элементами информационной деятельности (ЭЛЛ):

Уе = CYc(,...,Ytj,..•,Ysí!l.

3. Коллективное предложение информации (сообщения, поступающие « каждую точку коллективного взаимодействия):

у;» [у;.....,у«у...

где к - количество точек коллективного взаимодействия.

Зведем оператор выходной коммутации ?ГЕ (матрица размерности .Кхо) и оператор выходной селекции р'Е (матрица размерности Кх1). Тогда У6ж=(5Ге*Р'е)хУГ.

4. Лоток информационного обслуживания, поступающий в входным селекторам в результате входной коммутации:

Хе = ••» — »

Тогда введя "оператор входной коммутации 51Е (матрица размерности ^«к ), получаем Х£ = 0ГехУе.

5. Поток информационного обеспечения , поступавши.! к входным ЭЙД, определяется следуюцин образос.

Пусть в АСЛИ определен теиатичес.т.4 рубрикатор МО или НКИ Т = {т^, Т2,..., Тй}, где Я - число рубрик. Назовем потоком информационного обеспечения ту часть информации, ассимилируемой входными ЗВД, которая поступает в режиме передачи информации с фиксированной тематикой.

Введя оператор входной селекциирЕ (матрица размерности ^хй), получаем ХЕ =рЕ # ХЕ>

рис. I. Взаимодействие основных потоков АСЛИ -7-

Оператором сети коммуникаций называется оператор концентрации рассеяния

\Л/«С«) - Срв * ЗГе)'(5Гс »Р'е) , где

т= <Р1, 5Ге» 5Г'е ,0'е > .

Тогда

Управление погокаш в информационно;!' сети достигается путем варьирования операторов 5Ге , 5Ге , ^е, _р'е. ,

Введем оператор структуры взаимодействия 03 /е = е * ЗГе. Тогда \Л/ск(т) «рЕ * *Я'е • ,

Пусть Ре ир'б не зависят от и 5ТЕ, т.е. коммутация осуществляется независимо от селекции. Задача зыбора оптимального значения сводится к задаче оптимизации структуры баз данных с учетом существующих в сети ограничений на паиять прямого доступа.

Эта задача реиается в два этапа. На первом этапе АСПИ рассматривается как АИС, т.е. вопрос о структуре баз данных решается независимо от их территориального расположения. На втором этапа проводится распределение получэнных на первом этапе баз данных по организационным элементам, где они долены размещаться.

Пусть в результате реаения задачи на перзом этапе получена совокупность БД £= [в^^,,.. Чтобы осуществить распределение этих БД по СЭ, определим коэффициент связанности В; и Е] г 0 » еслиЛ1 > б^ ;

Кч ~ ( »Ромвио« случае,

где О.-,.- объем памяти прямого ;осхупа, занимаемой В^ ; - максимально возможный объем памяти прямого доступа в Е] ; 1\ - количество реквизитов, употребляемых в В^ - количество реквизитов, употребляемых в потоке информационного обслуаиванияХе. (рис.1), поступающем к входным селекторам Е] , ту?4 - количество реквизитов, употребляемых одновременно в В*, .

Тогда В^ отнесен к такому Б}, дт/я которого^- »тах(уь, у«,-.,^).

Далее осуществляется декомпозиция АСПЛ на'функциональные и технологические составляющие. Таким образом структура АСПИ могет быть представлена в виде матричной схемы, столбцами которой являются функциональные подсистема, а строками - технологические слухбы.

В результате построения оптимальной структуры баз данных и декомпозиции АСПЛ на структурные составляющие минимизируется количество информационно-технологических связей в АСЯИ, обеспечивается унификация технологических процедур ( в рамках подсистем) и эффективные контроль и управление технологическими процессами (в рамках технологических, слунб)-.

После того как в АСПИ выделены функциональные подсистемы и технологические службы, осуществляется оптимизация оператора выходной селекцил_р'Е. В качестве критерия оагишзадии зыбраяо среднее время первичной обработки одного документа з сети при ограничениях на объеи памятипрямого-доступа для каждого информационного центра.

Пусть из !ро:кестза реквизитов выходных потоков (информационного поля) забран один реквизит или группа реквизитов. Upu этом выбранные реквизиты обязательно должны присутствовать з документах всех выходных потоков. Затем, в зависимости от значений этих рекви- • зитов, осуществлено разбиение всех документов выходных потоков на классы так, что каждый документ относится к одному и только к одному классу.

Тогда количественно"! формой опаратopaр^является трехмерная бинарная матрица, элементы которой определяются выражениями:

, I, если первичная информация по L-му классу документов Pijl = ' 1-й технологической службы обрабатывается в Бj;

I О, в протизном случае; где1 =1,2,...,в; j=I,2,...,g; 1=1,2,..,,р.

Пусть имеются дополнительные условия

A'.j.u=°,; € Iл

Задача оптимизации Ре формулируется следующим образом: Р 9 к , ,

t = —' iiil ■ -Ü- TTUfl (I)

Р К

Sj = 2 1 plji Siji < Sj ; (2)

где t - среднее время первичной обработки одного документа в сети; tijl - среднее время обработки одного документа i-го класса 1-й технологической службы в Еj; Sj - память прямого доступа в Ej -максимально допустимая память прямого доступа э Sj ;<?tjl- память прямого доступа для хранения документов I-го клазса 1-й Texi алогической службы в Ej.

В работе приводятся формулы для вычисления элементов целевой функции (I) и ограничений (2). Для этого определяется понятие меры соответствия "информационный центр-класс документов". Пера соответствия наряду с другими характеристиками определяет скорость перево-са данных на машиночитаемые носители, оперативность подготовки коррекционных листов, количество опибок в обрабатываемой информации, В своп очередь, количество ошибок определяет характер техно-

логических aesaja вра обработке первично« индор^ации и объем памят прямого доступа» необходимой для хранения ошибочных записей.

При постановке задачи оптшшзацки одерагоравводятся.следу щие сграничзния: выходные потоки являются регулярными; при вводе выходного погона в згобое устройство обрабатывается вся входная оче радь; для обработки первичной информации любой технологической слу бы предусмотрено . ведение специальной БД. Показано, что значение элемента tyt в выракенгл (I) ыоает быть получено по формуле

гдеoíijl. - вероятность грубой^сшйва в документе»^! - вероятность негру бой ошбки в докуиенте» tji - периодичность предыашинной, обработки выходного потока; tji - периодичность обработки выходного пот на в^стройстзах подготовки данных; tjl - периодичность пополнения БД; tjl - периодичность ручней коррекции; t jl - периодичность коррекции БД,"t jl - периодичность генерации обменной LUl/tjl - периодич ность пересылки обменной Ь'Л в центр переработки информации. Выие под грубыми ошибками понимаются такие ошибки, что содержащие их за. си должны быть задерканы для ввода в БД (например, ошибки в иденти фикаторе записи); прочие ошибки в записях определяются как негрубьи

Приводится расчет объема памяти прямого доступа (2) для систе иы управления базами данных "СПЕКТР". Для этого рассмотре: i сгрукт; ра БД с первичной информацией. В такой БД имеются четыре дескриптора: дата отправки записи в центр переработки информации, дата обна] кения ошибки; дата исправления ошбки, идентификатор записи. Длина ассоциатора такой БД задается следующим выракенизм: <5 (cijl ♦ Qjt + ац) + ШIl-(t 11 + 12), где ají - количество дат отправки,oji - количество дат обнаружена; ошибки, 0|1 - количество дат коррекции - количество докуме!

сов БД, Zil - длина идентификатора документа! -го класса L -й технологической службы.

трест m реет <п реет

T]i V . Y

-эт— í aJL» -~?т 5 tji tji t^i

где TjfecI - период реставрации БД первичной информации 1-й технол! гической службы в Ej,

(I, если слугбы : О, в пр

бъем яамяти прямого доступа«&|1 = ( I +пи1 'с/^),

де<1л - средняя длина документа I -го класса 1-й технологической луибы.

Практическое решение задачи распределения функций обработки ерзичноЗ информации между узлаш АСЛИ на примере ВНО '¿СПИ приведе-о в глазе 3.

В работе рассмотрена оптимизация оператора входной селекциир^, усть в АСЯИ Е= [Ер Е-,,... определен рубрикато» Ш1 или НКЙ = {Т|,Т2,...,!г(!}. Тогда количественной формой оператора^ яв'ляется рехмерная бинарная матрица, элементы которой определяются выраае-,иек:

I, если информация по 1-й тематике 1-й технологической хранится в Е] , в противном случае; де 1=1,2,...,Я; 3 =1,2,...,5; 1=1,2,...,р.

При этомр^^ -I, если Е^. хранится информация ло1в-Й тематике 1в-й технологической службы.

Такаа образом задача оптиуизацииР£ сводится к оптимизации состава информационных фондов в узлах АСЛИ, исходя из потребительского ¡проса и критериев функционирования АСОИ. В качестве критерия ояти-шзацяи выбраны совокупные ло всем узлаы АСПИ экономические затра-;ы на ведение массивов и обслуживание запросов при ограничении ¡редкого времени доступа в АСГП.

Тогда задача оптимизации оператора РЕформулируется следующим )бразои: Со=Сп + С1 * ^-^-пип (3)

й * <4)

•де Со - совокупные по всем узлам сети экономические затраты;

Сп - потери абонентов, связанные с охиданиэд;

С* - затраты на ведение массивов;

С^ - затраты на обслуживание запросов;

^А ~ среднее время доступа э сети;

1*- критическое время ожидания, в течение которого инфорыа-щонная ценность ответа отлична от нуля.

Как показано в глазе I в результате исследования сетевой тех-юлогии АСДЛ, выполняются следующие условия: среднее время пересылки запросов махду любыми двумя узлами АСЛИ постоянно; время оаи-*ания обработки запроса в любом узле АСЛИ много меньше времени его тересылки; затраты на пересылку информации значительно ниже затрат 1а хранение массивов и обарботку запросов в узлах АСЛИ. Кроме того, *ля тематического рубрикатора !ЖИ (или НИ) справедливо следующее

утверждение: декомпозиция пгатенгных документов на тематические рубрики такова, что количество документов, относящихся одновременн! к нескольким рубрикам, значительно меньше количества документов любой рубрики.

При постановке задачи оптимизации^ вводятся следующие дополнительные ограничения: все потребители» приписанные к любоиу Ш„ являются локальными, суммарный объои документов БД, относящихся одновременно к нескольким технологическим слукбаы, значительно меньше объема бонда любой технологической службы,

%сть заданы следующие величины:

а) Среднее время пересылки запросов мезду любыми двумя (В *пер;

б) Векторы тематического состава фонда

^ = ( 11,«.., 2* )» где 1=1,2,...,р.

в) Векторы тематического состава потока запросов потребителей, приписанных к Е]

я^сХ'^Л.....

где] »1,2,1=1,2,...,р„

Обозначим Л] в ]> Л)1 » Ас - ]> Я] .

Тогда вероятность Р; ответа в Е] на запрос потребителя, приписанного к Ej, задается зыракениэм:

Pj-2

СП

среднее время ошдания ответа на запрос потребителя, приписанного

KEj.tj-ZCl-Pjjt пер ; ' 9

среднее'время доступа в сети 1д = 2 Aj' -•

j«1

Элементы выражения (3) вычисляются по формулам: Си = 6°* t д• А.е coast'

zJ+И zi-ptji>;

Ъ1 = const; C'- const'.

В третьей главе приводится практическое решение задачи минимизации цалев ой функции (5) при ограничении (4) на примере ЮТЛ.

Следующим эталон проектирования АСЯИ является создание в рамках выделенных на предыдущих этапах структурных составляющих эффективной системы управления функциональными потоками АСПИ(СУФП),*

ЗУФП фиксирует принятые на предыдущих этапах проектные рзмния и наполняет конкретным содержанием функционально-технологическую схв-иу АСПИ.

СУФП представляет собой совокупность программных и технологи-*еских средств«, которые позволяют обнаруживать ошибки наиболее пол-яо, на наиболее ранних стадиях прохождения информации в АСПИ и обеспечивают наиболее оперативное их устранение.

Средствам^ повышения эффективности 05511 являются:

- организация данных (пополнение элементного состава записей зпециальными реквизитами, унификация форматов всех данных, к которым применяется один и тог же оператор формирования потоков);

- технология устранения осшбочной информации (в частности, решение задачи, подлежат ли в данной АСПИ записи, в которых обнару-сены ошибки, дальнейшему прохождению в. сети);

- методы контроля ошибочных записей.

Оптимизация методов контроля ошибочных записей в АС1Ш прозо-(ится в дза этапа. На первом этапе все реквизиты, содержащиеся в ¿овокупноа потоке АСПЛ, разбиваются на группы. Ынонество реквизи -ров относится к одной группе, если они отражают один и.тэт же эле-■шнтарный семантический аспект информационного объекта. Например, с одной группе относятся реквизиты "дата приоритета", "дата публи-сации", "дата подачи заявки". Каждой такой группе ставится в соот-(етствие определенный метод контроля и совокупность классификато-юз. На зтором этапе каждому информационному потоку ставится в ¡оответствие матрица характеристик всех реквизитов, содержащихся I этом потоке. В данной матрице для каждого реквизита указываются 1ГО основные характеристика, как то: •- обязателен ли реквизит з записи;

- длина.поля реквизита;

-г длина подлоля реквизита (если есть лодполя фиксированной ;лины);

- специфика записи реквизита в данном потоке;

- номер группы, в которую входит реквизит.

Такой подход позволяет выделить типовые модули контроля рек-изитов и отделить программные средства контроля от' спецификаций аполнекия полей реквизитов. Для максимальной точности идентифи-ации обнаруженных ошибок з диссертации разработана методика их дассификации.

3 работе рассмотрены средства и методы совершенствования техн логик устранения ошибочной информации на всех стадиях обработки па тентной информации в АСПЛ.

При организации процесса подготовки информации для распространения в АСПИ предусмотрено ведение специальной БД, Эта БД включает в себя записи с патентной информацией, прошедшие контроль, оцибки в которых не являются грубыми.

Обменная МЛ включает в себя записи, в которых не обнаружена либо исправлены осибки. Если L'JI оказалась дефектной, обеспечена возможность её повтори ой генерации. Для осуществления этих функций в записи БД включены два дополнительных доля: "дата обнаружения ошибки" и "дата первичного включения записи в обменную МЛ".

В сеансе первичной генерации обменной Ш1 следует предусиотрзт! специальны" паг заполнения доля "дата первичного включения записи в обменную .'Л». Это поле заполняется дат': очередной отправки 1Ш, которую должен указать администратор, ответственный за распространение обменных МЛ, Тогда, если по какиа-либо причинам надо генерировать -обменную Щ повторно, следует задать дату первичной генераци этой ¡Я,

Обработка патентной информация в центре переработки информации состоит в ведении совокупности БД и включает в себя следующие технологические процедуры: первоначальную генерацию БД, актуализацию БД, контроль информации в БД, чистку БД, ведение страхового фонда, формирование выходных потоков АСПИ,

Корректирующая информация вокет генерироваться двумя источниками - центром-генератором информации (ЦРИ) и центром переработки информации (ЦПИ). Корректировка ошибочной информации з ЦПИ носит вспомогательны»! характер и проводится, если при корректировке информации в ¡ГИ не удовлетворяйся требования к качеству выходной продукции АСПИ, '

Чтобы упростить технологи» коррекции информации в БД, целесообразно дополнить каздую функциональную запись в БД тремя полями: "дата проведения коррекции из ЦГИ"; "дата проведения коррекции из ЦПИ"; "дата первичного включения записи в обменную МЛ".

Коррекция записей из ЦПИ состоит в следующем. Дефектные ведомости, содержащиеся в протоколе ввода и контроля, .анализируют и использованием первичных документов. Затем на рабочих листах подготавливают корректировочную информации, после чего эту информацию выводят на МЛ.

Контроль информации в БД состоит в автоматизированном сленении

за поступлением'корректирующей информации и в контроле на полноту информации в БД.

лежзниэ за поступлением корректирующей информации осуществляется помощью поле.1 "дата проведения коррекция из ДГ-'1" и "дата прове-ения коррекции из ЩШ". -

В работе рассмотрен комплекс средств оценки эффективности ункционирозан^я АСПЙ, являющийся составляющей системы управления ункциональныыл потоками. Такие средства позволяют осуществлять роверку выполнения принятых проектных решений.

В третьей! глазе работы описана практическая реализация схемы роетирозания сетевой технологии для второй очереди Международной истемы патентно.4) информации (ШГЛ-2).

. Проведена декомпозиция ¡.¡СПЯ-2 на структурные составляю^ огласно методам, описанным во зтороЗ главе.

Вычислены критерия оптимизации сетевой технолагии..\!С1Ш-2, об-«в формулы которых для АСЛЯ приведены ¿о второй главе. Приведены асчеты решения задачи оптимизации распределения функций по обра-эгке первичной информации между 3!!0 МСИИ и задачи определения оп-/шального состава патентно-ин^ормациояных фондов в ВНО.

Описан комплекс праграм:гно-тзхкологичас.;их средств одноД из 1ужб ЫСПЯ - Службы обмена библиографическая информацией между сранами-членами СЭВ и МНПАДСК. Слукба обмена' обеспечивает сбор контроль библиографических данных об изобретениях текуцей регист-щия стран-членов СЗЗ, еаенедельную передачу объединенных данных 2 ЙЛ в ИНПАДСК,- а такке контроль информации !Я ЖШАДСК. В соответ-[зии с принципами, описанными во зторо.4 глазе, реализована единая юцедура обмена патентной информацией стран-членов СЗЗ, для чего ¡тором разработано типовое программное обеспечение.

ПЛЛ СБШН1 предназначен для ввода, контроля и коррекции очеред-м порции библиографической информации о патентных документах )боЗ страны-члена СЗЗ и передачи зтоЯ информации в головной орган ¡ПИ. ПШ1 ОКШ2 по сравнению с ПИ ШЛ2Н1 дополнительно включает себя средства организации, ведения и использования базы данных, церзацей библиографическую патентнуо информацию данной страны -:вна СЭВ за определенный период времени. Эта БД ведется под управ-нием П1Ш системы управления базами данных "СПЕКТР'. Зеденае БД |вт возможность получать магнитную ленту для передачи з ГО ЫСПН посредственно из содержащейся в БД информации а позволяет прозо- ■ :ть дополнительный контроль помещающихся в ней записей с библио-¡афическими данными. Это.повывает качество информации, передавае-й в головной орган ШИ.

До соглаоеиияы с ЙШ1АДСК объединенную 1Л по странам-членам СЭВ предоставляет гол овна! орган ИСЗЙ, поэтому контроль качества информационного продукта является функцией НПО "Поиск". Для реализации этой функции автором, согласно изложенным в главе 2 принципа создан програишо-технологический комплекс, позволяющий осуществлять контроль библиографической информации стран-членов СЭВ с последующей отправкой в эти .страны дефектных ведомостей, содержащих информацию об ошибочных докуизнтах, выявленных в результате контр о ля, для их последующей коррекции.

Программная реализация алгоритма контроля записей с бибдиогра фической патентной информацией позволила выявить ряд категорий ошибок, которые не обнаруживаетИНЖДСК«,

В заключении описаны основные результаты работы, приведены сведения о внедрении и апробации диссертации; помещен список печат ных работ, в которых опубликованы основные результаты диссертации,

<ХНШ!Ш РЕЗУЛЬТАТЫ ДИССЕРТАЦИЯ

1. Предлоаен новый подход к решению проблемы разработки сетевой технология в АСЛИ.

2. Ресена задача оптимизации распределения функций обработки первичной патентной информации мзкду информационными центрами.

3. Решена задача оптимального формирования патентно-информационных фондов в узлах АСП'1.

4. Разработана технология обработки патентной инфор: ции с момента ввода ее в ЭБЫ до использования в конкретных задачах- НИ!.

5. На основе разработанных принципов автором создан и успеино ннедрен программный комплекс, осуществляющий технологическую поддержку обработки библиографической патентной информации. Внедрение этого лраграишаг о ко индекса повывает целостность и непротиворечивость патентной информации, поступающей к- потребителю, уменьшает экономические затраты на повторную обработку запиъей, в которых обнаружены ошибки, уменьшает расход машинного времени на технологическую поддерюсу АСПИ.

Основные результата диссертации опубликованы в следующих печатных работах?

Г, Сипапин Ю.В., Стояновский В.А., Эрлих Й.А. Типовое программное обеспечение Слуабы обмена библиографической патентной информацией лэвду сгранами-членаыи СЭВ и ШЯАДСК.

1.: íописи докладов Всесоюзного семинара "Onuv йсслодозашш ЗалпзозанноИ сисмш азтмашзнрозаиного обмена ииформацпэй эуйеяпыш сеяяип ЗЕМ и бшгкаш данных", LI., ЕШ1ЛЛАС, 1928),

2. Есысола Л.Г., Колесников А.П., Эрлнх Ii,А. Тробовашш к коп э библипграфичесно); патентной информации н соти обмена стран-зз СЭЗ .и ИНЛАДСй. (В кн.; Tonnen докладоз Всесоюзного сошшара t исолодозанил централизованной спсгош азтоштлзиропаннаго

¡а ипфорпациоЛ с зарубвжшш'cosnua'ЭВМ и башсаии nauaux", U,„ Í\C, 1386).

3. Снлупнов A.A., Эрллх H.A. Выводы п предложения по практика гдиичостза Госкоинзобретений с Вадоусяпаац по изобротатсшьству ¡-членон СЭл я «ЛДАДСК з области обиона патентной ннфориацисзП. [.: Тозпсы докладов Мэкдуиародисго сошшара "Оценка э.фректип-

I использозалия патентно;! пнйорыацид п лроиьшлзиности и уточне-[отробностей пстробатолз/.", .it., BHüMiHI, I3S5), .• >»■, Посохииа ГЛ.| Эрллх Л.А. Разработка и шгздрание гмтодов л :тз контроля, шшяза и корректировка (Шблпа?рафичаскоЛ инфор-

[ УЛ.ШШАЦСК. (В кн.: Сиотешшо исследования ГЛС1ГГП, ;j,3 ЗТЛ'лТ. ' • * •

5. Посохши Г Л., Зрл;пс vi,Л, Контроль, .знаяиз н коррэктнрешз отрзфичоскоа информации ;ЛЛ ШШЛДСК. (В кн.; Проблош созораон-ания пагеитио-лн^орьационното обослзчзния з условиях хозрас-

;.!., ЗШШПИ, IJ2J). ■

6. Лocoxinta i1 .АЭрл:к П.Д. Яовшвнпо инфорпагизности М Olí. (3 сборнике Всесоюзного сошнира по патентной информации. ШШП, I98D).