автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Модели и методы автоматизации принятия решения по определению патентоспособности изобретений

кандидата технических наук
Трошин, Евгений Владимирович
город
Москва
год
2000
специальность ВАК РФ
05.13.06
Диссертация по информатике, вычислительной технике и управлению на тему «Модели и методы автоматизации принятия решения по определению патентоспособности изобретений»

Автореферат диссертации по теме "Модели и методы автоматизации принятия решения по определению патентоспособности изобретений"

ШавахШГ

" 9 ЯНИ 7Щ

ТРОШИН ЕВГЕНИЙ ВЛАДИМИРОВИЧ

МОДЕЛИ И МЕТОДЫ АВТОМАТИЗАЦИИ ПРИНЯТИЯ РЕШЕНИЯ ПО ОПРЕДЕЛЕНИЮ ПАТЕНТОСПОСОБНОСТИ ИЗОБРЕТЕНИЙ

05.13.06 - Автоматизированные системы управления

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук .

Москва - 2000

Работа выполнена на кафедре информатизации структур государственной службы в Российской академии государственной слум

при Президенте РФ

Научные руководители: доктор технических наук А.Н. ПАВЛОВ кандидат технических наук C.B. СТРЕЖ Официальные оппоненты: доктор технических наук, профессор С.Н. Селетков кандидат технических наук, старший научный сотрудник В.Е. Китайс

Ведущая организация - Войсковая часть 32103

Защита состоится "22" июня 2000 г. в dû, 00 на засед; диссертационного совета Д151.04.24 в РАГС при Президенте РФ адресу: г. Москва, пр.Вернадского 84, аудитория 2117.

С диссертацией можно ознакомиться в библиотеке РАГС. Автореферат разослан мая 2000 года.

Ученый секретарь диссертационного совета Д151.04.24 кандидат технических наук, доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Научно-техническая революция стала причиной неуклонного и прогрессирующего возрастания числа новых исследований и разработок в науке и технике. Увеличиваются темпы обновления прикладных научно-технических идей и роста конечных параметров новой техники, уменьшается время промышленной реализации научных идей. Одним из важнейших источников научно-технического прогресса являются изобретения. Государственная экспертиза изобретений, как часть патентной стратегии государства, является важной задачей, решение которой определяющим образом влияет на технический, оборонный и экономический потенциал страны. В рамках требования скорейшего освоения новшеств возникает необходимость повышения оперативности процессов оформления, подачи и рассмотрения заявок на изобретения и принятия по ним решения. Существующая система экспертизы приводит к тому, что время анализа заявки составляет в среднем не менее 2-х лет, при этом ценность описания изобретения как источника информации снижается за этот период со 100 до 60-70%. Кроме того, запоздалая информированность приводит к повторному изобретательству, не позволяет комплексно осваивать новации. Указанные проблемы нуждаются в разрешении на фоне резкого увеличения объема научно-технической информации, при этом снижается относительная информированность разработчиков. В условиях информационного взрыва все трудней приходится работать и экспертам. В настоящее время на одного эксперта приходится более 50 заявок в год, что не может обеспечить оперативное и качественное их рассмотрение существующими методами.

Выше изложенное свидетельствует об актуальности и практической значимости автоматизации и совершенствования информационного обеспечения патентной деятельности, в частности экспертизы изобретений по критериям патентоспособности. Решение задач совершенствования информационного обеспечения экспертизы изобретений существенно зависит от форм и методов представления научно-технической информации и технологии ее обработки.

Анализ источников (С.Ботуз, Т.А.Арешев, А.В.Андрейчиков, В.И.Блинников, Л.В.Александров, Н.Н.Карпова, Л.Кравец, М.В.Крюкова и др.) позволяет сделать вывод о том, что в настоящее время наиболее хорошо разработаны автоматизированные информационно-поисковые системы патентной информации. Значительных успехов добились разработчики систем поддержки изобретательства, предпринимаются попытки построения баз знаний предметных областей, рассматриваются вопросы создания виртуального окружения эксперта, совершенствуются методы безбумажного делопроизводства, развиваются информационные технологии патентно-конъюнктурных исследований с использованием структурных матриц и обобщенных графов. В то же время вопросы автоматизации проверки патентоспособности технических предложений не получили достаточного развития, не достаточно разработаны также вопросы формализации заявочных материалов, вопросы создания единой базы знаний соответствующей области уровня техники.

В настоящее время человеку-эксперту приходится определять предметную область изобретения, отбирать массив патентных документов, проводить сопоставительный анализ с сущностью предлагаемого решения по текстовым описаниям. При этом область поиска оказывается

обширной, затрагивает смежные отрасли. От эксперта требуется большой опыт и высокая квалификация. Процесс рассмотрения заявки занимает месяцы, достоверность оценки при этом составляет менее 100%.

Данная проблема нуждается в разрешении. Выход из данной ситуации предлагается искать в области разработки формальных моделей технических решений и уровня техники и методов их обработки в автоматизированных системах.

Результаты, полученные в области представления знаний, разработки баз знаний, формализации данных, а также степень и направленность информатизации в патентной отрасли позволяют говорить об актуальности создания формализованных методов представления заявочных материалов и их обработки с помощью вычислительных систем..

Целью работы является повышение оперативности и достоверности принятия решения о соответствии технического предложения критериям патентоспособности.

Поставленная цель требует решения следующих научно-технических задач:

1) Формализация исходных материалов заявки на изобретение для последующего построения математической модели технического предложения.

2) Построение семантической модели уровня техники.

3) Разработка методов формализованной обработки патентной информации.

4) Разработка технологии определения патентоспособности изобретений, служащей основой создания автоматизированной системы патентной экспертизы.

Методы исследования. Для решения поставленных задач в работе использовались: системный подход, теория множеств, теория графов, структурные методы распознавания образов, методы логического программирования, методы построения семантических сетей, методы мифологического и логического проектирования баз знаний.

Научная новизна. К числу основных научных результатов, полученных в ходе исследования, относятся следующие:

1) Поставлена и решена научная задача формализации методов определения патентоспособности изобретений, как задача распознавания, т.е. определения принадлежности технического предложения к классу объектов, обладающих свойствами патентоспособности.

2) Создана методика построения "патентного заявочного подъязыка", являющегося ограниченной моделью естественного языка и предназначенного для ввода материалов заявки в автоматизированную систему с использованием ЕЯ-конструкций.

3) Создана многоуровневая семантическая модель уровня техники, представляющая собой целостную модель предметной области, синтезированную из ряда локальных моделей, семантически связанных между собой.

4) Создана математическая модель изобретения для целей патентной экспертизы.

5) Разработан метод иерархической скалярной кластеризации предметной области, ставящий в соответствие однотипным объектам предметной области (объектам в базе знаний) зависящий от структуры и состава данного объекта комплексный скалярный показатель, по которому осуществляется кластеризация предметной области.

6) Применены методы структурного (синтаксического) распознавания для определения изобретательского уровня и промышленной применимости изобретения, путем разработки формальных порождающих грамматик для описания комбинаций признаков из заявки и из уровня техники и распознающих конечных автоматов, производящих сравнение полученных комбинаций.

7) Разработана технология автоматизации принятия решения о патентоспособности технического предложения, представляющая собой комплекс этапов формальной обработки патентной информации.

Практическая ценность диссертационной работы заключается в следующем:

- программная реализация разработанных моделей и методов информационной поддержки проверки патентоспособности позволяет повысить оперативность принятия решения по заявке на изобретение вследствие исключения процедур поиска известных из уровня техники решений человеком-экспертом;

- формализация процессов экспертизы позволяет довести объем выборки, на которой происходит распознавание объекта изобретения до 100%;

- разработанные методики обработки заявочных материалов позволяют снизить расходы на патентование, а также снизить нагрузку на государственную экспертизу за счет предварительной проверки патентоспособности заявки средствами заявителя;

- полученные модели предметной области позволяют создавать отраслевые базы знаний уровней техники предметных подобластей.

Результаты диссертационной работы реализованы:

- в войсковой части 32103 (акт в/ч 32103 от 10.05.2000 г.);

- в войсковой части 08317 (акт в/ч 08317 от 29.03.2000г.);

- в ГКНПЦ им.М.В .Хруничева (акт от 06.05.2000 г.);

- в РИИС в учебном процессе (акт от 29.03.2000 г.). Реализация положений работы показала следующее:

- расходы на патентование в организации снижаются на 30-50% за счет подачи только патентоспособных решений;

- достоверность оценки патентоспособности силами патентных органов составляет 90%;

- время поиска релевантной информации снижается в 2 раза;

- информационный шум снижается на 40%.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на научно-технических конференциях и семинарах в в/ч 32103, в/ч 73790, в/ч 08317, ВИКА им. А.Ф.Можайского.

Основные материалы диссертации опубликованы в 7 статьях. Структура и объем диссертации. Диссертация состоит из введения, трех разделов, выводов, заключения, списка литературы и приложения. Текст изложен на 190 страницах, включает 27 рисунков, теорему, 5 таблиц, список литературы из 97 наименований. Основные положения, выносимые на защиту:

1. Методика формализации сущности изобретения.

2. Семантическая модель уровня техники как целостная модель предметной области, составленная из локальных представлений.

3. Метод иерархической скалярной кластеризации предметной области для определения новизны изобретения.

4. Методы синтаксического распознавания для определения патентоспособности изобретения.

5. Технология информационной поддержки принятия решения о патентоспособности.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении обоснована актуальность темы, приводится постановка задачи и краткая аннотация содержания работы по разделам, дана оценка новизны полученных результатов, сформулированы положения, выносимые на защиту.

В первом разделе диссертации «Концепция формирования методов информационной поддержки патентной экспертизы» проводится анализ существующих информационных систем в патентной и изобретательской деятельности, исследуется влияние НТП на патентную деятельность, проводится анализ предметной области, содержание оценки изобретений по критериям патентоспособности, предлагается подход к формализации методов патентной экспертизы, рассматривается структура автоматизированной системы.

Существенные изменения в концепции научно-технического развития сейчас происходят каждые 6-10 лет, при этом примерно 85-90% опубликованных технических сообщений в мире содержится в патентной литературе. В настоящее время ежегодно к патентным фондам добавляется 1 миллион документов. В то же время экспертиза изобретений длится не менее 2-х лет. Это приводит к запоздалой информированности разработчиков, к повторному изобретательству, ошибкам на начальных

стадиях проектирования. Разрешить указанные проблемы возможно путем использования новых информационных технологий.

В диссертации приводится краткий анализ систем автоматизации в патентной сфере, который показал широкий спектр применения информационных технологий: от детерминированных формализованных документальных библиотек, содержащих тексты описаний изобретений в виде электронных каталогов до интеллектуальных систем, работающих с концептуальными знаниями, помогающими создавать новые изобретения.

Патентная область рассматривается с точки зрения системного и информационного подходов с целью определения перспектив моделирования и формализации. Делается вывод о принадлежности системы патентной экспертизы к классу сложных больших систем. Исследуется механизм патентной экспертизы как совокупности процессов обработки информации, особое внимание уделяется анализу патентной информации как специфическому, имеющему уникальные особенности типу информации, хорошо формализуемому по определению.

Оценка патентоспособности изобретения заключается в проверке соответствия его трем критериям: новизны, промышленной применимости и изобретательского уровня. Решение поставленной в исследовании задачи формализованной оценки патентоспособности декомпозируется соответственно на три подзадачи: формализованной оценки новизны, изобретательского уровня и промышленной применимости.

В формализованном виде эти подзадачи представляются следую-' щим образом. Пусть Ъ - заявка на предполагаемое изобретения, - известные из уровня техники и решения, - комбинации элементов из

предлагаемого решения, т.е. подмножества множества элементов из Ъ, 1т - известные комбинации из уровня техники, т.е. фрагменты и, г(7.) - технический результат, заявляемый для Ъ, Г(Х,в) - обобщенная функция, выражающая совокупность известных науке физических эффектов в зависимости от множества входных воздействий X и состояний в, реализованная в предполагаемом изобретении и приводящая по мнению заявителя к достижению результата х(Т) при использовании изобретения. Формальная проверка патентоспособности заключается в удовлетворении одновременно трех условий.

Z п и Ф 1к , - проверка новизны, Ъ не повторяет полностью ни одно решение 1к из и; > р - проверка изобретательского уровня, расстояние между фрагментами заявляемого решения и известного уровня техники должно быть больше некоторой величины р;

Г(Х,С) = г(Х) - проверка промышленной применимости, возможность достижения заявленного технического результата с использованием физических эффектов, положенных в основу изобретения.

Решение поставленных подзадач осуществляется в рамках автоматизированной системы, структурная схема которой приведена на рис. 1.

Прототипом данной схемы является классическая структура экспертных систем, однако, представленная модель имеет существенные отличия, вызванные спецификой предметной области и решаемых задач, а именно, с одной стороны предметной областью системы является весь (!) уровень техники вкупе с известными науке физическими эффектами, а с другой стороны не большое число решаемых системой задач, при

этом вся информация структурирована и формализована, число возможных результатов работы системы мало.

Этапы информационной поддержки патентной экспертизы включают в себя следующие процессы: ввода материалов в вычислительную систему, построения внутренней модели заявки, формализованной оценки полученной модели по критериям патентоспособности путем соотнесения полученных данных с имеющимися в базе знаний уровня техники предметной области.

Блок определения области исп-ния изобретения

Модуль формулирования ответа

Решатель задачи

Модуль объяснения решения

Рис.1. Структурная схема автоматизированной системы экспертизы

Второй раздел «Формализованные модели и методы обработки заявочных материалов» посвящен разработке формальных моделей изобретения и уровня техники, методов проверки патентоспособности.

Первым шагом создания формальной математической модели изобретения является ввод материалов заявки в систему, способом, позволяющим работать дальше с семантикой заявки.

Осуществлять ввод материалов заявки предлагается на естественном языке, построенном с использованием ряда грамматико-синтаксических правил, которые перечислены ниже:

1) Используются только простые повествовательные предложения.

2) В предложении обязательно должны присутствовать подлежащее и сказуемое, предложение должно быть полным. В конструкции предложения отсутствует эллипсис.

3) Устанавливается фиксированный порядок слов в предложении: подлежащее, сказуемое, далее дополнения и обстоятельства. Определения и обстоятельства образа действия ставятся после определяемого слова. При этом, если одно или несколько определений или обстоятельств образа действия определяют несколько слов, то они ставятся после каждого из них для устранения неоднозначности.

4) Вместо предложений с однородными членами используются несколько простых аналогичных предложений по числу однородных членов.

5) Не допускаются причастные и деепричастные обороты, вводные слова, сложноподчиненные и сложносочиненные предложения.

6) В пределах информационно-связной части каждое последующее предложение должно быть связано по смыслу с предыдущим, содержать тему и рему. Перескакивание с одной смысловой темы на другую не допустимо.

7) Из текста на заявочном подъязыке исключаются пресуппозиции ("молчаливые предпосылки") и умолчания (отсутствия явного указания на все аспекты ситуации).

8) Не используются неопределенные с семантической точки зрения, слова, такие как, большой, около и др., слова в переносном значении.

9) Исключаются все слова, не являющиеся необходимыми для передачи смысла, а также сложные предлоги и вводные обороты.

10) Использование ссылки на антецедент не допускается, т.е. употребление анафоры является обязательным.

В состав лингвистического обеспечения включаются словари мета-лексики, терминов-предикатов, актантной лексики. Текст описания заявки должен быть строго структурирован.

Основой разработки методики создания заявочного подъязыка послужил план, предложенный Дж. Лербергером. Анализ сущности патентной информации позволил наполнить этот план содержанием, вытекающим из задач определения патентоспособности.

Основой системы экспертизы является база знаний, содержащая известный уровень техники данной отрасли. Для построения модели предметной области на этапе инфологического проектирования использовалась модель типа "сущность-связь".

Модель уровня техники представляет собой многоуровневую семантическую сеть, элементы которой способны одновременно входить в различные локальные представления предметной области (рис.2). Локальными представления являются следующие подмодели: модель признака, модель комбинации признаков, модель технического объекта (изобретения), иерархические модели связи признаков по типу "род-вид", по типу "целое-часть", функциональная сетевая модель связи признаков в объектах техники, модель соответствия известных комбинаций признаков известным техническим результатам, модель преемственно-

сти изобретений, выражающая отношение "прототип-усовершенствование", библиографические данные изобретений, модель известных физических эффектов. В базу знаний входят также терминологические словари-тезаурусы, лингвистические словари, словари мета-лексики и др.

Признаки" «целое'часть Физические

Рис.2. Семантическая модель уровня

Известные признаки-элементы составляют множество РО, признаки-связи - множество WD, известные комбинации находятся в множестве С1, результаты составляют множество МЭ, изобретения составляют множество I, известные эффекты находятся в множестве ЕЭ. Свойства признаков заданы функциями, которые они выполняют - £ и фу.

Для представления модели предметной области используются графы. Различные графы соответствуют различным локальным моделям и связываются между собой межуровневыми связями, объединяющими локальные представления в единую семантическую модель предметной области. Впервые предложена модель, содержащая не текстовые описания изобретений, а формализованные представления семантической сущности объектов, являющихся содержанием патентной информации.

Задача формализации оценки патентоспособности требует построения математической модели изобретения. Структурно-функциональное содержание технического объекта в формализованном виде выражается с помощью многомерного графа:

Ъ = <А, Р,\У,С,Р0,\¥о,Ы>,

где А - бинарная матрица смежности размерности N. (КГ - число элементов в данном техническом решении), показывающая наличие связи между парами элементов, являющихся признаками изобретения, в техническом решении; Р - матрица-столбец (И) весов вершин, т.е. типов элементов из словаря, Р = [рД, pi = р^, р^ е РО, РО - множество известных типов элементов; W - матрица весов дуг, т.е. типов бинарных связей между элементами, = [Шу], Шу = , если а^ = 1, иначе 0, е -

множество типов известных связей; И. - результат, достигаемый, по мнению заявителя при использовании данного изобретения, Я = г^ е 1Ю -

множеству известных из уровня техники технических результатов; С -множество комбинаций признаков, выделенных заявителем с объявлением результатов, достигаемых этими комбинациями, Р0 и W0 - множества отличительных признаков-элементов и признаков-связей.

Построенная модель позволяет применять к ней формальные методы проверки патентоспособности. Определение новизны - первая подзадача оценки патентоспособности.

На математическом языке определение новизны означает выполнение условия:

Для Vk А - AIk = 0 а Р — PIk = 0 л W — Wik = 0 => новизна отсуствует.

Сравниваются структуры (матрицы А и АГ^) и составы (матрицы P,W и PDk, WDk) предложенного и известных технических решений.

В исследовании предлагается для установления новизны изобретения использовать разработанный для этого метод иерархической скалярной кластеризации. В основу данного метода положена доказанная в работе теорема.

Теорема. Для любого множества А бинарных матриц Av одинаковой размерности пхт существует взаимно однозначное отображение множества А в множество S4 скалярных показателей S*„ являющихся образами соответствующих матриц Ау.

В решаемой задаче скалярный показатель SA вычисляется по формуле:

п II

S =ЕХач'2 , П- размерность матрицы, k = (n +n-(j-l)(2n-j))/2+i-2.

я >■/

Этот показатель идентифицирует структуру изобретения. Показатели Sp и Sw идентифицируют состав изобретения, т.е. матрицы-столбцы весов элементов и связей.

8Р=5>2

,х(М)

В результате получается комплексный скалярный показатель (КСП): Б = < 8Л, 8Р, 8Ш>, однозначно идентифицирующий данное техническое решение.

В базе знаний все известные решения упорядочены по значению, вычисленных для них комплексных скалярных показателей 81. Определение новизны заключается в поиске скалярного показателя, равного вычисленному для заявки. Если результат поиска отрицателен, то решение является новым.

В рассматриваемой области создаются кластеры, соответствующие скалярному показателю Б1Ак и упорядоченные по его значениям (рис.3). В к-том кластере находятся технические решения, имеющие одинаковые значения Б1Л, т.е. решения, представленные идентичными графами смежности и различающиеся весами (типами) вершин (конструктивных элементов) и дуг (связей между элементами).

При нахождении в базе 81Л, равного 8Л, в кластере, соответствующем найденному 81А, осуществляется поиск 81р, равного 8Р, на более низком иерархическом уровне. При положительном результате поиска происходит переход на еще более низкий иерархический уровень для проверки равенства значений Б4"" и 81^

81\

81Гк1... 81Рку

81 и1 ••• 81Гие ... вг

кЧа 81™иу1... вГц«... 81"^ П31\„ ...81 „1ь... 81Г„1Г Рис.3.

Метод иерархической скалярной кластеризации позволяет со стопроцентной достоверностью, в отличие от традиционных методов, определять новизну объекта, т.к. он отыскивает не множество предположительно похожих объектов, а один конкретный с конкретным значением КСП. Кроме того, этот метод в нужную область базы знаний обращается прямым доступом, в результате отпадает необходимость в полном переборе записей, и как следствие существенно увеличивается скорость выполнения поисковой операции.

Решение второй подзадачи - проверки изобретательского уровня заключается в выработке эвристик формализованных рассуждений и построении формального аппарата их проверки с использованием известных методов структурного распознавания и метода иерархической скалярной кластеризации.

Первая эвристика утверждает, что если в уровне техники не известны комбинации типа элемент-связь-элемент, взятые из модели заявки, причем хотя бы один из признаков обязательно должен быть отличительным, то изобретение соответствует изобретательскому уровню.

Для проверки этой эвристики использована теория формальных языков, разработанная Хомским, на которой основывается задача структурного или синтаксического распознавания. В результате в работе получен ряд порождающих грамматик и распознающий конечный автомат. С, = {Уц, Ум2, Р], 81, — программная порождающая грамматика, [^(С,) = {р^^р*^} — комбинации известных признаков из заявки, Сг = {У*2, Ут2> 82, Р2, .12} — программная порождающая грамматика, Ь2(С2) = {р<'я\У<1ьр',с} — комбинации признаков из уровня техники, С.""'3 = {У"\3, У%3, 845Чз, Р,5Ч3}—порождающая грамматика,

Ьйчз(СЬчз) = {Ри Ws, Рч} — множество состояний конечного автомата,

настроенного на распознавание соответствующей tsq-кoмбинaции признаков, А = {£, 0,6, q0, Г} — детерминированный распознающий конечный автомат, сравнивающий комбинации и Ь2.

Вторая эвристика связана с тем, что заявитель может в описании изобретения выделить некоторую комбинацию признаков и объявить для нее результат, достигаемый этой комбинацией. Необходимо проверить известность из уровня техники такой комбинации и известность результата ею достигаемого.

Такие комбинации выделяются во множество С. Эти комбинации являются подграфами графа Ъ. Для них вычисляется комбинационный комплексный скалярный показатель, и проверка проводится аналогично проверке новизны, но только для комбинаций признаков, в соответствующей области базы знаний. При нахождении аналогичной комбинации в уровне техники производится сравнение результатов: известного и объявленного заявителем.

Изобретательский уровень присутствует, если выполнилась хотя бы одна из двух эвристик.

С помощью предложенных методов эксперт избавляется от отбора и изучения большого массива текстовых документов, еще большего, чем при проверке новизны. Рассуждения по неформальному критерию с помощью метода сводятся к поисковым процедурам. Причем, поиск производится в заранее определенной узкой области и является осмысленным и направленным. Заранее известно, что искать и где.

При решении третьей подзадачи оценки патентоспособности формальными методами также использовались методы синтаксического распознавания.

Проверка промышленной применимости заключается в подтверждении осуществимости изобретения с помощью заявленных или известных средств и методов, а также обеспечения достижения усматриваемого заявителем технического результата. В основе функционирования технического объекта лежат физические эффекты. Общая формула описания эффекта: А -> В(и), где А - причина эффекта, В - следствие эффекта, и - условия реализации эффекта.

Эффект в данном случае есть функция выполняемая элементом в техническом объекте.

£(х0 = y¡, где Х| - входное воздействие на ¡-й элемент, у1 - выход этого элемента , т.е. результат, достигаемый использованием данного элемента в объекте, £ - функция, преобразующая входное воздействие в выходной результат. При этом результат yi является входным воздействием для £+1-го элемента. Выход последнего элемента есть результат, достигаемый изобретением. Проверка достижимости результата, объявленного заявителем заключается в последовательном вычислении функций

и=р(х>=а«...«...^,)...)...)).

В базе знаний уровня техники функции хранятся как свойства известного элемента, а свойства находятся в отношениях с известными физическими эффектами, связанными между собой в единую семантическую сеть.

С помощью формальных грамматик, предложенных в работе, строится дерево эффектов, соответствующее структуре и содержанию тех-

нического решения путем подстановок вместо признаков изобретения их свойств-функций, а вместо функций — известных физических эффектов. Далее производится проверка достижимости технического результата при использовании изобретения, объявленного заявителем. Для этого были созданы формальные языки эффектов и конечные автоматы имитации функционирования.

В рассматриваемой задаче граф устройства преобразуется в дерево эффектов.

еа№: г'е —> гйв(ие8) - формула физического эффекта, где е1|№ - эффект из множества эффектов ЕО, Д и г^-известные результаты из множества известных результатов 1Ш, ие8- условия возникновения эффекта Грамматики, порождающие языки эффектов для признаков-элементов для признаков-связей

С, = {У/, УгЛ Рг, Сф = {Утф, V/, Рф, 8Ф}

Ь,<С,) = {еЛ Ьф(Сф)={еЛ

Конечные автоматы имитации функционирования для признаков-элементов для признаков-связей

АГ| = {<У;, 1';, 5Г;, ЧЛ Ж*,}, А\ = {(^ц, б'у, Чо% Ефц}

Ам= {О14,114, Яо14» - выходной конечный автомат

СМ={Чо, Ум, Л}, Iм = {хм, гй№}, = {ДА, НЕТ}, 8Ы: 5,(я0, хк) = ум = Чм, 52(ЧЫ, Хы) = НЕТ, ЛО = ДА - результат, объявленный заявителем, - достижим. При использовании предложенного метода не требуется высококвалифицированный специалист данной области.

Разработанные формальные методы позволяют свести все процедуры определения патентоспособности в единую технологию, основными этапами которой являются: подготовка материалов заявки, построение модели изобретения, проверка новизны, проверка промышленной применимости, проверка изобретательского уровня, пополнение базы знаний в случае признания решения патентоспособным.

В третьем разделе «Использование методов формализованной обработки заявочных материалов» описано использование разработанных методов информационной поддержки применительно к изобретениям-устройствам из области дискретных электронных устройств.

Класс этих устройств характеризуется тем, что они состоят из отдельных элементов, число которых относительно не велико, связи между этими элементами представляют собой электрические соединения типа "входХ - выходУ". Связь характеризуется тем, что она либо есть, либо ее нет, взаимное расположение элементов здесь не имеет места. Эффектами в таком устройстве являются комбинации сигналов на выходах элементов, представляющие собой логические 0 и 1. Свойства элементов в рассматриваемой подобласти описываются таблицей истинности, устанавливающей соответствие между комбинацией булевых переменных на входе и комбинацией булевых значений на выходе элемента.

В базе знаний физические эффекты заменены здесь на правила булевой алгебры, а объявленные заявителем и известные результаты представляют собой не комбинации булевых величин, а некие прагматические результаты, имеющие практическое назначение в соответствующей отрасли промышленности, например, увеличение скважности, преобразование двоично-восьмеричного кода в десятичный и др. Тип связи ха-

рактеризуется тем, какие выводы данных элементов соединены этой связью.

Каждому элементу присваивается уникальный числовой идентификатор, и записи в базе знаний упорядочиваются в порядке возрастания идентификаторов, также вычисляются комплексные скалярные показатели для известных устройств и комбинаций, записи им соответствующие упорядочиваются по возрастанию показателей.

В работе приводится пример применения разработанной методики формализации описания изобретения и проверки его патентоспособности на конкретном техническом предложении, ставшем изобретением, подтвержденным патентом РФ. Для этого представляется фрагмент базы знаний предметной области и алгоритм проверки критериев патентоспособности заявки методами скалярной кластеризации и синтаксического распознавания применительно к изобретениям-устройствам из области дискретных электронных устройств.

Анализ конкретной области показал, что применение разработанных методов в различных предметных областях имеет свои особенности. Для уменьшения размерности скалярных показателей последние могут отображаться в кортежи частных показателей.

Разработанные методы позволили получить программно реализуемые алгоритмы. Практическое использование основных положений работы привело к созданию автоматизированного рабочего места эксперта. Результаты практической отработки оказались следующими: - расходы на патентование в организации снижаются на 30-50% за счет подачи только патентоспособных решений;

- достоверность оценки патентоспособности силами патентных подразделений на предприятии составляет 90%;

- время поиска релевантной информации снижается в 2 раза;

- информационный шум снижается на 40%.

Показатели размерности элементов системы приведены в таблице 1.

Таблица 1.

Общее число патентных документов по направлению 180000

Ежегодно в мире подается заявок по направлению 3000

Известных типов элементов 500

Количество признаков-элементов в устройстве в среднем 20

Максимально 35

Количество признаков-связей в устройстве в среднем 28

Максимально 50

Количество отличительных признаков-элементов 9

- связей 14

Максимальная размерность компонентов КСП байт 20

Сравнительная оценка показателей эффективности определения патентоспособности по традиционной технологии и предложенной дана

в таблице 2.

Таблица 2.

ПРОЦЕДУРА ВРЕМЯ ДОСТОВЕРНОСТЬ КВАЛИФИКАЦИЯ ЭКСПЕРТА

тт нт тт НТ ТТ НТ

Оценка новизны дни сек. мин. около 100% 100% высокая средняя

Определение изобретательского уровня дни, месяцы мин. не равно 100% около 100% высокая средняя

Проверка ромышлеиной применимости дни, месяцы мин. около 100% 100% высокая средняя

ТТ — традиционная технология, НТ - новая технология.

Для оценки использовался патентный фонд, выбрано направление Н04. Расчет показателей производился на случайной выборке из 100 патентных документов.

ЗАКЛЮЧЕНИЕ

В результате проведенного исследования решена научно-техническая задача создания формализованных методов информационной поддержки и автоматизации принятия решения по определению соответствия предлагаемого изобретения критериям патентоспособности, имеющая существенное значения для отрасли знания — автоматизированные системы управления, при этом получены следующие основные научные и практические результаты.

Сформулирована и решена научная задача автоматизированной оценки патентоспособности заявляемого изобретения как задача распознавания, т.е. определения принадлежности технического предложения к классу объектов, удовлетворяющих критериям патентоспособности, с использованием методов обработки формализованной информации.

Разработана методика построения «патентного заявочного подъязыка», являющегося ограниченной моделью естественного языка и предназначенного для ввода материалов заявки в вычислительную систему с использованием ЕЯ-конструкций, понятных пользователю-заявителю и облегчающего взаимодействие человека и вычислительной системы.

Создана семантическая модель уровня техники, представляющая собой целостную модель предметной области, синтезированную из ряда локальных моделей, семантически связанных между собой, элементы в

которых находятся друг с другом в различных отношениях, являясь одновременно элементами нескольких локальных моделей. Данная модель является инфологической моделью полной и непротиворечивой базы знаний известного уровня техники.

Разработана математическая модель изобретения.

Предложен метод иерархической скалярной кластеризации предметной области, ставящий в соответствие объектам предметной области (объектам в базе знаний) скалярные показатели, зависимые от структуры и состава данного объекта, по которым осуществляется кластеризация предметной области. Данный метод позволяет прямым доступом без перебора находить кластер, содержащий объект, имеющий похожую структуру и состав.

Предложена формализованная схема рассуждений по трудно формализуемому критерию «изобретательского уровня» на основе четкого выделения подструктур анализируемого объекта и сравнения этих подструктур с аналогичными подструктурами, известными из уровня техники, т.е. сведение оценки по данному критерию к поиску в базе знаний, объектов, схожих с элементами структуры заявляемого решения, что позволило применить метод формализованной оценки изобретения по указанному критерию.

В работе использованы методы структурного распознавания для определения изобретательского уровня изобретения, в результате чего получены формальные порождающие грамматики для описания комбинаций признаков из заявки и из уровня техники и распознающий конечный автомат, производящий сравнение полученных комбинаций.

Определение соответствия заявки критерию промышленной применимости также производится с использованием методов структурного распознавания. При этом решена задача обратная задачам, решаемым в системах автоматизированного проектирования, где из дерева эффектов получается устройство. В настоящей задаче из графа устройства получено дерево эффектов. На этом дереве осуществляется распознавание принципа функционирования изобретения.

Осуществлен синтез методов информационной поддержки принятия решения о патентоспособности технического предложения в единую технологию, представляющую собой комплекс этапов формальной обработки патентной информации, включающих процедуры ввода исходных данных, внутренней интерпретации их и сопоставления с имеющимися данными (в виде базы знаний) с целью принятия решения о принадлежности заявки, содержащейся во входных данных, к классу патентоспособных объектов в рамках автоматизированной системы патентной экспертизы.

Внедрение разработанных моделей и методов информационной поддержки проверки патентоспособности позволяет повысить оперативность принятия решения по заявке на изобретение вследствие исключения процедур поиска известных из уровня техники решений и анализа текстовых описаний человеком-экспертом.

Формализация процессов экспертизы позволяет довести объем выборки, на которой происходит распознавание объекта изобретения до 100% и исключения тем самым субъективизма оценки, неизбежно присущей человеку.

Построение целостной модели уровня техники открывает широкие перспективы для комплексного исследования предметной области, позволяет ставить новые научные задачи анализа соответствующей отрасли техники.

На основе разработанных моделей и методов разработан ряд методик, внедренных в практическую деятельность в ГКНПЦ им.М.В.Хруничева, в/ч 08317 и в/ч 32103, также разработано и внедрено автоматизированное рабочее место эксперта. Положения работы использованы в учебном процессе в Российском институте интеллектуальной собственности.

Использование методов, предложенных в диссертационной работе, позволяет осуществлять предзаявочную экспертизу технических предложений силами заявителя с целью определения целесообразности патентования, тем самым сокращает финансовые и людские ресурсы.

Предложенные методы могут быть использованы для определения патентоспособности других объектов промышленной собственности. Метод иерархической скалярной кластеризации может применяться для любых объектов, структура которых может быть представлена с помощью графа.

Дальнейшими направлениями исследования являются следующие:

- развитие методов применительно к конкретным предметным областям;

- формализация свойств признаков, разработка терминологических сло-

варей-тезаурусов; выработка эвристик, совершенствование правил оформления документов;

- создание методов автоматизированного наполнения баз знаний;

- проектирование баз знаний уровня техники по отраслям.

Основные публикации по теме диссертации:

1. Трошин Е. В. Ввод материалов заявки на изобретение в автоматизированную патентную систему на заявочном подъязыке-ограниченной модели естественного языка // Проблемы промышленной собственно-сти.-1998, №5.

2. Трошин Е. В. Оценка изобретательского уровня изобретения-устройства с точки зрения формального алгоритма экспертизы // Проблемы промышленной собственности.-1998, №12.

3. Трошин Е.В. Автоматизация экспертизы изобретений - актуальная задача // Интеллектуальная собственность.-1999, №4.

4. Трошин Е. В. Автоматическая оценка технического решения по критериям патентоспособности. Научно-информационный сборник (труды). Вып.2.-М.:ГИЦИУ, 1996.

5. Трошин Е. В. Структура автоматизированной патентной системы. Научно-информационный сборник (труды). Вып.2.-М.:ГИЦИУ, 1996.

6. Трошин Е. В. Экспертная система экспертизы изобретений по критериям патентоспособности. Научно-информационный сборник (труды). Вып.З.-М.:ГИЦИУ, 1996.

7. Трошин Е. В. Концепция создания автоматизированной системы экспертизы изобретений. Научно-информационный сборник (труды). Вып.2.-М.:ГИЦИУ, 1995.

I/ Зак.№ 2£8 Тир. ХО экз. ПМБ РАГС 117606 Москва, пр.Вернадского, 84

Оглавление автор диссертации — кандидата технических наук Трошин, Евгений Владимирович

ВВЕДЕНИЕ.

Раздел 1. Концепция формирования методов информационной поддержки патентной экспертизы.

1.1. Роль и место патентной деятельности в НТП.

1.2. Системно-информационный анализ патентной области как объекта моделирования и автоматизации.

1.3. Анализ информационных систем в патентной деятельности.

1.4. Содержание задачи оценки изобретения по критериям патентоспособности.

1.5. Математическая постановка задачи оценки технического решения по критериям патентоспособности.

1.6. Структура вычислительной системы обработки данных заявки на изобретение для установления ее патентоспособности.

ВЫВОДЫ ПО РАЗДЕЛУ 1.

Раздел 2. Формализованные модели и методы обработки заявочных материалов.

2.1. Ввод материалов заявки на изобретение на заявочном подъязыке - ограниченной модели естественного языка.

2.2. Информационный анализ уровня техники.

2.3. Мифологические модели локальных представлений уровня техники, синтез многоуровневой семантической модели базы знаний уровня техники.

2.4. Математические модели элементов базы знаний.

2.5. Метод иерархической скалярной кластеризации.

2.6. Методы структурного распознавания технического предложения как патентоспособного объекта.

2.7. Технологии оценивания технического предложения по критериям патентоспособности.

ВЫВОДЫ ПО РАЗДЕЛУ 2.

Раздел 3. Использование методов формализованной обработки заявочных материалов.

3.1. Особенности предметной области дискретных электронных устройств -подобласти известного уровня техники.

3.2. Методика формализации оценки патентоспособности в области электронных дискретных устройств.

Введение 2000 год, диссертация по информатике, вычислительной технике и управлению, Трошин, Евгений Владимирович

Предметом настоящего исследования является информационная поддержка экспертизы изобретений, а именно построение экспертной человеко-машинной системы оценивания технического решения, содержащегося в заявке на изобретение по критериям патентоспособности.

Объектом исследования является экспертиза изобретений по критериям патентоспособности, таким как новизна, промышленная применимость и изобретательский уровень. При этом основное внимание уделено такому слабо формализуемому критерию, как изобретательский уровень. В зависимости от отрасли использования предполагаемого изобретения и вида самого изобретения, как объекта правовой охраны, патентная экспертиза имеет свои особенности, правила и методы, хотя при этом сохраняются общие положения и подходы, вытекающие из законодательства и методологии экспертизы. В исследовании главным объектом экспертизы является устройство из области дискретных электронных устройств. Следует, однако, заметить, что в силу целостного характера всей системы патентной экспертизы, в силу объединения различных подотраслей в общем для них уровне техники, а также в силу недостаточной разработанности вопросов автоматизации патентной экспертизы в работе приходится касаться и смежных проблем, выходящих за непосредственные границы исследования.

Научно-техническая революция стала причиной неуклонного и прогрессирующего возрастания числа новых исследований и разработок в науке и технике. Увеличиваются темпы обновления прикладных научно-технических идей и роста конечных параметров новой техники, уменьшается время промышленной реализации научных идей. Одним из важнейших источников научно-технического прогресса являются изобретения. В рамках требования скорейшего освоения новшеств возникает необходимость повышения оперативности процессов оформления, подачи и рассмотрения заявок на изобретения и принятия по ним решения. Существующая система экспертизы приводит к тому, что время анализа заявки составляет в среднем не менее 2-х лет, при этом ценность описания изобретения как источника информации снижается за этот период со 100 до 60-70%. Кроме того, запоздалая информированность приводит к повторному изобретательству, не позволяет комплексно осваивать новации. Указанные проблемы нуждаются в разрешении на фоне резкого увеличения объема научно-технической информации, при этом снижается относительная информированность разработчиков. В условиях информационного взрыва все трудней приходится работать и экспертам. В настоящее время на одного эксперта приходится более 50 заявок в год, что не может обеспечить оперативное и качественное их рассмотрение.

Выше изложенное свидетельствует об актуальности и практической значимости автоматизации и совершенствования информационного обеспечения патентной деятельности, и в частности экспертизы изобретений по критериям патентоспособности. Решение задач совершенствования информационного обеспечения экспертизы изобретений существенно зависит от форм и методов представления научно-технической информации и технологии ее обработки.

Анализ источников [8], [15], [32], [33], [55], [72] и др. позволяет сделать вывод о том, что в настоящее время наиболее глубоко разработаны автоматизированные информационно-поисковые системы патентной информации. Значительных успехов добились разработчики систем поддержки изобретательства, в частности систем поиска новых технических решений с помощью структурно-функционального синтеза [66], методов кластерного анализа [5]. В рамках этих проектов предпринимаются попытки построения баз знаний предметных областей соответствующих классов технических устройств. Рассматриваются вопросы создания виртуального окружения эксперта с целью облегчения работы последнего [10]. Также совершенствуются методы безбумажного делопроизводства, развиваются информационные технологии патентно-конъюнктурных исследований с использованием структурных матриц и обобщенных графов [2], определения перспектив развития техники, анализа изобретательской деятельности [3]. В то же время вопросы автоматизации проверки патентоспособности технических предложений в заявках на изобретения не получили достаточного развития, не достаточно разработаны также вопросы формализации заявочных материалов, правил оценки изобретений по критериям патентоспособности, вопросы создания единой базы знаний соответствующей подобласти уровня техники.

Результаты, полученные в области представления знаний, разработки баз знаний, формализации данных, обработки трудно формализуемой информации, а также степень и направленность информатизации в патентной отрасли позволяют говорить об актуальности (возможности и необходимости) создания формализованных методов представления заявочных материалов и их обработки с помощью вычислительных систем, т.е. о разработке методов формализации информационной поддержки патентной экспертизы.

Целью исследования является повышение оперативности принятия решения с одновременным увеличением достоверности о соответствии технического предложения критериям патентоспособности на основе теоретических положений лингвистической формализации и научно-обоснованной технологии распознавания изобретения, как решение важной научно-прикладной задачи автоматизации государственной научно-технической экспертизы изобретений, а также определения целесообразности патентования у заявителя.

Для достижения поставленной цели необходимо решить следующие научно-технические задачи:

1) Формализация исходных материалов заявки на изобретение для последующего построения математической модели изобретения;

2) построение семантической модели уровня техники;

3) разработка методов формализованной обработки патентной информации;

4) разработка технологии определения патентоспособности изобретений.

При этом следует иметь в виду, что задачи, решаемые рассматриваемой системой, принципиально отличаются от задач, достаточно широко используемых в патентной области в настоящее время АИПС (автоматизированных информационно-поисковых систем). АИПС в основном осуществляют поиск необходимых данных по заданным условиям отбора. В рассматриваемом случае встает задача интеллектуальной обработки информации. Автоматизированная система патентной экспертизы должна работать со смыслом, "понимать" техническую сущность заявляемого предложения. АИПС работают, как правило, с базой данных, в то время как выше указанная система должна обращаться к базе знаний, представляющей собой единую семантическую (смысловую) модель всего известного уровня техники в целом.

Для решения поставленных задач в работе использовались: системный подход, теория множеств, теория графов, теория систем (структурно-математический подход), теория формальных языков, структурные методы в распознавании образов, методы логического программирования, методы построения семантических сетей, методы инфологического и логического проектирования баз знаний.

К числу основных новых научных результатов, полученных в ходе исследования, относятся следующие:

1) Поставлена и решена научная задача автоматизации патентной экспертизы как задача распознавания, т.е. определения принадлежности технического предложения к классу объектов, обладающих свойствами патентоспособности, с использованием методов обработки формализованной информации.

2) Разработана методика построения "патентного заявочного подъязыка", являющегося ограниченной моделью естественного языка и предназначенного для ввода материалов заявки в вычислительную систему с использованием ЕЯ-конструкций, понятных пользователю-заявителю.

3) Разработана многоаспектная многоуровневая иерархическая семантическая модель уровня техники, представляющая собой целостную модель предметной области, синтезированную из ряда локальных моделей, семантически связанных между собой, элементы в которых находятся друг с другом в различных отношениях, являясь одновременно элементами нескольких локальных моделей.

4) Разработана математическая модель изобретения.

5) Создан метод иерархической скалярной кластеризации предметной области, ставящий в соответствие объектам предметной области (объектам в базе знаний) скалярный показатель, зависимый от структуры данного объекта, по которому осуществляется ранжирование предметной области.

6) Выработаны эвристики рассуждения по трудно формализуемому критерию "изобретательского уровня" на основе четкого выделения подструктур анализируемого объекта и сравнения этих подструктур с аналогичными подструктурами, известными из уровня техники, т.е. сведения оценки по данному критерию к поиску в базе знаний, объектов, схожих с элементами структуры заявляемого решения.

7) Построены формальные грамматики, предназначенные для установления соответствия между предъявляемым объектом и известным из уровня техники объектом.

8) Разработана технология информационной поддержки принятия решения о патентоспособности технического предложения, представляющая собой комплекс этапов оригинальной обработки патентной информации, включающий процедуры ввода исходных данных, внутренней интерпретации их и сопоставления с имеющимися данными (в виде базы знаний) с целью принятия решения о принадлежности заявки, содержащейся во входных данных, к классу патентоспособных объектов.

Отличие предлагаемой работы от предыдущих исследований заключается в сомплексном системном подходе к автоматизации патентной экспертизы. От шформационно-поисковых и офисных систем разрабатываемая система отличается ^пользованием элементов искусственного интеллекта, а от систем поддержки изобретательства - строго формальным детерминистским предсказуемым характером поведения. Таким образом, предлагаемая в настоящей работе система татентной экспертизы представляет собой новый класс человеко-машинных шчислительных систем - формально рассуждающая интеллектуальная система, 1ринимающая ответственное решение, являющееся не наилучшим, а единственно травильным, при этом доступным для обнаружения высококвалифицированным теловеком-экспертом.

Практическая ценность диссертационной работы заключается в следующем:

- программно-аппаратная реализация разработанных моделей и методов шформационной поддержки проверки патентоспособности позволяет повысить оперативность принятия решения по заявке на изобретение вследствие исключения 1роцедур поиска известных из уровня техники решений человеком-экспертом;

- формализация процессов экспертизы позволяет довести объем выборки, на которой происходит распознавание объекта изобретения до 100% и исключения тем самым субъективизма оценки, неизбежно присущей человеку;

- разработанные методики обработки заявочных материалов позволяют снизить расходы на патентование, а также снизить нагрузку на государственную экспертизу за счет предварительной проверки патентоспособности заявки средствами заявителя;

- полученные модели предметной области позволяют создавать отраслевые базы знаний уровней техники предметных подобластей.

Результаты диссертационной работы реализованы:

- в войсковой части 32103 (акт от 10.05.2000 г.);

- в войсковой части 08317 (акт от 29.03.2000 г.);

- в ГКНПЦ им.М.В. Хруничева (акт от 06.05.2000 г.);

- в РИИС в учебном процессе (акт от 29.03.2000 г.).

Основные положения диссертационной работы докладывались и обсуждались на научно-технических конференциях и семинарах в в/ч 32103, в/ч 73790, ВИКА им. А.Ф.Можайского.

Основные материалы диссертации опубликованы в 7 статьях.

При работе над темой исследования использовались публикации и отчеты, касающиеся патентной деятельности, описания существующих систем автоматизации, патентный фонд.

Диссертация состоит из введения, трех разделов, выводов, заключения, списка литературы, приложения. Текст изложен на 190 страницах, включает 27 рисунков, 5 таблиц, 1 теорему, список литературы из 97 наименований.

Заключение диссертация на тему "Модели и методы автоматизации принятия решения по определению патентоспособности изобретений"

ВЫВОДЫ ПО РАЗДЕЛУ 3:

1. Узкая предметная область имеет свои специфические особенности при ее моделировании.

2. Для понижения размерности скалярных показателей последние преобразовываются в кортежи частных скалярных показателей.

3. При практической реализации разработанных методов получены результаты, показывающие, что применение разработанных методов на несколько порядков повышает скорость принятия решения о патентоспособности заявки на изобретение, а также повышает достоверность принятого решения.

ЗАКЛЮЧЕНИЕ

В результате проведенного исследования решена научно-техническая задача создания формализованных методов информационной поддержки принятия решения по определению соответствия предлагаемого изобретения критериям патентоспособности, имеющая существенное значения для отрасли знания - автоматизированные системы управления, при этом получены следующие основные научные и практические результаты.

Сформулирована и решена научная задача автоматизированной оценки патентоспособности заявляемого изобретения как задача распознавания, т.е. определения принадлежности технического предложения к классу объектов, удовлетворяющих критериям патентоспособности, с использованием методов обработки формализованной информации.

Разработана методика построения «патентного заявочного подъязыка», являющегося ограниченной моделью естественного языка и предназначенного для ввода материалов заявки в вычислительную систему с использованием ЕЯ-конструкций, понятных пользователю-заявителю и облегчающего взаимодействие человека и вычислительной системы.

Создана многоаспектная многоуровневая иерархическая семантическая модель уровня техники, представляющая собой целостную модель предметной области, синтезированную из ряда локальных моделей, семантически связанных между собой, элементы в которых находятся друг с другом в различных отношениях, являясь одновременно элементами нескольких локальных моделей. Данная модель является инфологической моделью полной и непротиворечивой базы знаний известного уровня техники.

Разработана математическая модель изобретения.

Предложен метод иерархической скалярной кластеризации предметной области, ставящий в соответствие объектам предметной области (объектам в базе знаний) скалярные показатели, зависимые от структуры и состава данного объекта, по которым осуществляется ранжирование предметной области. Данный метод позволяет прямым доступом без перебора находить кластер, содержащий объект, имеющий похожую структуру и состав.

Предложена формализованная схема рассуждений по трудно формализуемому критерию «изобретательского уровня» на основе четкого выделения подструктур анализируемого объекта и сравнения этих подструктур с аналогичными подструктурами, известными из уровня техники, т.е. сведение оценки по данному критерию к поиску в базе знаний, объектов, схожих с элементами структуры заявляемого решения, что позволило применить метод формализованной оценки изобретения по указанному критерию.

В работе использованы методы структурного распознавания для определения изобретательского уровня изобретения, в результате чего получены формальные порождающие грамматики для описания комбинаций признаков из заявки и из уровня техники и распознающий конечный автомат, производящий сравнение полученных комбинаций.

Определение соответствия заявки критерию промышленной применимости также производится с использованием методов структурного распознавания. При этом решена задача обратная задачам, решаемым в системах автоматизированного проектирования, где из дерева эффектов получается устройство. В настоящей задаче из графа устройства получено дерево эффектов. На этом дереве осуществляется распознавание принципа функционирования изобретения.

Осуществлен синтез методов автоматизированной информационной поддержки принятия решения о патентоспособности технического предложения в единую технологию, представляющую собой комплекс этапов обработки патентной информации, включающих процедуры ввода исходных данных, внутренней интерпретации их и сопоставления с имеющимися данными (в виде базы знаний) с целью принятия решения о принадлежности заявки, содержащейся во входных данных, к классу патентоспособных объектов. Этапы обработки заявочной информации представляют собой программируемые детерминированные алгоритмы.

Внедрение разработанных моделей и методов информационной поддержки проверки патентоспособности позволяет на порядки повысить оперативность принятия решения по заявке на изобретение вследствие исключения процедур поиска известных из уровня техники решений и анализа текстовых описаний человеком-экспертом.

Формализация процессов экспертизы позволяет довести объем выборки, на которой происходит распознавание объекта изобретения, до 100% и исключить тем самым субъективизм оценки, неизбежно присущей человеку.

Построение целостной модели уровня техники открывает широкие перспективы для комплексного исследования предметной области, позволяет ставить новые научные задачи анализа соответствующей отрасли техники.

На основе разработанных моделей и методов разработан ряд методик, внедренных в практическую деятельность в НПО им. Хруничева, в/ч 08317 и в/ч 32103, также разработано и внедрено автоматизированное рабочее место эксперта. Положения работы использованы в учебном процессе в Российском институте интеллектуальной собственности.

Использование методов, предложенных в диссертационной работе позволяет осуществлять предзаявочную экспертизу технических предложений силами заявителя с целью определения целесообразности патентования, тем самым сокращает финансовые и людские ресурсы.

Предложенные методы могут быть использованы для определения патентоспособности других объектов промышленной собственности.

Метод иерархической скалярной кластеризации может применяться для любых объектов, структура которых может быть представлена с помощью графа.

Дальнейшими направлениями исследования являются следующие:

- развитие методов применительно к конкретным предметным областям;

- формализация свойств признаков, разработка терминологических словарей-тезаурусов; выработка эвристик, совершенствование правил оформления документов;

- создание методов автоматизированного наполнения баз знаний;

- проектирование баз знаний уровня техники по отраслям.

Библиография Трошин, Евгений Владимирович, диссертация по теме Автоматизация и управление технологическими процессами и производствами (по отраслям)

1. Автоматизированные библиотечно-информационные системы. Тезисы докладов и сообщений.-Новосибирск: ГПНТБ СО АН СССР, 1989.

2. Александров JI.B., Блинников В.И. Использование структурных матриц и обобщенных графов при выявлении изобретений.-М.: ВНИИПИ, 1991.

3. Александров JI.B., Карпова Н.Н. Рабочая книга по систематизации ин-формации.-М.: ВНИИПИ, 1993.

4. Андрейчиков А.В., Андрейчикова О.Н. Компьютерная поддержка изобре-тательства.-М.: Машиностроение, 1998.

5. Анохин П. К. Филосовский смысл проблемы естественного и искусственного интеллекта.-В кн.: Кибернетика живого: Человек в разных аспектах.-М.: Наука, 1985.

6. Арешев Т.А. К вопросу о представлении технических решений в формализованном виде.-В сб.: Патентные проблемы вычислительной техники и кибернетики. Л.: ЛНИВЦ АН СССР, 1985.

7. Белоногов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. М., Наука, 1983.

8. Беляев В. О. И др. Разработка тематических АИПС на основе структурно-функционального анализа. Методические рекомендации. М.: ВНИИПИ, 1991.

9. Блинников В.И. Патентная экспертиза: состояние, проблемы, перспекти-вы.//Вопросы изобретательства, № 3, 1990.

10. Ботуз С. Диалог с машиной // Интеллектуальная собственность,№ 5-6, 1996.

11. Бризгал Е., Гречко Т., Колесников А. Патентная статистика России: Регионально-тематический аспект. // Интеллектуальная собственность, № 4, 1999.

12. Бузук Г.Л. Логика и компьютер.-М.: Финансы и статистика, 1995.

13. Вайнерман М.И., Голдовский Б.И. Комплексный метод поиска решений технических проблем.-М.: Речной транспорт, 1990.

14. Вайнерман М.И., Голдовский Б.И. Рациональное творчество.-М.: Речной транспорт, 1990.

15. Волкова М.В., Омарова Т.Б., Румянцева Н.Л. Использование вычислительной техники в автоматизированных информационных системах.-М.: ВНИИПИ, 1988.

16. Гварамадзе Ш.А., Дудучаева Л.В. Информационное соотношение формулы и описания изобретения.-В сб.: Патентные проблемы вычислительной техники и кибернетики. Л.: ЛНИВЦ АН СССР, 1985.

17. Головин Б.Н., Кобрин Р.Ю. Лингвистические основы учения о терминах. М.: Высшая школа, 1987.

18. Гладкий А.Б. Формальные грамматики и языки.-М.: Наука, 1973.

19. Глазунов В.Н. Параметрический метод разрешения противоречий в технике.-М.: Речной транспорт, 1990.

20. Глазунов В.Н. Поиск принципов действия технических систем.-М.: Речной транспорт, 1990.

21. Горбатов В.А. Основы дискретной математики.-М.: Высшая школа, 1986.

22. Городецкий Б.Ю. К созданию машинного фонда русского языка // Машинный фонд русского языка: Идеи и суждения . М.: Наука, 1986.

23. Грэй П. Логика, алгебра и базы данных.-М.'Машиностроение, 1989.

24. Дейт К. Введение в системы баз данных.-М.: Диалектика, 1998.

25. Дементьев В.Н. Проблемы оценки новизны изобретений.//Впросы изобретательства, № 4, 1990.

26. Джонстон Д., Мичи Д. Компьютер-творец.-М.:Мир, 1987.

27. Добров Г.М. Наука о науке. Наукова думка. Киев, 1989.

28. Добров Г.М. Научно-технический прогресс производительных сил. Тех-нка. Киев, 1985.

29. Добров Г.М. Прогнозирование науки и техники.-М.: Наука, 1977.

30. Добров Г.М. и др.Управление эффективностью управления научной деятельностью. Киев, Наукова думка, 1978.

31. Единая система конструкторской документации. Правила выполнения схем. ГОСТ 2.701-68,69.

32. Ермаков М., Нарумова О. Автоматизация патентного поиска: проблемы и решения.//Вопросы изобретательства, № 5-6, 1995.

33. Информационно-поисковые системы и традиционный патентный поиск. Под. ред. Розова Б.С.-М.: ВНИИПИ, 1987.

34. Как правильно оформить и подать заявку на патент. Практическое руководство. Под ред. В.А.Мещерякова.-М.: ДжИПЛА лимитед, 1993.

35. Киселев О.М. Критерии существенности количественных отличий.-"Вопросы изобретательства", 1978, N7.

36. Киселева Т.С. Экспертиза объектов техники на патентную чистоту.-М.: ВНИИПИ, 1991.

37. Ковчуго Е.А. Анализ изобретательской и патентно-информационной деятельности с применением моделирования на ЭВМ. (Обзорная информа-ция).-М.: ВНИИПИ, 1990.

38. Кокорева Л.В. и др. Диалоговые системы и представление знаний. Справочное пособие.-Киев: Наукова думка, 1993.

39. Комментарии к Российскому патентному законодательству. СП-1, Роспа-тент-ВНИИГПЭ, М., 1993.

40. Комментарии к Российскому патентному Законодательству (Справочное пособие патентоведов и изобретателей). Второй выпуск.-М.: ВНИИГПЭ Роспатента, 1994.

41. Коршунов Ю.М. Математические основы кибернетики.-М.: Энергоатом-издат, 1987.

42. Кравец Л. Тенденции изменения патентно-информационной полити-ки.//Интеллектуальная собственность, № 2, 1999.

43. Крюкова М.В. Стандартизация патентно-информационного обеспече-ния.//Патенты и лицензии, № 1, 2000.

44. Кудрявцев А.В. Методы интуитивного поиска технических решений.-М.: Речной транспорт, 1991.

45. Кузин Е.С. и др. Интеллектуализация ЭВМ.-М.: Высшая школа, 1989.

46. Лещенко В.М. Патентное дело в таблицах и схемах: Правовые аспекты/ Справочное пособие.-М.: Издательство Приор, 1999.

47. Марселлус Д. Программирование экспертных систем на Турбо Прологе.-М.:Финансы и статистика, 1994.

48. Мартин Дж. Организация баз данных в вычислительных системах.-М.: Мир, 1978.

49. Мельникова Л.И., Шведова В.В. Системный анализ при создании и освоении объектов техники.-М.: ВНИИПИ, 1991.

50. Нейлор К. Как построить свою экспертную систему.-М.: Энергоатомиз-дат, 1991.

51. Обработка и представление данных в человеко-машинных системах. Отв. редактор Овсеевич И.А.-М.: Наука, 1988.

52. Определение технического уровня объектов техники и научно-техническое прогнозирование.-М.: ВНИИПИ, 1986.

53. Оре О. Теория графов.-М.: Главная редакция физико-математической литературы, 1980.

54. Паршин Е. Условие патентоспособности промышленная примени-мость.//Интеллектуальная собственность, № 6, 1999.

55. Патентная информация на современном этапе. Материалы юбилейной научно-практической конференции. М., ВПТБ, 1996.

56. Патентное дело. Дайджест российской и зарубежной прессы. № 5, 1999.

57. Патентное дело. Дайджест российской и зарубежной прессы. № 6, 1999.

58. Попов Э.В. Общение с ЭВМ на естественном языке.-М.: Наука, 1989.

59. Поспелов Г.С. Искусственный интеллект основа новой информационной технологии.-М.: Наука, 1988.

60. Поспелов Д.А. Моделирование рассуждений.-М.: Радио и связь, 1989.

61. Правила рассмотрения заявок на изобретения.- Роспатент-ВНИИГПЭ, М., 1994.

62. Правила составления и подачи заявки.-М.: НПО «Поиск», 1993.

63. Проблемы логики научного познания. Ред.П.В.Тавнц.-М.:Наука, 1964.

64. Разработка и применение лингвистических процессоров. Сборник научных трудов. Под ред. А.С.Нариньяни. Новосибирск: Вычислительный центр СО АН СССР, 1983.

65. Разработка проблем лингвистического обеспечения диалоговых систем безбумажного делопроизводства при патентовании // Заключительный отчёт по НИР, ЧГТУ. Челябинск, 1992.

66. Разработка системы логико-семантического анализа текстов на ЕЯ. // Заключительный отчёт по НИР, ИПИ РАН, М., 1995.

67. Разработка тематических АИПС на основе структурно-функционального анализа. (Методические рекомендации).-М.: ВНИИПИ, 1991.

68. Резников Б.А. Системные направления в науке и управлении.-Ленинград: ВИКИ им.А.Ф.Можайского, 1974.

69. Роспатент. Годовой отчет 1995. ВПТБ, Москва, 1996.

70. Сарьян В.К. Автоматизированные системы патентной информации. Обзорная информация.-М.: ВНИИПИ, 1990.

71. Системы управления базами данных и знаний: Справочное издание. Под ред. А.Н. Наумова.-М.: Финансы и статистика, 1991.

72. Современные средства автоматизированного патентного поиска. Темати-4 ческий выпуск по материалам отечественной и зарубежной литературы//Сост. И автор Л.Г.Кравец.-М.: ИНИЦ Роспатента, 1999.

73. Соломатин Н.М. Информационные семантические системы.-М.:Высшая школа, 1989.

74. Титов В.В. Выбор целей в поисковой деятельности.-М.:Речной транспорт, 1991.

75. Толковый словарь по вычислительным системам.-М.Машиностроение, 1989.

76. Торбенко В.М., Белов В.В. Перспективы компьютеризации подразделений Госкомизобретений.//Впросы изобретательства, № 12, 1990.

77. Трошин Е. В. Автоматическая оценка технического решения по критериям патентоспособности. Научно-информационный сборник (труды). Вып.2.-М.:ГИЦИУ, 1996.

78. Трошин Е.В. Автоматизация экспертизы изобретений актуальная задача // Интеллектуальная собственность.-1999, №4.

79. Трошин Е. В. Ввод материалов заявки на изобретение в автоматизированную патентную систему на заявочном подъязыке-ограниченной модели естественного языка//Проблемы промышленной собственности.-1998, №5.

80. Трошин Е. В. Концепция создания автоматизированной системы экспертизы изобретений. Научно-информационный сборник (труды). Вып.2.-М.:ГИЦИУ, 1995.

81. Трошин Е. В. Оценка изобретательского уровня изобретения-устройства с точки зрения формального алгоритма экспертизы // Проблемы промышленной собственности.-1998, №12.

82. Трошин Е. В. Структура автоматизированной патентной системы. Научно-информационный сборник (труды). Вып.2.-М.:ГИЦИУ, 1996.

83. Трошин Е. В. Экспертная система экспертизы изобретений по критериям патентоспособности. Научно-информационный сборник (труды). Вып.З,-М.:ГИЦИУ, 1996.

84. Уемов А.И. Системный подход и общая теория систем.-М.: Мысль, 1978.

85. Уилсон Р. Введение в теорию графов.-М.: Мир, 1977.

86. Федулов Ю.Г. Основы автоматизированного организационного управления.-М.: Издательство РАГС, 1997.

87. Фетина В.Н. Особенности формул изобретений, относящихся к электрическим схемам.-М.: ИНИЦ Роспатента, 1999.

88. Фор А. Восприятие и распознавание образов.-М.Машиностроение, 1989.

89. Фу К. Структурные методы в распознавании образов.-М.: Мир, 1977.

90. Хомский Н. Формальные свойства грамматик. Русский перевод. «Кибернетический сборник», новая серия, № 2, 1966.

91. Чен П. Модель «сущность-связь» шаг к единому представлению дан-ных.//СУБД, 1995, № 3.

92. Четвериков В.Н., Ревунков Г.И., Самохвалов Э.Н. Базы и банки данных.-М.: Высшая школа, 1987.

93. Шемакин Ю.И. Начала компьютерной лингвистики.-М.: Издательство МГОУ А/О «Росвузнаука», 1992.

94. Шемакин Ю.И., Романов А.А. Компьютерная семантика.-М.: НОЦ «Школа Китайгородской», 1995.

95. Эшби У. Росс. Введение в кибернетику. ИЛ =, 1959.

96. Lehrberger J. Automatic Translation and the Concept of Sublanguages // Sublanguage:Studies ofLanguage in Restricted Domains Vol.1.-Berlin, 1982.

97. Leontief W, Introduction in the Book by L.S.Silk // The Research Revolution.-N.Y., 1960.185