автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка нейросетевых методов разрешения неоднозначностей на основе реконструктивного покрытия и принципа аналогии

кандидата технических наук
Демин, Виталий Анатольевич
город
Тирасполь
год
2003
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка нейросетевых методов разрешения неоднозначностей на основе реконструктивного покрытия и принципа аналогии»

Оглавление автор диссертации — кандидата технических наук Демин, Виталий Анатольевич

ВВЕДЕНИЕ.

ГЛАВА 1. ОБЗОР СОВРЕМЕННОГО СОСТОЯНИЯ ИССЛЕДОВАНИЙ.

1.1. Проблема неоднозначности и методы её разрешения.

1.2. Реконструктивные свойства интеллекта.

1.3. Аналогия в искусственном интеллекте.

1.4. Нейросетевые модели обработки информации.

1.5. Выводы к главе 1.

ГЛАВА 2. КОНЦЕПТУАЛЬНЫЕ ОСНОВЫ РЕКОНСТРУКТИВНОГО ПОКРЫТИЯ.

2.1. Введение в проблему.

2.2. Понятия универсума, отражения, модели.

2.3. Взаимное структурирование объектов.

2.4. Реконструкция информации по модели универсума.

2.5. Выводы к главе 2.

ГЛАВА 3. РАЗРЕШЕНИЕ НЕОДНОЗНАЧНОСТЕЙ В РЕКОНСТРУКТИВНОМ ПОКРЫТИИ.

3.1. Математическая постановка задачи реконструктивного покрытия

3.2. Оценка правдоподобия объектов-прототипов.

3.3. Бинарные трансформационные аналогии.

3.4. Разрешение неоднозначностей покрытия с помощью бинарной аналогии.

3.5. Выводы к главе 3.

ГЛАВА 4. ОДНОРОДНЫЕ НЕЙРОПОДОБНЫЕ СЕТИ.

4.1. Представление модели универсума в виде однородной нейроподобной сети.

4.2. Общие принципы функционирования однородных нейроподобных сетей.

4.3. Метод и алгоритм параллельного обратного возбуждения.

4.4. Реконструктивное покрытие в однородной нейроподобной сети.

4.5. Место однородных нейроподобных сетей среди прочих коннекционистских подходов.

4.6. Выводы к главе 4.

ГЛАВА 5. ПРИМЕНЕНИЕ РАЗРАБОТАННЫХ МЕТОДОВ.

5.1. Тематическое реферирование текстовых документов.

5.2. Разрешение лексических неоднозначностей.

5.3. Общий вывод к главе 5.

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Демин, Виталий Анатольевич

В настоящее время происходит бурное развитие информационных технологий, связанных с интеллектуальной обработкой информации. Большая часть информации представлена на естественном языке (ЕЯ), который обладает рядом свойств, принципиально отличающих его от всех искусственных языков. Наибольшие затруднения при обработке естественно-языковой информации (ОЕЯ) вызывает неоднозначность естественного языка, т.е. наличие у каждой единицы языка нескольких значений, различающихся по контексту. Контекст в общем случае включает не только непосредственное окружение слова, но и другие смысловые связи, а также представление о ситуации, формирующееся в сознании воспринимающего субъекта. Таким образом, проблема неоднозначности выходит далеко за рамки чистой лингвистики и привлекает к себе внимание многих специалистов по когнитивной психологии и компьютерным наукам.

Коммуникационный барьер между специалистом (пользователем) и программным обеспечением является одним из узких мест современных вычислительных систем. Минимальным требованием к системам нового поколения является наличие естественно-языкового интерфейса; дальнейшие перспективы связаны с программированием на естественном языке [15], а также с извлечением знаний из необработанных ЕЯ-документов [83]. Вся эта совокупность задач не может быть решена без надёжных и теоретически обоснованных методов разрешения неоднозначностей.

Существующие методы разрешения неоднозначностей могут быть разделены на две большие группы: статистические и эвристические. Первые используют не зависящие от языка статистические приёмы и критерии [39,44,48], вторые опираются на формализованные знания экспертов-лингвистов, используют всевозможные словари, энциклопедии и семантические сети [4,57,61,65]. Статистические методы требуют большого объёма обучающих данных, как правило, на несколько порядков превышающего объёмы тестовой или рабочей выборки. Эвристические методы разрабатываются под конкретные задачи и не могут быть интегрированы в комплексные интеллектуальные системы различного назначения. Помимо этого, каждый из существующих методов использует свои собственные средства представления неоднозначных структур, что осложняет повторное использование таких методов и затрудняет их комплексирова-ние с другими составляющими математического обеспечения интеллектуальных систем.

По мнению автора, указанные выше недостатки могут быть преодолены путём формализации проблемы неоднозначности и создания методов её разрешения в универсальной, функционально однородной среде распределённых вычислений. Совмещение хранения и обработки информации должно служить базой для решения проблемы неоднозначных интерпретаций. При этом сам способ хранения информации должен соответствовать потребностям разрешения неоднозначностей и допускать совместное существование и конкуренцию различных интерпретаций, а обработка информации - включать пересчёт оценок правдоподобия интерпретаций исходя не только из входной, но и модельной информации. Для этого в данной работе активно используются реконструктивная модель памяти [9,32] и методы аналогии [35].

Объектом исследования является проблема неоднозначности в задачах искусственного интеллекта, предметом исследования - разрешение неоднозначностей с использованием принципа аналогии и принципа реконструк-тивности.

Цель исследования - создание методов представления и разрешения неоднозначностей в нейросетевой вычислительной среде на основе реконструктивного покрытия и принципа аналогии.

Принцип реконструктивного покрытия, который вводится в данной работе, состоит в дополнении входных объектов до наиболее правдоподобного целого путём привлечения модельной информации, полученной на этапе обучения. Этот принцип находится в полном согласии с концепцией реконструктивной памяти и выступает в качестве её формальной модели. Принцип аналогии используется в той его трактовке, которая связана с языками аналогических строк [35].

Задачи исследования:

1) разработка концептуальной системы для представления и обработки неоднозначных структур данных;

2) разработка математического формализма для описания и решения задач реконструктивного покрытия с разрешением неоднозначностей;

3) исследование способов реализации реконструктивного покрытия в распределённой вычислительной среде;

4) разработка аппарата однородных нейроподобных сетей, специально предназначенного для реконструктивного покрытия с разрешением неоднозначностей;

5) реализация принципов аналогии в однородных нейроподобных сетях;

6) разработка практических экспериментальных систем, использующих предложенные нейросетевые методы разрешения неоднозначностей, и проведение экспериментов с этими системами для подтверждения правильности разработанных методов.

Конкретным результатом проведённых исследований являются новые методы разрешения неоднозначностей, успешно применённые к решению актуальных задач обработки естественного языка:

1) задаче автоматического построения реферата текстового документа с настраиваемым уровнем детализации и пользовательским выбором тем при условии автоматического определения наиболее значимых тем текста;

2) задаче разрешения лексических неоднозначностей в парных словосочетаниях в условиях минимального контекста и повышенной разрежённости обучающих данных.

Для реализации экспериментов с помощью методов объектно-ориентированного программирования была разработана программная модель однородной нейроподобной сети. Модель реализована в виде библиотеки классов и функций на языке программирования С++ и предназначена для встраивания в конкретные приложения на этапе кодирования. Доступность электронных текстов, высокая сложность и актуальность задач обработки естественного языка явились факторами, определившими сферу испытания разработанных нейросетевых методов разрешения неоднозначностей. Научная новизна работы состоит в следующем:

1) предложен новый формализм для представления дискретных структур в системах искусственного интеллекта - формализм П-структур, - который может быть использован для представления объектов с многочисленными неоднозначными интерпретациями;

2) выполнена математическая постановка задачи реконструктивного покрытия с разрешением неоднозначностей и предложен подход к её решению в распределённой вычислительной среде;

3) предложена формальная математическая схема бинарной трансформационной аналогии и способ её применения к определению оценок правдоподобия, необходимых для разрешения неоднозначностей реконструктивного покрытия;

4) разработан аппарат однородных нейроподобных сетей, предназначенный для решения задач реконструктивного покрытия с разрешением неоднозначностей на объектах, заданных множествами компонентов либо множествами признаков;

5) разработаны методы разрешения неоднозначностей в однородных нейроподобных сетях на основе вычисления оценок правдоподобия объектов, представляемых уровнями возбуждения нейронов сети;

6) разработан способ тематического реферирования текстов с использованием однородных нейроподобных сетей по принципу движения «снизу-вверх» (от тем к предложениям);

7) исследованы возможности разрешения лексических неоднозначностей в парах «глагол-дополнение» с использованием однородных нейроподобных сетей.

На защиту выносятся:

1) формализм П-структур;

2) математическая формализация задачи реконструктивного покрытия;

3) аппарат однородных нейроподобных сетей (ОНС);

4) метод автоматического реферирования текстов с использованием многоуровневого разрешения неоднозначностей покрытия;

5) метод разрешения лексических неоднозначностей посредством поиска аналогий в однородной нейроподобной сети.

При работе над диссертацией активно использовались научные статьи и отчёты, опубликованные или продублированные в электронной форме в сети Интернет. Для доступа к электронным публикациям и библиографии использовались ведущие международные каталоги:

• Research Index (CiteSeer), http://citeseer.nj.nec.com

• CS Bibliography Server, http://liinwww.ira.uka.de

• National Computer Science Technical Report Library, http://www.ncstrl.org Использование данных каталогов позволило получить доступ к наиболее современным и актуальным публикациям по теме исследования и существенно способствовало построению литературного обзора, составляющего содержание главы 1 настоящей диссертации. Главы 2, 3 и 4 последовательно раскрывают ход проведённых диссертационных исследований. Глава 5 посвящена описанию практического приложения разработанных в диссертации методов к решению конкретных задач по обработке естественного языка. В приложении 1 описан состав функционального ядра разрешения неоднозначностей покрытия, в приложении 2 содержатся образцы кратких рефератов, полученных с помощью разработанных в диссертации нейросетевых методов, в приложении 3 приведён пример разрешения лексических неоднозначностей с помощью однородной нейроподобной сети. Приложение 4 содержит копию акта о внедрении результатов данной диссертационной работы.

Заключение диссертация на тему "Разработка нейросетевых методов разрешения неоднозначностей на основе реконструктивного покрытия и принципа аналогии"

Общие выводы из проведённых экспериментов таковы:

1) аналогия играет важную роль в образовании новых словосочетаний;

2) однородные нейроподобные сети способны выявлять аналогию и использовать её для разрешения неоднозначностей.

5.3. Общий вывод к главе 5

Экспериментальные исследования, описанные в настоящей главе подтвердили работоспособность разработанных в диссертации методов разрешения неоднозначностей и их практическую применимость к таким задачам как поиск и реферирование текстовой информации, оценка сочетаемости слов. Подтвердилась и роль аналогии в разрешении неоднозначностей. ОНС продемонстрировали способность обнаруживать аналогии и использовать их для корректировки оценок правдоподобия компонентов модели.

Кроме перечисленного, эксперименты показали и то, что однородные нейроподобные сети могут быть эффективно реализованы в виде программных систем или модулей, предназначенных для обычных операционных систем и обычных персональных компьютеров. Это чрезвычайно важно для разработки практических, рабочих интеллектуальных систем. Используя обоснованные и экспериментально подтверждённые принципы и методы реконструктивного покрытия, разработчики систем искусственного интеллекта могут повысить уровень наукоёмкости разрабатываемых программных продуктов, улучшить их интегрируемость и расширить их функциональные возможности.

ЗАКЛЮЧЕНИЕ

В диссертации разработана теоретически обоснованная совокупность ней-росетевых методов разрешения неоднозначностей, базирующаяся на принципе реконструктивности и приниципе аналогии.

Ниже перечислены основные теоретические результаты работы.

1) Разработан математический формализм П-структур для представления дискретных структур с неоднозначностями.

2) Выполнена математическая формализация задачи реконструктивного покрытия с разрешением неоднозначностей, разработана система понятий, необходимых для конкретной постановки и решения задач, связанных с разрешением неоднозначностей, представимых П-структурами.

3) Предложена формальная схема бинарной траснформационной аналогии и способ использования данной схемы для вычисления оценок правдоподобия новых объектов.

4) Разработан аппарат однородных нейроподобных сетей, предназначенный для выполнения реконструктивного покрытия с разрешением неоднозначностей, в том числе с использованием бинарных аналогий.

5) Разработаны методы для разрешения неоднозначностей в однородных нейроподобных сетях, опробованные при решении практических задач.

В практической части диссертации получены следующие важные результаты.

1) Задача автоматического реферирования текстов впервые поставлена и решена как задача многоуровневого разрешения неоднозначностей покрытия в структурированной модели текста. Это позволяет динамически получать различные тематические проекции текста и выявлять связи между понятиями.

2) Экспериментально подтверждена применимость разработанных нейросете-вых методов разрешения неоднозначностей к задаче оценки сочетаемости слов в парах «глагол-дополнение» при высокой разрежённости обучающих

132 данных. Эксперименты продемонстрировали, что однородные нейроподоб-ные сети способны обнаруживать аналогию и использовать её для разрешения неоднозначностей.

Таким образом, проведённые исследования показали целесообразность учёта реконструктивных свойств интеллекта и приниципа аналогии при решении интеллектуальных задач, связанных с выбором правильных интерпретаций в условиях неоднозначности.

Дальнейшие исследования должны в первую очередь вестись в направлении изучения возможностей разработанных методов в приложении к другим задачам искусственного интеллекта, в первую очередь, к другим видам неоднозначностей и другим условиям обучения. Помимо этого, целесообразно исследовать возможность аппаратной реализации однородных нейроподобных сетей для получения быстродействующей платформы для задач, требующих разрешения неоднозначностей. Не исключаются и теоретические исследования, направленные на совершенствование методов, в частности, путём привлечения более сложных теорий аналогии или иных аспектов реконструктивного покрытия, например, отрицательных обучающих примеров или явного представления и обработки преобразований в нейроподобной сети.

Библиография Демин, Виталий Анатольевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Bach K. Ambiguity // Routledge Encyclopedia of Philosophy. On-line version, 1999. http://online.sfsu.edu/~kbach/ambguity.html

2. Bartfai G. An ART-based Modular Architecture for Learning Hierarchical Clusterings // Neurocomputing, 1996. http://citeseer.nj.nec.com/54299.html

3. Brun C.A. Client/Server Architecture for Word Sense Disambiguation, 2000. http://citeseer.nj.nec.com/brunOOclientserver.html

4. Carpenter G.A., Grossberg S., Rosen D.B. Fuzzy ART: Fast Stable Learning and Categorization of Analog Patterns by an Adaptive Resonance System // Neural Networks, 1991. vol.4-pp.759-771.

5. Ciaramita M., Johnson M. Explaining away ambiguity: Learning verb selectional preference with Bayesian networks. Proceedings of the 18th International Conference on Computational Linguistics, 2000. vol. 1. http://arxiv.org/ps/cs/0008020

6. Dagan I., Lee L., Pereira F. Similarity-Based Methods For Word Sense Disambiguation // In Proceedings of ACL-EACL, 1997. http://citeseer.nj.nec.com/dagan99similaritybased.html

7. DeLosh E., Merritt P. Reconstructive Processes in Memory. On-line publication, 2000. http://www.psych.nmsu.edu/~cooke/courses/ReconstructiveOH.htm

8. Dennis S. The Interactive Activation and Competition Network: How Neural Networks Process Information. On-line publication, 1997. http://www2.psy.uq.edu.au/~brainwav/Manual/IAC.html

9. Falkenhainer B., Forbus K.D., Gentner D. The Structure mapping engine: algorithm and examples//Artificial Intelligence, 1990. vol.41 - pp.1-63. http://www.cc.gatech.edu/~jimmyd/summaries/falkenhainerl990.html

10. Faloutsos C., Oard D. A Survey of Information Retrieval and Filtering Methods. Technical Report, Information Filtering Project, University of Maryland, College Park, MD, 1996. http://citeseer.nj.nec.com/faloutsos96survey.html

11. Feldman J.A., Ballard D.H. Connectionist models and their properties. Cognitive Science,1982.-vol. 6. pp.205-254.

12. Fuchs N.E., Schwitter R. Specifying Logic Programs in Controlled Natural Language // CLNLP 95, Workshop On Computational Logic For Natural Language Processing, Edinburgh, 1995. http://www.ncstrl.org

13. Gale W.A., Church K.W., Yarowsky D. A Method for Disambiguating Word Senses in a Large Corpus // Computers and the Humanities, 1992. vol. 26 - pp.415-439. http://citeseer.nj.nec.cOm/context/64863/0

14. Gentner D. Structure-mapping: A theoretical framework for analogy // Cognitive Science,1983. vol.7 - pp.155-170. http://www.cc.gatech.edu/~jimmyd/summaries/gentnerl983-1 .html

15. Gentner D., Markman A.B. Structure Mapping in Analogy and Similarity // American Psycologist, 1997 vol. 52, no.l - 45-56.www.qrg.ils.nwu.edu/papers/files/GentnerMarkmanAmPsyJan97.pdf

16. Goldstein J., Kantrowitz M., Mittal V., Carbonell J. Summarizing Text Documents: Sentence Selection and Evaluation Metrics // Proceedings of SIGIR-99, Berkeley, 1999. http://citeseer.nj.nec.com/article/goldstein99summarizing.html

17. Hofmann T., Puzicha J. Unsupervised learning from dyadic data. Technical Report TR-98-042, International Computer Science Insitute, Berkeley, 1998. http://citeseer.nj.nec.com/article/hofmann98unsupervised.html

18. Holyoak K. J., Thagard P. The analogical mind // American Psychologist, 1997. vol. 52 -pp. 35-44. http://www.cc.gatech.edxi/~jimmyd/summaries/ holyoakl997.html

19. Hutchens J., Alder M. Finding Structure via Compression. University of Western Australia, 1997.- http://cs-tr.cs.cornell.edU/Dienst/UI/l.0/Display/ncstrl.uwaee/CP98-01

20. Hwee Tou Ng. Getting serious about word sense disambiguation // ACL SIGLEX Workshop on Tagging Text with Lexical Semantics: Why, What, and How? April, 1997. http://www.ims.uni-stuttgart.de/-light/tuebhtml/semtagws.html

21. Jing H., Barzilay R., McKeown K., Elhadad M. Summarization Evaluation Methods: Experiments and Analysis, 1998. http://citeseer.nj.nec.com/jing98summarization.html

22. Keane, M. Analogical Asides on Case-Based Reasoning. // Lecture Notes in Artificial Intelligence, vol.837. Springer-Verlag, 1994. - pages 21-32. http://citeseer.nj.nec.com/keane94analogical.html

23. Klavans J., McKeown K., Kan M., Lee S. Resources for the Evaluation of Summarization Techniques // Proceedings of the 1 st Int'l Conference on Language Resources and Evaluation, Grenada, 1998. http://citeseer.nj.nec.com/5308.html

24. Kokinov B., Petrov A. Integration of memory and reasoning in analogy-making: the AMBR model. // D. Gentner, K. Holyoak, and B. Kokinov (Eds.): Analogy: Perspectives from Cognitive Science. MIT Press, 2000. http://citeseer.nj.nec.com/273256.html

25. Kupiec J., Pedersen J., Chen F. A trainable document summarizer // Research and Development in Information Retrieval, 1995. pp.68-73. http://citeseer.nj.nec.com/kupiec95trainable.html

26. Lee L. Similarity-Based Approaches to Natural Language Processing. Ph.D. thesis. Harvard University Technical Report TR-11-97, 1997. http://www.cs.cornell.edu/home/llee/papers/thesis.pdf

27. Lepage Y. Languages of Analogical Strings // Proceedings of the International Conference on Computional Linguistics, Europe, 2000.http://nlp3 .korea.ac.kr/proceeding/coling2000/COLING/pdf/071.pdf

28. Marquez L. Machine Learning and Natural Language Processing. Electronic publication, 2000. http://citeseer.nj.nec.com/marquezOOmachine.html

29. Medler D. A Brief History of Connectionism. University of Alberta, Canada. On-line version, 1998. http://ww.icsi.berkeley.edu/~iagota/NCS/VOLl/P3html/voll3.html

30. Mitamura T., Nyberg E., Carbonell J. An Efficient Inter lingua Translation System for Multi-lingual Document Production// Proceedings of Machine Translation Summit III, Washington, 1991. http://www.lti.cs.cmu.edu/Research/Kant/PDF/mts3-nofoot.pdf

31. Morrison T., Dietrich E. Structure-Mapping vs. High-level Perception: The Mistaken Fight Over The Explanation of Analogy. State University of New York. Electronic publication, 1999. http://citeseer.nj.nec.c0m/l 18164.html

32. Nevill-Manning C., Witten I. Identifying Hierarchical Structure in Sequences: A linear-time algorithm // Journal of Artificial Intelligence Research, 1997. vol.7, http://www.ncstrl.org, report xxx.cs.AI/9709102.

33. O'Donoghue D. An Integrated Analogy Model for Creative Reasoning, 1997. http://citeseer.nj.nec.com/383281.html

34. Pereira F., Tishby N., Lee L. Distributional Clustering of English Words // In Proceedings of the "Meeting of the Association for Computational Linguistics", 1993. pp.183-190. http://citeseer.nj.nec.com/article/pereira93distributional.html

35. Plaut D. Connectionist Modeling. To appear in Kasdin, A. (Ed.), Encyclopedia of Psychology. On-line version, 1999.http://www.cnbc.cmu.edu/~plaut/papers/pdf/PlautIPchap.conn.pdf

36. Poesio M. Semantic ambiguity and perceived ambiguity. Electronic publication, 1994. http://citeseer.nj.nec.com/poesio94semantic.html

37. Pollack J. B. Connectionism: Past, Present, and Future. // Artificial Intelligence Review, 1989. vol. 3, pp. 3-20. http://citeseer.nj.nec.com/pollack88connectionism.html

38. Prescher D., Riezler S., Rooth M. Using a Probabilistic Class-Based Lexicon for Lexical Ambiguity Resolution, 2000. http://citeseer.nj.nec.com/prescherOOusing.html

39. Pritchard E. Attention & Memory: Lecture Notes. University of Winnipeg, 2000. http://www.uwinnipeg.ca/~epritchl/amnotesfall2000.html

40. Ratnaparkhi A., Maximum Entropy Models for Natural Language Ambiguity Resolution, Ph.D. thesis, University of Pennsylvania, Philadelphia, PA, 1998. http://citeseer.nj.nec.com/ratnaparkhi98maximum.html

41. Resnik P. Selectional preference and sense disambiguation // ACL SIGLEX Workshop on Tagging Text with Lexical Semantics, 1997. http://www.ims.unistuttgart. de/~l ight/tuebhtml/resnik2 .ps

42. Rodriguez P., Wiles J., Elman J.L. A recurrent neural network that learns to count. Connection Science, 1999. vol. 11 - pp. 5-40. http://crl.ucsd.edu/~elman/Papers/cs-counter.pdf

43. Roth D. Learning to resolve natural language ambiguities: A unified approach // Proceedings of the National Conference on Artificial Intelligence, 1998. pp. 806-813. http ://citeseer. nj. nec. com/roth9 81earning .html

44. Sanderson M. Word Sense Disambiguation and Information Retrieval, PhD Thesis, Technical Report (TR-1997-7) of the Department of Computing Science at the University of Glasgow, 1997. http://citeseer.nj.nec.com/sanderson97word.html

45. Seagull A. A Compaction of WordNet Senses for Evaluation of Word Sense Disambiguators, 2000. http://citeseer.nj .nec.com/seagull00compaction.html

46. Siler W. Building Fuzzy Expert Systems. On-line book, 1998. http://members.aol.com/wsiler/

47. Similarity-Based Estimation of Word Cooccurrence Probabilities. // Ido Dagan, Fernando Pereira, and Lillian Lee Proceedings of the 32nd ACL, 1994. pp 272-78. http://www.cs.eornell.edu/home/llee/papers/dpl.ps

48. Survey of the State of the Art in Human Language Technology / Ronald A. Cole et al. (Eds.). Cambridge University Press, 1995. http:://www.coli.uni-sb.de/~hansu/cl.html

49. Yeronis J., Ide M. Word Sense Disambiguation with Very Large Neural Networks Extracted from Machine Readable Dictionaries // Proceedings of COLING'90, Helsinki, August 1990. http://www.up.umv-mrs.fr/~veronis/pdf/l990coling.pdf

50. Wermter S. and Sun R. (eds.). Hybrid Neural Systems // Lecture Notes in Articial Intelligence (LNCS 1778), Springer-Verlag, Heidelberg, 2000. http://citeseer.nj.nec.com/article/wermterOOhybrid.html

51. Yarowsky D. Unsupervised word sense disambiguation rivalling supervised methods, in Proceedings of the ACL, 1995. vol. 33. http://citeseer.nj.nec.com/yarowski95unsupervised.html

52. Yarowsky D. Word sense disambiguation using statistical models of Roget's categories trained on large corpora, in Proceedings of COLING Conference, 1992. pp. 454-460. http://citeseer.nj.nec.com/yarowsky92wordsense.html

53. Zechner K. A Literature Survey on Information Extraction and Text Summarization. CMU LTI Report, 1997 http://www.csi.uottawa.ca/tanka/ArtDB/infoextr.ps.gz

54. Батороев К.Б. Кибернетика и метод аналогий. Учеб. пособие. М.: Высш. школа, 1974. - 104 с.

55. Беркович С.Я. Клеточные автоматы как модель реальности: поиски новых представлений физических и информационных процессов. Пер. с англ. М.: Изд-во МГУ, 1993. - 112 с.

56. Галушкин А.И. Теория нейронных сетей. Кн. 1: Учеб. пособие для вузов / Общая ред. А.И. Галушкина. М.: ИПРЖР, 2000. - 416 с.

57. Глушков В.М. Основы безбумажной информатики. М.: 1987.-552 с.

58. Головко В.А. Нейронные сети: обучение, организация и применение. Кн. 4 / Общая ред. А.И. Галушкина. М.: ИПРЖР, 2001. - 256 с.

59. Горбань А.Н. Обобщённая аппроксимационная теорема и вычислительные возможности нейронных сетей // Сиб. журн. вычисл. математики / РАН, Сиб. отд-ние. Новосибирск, 1998. -т.1,№1. -с. И-24.

60. Горбань А.Н. Обучение нейронных сетей. М.: СП "Параграф", 1990. - 160с.

61. Гроссберг С. Внимательный мозг// Открытые системы. 1997. - №4. http://www.osp.rU/os/l 997/04/29.htm

62. Демин В A. Re-Fine: средство интеллектуального анализа текстов на основе методологии воссоздания объектов // Труды Международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. Т.2. Аксакове, 2001. - С.:93-99.

63. Демин В.А. Бинарная трансформационная аналогия как операция получения новых знаний // Аспирант и соискатель. 2001. - № 5.- № 5. - С. 203-207.

64. Демин В.А. Использование однородных нейроподобных сетей для разрешения лексических неоднозначностей // Актуальные проблемы современной науки 2001. - № 1. -С. 116-121.

65. Демин В.А. Концепция универсума в искусственном интеллекте // Искусственный интеллект. -2001. -№1. С.43-51.

66. Демин В.А. Однородные нейроподобные сети: универсальная среда воссоздания объектов // Актуальные проблемы современной науки 2001. - № 1. - С. 122-126.

67. Демин В.А. Парадигма воссоздания объектов // Искусственный интеллект. 2001.-№2. С. 120-127.

68. Демин В.А. Реконструктивная обработка естественно-языковой информации в однородных нейроподобных сетях // Искусственный интеллект. -Донецк: ДонГИИИ, 2002,-№4.-С. 692-696.

69. Искусственный интеллект: В 3 кн. Кн. 1. Системы общения и экспертные системы: Справочник / Под ред. Э. В. Попова. М.: Радио и связь, 1990. - 464 с.

70. Каллан Р. Основные концепции нейронных сетей : Пер. с англ. М.: Издательский дом "Вильяме", 2001. - 288 с.

71. Каляев И.А., Гайдук А.Р. Однородные нейроподобные структуры в системах выбора действий интеллектуальных роботов. М.: "Янус-К", 2000. - 280 с.

72. Колегов A.B. Грамматика языка-посредника Эльюнди. Тирасполь: РИО ПГУ, 1998. -220 с.

73. Комарцова Л.Г., Максимов A.B. Нейрокомпьютеры. М.: Изд-во МГТУ им. Н.Э.Баумана, 2002. - 320 с.

74. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инженера. М.: Энергоатомиздат, 1988. - 344 с.

75. Лернер А.Я. Начала кибернетики. М.: Наука, 1967. - 400 с.

76. Логический подход к искусственному интеллекту: от классической логики к логическому программированию: Пер. с франц./ Тейз А., Грибомон П., Луи Ж. и др. М.: Мир, 1990. - 432 с.

77. Норман Д. Память и научение: Пер. с англ. М.: Мир, 1985. - 160 с.

78. Пекар В.И. Корпусная репрезентация семантических ролей глаголов // Труды международного семинара Диалог'2001 по компьютерной лингвистике и её приложениям. -Том 1. С.204-212.

79. Пойа Д. Математика и правдоподобные рассуждения. М.: Наука, 1975. 464 с.

80. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. -М.: Радио и связь, 1989. 184 с.

81. Прикладное языкознание: Учебник / Л.В.Бондарко, Л.А.Вербицкая, Г.Я.Мартыненко и др.; Отв. редактор А.С.Герд. СПб.: Изд-во С.-Петербург, ун-та, 1996. 528 с.

82. Рузавин Г.И. Математизация научного знания. М.: Мысль, 1984. - 207 с.

83. Тульчинский Г.Л. В каком смысле возможна теория смысла (постановка вопроса). / В кн. Философские основания научной теории. Новоси-бирск: Наука, 1985. - 289 с. (с. 108-127)

84. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика / Перевод с англ. Ю. А. Зуева, В. А. Точенова; Под ред. А. И. Галушкина / А. И. Галушкин , Ю. А. Зуев , В. А. Точенов . М.: Мир, 1992. - 236 с.141

85. Хофман И. Активная память: Эксперимент, исслед. и теории человеч. памяти: Пер. с нем/Общ. ред. и предисл. Б.М. Величковского и Н.К.Корсаковой. М.: Прогресс, 1986.-312 с.

86. Чечкин A.B. Математическая информатика. М.: Наука. Гл. ред. физ.-мат. лит., 1991, -416с.

87. Шалютин С.М. Искусственный интеллект: гносеологический аспект. М.: Мысль, 1985. - 199 с.

88. Яковлева Г.Л. Разработка автоматизированных систем прогнозирования на основе методов теории нейронных сетей: Автореф. дис. на соискание ученой степени канд. техн. наук. М., 2000. - 19 с.

89. Ященко В.А. Интеллектуальная многопроцессорная ЭВМ с нейроподобной структурой // Искусственный интеллект. 2000. - №1. - С. 6-291. ТИПЫ ДАННЫХ

90. SetObject объект-множество PSetObject - указатель на объект-множество

91. Fragment фрагмент, т.е. некоторое подмножество компонентов объекта, в частности всё это множество1. ФУНКЦИИ ПОСТРОЕНИЯ МОДЕЛИvoid splitlnThree( Fragments objl, Fragments obj2, Fragments com,

92. Fragments difl, Fragments dif2 )

93. Разделение объектов-множеств objl и obj2 на три части: общая часть com, остаток первого объекта difl, остаток второго объекта di£2.void subst ( PSetObjectS x, Fragments com, Fragments difx, PSetObjectS objCom )

94. SetObject *separate( SetObject "*obj, Fragments frag ) Обособление фрагмента frag в самостоятельный объект модели.

95. PSetObject parseObject( PSetObjectS xobj )

96. Взаимное структурирование объекта xobj с имеющейся на момент вызовафункции моделью. Как объект xobj, так и модель в общем случае претерпевают изменения, связанные с обнаружением новых общих фрагментов и оформлением их в самостоятельные объекты модели.

97. ФУНКЦИИ РЕКОНСТРУКТИВНОГО ПОКРЫТИЯvoid initBoostValues( Fragments z,int boost, bool ifZeroOnly = faise )

98. Обеспечивает увеличение возбуждений НЭ из множества z на величину boost-Delta при соблюдении порога максимального возбуждения, установленного в глобальной переменной boostScale.void normalizeBoostValues( Fragments z )

99. Выполняет обратную передачу уменьшенного возбуждения от НЭ из множества у нижестоящим НЭ согласно второй фазе алгоритма ПОВ.void filterByBoostValue( Fragments zl, Fragments z2,int bvlo, int bvHi )

100. Осуществляет фильтрацию множества НЭ zl и множества НЭ z2 по следующему критерию: возбуждение е нейроподобного элемента должно удовлетворять неравенству bvLo <= е <= bvHi.void reconStep ( Fragments Cx, Fragments protos )

101. Обнуление всех возбуждений и приведение нейроподобной сети в исходное состояние. Данная функция должна вызываться перед началом решения каждой новой задачи.

102. РЕЗУЛЬТАТЫ ОБРАБОТКИ ПЕРВОЙ ГЛАВЫ ДИССЕРТАЦИИ

103. Выбранные темы для реферата:6 аналогий, пропорция б нейросетевые, модели 6 проблема, неоднозначности 5 реконструктивных, памяти

104. Реферат по выбранным темам (1,7% от текста, время обработки —менее 1с):

105. РЕЗУЛЬТАТЫ ОБРАБОТКИ ТЕКСТА НА АНГЛИЙСКОМ ЯЗЫКЕ

106. Материал: Around the World in Eighty Days (Jules Verne), Chapter 27

107. Источник: http ://www.literature.org1. Размер файла: 5,5 Кбайт

108. Количество предложений: 72

109. Количество объектов модели: 131

110. Время построения модели менее 1 секунды.150

111. Основные выделенные темы: 9 phileas, fogg 3 around, world 3 day, arrival 3 passepartout, hours 3 twenty, minutes 3 world, eighty1. Выбраны все темы.

112. Реферат (11% от текста, время обработки — менее 1 с):

113. Around the World in Eighty Days. You have made a mistake of one day!We arrived twenty-four hours ahead of time; but there are only ten minutes left!"

114. ПЛОТНОСТЬ МОДЕЛИ: 1.2 словосочетаний/слово

115. ТЕСТИРОВАЛОСЬ 15 6 СЛОВОСОЧЕТАНИЙ ИЗ 15 6 СЛОВОСОЧЕТАНИЙ (100%) ДОЛЯ НОВЫХ СЛОВОСОЧЕТАНИЙ 10 0%

116. ТОЧНОСТЬ ОНС ПРИ ОПРЕДЕЛЕННОСТИ 8 4%

117. ТОЧНОСТЬ МАХП1Е<2 ПРИ ОПРЕДЕЛЕННОСТИ 5 0%1. ОБЩАЯ ТОЧНОСТЬ ОНС 80%

118. ОБЩАЯ ТОЧНОСТЬ МАХГИЕО 5 0%1. ПОПАДАНИЙ ОНС 111

119. НЕОПРЕДЕЛЕННЫХ СОСТОЯНИЙ ОНС 2 5 ОШИБОК ОНС 2 0

120. СКОРОСТЬ ОБРАБОТКИ: 7 8 СЛОВОСОЧЕТАНИЙ / Сs.r.l.1. УТВЕРЖДАЮ»:

121. Генеральный директор Иностранного общества с ограниченной ответственностьюyWfX. БУХТИЕНКО с.и.1. АКТо внедрении результатов кандидатской диссертационной работы Демина Виталия Анатольевича1. Комиссия в составе:

122. Председатель, Мордкович Борис Абрамович, - генеральный инспектор качества. Члены комиссии:

123. Печерский Сергей Иванович, ведущий конструктор,1. Члены комиссии:1. Мордкович Б.А.1. Печерский С.И.1. Тизул Л.Л.

124. СИ 6900 Lugano - Via General Guisan. 6 Palazzo 5 Continental. 091/9948393 - 9948394 Fax. 091/9941841 - Telex 843097 TEBO CH E-mail; sales-depl@tebowa.com

125. MOLDOVA 3300, Tiraspol UT. Sakriera2d- Tel. + 33-51067 Fax +33^34036 - Telex 163160 MGP MD E-mail: tiras@mgp.mldnet.com1. П «Типар»