автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка нейросетевых методов разрешения неоднозначностей на основе реконструктивного покрытия и принципа аналогии
Оглавление автор диссертации — кандидата технических наук Демин, Виталий Анатольевич
ВВЕДЕНИЕ.
ГЛАВА 1. ОБЗОР СОВРЕМЕННОГО СОСТОЯНИЯ ИССЛЕДОВАНИЙ.
1.1. Проблема неоднозначности и методы её разрешения.
1.2. Реконструктивные свойства интеллекта.
1.3. Аналогия в искусственном интеллекте.
1.4. Нейросетевые модели обработки информации.
1.5. Выводы к главе 1.
ГЛАВА 2. КОНЦЕПТУАЛЬНЫЕ ОСНОВЫ РЕКОНСТРУКТИВНОГО ПОКРЫТИЯ.
2.1. Введение в проблему.
2.2. Понятия универсума, отражения, модели.
2.3. Взаимное структурирование объектов.
2.4. Реконструкция информации по модели универсума.
2.5. Выводы к главе 2.
ГЛАВА 3. РАЗРЕШЕНИЕ НЕОДНОЗНАЧНОСТЕЙ В РЕКОНСТРУКТИВНОМ ПОКРЫТИИ.
3.1. Математическая постановка задачи реконструктивного покрытия
3.2. Оценка правдоподобия объектов-прототипов.
3.3. Бинарные трансформационные аналогии.
3.4. Разрешение неоднозначностей покрытия с помощью бинарной аналогии.
3.5. Выводы к главе 3.
ГЛАВА 4. ОДНОРОДНЫЕ НЕЙРОПОДОБНЫЕ СЕТИ.
4.1. Представление модели универсума в виде однородной нейроподобной сети.
4.2. Общие принципы функционирования однородных нейроподобных сетей.
4.3. Метод и алгоритм параллельного обратного возбуждения.
4.4. Реконструктивное покрытие в однородной нейроподобной сети.
4.5. Место однородных нейроподобных сетей среди прочих коннекционистских подходов.
4.6. Выводы к главе 4.
ГЛАВА 5. ПРИМЕНЕНИЕ РАЗРАБОТАННЫХ МЕТОДОВ.
5.1. Тематическое реферирование текстовых документов.
5.2. Разрешение лексических неоднозначностей.
5.3. Общий вывод к главе 5.
Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Демин, Виталий Анатольевич
В настоящее время происходит бурное развитие информационных технологий, связанных с интеллектуальной обработкой информации. Большая часть информации представлена на естественном языке (ЕЯ), который обладает рядом свойств, принципиально отличающих его от всех искусственных языков. Наибольшие затруднения при обработке естественно-языковой информации (ОЕЯ) вызывает неоднозначность естественного языка, т.е. наличие у каждой единицы языка нескольких значений, различающихся по контексту. Контекст в общем случае включает не только непосредственное окружение слова, но и другие смысловые связи, а также представление о ситуации, формирующееся в сознании воспринимающего субъекта. Таким образом, проблема неоднозначности выходит далеко за рамки чистой лингвистики и привлекает к себе внимание многих специалистов по когнитивной психологии и компьютерным наукам.
Коммуникационный барьер между специалистом (пользователем) и программным обеспечением является одним из узких мест современных вычислительных систем. Минимальным требованием к системам нового поколения является наличие естественно-языкового интерфейса; дальнейшие перспективы связаны с программированием на естественном языке [15], а также с извлечением знаний из необработанных ЕЯ-документов [83]. Вся эта совокупность задач не может быть решена без надёжных и теоретически обоснованных методов разрешения неоднозначностей.
Существующие методы разрешения неоднозначностей могут быть разделены на две большие группы: статистические и эвристические. Первые используют не зависящие от языка статистические приёмы и критерии [39,44,48], вторые опираются на формализованные знания экспертов-лингвистов, используют всевозможные словари, энциклопедии и семантические сети [4,57,61,65]. Статистические методы требуют большого объёма обучающих данных, как правило, на несколько порядков превышающего объёмы тестовой или рабочей выборки. Эвристические методы разрабатываются под конкретные задачи и не могут быть интегрированы в комплексные интеллектуальные системы различного назначения. Помимо этого, каждый из существующих методов использует свои собственные средства представления неоднозначных структур, что осложняет повторное использование таких методов и затрудняет их комплексирова-ние с другими составляющими математического обеспечения интеллектуальных систем.
По мнению автора, указанные выше недостатки могут быть преодолены путём формализации проблемы неоднозначности и создания методов её разрешения в универсальной, функционально однородной среде распределённых вычислений. Совмещение хранения и обработки информации должно служить базой для решения проблемы неоднозначных интерпретаций. При этом сам способ хранения информации должен соответствовать потребностям разрешения неоднозначностей и допускать совместное существование и конкуренцию различных интерпретаций, а обработка информации - включать пересчёт оценок правдоподобия интерпретаций исходя не только из входной, но и модельной информации. Для этого в данной работе активно используются реконструктивная модель памяти [9,32] и методы аналогии [35].
Объектом исследования является проблема неоднозначности в задачах искусственного интеллекта, предметом исследования - разрешение неоднозначностей с использованием принципа аналогии и принципа реконструк-тивности.
Цель исследования - создание методов представления и разрешения неоднозначностей в нейросетевой вычислительной среде на основе реконструктивного покрытия и принципа аналогии.
Принцип реконструктивного покрытия, который вводится в данной работе, состоит в дополнении входных объектов до наиболее правдоподобного целого путём привлечения модельной информации, полученной на этапе обучения. Этот принцип находится в полном согласии с концепцией реконструктивной памяти и выступает в качестве её формальной модели. Принцип аналогии используется в той его трактовке, которая связана с языками аналогических строк [35].
Задачи исследования:
1) разработка концептуальной системы для представления и обработки неоднозначных структур данных;
2) разработка математического формализма для описания и решения задач реконструктивного покрытия с разрешением неоднозначностей;
3) исследование способов реализации реконструктивного покрытия в распределённой вычислительной среде;
4) разработка аппарата однородных нейроподобных сетей, специально предназначенного для реконструктивного покрытия с разрешением неоднозначностей;
5) реализация принципов аналогии в однородных нейроподобных сетях;
6) разработка практических экспериментальных систем, использующих предложенные нейросетевые методы разрешения неоднозначностей, и проведение экспериментов с этими системами для подтверждения правильности разработанных методов.
Конкретным результатом проведённых исследований являются новые методы разрешения неоднозначностей, успешно применённые к решению актуальных задач обработки естественного языка:
1) задаче автоматического построения реферата текстового документа с настраиваемым уровнем детализации и пользовательским выбором тем при условии автоматического определения наиболее значимых тем текста;
2) задаче разрешения лексических неоднозначностей в парных словосочетаниях в условиях минимального контекста и повышенной разрежённости обучающих данных.
Для реализации экспериментов с помощью методов объектно-ориентированного программирования была разработана программная модель однородной нейроподобной сети. Модель реализована в виде библиотеки классов и функций на языке программирования С++ и предназначена для встраивания в конкретные приложения на этапе кодирования. Доступность электронных текстов, высокая сложность и актуальность задач обработки естественного языка явились факторами, определившими сферу испытания разработанных нейросетевых методов разрешения неоднозначностей. Научная новизна работы состоит в следующем:
1) предложен новый формализм для представления дискретных структур в системах искусственного интеллекта - формализм П-структур, - который может быть использован для представления объектов с многочисленными неоднозначными интерпретациями;
2) выполнена математическая постановка задачи реконструктивного покрытия с разрешением неоднозначностей и предложен подход к её решению в распределённой вычислительной среде;
3) предложена формальная математическая схема бинарной трансформационной аналогии и способ её применения к определению оценок правдоподобия, необходимых для разрешения неоднозначностей реконструктивного покрытия;
4) разработан аппарат однородных нейроподобных сетей, предназначенный для решения задач реконструктивного покрытия с разрешением неоднозначностей на объектах, заданных множествами компонентов либо множествами признаков;
5) разработаны методы разрешения неоднозначностей в однородных нейроподобных сетях на основе вычисления оценок правдоподобия объектов, представляемых уровнями возбуждения нейронов сети;
6) разработан способ тематического реферирования текстов с использованием однородных нейроподобных сетей по принципу движения «снизу-вверх» (от тем к предложениям);
7) исследованы возможности разрешения лексических неоднозначностей в парах «глагол-дополнение» с использованием однородных нейроподобных сетей.
На защиту выносятся:
1) формализм П-структур;
2) математическая формализация задачи реконструктивного покрытия;
3) аппарат однородных нейроподобных сетей (ОНС);
4) метод автоматического реферирования текстов с использованием многоуровневого разрешения неоднозначностей покрытия;
5) метод разрешения лексических неоднозначностей посредством поиска аналогий в однородной нейроподобной сети.
При работе над диссертацией активно использовались научные статьи и отчёты, опубликованные или продублированные в электронной форме в сети Интернет. Для доступа к электронным публикациям и библиографии использовались ведущие международные каталоги:
• Research Index (CiteSeer), http://citeseer.nj.nec.com
• CS Bibliography Server, http://liinwww.ira.uka.de
• National Computer Science Technical Report Library, http://www.ncstrl.org Использование данных каталогов позволило получить доступ к наиболее современным и актуальным публикациям по теме исследования и существенно способствовало построению литературного обзора, составляющего содержание главы 1 настоящей диссертации. Главы 2, 3 и 4 последовательно раскрывают ход проведённых диссертационных исследований. Глава 5 посвящена описанию практического приложения разработанных в диссертации методов к решению конкретных задач по обработке естественного языка. В приложении 1 описан состав функционального ядра разрешения неоднозначностей покрытия, в приложении 2 содержатся образцы кратких рефератов, полученных с помощью разработанных в диссертации нейросетевых методов, в приложении 3 приведён пример разрешения лексических неоднозначностей с помощью однородной нейроподобной сети. Приложение 4 содержит копию акта о внедрении результатов данной диссертационной работы.
Заключение диссертация на тему "Разработка нейросетевых методов разрешения неоднозначностей на основе реконструктивного покрытия и принципа аналогии"
Общие выводы из проведённых экспериментов таковы:
1) аналогия играет важную роль в образовании новых словосочетаний;
2) однородные нейроподобные сети способны выявлять аналогию и использовать её для разрешения неоднозначностей.
5.3. Общий вывод к главе 5
Экспериментальные исследования, описанные в настоящей главе подтвердили работоспособность разработанных в диссертации методов разрешения неоднозначностей и их практическую применимость к таким задачам как поиск и реферирование текстовой информации, оценка сочетаемости слов. Подтвердилась и роль аналогии в разрешении неоднозначностей. ОНС продемонстрировали способность обнаруживать аналогии и использовать их для корректировки оценок правдоподобия компонентов модели.
Кроме перечисленного, эксперименты показали и то, что однородные нейроподобные сети могут быть эффективно реализованы в виде программных систем или модулей, предназначенных для обычных операционных систем и обычных персональных компьютеров. Это чрезвычайно важно для разработки практических, рабочих интеллектуальных систем. Используя обоснованные и экспериментально подтверждённые принципы и методы реконструктивного покрытия, разработчики систем искусственного интеллекта могут повысить уровень наукоёмкости разрабатываемых программных продуктов, улучшить их интегрируемость и расширить их функциональные возможности.
ЗАКЛЮЧЕНИЕ
В диссертации разработана теоретически обоснованная совокупность ней-росетевых методов разрешения неоднозначностей, базирующаяся на принципе реконструктивности и приниципе аналогии.
Ниже перечислены основные теоретические результаты работы.
1) Разработан математический формализм П-структур для представления дискретных структур с неоднозначностями.
2) Выполнена математическая формализация задачи реконструктивного покрытия с разрешением неоднозначностей, разработана система понятий, необходимых для конкретной постановки и решения задач, связанных с разрешением неоднозначностей, представимых П-структурами.
3) Предложена формальная схема бинарной траснформационной аналогии и способ использования данной схемы для вычисления оценок правдоподобия новых объектов.
4) Разработан аппарат однородных нейроподобных сетей, предназначенный для выполнения реконструктивного покрытия с разрешением неоднозначностей, в том числе с использованием бинарных аналогий.
5) Разработаны методы для разрешения неоднозначностей в однородных нейроподобных сетях, опробованные при решении практических задач.
В практической части диссертации получены следующие важные результаты.
1) Задача автоматического реферирования текстов впервые поставлена и решена как задача многоуровневого разрешения неоднозначностей покрытия в структурированной модели текста. Это позволяет динамически получать различные тематические проекции текста и выявлять связи между понятиями.
2) Экспериментально подтверждена применимость разработанных нейросете-вых методов разрешения неоднозначностей к задаче оценки сочетаемости слов в парах «глагол-дополнение» при высокой разрежённости обучающих
132 данных. Эксперименты продемонстрировали, что однородные нейроподоб-ные сети способны обнаруживать аналогию и использовать её для разрешения неоднозначностей.
Таким образом, проведённые исследования показали целесообразность учёта реконструктивных свойств интеллекта и приниципа аналогии при решении интеллектуальных задач, связанных с выбором правильных интерпретаций в условиях неоднозначности.
Дальнейшие исследования должны в первую очередь вестись в направлении изучения возможностей разработанных методов в приложении к другим задачам искусственного интеллекта, в первую очередь, к другим видам неоднозначностей и другим условиям обучения. Помимо этого, целесообразно исследовать возможность аппаратной реализации однородных нейроподобных сетей для получения быстродействующей платформы для задач, требующих разрешения неоднозначностей. Не исключаются и теоретические исследования, направленные на совершенствование методов, в частности, путём привлечения более сложных теорий аналогии или иных аспектов реконструктивного покрытия, например, отрицательных обучающих примеров или явного представления и обработки преобразований в нейроподобной сети.
Библиография Демин, Виталий Анатольевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. Bach K. Ambiguity // Routledge Encyclopedia of Philosophy. On-line version, 1999. http://online.sfsu.edu/~kbach/ambguity.html
2. Bartfai G. An ART-based Modular Architecture for Learning Hierarchical Clusterings // Neurocomputing, 1996. http://citeseer.nj.nec.com/54299.html
3. Brun C.A. Client/Server Architecture for Word Sense Disambiguation, 2000. http://citeseer.nj.nec.com/brunOOclientserver.html
4. Carpenter G.A., Grossberg S., Rosen D.B. Fuzzy ART: Fast Stable Learning and Categorization of Analog Patterns by an Adaptive Resonance System // Neural Networks, 1991. vol.4-pp.759-771.
5. Ciaramita M., Johnson M. Explaining away ambiguity: Learning verb selectional preference with Bayesian networks. Proceedings of the 18th International Conference on Computational Linguistics, 2000. vol. 1. http://arxiv.org/ps/cs/0008020
6. Dagan I., Lee L., Pereira F. Similarity-Based Methods For Word Sense Disambiguation // In Proceedings of ACL-EACL, 1997. http://citeseer.nj.nec.com/dagan99similaritybased.html
7. DeLosh E., Merritt P. Reconstructive Processes in Memory. On-line publication, 2000. http://www.psych.nmsu.edu/~cooke/courses/ReconstructiveOH.htm
8. Dennis S. The Interactive Activation and Competition Network: How Neural Networks Process Information. On-line publication, 1997. http://www2.psy.uq.edu.au/~brainwav/Manual/IAC.html
9. Falkenhainer B., Forbus K.D., Gentner D. The Structure mapping engine: algorithm and examples//Artificial Intelligence, 1990. vol.41 - pp.1-63. http://www.cc.gatech.edu/~jimmyd/summaries/falkenhainerl990.html
10. Faloutsos C., Oard D. A Survey of Information Retrieval and Filtering Methods. Technical Report, Information Filtering Project, University of Maryland, College Park, MD, 1996. http://citeseer.nj.nec.com/faloutsos96survey.html
11. Feldman J.A., Ballard D.H. Connectionist models and their properties. Cognitive Science,1982.-vol. 6. pp.205-254.
12. Fuchs N.E., Schwitter R. Specifying Logic Programs in Controlled Natural Language // CLNLP 95, Workshop On Computational Logic For Natural Language Processing, Edinburgh, 1995. http://www.ncstrl.org
13. Gale W.A., Church K.W., Yarowsky D. A Method for Disambiguating Word Senses in a Large Corpus // Computers and the Humanities, 1992. vol. 26 - pp.415-439. http://citeseer.nj.nec.cOm/context/64863/0
14. Gentner D. Structure-mapping: A theoretical framework for analogy // Cognitive Science,1983. vol.7 - pp.155-170. http://www.cc.gatech.edu/~jimmyd/summaries/gentnerl983-1 .html
15. Gentner D., Markman A.B. Structure Mapping in Analogy and Similarity // American Psycologist, 1997 vol. 52, no.l - 45-56.www.qrg.ils.nwu.edu/papers/files/GentnerMarkmanAmPsyJan97.pdf
16. Goldstein J., Kantrowitz M., Mittal V., Carbonell J. Summarizing Text Documents: Sentence Selection and Evaluation Metrics // Proceedings of SIGIR-99, Berkeley, 1999. http://citeseer.nj.nec.com/article/goldstein99summarizing.html
17. Hofmann T., Puzicha J. Unsupervised learning from dyadic data. Technical Report TR-98-042, International Computer Science Insitute, Berkeley, 1998. http://citeseer.nj.nec.com/article/hofmann98unsupervised.html
18. Holyoak K. J., Thagard P. The analogical mind // American Psychologist, 1997. vol. 52 -pp. 35-44. http://www.cc.gatech.edxi/~jimmyd/summaries/ holyoakl997.html
19. Hutchens J., Alder M. Finding Structure via Compression. University of Western Australia, 1997.- http://cs-tr.cs.cornell.edU/Dienst/UI/l.0/Display/ncstrl.uwaee/CP98-01
20. Hwee Tou Ng. Getting serious about word sense disambiguation // ACL SIGLEX Workshop on Tagging Text with Lexical Semantics: Why, What, and How? April, 1997. http://www.ims.uni-stuttgart.de/-light/tuebhtml/semtagws.html
21. Jing H., Barzilay R., McKeown K., Elhadad M. Summarization Evaluation Methods: Experiments and Analysis, 1998. http://citeseer.nj.nec.com/jing98summarization.html
22. Keane, M. Analogical Asides on Case-Based Reasoning. // Lecture Notes in Artificial Intelligence, vol.837. Springer-Verlag, 1994. - pages 21-32. http://citeseer.nj.nec.com/keane94analogical.html
23. Klavans J., McKeown K., Kan M., Lee S. Resources for the Evaluation of Summarization Techniques // Proceedings of the 1 st Int'l Conference on Language Resources and Evaluation, Grenada, 1998. http://citeseer.nj.nec.com/5308.html
24. Kokinov B., Petrov A. Integration of memory and reasoning in analogy-making: the AMBR model. // D. Gentner, K. Holyoak, and B. Kokinov (Eds.): Analogy: Perspectives from Cognitive Science. MIT Press, 2000. http://citeseer.nj.nec.com/273256.html
25. Kupiec J., Pedersen J., Chen F. A trainable document summarizer // Research and Development in Information Retrieval, 1995. pp.68-73. http://citeseer.nj.nec.com/kupiec95trainable.html
26. Lee L. Similarity-Based Approaches to Natural Language Processing. Ph.D. thesis. Harvard University Technical Report TR-11-97, 1997. http://www.cs.cornell.edu/home/llee/papers/thesis.pdf
27. Lepage Y. Languages of Analogical Strings // Proceedings of the International Conference on Computional Linguistics, Europe, 2000.http://nlp3 .korea.ac.kr/proceeding/coling2000/COLING/pdf/071.pdf
28. Marquez L. Machine Learning and Natural Language Processing. Electronic publication, 2000. http://citeseer.nj.nec.com/marquezOOmachine.html
29. Medler D. A Brief History of Connectionism. University of Alberta, Canada. On-line version, 1998. http://ww.icsi.berkeley.edu/~iagota/NCS/VOLl/P3html/voll3.html
30. Mitamura T., Nyberg E., Carbonell J. An Efficient Inter lingua Translation System for Multi-lingual Document Production// Proceedings of Machine Translation Summit III, Washington, 1991. http://www.lti.cs.cmu.edu/Research/Kant/PDF/mts3-nofoot.pdf
31. Morrison T., Dietrich E. Structure-Mapping vs. High-level Perception: The Mistaken Fight Over The Explanation of Analogy. State University of New York. Electronic publication, 1999. http://citeseer.nj.nec.c0m/l 18164.html
32. Nevill-Manning C., Witten I. Identifying Hierarchical Structure in Sequences: A linear-time algorithm // Journal of Artificial Intelligence Research, 1997. vol.7, http://www.ncstrl.org, report xxx.cs.AI/9709102.
33. O'Donoghue D. An Integrated Analogy Model for Creative Reasoning, 1997. http://citeseer.nj.nec.com/383281.html
34. Pereira F., Tishby N., Lee L. Distributional Clustering of English Words // In Proceedings of the "Meeting of the Association for Computational Linguistics", 1993. pp.183-190. http://citeseer.nj.nec.com/article/pereira93distributional.html
35. Plaut D. Connectionist Modeling. To appear in Kasdin, A. (Ed.), Encyclopedia of Psychology. On-line version, 1999.http://www.cnbc.cmu.edu/~plaut/papers/pdf/PlautIPchap.conn.pdf
36. Poesio M. Semantic ambiguity and perceived ambiguity. Electronic publication, 1994. http://citeseer.nj.nec.com/poesio94semantic.html
37. Pollack J. B. Connectionism: Past, Present, and Future. // Artificial Intelligence Review, 1989. vol. 3, pp. 3-20. http://citeseer.nj.nec.com/pollack88connectionism.html
38. Prescher D., Riezler S., Rooth M. Using a Probabilistic Class-Based Lexicon for Lexical Ambiguity Resolution, 2000. http://citeseer.nj.nec.com/prescherOOusing.html
39. Pritchard E. Attention & Memory: Lecture Notes. University of Winnipeg, 2000. http://www.uwinnipeg.ca/~epritchl/amnotesfall2000.html
40. Ratnaparkhi A., Maximum Entropy Models for Natural Language Ambiguity Resolution, Ph.D. thesis, University of Pennsylvania, Philadelphia, PA, 1998. http://citeseer.nj.nec.com/ratnaparkhi98maximum.html
41. Resnik P. Selectional preference and sense disambiguation // ACL SIGLEX Workshop on Tagging Text with Lexical Semantics, 1997. http://www.ims.unistuttgart. de/~l ight/tuebhtml/resnik2 .ps
42. Rodriguez P., Wiles J., Elman J.L. A recurrent neural network that learns to count. Connection Science, 1999. vol. 11 - pp. 5-40. http://crl.ucsd.edu/~elman/Papers/cs-counter.pdf
43. Roth D. Learning to resolve natural language ambiguities: A unified approach // Proceedings of the National Conference on Artificial Intelligence, 1998. pp. 806-813. http ://citeseer. nj. nec. com/roth9 81earning .html
44. Sanderson M. Word Sense Disambiguation and Information Retrieval, PhD Thesis, Technical Report (TR-1997-7) of the Department of Computing Science at the University of Glasgow, 1997. http://citeseer.nj.nec.com/sanderson97word.html
45. Seagull A. A Compaction of WordNet Senses for Evaluation of Word Sense Disambiguators, 2000. http://citeseer.nj .nec.com/seagull00compaction.html
46. Siler W. Building Fuzzy Expert Systems. On-line book, 1998. http://members.aol.com/wsiler/
47. Similarity-Based Estimation of Word Cooccurrence Probabilities. // Ido Dagan, Fernando Pereira, and Lillian Lee Proceedings of the 32nd ACL, 1994. pp 272-78. http://www.cs.eornell.edu/home/llee/papers/dpl.ps
48. Survey of the State of the Art in Human Language Technology / Ronald A. Cole et al. (Eds.). Cambridge University Press, 1995. http:://www.coli.uni-sb.de/~hansu/cl.html
49. Yeronis J., Ide M. Word Sense Disambiguation with Very Large Neural Networks Extracted from Machine Readable Dictionaries // Proceedings of COLING'90, Helsinki, August 1990. http://www.up.umv-mrs.fr/~veronis/pdf/l990coling.pdf
50. Wermter S. and Sun R. (eds.). Hybrid Neural Systems // Lecture Notes in Articial Intelligence (LNCS 1778), Springer-Verlag, Heidelberg, 2000. http://citeseer.nj.nec.com/article/wermterOOhybrid.html
51. Yarowsky D. Unsupervised word sense disambiguation rivalling supervised methods, in Proceedings of the ACL, 1995. vol. 33. http://citeseer.nj.nec.com/yarowski95unsupervised.html
52. Yarowsky D. Word sense disambiguation using statistical models of Roget's categories trained on large corpora, in Proceedings of COLING Conference, 1992. pp. 454-460. http://citeseer.nj.nec.com/yarowsky92wordsense.html
53. Zechner K. A Literature Survey on Information Extraction and Text Summarization. CMU LTI Report, 1997 http://www.csi.uottawa.ca/tanka/ArtDB/infoextr.ps.gz
54. Батороев К.Б. Кибернетика и метод аналогий. Учеб. пособие. М.: Высш. школа, 1974. - 104 с.
55. Беркович С.Я. Клеточные автоматы как модель реальности: поиски новых представлений физических и информационных процессов. Пер. с англ. М.: Изд-во МГУ, 1993. - 112 с.
56. Галушкин А.И. Теория нейронных сетей. Кн. 1: Учеб. пособие для вузов / Общая ред. А.И. Галушкина. М.: ИПРЖР, 2000. - 416 с.
57. Глушков В.М. Основы безбумажной информатики. М.: 1987.-552 с.
58. Головко В.А. Нейронные сети: обучение, организация и применение. Кн. 4 / Общая ред. А.И. Галушкина. М.: ИПРЖР, 2001. - 256 с.
59. Горбань А.Н. Обобщённая аппроксимационная теорема и вычислительные возможности нейронных сетей // Сиб. журн. вычисл. математики / РАН, Сиб. отд-ние. Новосибирск, 1998. -т.1,№1. -с. И-24.
60. Горбань А.Н. Обучение нейронных сетей. М.: СП "Параграф", 1990. - 160с.
61. Гроссберг С. Внимательный мозг// Открытые системы. 1997. - №4. http://www.osp.rU/os/l 997/04/29.htm
62. Демин В A. Re-Fine: средство интеллектуального анализа текстов на основе методологии воссоздания объектов // Труды Международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям. Т.2. Аксакове, 2001. - С.:93-99.
63. Демин В.А. Бинарная трансформационная аналогия как операция получения новых знаний // Аспирант и соискатель. 2001. - № 5.- № 5. - С. 203-207.
64. Демин В.А. Использование однородных нейроподобных сетей для разрешения лексических неоднозначностей // Актуальные проблемы современной науки 2001. - № 1. -С. 116-121.
65. Демин В.А. Концепция универсума в искусственном интеллекте // Искусственный интеллект. -2001. -№1. С.43-51.
66. Демин В.А. Однородные нейроподобные сети: универсальная среда воссоздания объектов // Актуальные проблемы современной науки 2001. - № 1. - С. 122-126.
67. Демин В.А. Парадигма воссоздания объектов // Искусственный интеллект. 2001.-№2. С. 120-127.
68. Демин В.А. Реконструктивная обработка естественно-языковой информации в однородных нейроподобных сетях // Искусственный интеллект. -Донецк: ДонГИИИ, 2002,-№4.-С. 692-696.
69. Искусственный интеллект: В 3 кн. Кн. 1. Системы общения и экспертные системы: Справочник / Под ред. Э. В. Попова. М.: Радио и связь, 1990. - 464 с.
70. Каллан Р. Основные концепции нейронных сетей : Пер. с англ. М.: Издательский дом "Вильяме", 2001. - 288 с.
71. Каляев И.А., Гайдук А.Р. Однородные нейроподобные структуры в системах выбора действий интеллектуальных роботов. М.: "Янус-К", 2000. - 280 с.
72. Колегов A.B. Грамматика языка-посредника Эльюнди. Тирасполь: РИО ПГУ, 1998. -220 с.
73. Комарцова Л.Г., Максимов A.B. Нейрокомпьютеры. М.: Изд-во МГТУ им. Н.Э.Баумана, 2002. - 320 с.
74. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инженера. М.: Энергоатомиздат, 1988. - 344 с.
75. Лернер А.Я. Начала кибернетики. М.: Наука, 1967. - 400 с.
76. Логический подход к искусственному интеллекту: от классической логики к логическому программированию: Пер. с франц./ Тейз А., Грибомон П., Луи Ж. и др. М.: Мир, 1990. - 432 с.
77. Норман Д. Память и научение: Пер. с англ. М.: Мир, 1985. - 160 с.
78. Пекар В.И. Корпусная репрезентация семантических ролей глаголов // Труды международного семинара Диалог'2001 по компьютерной лингвистике и её приложениям. -Том 1. С.204-212.
79. Пойа Д. Математика и правдоподобные рассуждения. М.: Наука, 1975. 464 с.
80. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. -М.: Радио и связь, 1989. 184 с.
81. Прикладное языкознание: Учебник / Л.В.Бондарко, Л.А.Вербицкая, Г.Я.Мартыненко и др.; Отв. редактор А.С.Герд. СПб.: Изд-во С.-Петербург, ун-та, 1996. 528 с.
82. Рузавин Г.И. Математизация научного знания. М.: Мысль, 1984. - 207 с.
83. Тульчинский Г.Л. В каком смысле возможна теория смысла (постановка вопроса). / В кн. Философские основания научной теории. Новоси-бирск: Наука, 1985. - 289 с. (с. 108-127)
84. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика / Перевод с англ. Ю. А. Зуева, В. А. Точенова; Под ред. А. И. Галушкина / А. И. Галушкин , Ю. А. Зуев , В. А. Точенов . М.: Мир, 1992. - 236 с.141
85. Хофман И. Активная память: Эксперимент, исслед. и теории человеч. памяти: Пер. с нем/Общ. ред. и предисл. Б.М. Величковского и Н.К.Корсаковой. М.: Прогресс, 1986.-312 с.
86. Чечкин A.B. Математическая информатика. М.: Наука. Гл. ред. физ.-мат. лит., 1991, -416с.
87. Шалютин С.М. Искусственный интеллект: гносеологический аспект. М.: Мысль, 1985. - 199 с.
88. Яковлева Г.Л. Разработка автоматизированных систем прогнозирования на основе методов теории нейронных сетей: Автореф. дис. на соискание ученой степени канд. техн. наук. М., 2000. - 19 с.
89. Ященко В.А. Интеллектуальная многопроцессорная ЭВМ с нейроподобной структурой // Искусственный интеллект. 2000. - №1. - С. 6-291. ТИПЫ ДАННЫХ
90. SetObject объект-множество PSetObject - указатель на объект-множество
91. Fragment фрагмент, т.е. некоторое подмножество компонентов объекта, в частности всё это множество1. ФУНКЦИИ ПОСТРОЕНИЯ МОДЕЛИvoid splitlnThree( Fragments objl, Fragments obj2, Fragments com,
92. Fragments difl, Fragments dif2 )
93. Разделение объектов-множеств objl и obj2 на три части: общая часть com, остаток первого объекта difl, остаток второго объекта di£2.void subst ( PSetObjectS x, Fragments com, Fragments difx, PSetObjectS objCom )
94. SetObject *separate( SetObject "*obj, Fragments frag ) Обособление фрагмента frag в самостоятельный объект модели.
95. PSetObject parseObject( PSetObjectS xobj )
96. Взаимное структурирование объекта xobj с имеющейся на момент вызовафункции моделью. Как объект xobj, так и модель в общем случае претерпевают изменения, связанные с обнаружением новых общих фрагментов и оформлением их в самостоятельные объекты модели.
97. ФУНКЦИИ РЕКОНСТРУКТИВНОГО ПОКРЫТИЯvoid initBoostValues( Fragments z,int boost, bool ifZeroOnly = faise )
98. Обеспечивает увеличение возбуждений НЭ из множества z на величину boost-Delta при соблюдении порога максимального возбуждения, установленного в глобальной переменной boostScale.void normalizeBoostValues( Fragments z )
99. Выполняет обратную передачу уменьшенного возбуждения от НЭ из множества у нижестоящим НЭ согласно второй фазе алгоритма ПОВ.void filterByBoostValue( Fragments zl, Fragments z2,int bvlo, int bvHi )
100. Осуществляет фильтрацию множества НЭ zl и множества НЭ z2 по следующему критерию: возбуждение е нейроподобного элемента должно удовлетворять неравенству bvLo <= е <= bvHi.void reconStep ( Fragments Cx, Fragments protos )
101. Обнуление всех возбуждений и приведение нейроподобной сети в исходное состояние. Данная функция должна вызываться перед началом решения каждой новой задачи.
102. РЕЗУЛЬТАТЫ ОБРАБОТКИ ПЕРВОЙ ГЛАВЫ ДИССЕРТАЦИИ
103. Выбранные темы для реферата:6 аналогий, пропорция б нейросетевые, модели 6 проблема, неоднозначности 5 реконструктивных, памяти
104. Реферат по выбранным темам (1,7% от текста, время обработки —менее 1с):
105. РЕЗУЛЬТАТЫ ОБРАБОТКИ ТЕКСТА НА АНГЛИЙСКОМ ЯЗЫКЕ
106. Материал: Around the World in Eighty Days (Jules Verne), Chapter 27
107. Источник: http ://www.literature.org1. Размер файла: 5,5 Кбайт
108. Количество предложений: 72
109. Количество объектов модели: 131
110. Время построения модели менее 1 секунды.150
111. Основные выделенные темы: 9 phileas, fogg 3 around, world 3 day, arrival 3 passepartout, hours 3 twenty, minutes 3 world, eighty1. Выбраны все темы.
112. Реферат (11% от текста, время обработки — менее 1 с):
113. Around the World in Eighty Days. You have made a mistake of one day!We arrived twenty-four hours ahead of time; but there are only ten minutes left!"
114. ПЛОТНОСТЬ МОДЕЛИ: 1.2 словосочетаний/слово
115. ТЕСТИРОВАЛОСЬ 15 6 СЛОВОСОЧЕТАНИЙ ИЗ 15 6 СЛОВОСОЧЕТАНИЙ (100%) ДОЛЯ НОВЫХ СЛОВОСОЧЕТАНИЙ 10 0%
116. ТОЧНОСТЬ ОНС ПРИ ОПРЕДЕЛЕННОСТИ 8 4%
117. ТОЧНОСТЬ МАХП1Е<2 ПРИ ОПРЕДЕЛЕННОСТИ 5 0%1. ОБЩАЯ ТОЧНОСТЬ ОНС 80%
118. ОБЩАЯ ТОЧНОСТЬ МАХГИЕО 5 0%1. ПОПАДАНИЙ ОНС 111
119. НЕОПРЕДЕЛЕННЫХ СОСТОЯНИЙ ОНС 2 5 ОШИБОК ОНС 2 0
120. СКОРОСТЬ ОБРАБОТКИ: 7 8 СЛОВОСОЧЕТАНИЙ / Сs.r.l.1. УТВЕРЖДАЮ»:
121. Генеральный директор Иностранного общества с ограниченной ответственностьюyWfX. БУХТИЕНКО с.и.1. АКТо внедрении результатов кандидатской диссертационной работы Демина Виталия Анатольевича1. Комиссия в составе:
122. Председатель, Мордкович Борис Абрамович, - генеральный инспектор качества. Члены комиссии:
123. Печерский Сергей Иванович, ведущий конструктор,1. Члены комиссии:1. Мордкович Б.А.1. Печерский С.И.1. Тизул Л.Л.
124. СИ 6900 Lugano - Via General Guisan. 6 Palazzo 5 Continental. 091/9948393 - 9948394 Fax. 091/9941841 - Telex 843097 TEBO CH E-mail; sales-depl@tebowa.com
125. MOLDOVA 3300, Tiraspol UT. Sakriera2d- Tel. + 33-51067 Fax +33^34036 - Telex 163160 MGP MD E-mail: tiras@mgp.mldnet.com1. П «Типар»
-
Похожие работы
- Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами
- Метод, алгоритмы синтеза и структурно-функциональная организация отказоустойчивых нейросетевых логических устройств
- Методы проектирования систем защиты информации в нейросетевых вычислительных средах
- Нейросетевое управление рентабельностью предприятия
- Параллельные цифровые нейрокомпьютеры и их применение в задачах распознавания зрительных образов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность