автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка и исследование гибридных нейросетевых моделей для автоматической классификации текстовых документов
Автореферат диссертации по теме "Разработка и исследование гибридных нейросетевых моделей для автоматической классификации текстовых документов"
На правах рукописи
Мешкова Екатерина Владимировна
РАЗРАБОТКА И ИССЛЕДОВАНИЕ ГИБРИДНЫХ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ ДЛЯ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ
Специальность: 05.13.01 — «Системный анализ, управление и обработка информации»
Автореферат диссертации на соискание ученой степени кандидата технических наук
0034В80Э8
Таганрог 2009
003468098
Работа выполнена в Южном федеральном университете.
Научный руководитель: доктор технических наук, профессор
Лебедев Борис Константинович
Официальные оппоненты: д.т.н., профессор Галуев Геннадий
Анатольевич (зав.каф. Информационных систем Таганрогского государственного педагогического института, г. Таганрог), д.т.н., профессор Галушкин Николай Ефимович (зав. каф. Математики и прикладной информатики Новошах-тинского филиала Южного федерального университета, г. Новошах-тинск).
Ведущая организация: Научно-исследовательский институт
вычислительных, информационных и управляющих систем (НИИ ВИ-УС) - структурное подразделение ЮРГТУ (НПИ), г. Новочеркасск
Защита диссертации состоится « 21 » мая 2009 г. в 13-00 на заседании диссертационного совета Д 212.208.22 при Южном федеральном университете по адресу: 347928, Таганрог, пер. Некрасовский, 44, ауд. Д-406.
С диссертацией можно ознакомиться в Зональной научной библиотеке Южного федерального университета по адресу: 344000, Ростов-на-Дону, ул. Пушкинская, 148.
Автореферат разослан « 18 » апреля 2009 г.
Ученый секретарь
диссертационного совета Д 212.208.22, доктор технических наук, профессор Целых А.Н.
Актуальность работы. Актуальность задачи автоматической классификации текстов повышается по мере внедрения и развития информационных технологий. Исследования и разработки в области автоматической обработки и классификации текста привлекают внимание крупнейших фирм и государственных организаций всего мира. Об этом говорит и наличие множества грантов, конкурсов различных научных фондов и поисковых систем, направленных на разработку, анализ и апробацию различных подходов, увеличивающих эффективность автоматической классификации.
Развитие не только глобальных компьютерных сетей, но и полнотекстовых баз данных привело к постоянному наращиванию информационных текстовых ресурсов: образовательные центры организуют в Интернете базы научных статей, авторефератов, многие организации предоставляют доступ к ресурсам электронных библиотек, публикуются тысячи полных текстов докладов и т.п. При постоянном и интенсивном возрастании объемов текстовой информации, трудности поиска требуемых сведений среди множества доступных текстов значительно уменьшают ее ценность. Поэтому особенную значимость автоматическая классификация текстовых документов имеет для информационно-поисковых систем глобальных сетей, полнотекстовых баз данных. Исходя из этого, задача автоматической классификации текста, представляя собой частный случай задачи распознавания смысла, является в настоящее время актуальной проблемой, затрагивающей различные сферы человеческой деятельности, т.к. ее решение позволит полностью автоматизировать процесс обработки, классификации и поиска информации.
В настоящее время в мире существуют и активно развиваются системы автоматической классификации текста, специализированные системы полнотекстового анализа (например, в России это "Следопыт", "ТекстАна-лист") позволяющие проводить автоматическую классификацию и реферирование текстов.
Наиболее часто используемыми методами в автоматической классификации текстовых документов являются статистические методы. К ним относятся: статистические классификаторы на основе вероятностных методов, методы многомерного статистического анализа, в частности, факторного анализа, кластерного анализа, таксономии, распознавания образов без учителя, частотный анализ текста, математический анализ текста на основе законов Зипфа (Zipf). В некоторых областях, например, лексико-грамматическом анализе предложения, синтаксическом анализе предложения, автоматическом реферировании, в большей степени применяются лингвистические методы.
Сфера применения разработанной автором модели достаточно обширна. Это информационно-поисковые системы, системы автоматической классификации, библиотечно-справочные системы, поисковые роботы, системы обработки текстовой информации, Text Mining.
Так как автоматическая классификация является подзадачей распознавания смысла, для которой используются модели представления знаний, логичным будет совместить нейронные сети, осуществляющие классификацию
(кластеризацию) по признакам, и семантические сети с заранее установленными связями между объектами, имеющими имя и значение.
В данной работе осуществляется попытка отойти от традиционного направления классификации на нейронных сетях, как работы с признаками, и обратить большее внимание на смысловые единицы (слова), содержащиеся в тексте, и связи менаду ними, что традиционно является прерогативой семантических сетей. Проанализировав качества нейронных и семантических сетей, предложена модель, позволяющая частично компенсировать недостатки и сложности при построении обоих сетей, за счет поэтапного изменения конфигурации гибридной сети.
В работе предложена новая модель, использующая в своей основе семантические, смысловые связи, отраженные на ассоциативной нейронной сети. Таким образом, возникает возможность использовать преимущества ассоциативной нейронной сети, позволяющие выделять собственные закономерности, и обучаться, и возможности семантических связей при создании «семантического образа» области знания, раздела классификации или поискового запроса.
Разработанный в работе подход дает значительное преимущество по сравнению со статистическими методами, и классификацией с помощью ключевых слов и содержащихся в тексте терминов. Это становится возможным, прежде всего потому, что в разработанной модели учитываются не только термины, собственно присутствующие в тексте, но и их семантические связи с другими словами и понятиями, объединенными в семантические образы различных классов и областей знаний. Таким образом, одни и те же термины могут входить в различные семантические образы областей знаний, разделов, что дает более точную классификацию документа.
При классификации документа рассматривается не только входящая в него терминология, но и ее окружение, контекст. Учитывать связи между словами в документе можно с помощью ассоциативной нейронной сети, устанавливая ассоциативную связь между словами. Это позволяет, например, уточнять поиск «документа по подобию». Такая возможность позволяет обучать построенную гибридную сеть.
Таким образом, в предложенной модели делается попытка объединить семантические и ассоциативные связи на базе ассоциативной нейронной сети.
Особенностью предложенной в работе модели является то, что в ней используются заранее установленные семантические отношения, семантические образы областей знаний и разделов, но при этом сохраняется возможность обучения сети, введения новых ассоциативных связей, выделения неявных закономерностей, что является чертой ассоциативных нейронных сетей.
Составление семантического образа предметной области эффективно используется в классификации, однако в нем отсутствует возможность обучения, введения новых отношений, гибкость, которые являются отличительными чертами разработанной модели. Начальные семантические связи фор-
мируются с использованием принадлежности терминов к областям знаний, и из семантических отношений между собой, основанных на словарных определениях. Одной из главных отличительных особенностей предложенной новой модели является то, что последующие семантические образы создаются на базе ассоциаций и закономерностей, полученных ассоциативной нейронной сетью, а не на основе семантических же отношений или частотного анализа, как ранее.
Исходя из этого, использование предложенной в работе гибридной модели полезно и перспективно.
Хотя существует множество различных алгоритмов для автоматической классификации, они не дают исчерпывающее решение. Ценность модели состоит также, помимо вышесказанного, в попытке решить задачи автоматической классификации без выделения признаков и не подвергая текст сложному лексико-грамматическому анализу. Положительной чертой предложенного подхода является то, что он позволяет существенно упростить трудоемкий процесс обучения нейронной сети.
Целью диссертационной работы является разработка и исследование новых методик, моделей и алгоритмов построения гибридной модели нейронной, ассоциативной нейронной и семантической сетей для применения их при автоматической классификации текста.
Для достижения поставленной цели были решены следующие задачи:
• разработка гибридной модели на основе нейронной и семантической сетей;
• разработка методики представления семантических связей между объектами на базе нейронной сети;
• разработка обобщенного алгоритма создания гибридной модели;
• разработка структуры и параметров гибридной модели сети для автоматической классификации текста;
• выбор и обоснование основных характеристик гибридной сети (структуры нейронов, сумматора, активационной и пороговой функций, установление синаптических весов, оптимального количества тактов передачи сигнала);
• разработка методики преобразования гибридной сети в ассоциативную нейронную сеть;
• исследование полученной сетевой модели с точки зрения ее соответствия выполнению задачи автоматической классификации текста.
Для решения поставленных задач использовались следующие методы исследований: элементы теории алгоритмов, методы теории искусственного интеллекта, методы теории нейронных сетей, элементы теории графов.
Научная новизна диссертационной работы заключается в следующем:
1. разработке новой гибридной модели на основе нейронной и семантической сетей, предназначенной для автоматической классификации текста;
2. разработке новой методики представления семантических связей между объектами на базе нейронной сети;
3. разработке обобщенного алгоритма создания гибридной модели;
4. разработке структуры и параметров гибридной модели сети для автоматической классификации текста;
5. разработке новой методики преобразования гибридной сети в ассоциативную нейронную сеть, особенностью которой является то, что последующие семантические образы создаются на базе ассоциаций и закономерностей, полученных ассоциативной нейронной сетью.
К числу наиболее важных научных результатов диссертации относятся:
1. новая методика представления семантических связей между объектами на базе нейронной сети;
2. новая методика преобразования гибридной сети в ассоциативную нейронную сеть с сохранением семантических отношений, особенностью которой является то, что последующие семантические образы создаются на базе ассоциаций и закономерностей, полученных ассоциативной нейронной сетью.
3. методика построения гибридного классификатора, позволяющая значительно упростить трудоемкий процесс обучения нейронной сети.
Практические ценности работы представляют:
1. пакет программ для выполнения автоматической классификации, разработанный на основе представленного в работе алгоритма создания гибридной модели сети, позволяющий проводить автоматическую классификацию текстовых документов;
2. пакет программ, реализующих преобразование гибридной сети в ассоциативную нейронную сеть на основе разработанного алгоритма конвертации.
Реализация и внедрение результатов работы.Основные теоретические и практические результаты диссертационной работы использованы в госбюджетной НИР «Применение интеллектуальных методов при разработке информационных систем в науке, технике и образовании» (Г-6.06 ,ВИС).Резул ьтаты работы были внедрены в научно-исследовательском институте перспективных технологий (НИИ ПТ)Волгодонского института сервиса Южно-Российского государственного университета экономики и сервиса (ВИС ЮРГУЭС), ООО НПФ «Южно-Российский информационной центр». Материалы диссертации были использованы в учебном процессе на кафедре «Информатика» Волгодонского институт сервиса (ВИС) (филиала ЮРГУЭС),при чтении лекций, проведении практических и лабораторных занятий по учебным дисциплинам:«Интеллекгуальные информаци-
онные системы» и «Представление знаний», а также на кафедре «Прикладная информатика» Технологического института Южного Федерального университета в г. Таганроге, при выполнении курсовых и дипломных работах, чтении лекций, проведении практических и лабораторных занятий по учебным дисциплинам «Интеллектуальные интернет-технологии», «Методы интеллектуального анализа данных», а также в научно-исследовательской работе студентов.
Основные теоретические и практические результаты диссертационной работы использованы в научно-исследовательской работе, выполненной по гранту при финансовой поддержке Президента Российской Федерации (проект №МК-119.2003.01).
Апробация основных теоретических и практических результатов работы состояла в публикации материалов исследований в отечественных периодических изданиях, и в выступлении с докладами на всероссийских и международных конференциях и опубликовании текстов этих докладов.
Основные результаты диссертационной работы были представлены на следующих конференциях:
• Международной научно- практической конференции «Информационные технологии в науке и образовании», (Шахты, 2001г.);
• Международная научно-практическая конференция «Информационные технологии и информационная безопасность в науке, технике и образовании» «ИНФОТЕХ - 2002» (Севастополь, Украина, 2002г.);
• IV Международной научно-практической конференции «Моделирование. Теория, методы и средства» (Новочеркасск, 2004г.);
• Международной научной конференции «Анализ и синтез как методы научного познания» (Таганрог, 2004г.);
• Международных научно-технических конференциях «Интеллектуальные системы», «Интеллектуальные САПР» (Геленджик, пос. Див-номорская, 2008 г.).
Публикации. Результаты диссертации отражены в 9 печатных работах и 5 докладах на Международных научно-технических конференциях.
Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения, списка использованных источников и приложений. Работа содержит 159 стр., а также 32 рисунка, 5 таблиц, список литературы из 154 наименований, 10 стр. приложений и актов об использовании.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертационной работы, поставлена цель работы, приведены основные научные положения, выносимые на защиту, представлены сведения о практической ценности, реализации и внедрении, дано общее описание выполненной работы.
В первом разделе приводится постановка задачи автоматической классификации текста. Проводится анализ существующих подходов к решению подобных задач. Рассматривается обобщенная структура автоматической системы классификации текста. Проведен анализ традиционных подходов к решению задачи автоматической классификации текста. Рассмотрено решение задачи автоматической классификации текста на базе ассоциативных нейронных сетей, а также их свойства, строение и различные области применения. Проведено сравнение семантической и нейронной сетей, их сильных и слабых сторон с точки зрения выбора типа сети для решения задачи автоматической классификации текста. На основе проведенного сравнения сделан вывод о ценности гибридной модели, позволяющей компенсировать недостатки обоих подходов. Выбран подход к решению задачи автоматической классификации текстов на основе использования гибридной архитектуры, с помощью которой можно компенсировать недостатки каждого из механизмов.
Второй раздел посвящен разработке гибридного подхода к построению ассоциативной нейронной сети, предназначенной для автоматической классификации текстовых документов. Исходя из сопоставления преимуществ и недостатков семантической и нейронной сетей применительно к поставленной задаче, выделен принцип и разработаны основные этапы создания гибридной модели. Приводится анализ и выбор сетевой архитектуры, исходя из поставленных целей разработки системы классификации. Проведен сравнительный анализ семантических и нейросетевых систем, на основе чего сделан вывод о необходимости частичной замены процесса обучения в разрабатываемой гибридной модели заранее установленными семантическими отношениями между объектами. Выбран тип семантических отношений и способ их отображения на ассоциативной нейронной сети. Сделан вывод о том, что такой подход позволяет частично компенсировать недостатки обоих парадигм и значительно упростить процедуру создания модели.
В третьем разделе приводится методика создания гибридной нейро-сетевой модели, позволяющая классифицировать текст, используя заложенную в текст терминологию и ее семантические связи, а также выделение неявных ассоциаций. Представляются основные параметры работы сети, сделан и обоснован выбор активационной функции. Приведен пример работы сети на начальном этапе, а также описание разрабатываемой гибридной модели, созданной с целью найти гибридную архитектуру, в которой можно компенсировать недостатки каждого из подходов. Представлен алгоритм создания сети. Предлагается принцип преобразования гибридной сети в сеть, аналогичную ассоциативной нейронной, благодаря чему нейронная сеть может выделять собственные закономерности, исходя из предоставленных ей примеров. Приведен пример работы сети на начальном этапе.
Построение разработанной гибридной модели осуществляется в 3
этапа.
Связи,
ПОНЯТ!'.'.!' II
Связи,
упаишиенные ' и'жду с.нш чи н иошпиячи
1 СЛОИ. Первая он« ш ска- ,.• кчморымизакре плепы нейроны
1 ЭТАП. На этом этапе устанавливают отношения между нейронами-словами и их значимость, аналогично отношениям в семантических сетях. Отношения в представленной модели составлены исходя из определений базовых понятий, представленных в словарях и учебниках предметной области. Далее, устанавливаются иерархические связи «слово - понятие - раздел (область знаний)».
Предложенная модель нейронной сети (рис.1) состоит из трех слоев, которые выстроены иерархически, обобщая первоначальные единицы текста (слова) в понятия, и, затем, в области знаний.
Рисунок 1. - Трехслойная гибридная сеть.
Построенная сеть содержит термины, относящиеся к определенным областям знаний, и является их упрощенным семантическим полем, объединяя между собой базовые понятия этой области. Выделяются «понятия», в соответствие которым ставятся слова, входящие в их определение. Например, Понятию «изотоп» ставится в соответствие определение: «Нуклиды (9) с одинаковым (10) числом (11) протонов (12)» , где каждое слово пронумеровано.
Первый слой содержит нейроны, которым присваиваются значения слов (в дальнейшем - слова). Нейроны -слова связываются между собой на
основе словарных определений понятий, в которые входят, и имеют прямые связи с соответствующими нейронами-понятиями второго слоя. Каждому понятию соответствует ряд нейронов-слов первого слоя.
Второй слой включает в себя нейроны как понятия, связанные с нейронами -словами первого слоя, которые входят в его определение, и с нейронами областей знаний (третий слой). Нейроны-понятия принадлежат различным областям знаний.
Третий слой составляют нейроны как области знаний. За каждой областью знаний закреплены соответствующие им понятия, которые могут принадлежать одновременно нескольким областям знаний. Третий слой является выходным и показывает, к какой области знания относится текст.
Данная гибридная модель сети представлена в виде графа, вершинами которого являются нейроны, а ребрами - установленные между ними связи. Связи между нейронами как внутри одного слоя, так и между нейронами разных слоев описаны матрицами смежности.
Например, связи между нейронами первого слоя отражены квадратной матрицей V) размерности пхп, где п - количество нейронов первого слоя, элемент которой vy характеризует связь i-го нейрона с j-м нейроном, а отношения между нейронами-словами первого слоя и нейронами-понятиями второго слоя представлены матрицей смежности Vn размерности гост, где п -количество нейронов первого слоя, am- количество нейронов второго слоя. Элемент матрицы Vn v'y характеризует связь /-го нейрона-слова с j-м нейроном- понятием. Аналогично для остальных слоев. Следует отметить, что нейроны-понятия на начальном этапе не связаны между собой, поэтому матрица V2 не рассматривается.
Таким образом, структура каждого слоя сети может быть задана набором:
<N, Vn, Wn, Vm4> (1)
где:
• N -множество нейронов л-слоя,
• V„ — матрица смежности нейронов и-слоя,
• W„ - матрица весовых коэффициентов и-слоя,
• Vrm+i - матрица смежности нейронов n-слоя и нейронов следующего слоя.
Например, структура первого слоя сети задается набором:
<А, V,, Wl, V,2> (2)
где:
• А - множество нейронов слоя, а/ е А,
• Vj - матрица смежности нейронов первого слоя,
• W] - матрица весовых коэффициентов,
• V12 - матрица смежности нейронов первого слоя и нейронов второго слоя.
Далее на основании матриц смежности создаются матрицы весовых коэффициентов для каждого слоя, отражающие значения синапсов нейро-
нов. Синапсы (умножители) осуществляют связь между нейронами, умножая входной сигнал на число, характеризующее силу связи (вес синапса). На начальный момент для создаваемой модели входы и выходы равносильны, т.е. нейрон может как принимать, так и передавать сигнал по своим связям. Весовые коэффициенты генерируются случайным образом, так как благодаря структуре сети и выбранной передаточной функции на первом этапе установленные отношения достаточно сильны, практически независимо от весовых коэффициентов. Коррекция весовых коэффициентов проводиться позднее, на третьем этапе (преобразования гибридной сети в ассоциативную нейронную сеть).
На этом этапе были установлены семантические отношения для следующих разделов: Физика, Химия, Математика, Экономика, Религия.
При установлении связей были использованы следующие ресурсы:
Портал http://terms.com.ua -словари, глоссарии, термины по различным темам (в том числе словари 8 разделов физики, 6 словарей банковских, финансовых, внешнеэкономических терминов)
Портал http://www.mavicanet.com/directory/rus/8186.html - множество предметных словарей, в том числе по физике 8 словарей, математике 22 словаря, экономике и финансам 13 словарей, религии 1 словарь).
2 ЭТАП. Если способ установления связей на первом этапе является семантическим, то способ передачи сигнала аналогичен ассоциативным нейронным сетям.
На 2 этапе на вход сети подается фрагмент текста (рис.2). Слова сопоставляются с имеющимися в библиотеках и в случае совпадения им присваивается соответствующий номер. Таким образом, на вход нейронной сети приходят некие понятия под номерами, и нейрон с аналогичным номером в сети возбуждается (начальное возбуждение х принимается за единицу) и передает сигнал (с помощью передаточной функции, как в нейронной сети) по установленным на первом этапе связям.
Начальное возбуждение х, подаваемое на вход сети, принимается за единицу, далее сигнал передается с помощью активационной функции, аналогично передаче сигнала в нейронных сетях. Сумматор сигналов, поступающих по синаптическим связям от других нейронов и внешних входных сигналов, рассчитывается по формуле:
= (3)
где:
• wi - весовой коэффициент 1-го синапса у-го нейрона,
• X/ - /-й компонент входного вектора х,
• п — количество входов нейрона.
Структура трехслойной гибридной сети представлена на рис.2.
Входной текст 1
Библиотека
слов-определений
Библиотека слов-понятий
Библиотека областей знаний
Слой слов-определений
Слой слов-понятий
Слой областей знаний
Рисунок 2. - Структура трехслойной гибридной сети
Была выбрана активационная функция/(я) 1
№ =
1 + е
-Я5
где а - произвольно задаваемая величина.
Тогда выходной сигналу-го нейрона, соответственно:
1=1
(4)
(5)
Выбор пороговой активационной функции обусловлен тем, что используя ее на третьем этапе создания сети легко сохранить уже установленные на втором этапе устойчивые связи, и, в то же время, делая пороговую функцию более пологой, породить новые ассоциации.
Это возможно, поскольку на начальном периоде обучения слова-определения, связанные между собой и входящие в определение одного понятия, зациклены друг на друга и посылают возбуждения соответствующему понятию благодаря не столько подстройке коэффициентов, сколько пороговой функции и самой структуре сети. Поэтому на втором этапе коэффициент а может быть небольшим, делая функцию более пологой. На третьем этапе, когда осуществляется генерация новых весовых коэффициентов, изменяется коэффициент а, влияющий на чувствительность функции и, как следствие, повышается чувствительность сети к более слабым сигналам.
Более подробно распространение сигнала в сети показано на рис.3 и 4. На вход подаются несколько слов под номерами, в том числе и «нуклид» (9) (рис.3). Понятию «изотоп» соответствует определение: «Нуклиды (9) с одинаковым (10) числом (11) протонов (12)». Нейрон 9 передает сигнал связанным с ним нейронам 10,11,12.
1 ТАКТ
Рисунок 3. - Начало работы сети.
Под тактом в данном случае понимается единовременная передача сигнала возбужденным нейроном (нейронами) связанным с ним нейронам. На вход подается вектор, состоящий из нескольких слов под номерами. В разработанной модели входной вектор включает в себя 12 входов. На один входной вектор приходится 3 такта - этого достаточно, чтобы произошло зацикливание нейронов, входящих в одно определение. Если требуется получить больше родственных понятий, можно увеличить количество тактов, однако значительное их увеличение может привести к избыточности и снизить точность классификации.
Второй слой
Начальное возбуждение 1такт
2 такт / **"
Рисунок 4 - Передача сигнала и зацикливание на 1 слое.
Нейрон 10 передает полученное возбуждение на нейроны 11 и 12. Полученное возбуждение умножается на вес синапса и суммируется по формуле (1), и преобразуется по формуле (2).
Ниже показан пример расчета передачи сигналов на начальном этапе.
1 такт.
Нейрон 10:
Весовые коэффициенты М!10 я= 0,7, м>ю ц= 0,5, м>ю п = 0,6 Сигнал поступил от нейрона 9 Х;>= 1, Хц~ 0, хп= 0
Суммарный сигнал (\\>ю 9 • х? + м> ю ц ' хц + у/10 п ' Хц ) = 0,7 преобразуется активационной функцией и передается на выход.
Аналогично с нейронами 11, 12, которые также получили первоначальный сигнал от нейрона 9 и передают возбуждение связанным с ними нейронам.
Нейрон 11:
и>И9 = 0,4, м>1110 = Ъ,5Ъ, у>ц12 = Ъ,2-, хд=\, х,2 = Ъ, х10 = Ъ
Выходной сигнал 0,67.
Нейрон 12:
■и>12 9 = 0,5, "Мин = 0,33, ч>,210 = 0,45; х, = 1, х,0 = 0, х„ = 0
Выходной сигнал /(У = 0,731.
Задается пороговая величина Д при значении /(б) >В сигнал не передается. В данном случае величина О = 0,5
На втором такте нейроны 10, 11 и 12 передают возбуждение друг другу, помимо этого нейрон 12 передал возбуждение не связанным с другими нейронам 2,4,5. Аналогично ведут себя и нейроны 11,12.
Уже на 3 такте получается зацикливание связанных между собой нейронов друг на друга. В случае такого зацикливания возбуждение передается в слой 2 (слой «понятий»).
Таким образом, в тексте выявляется наличие специализированных терминов, порождающих зацикливание слов-определений и вызывающих обращение к слою понятий, а далее - к слою областей знаний или тематических разделов.
Понятия второго слоя не связаны между собой, определяется только их принадлежность к области, или областям, знаний. Понятия относятся с некой области знаний. На этом этапе анализируется, к какой области относится наибольшее количество понятий. Раздел, получивший наибольшее количество обращений к входящим в него понятиям и есть требуемый класс.
Так как одно и то же понятие с разной частотой входит в разные области знаний, то степень принадлежности текста к данной области будет определяться набором содержащихся в тексте понятий, относящихся к данной области. Несмотря на то, что некоторые понятия входят в разные области знаний, понятийный набор областей отличается друг от друга.
3 ЭТАП. Заключительный этап представляет собой преобразование гибридной сети в сеть, аналогичную ассоциативной нейронной сети. Благодаря этому преобразованию нейронная сеть может выделять собственные закономерности исходя из предоставленных ей документов, устанавливать новые ассоциативные связи, формируя свои группы связанных нейронов, на основании которых будут получены новые закономерности отнесения текста к одной из категорий. Наиболее значимо это преобразование для 2 и 3 слоев сети, в которых присутствуют ключевые тематические понятия.
Вводятся новые ассоциативные связи (сеть становится полносвязной). Отметим, что связи, установленные на 1 этапе, более сильные. Генерируются новые весовые коэффициенты, которые существенно меньше ранее установленных для того, чтобы семантические связи 1 этапа имели приоритет. Создаются ассоциативные связи между понятиями, пришедшими одновременно или с установленным промежутком времени (тактов).
Если на втором этапе функционирования сети во втором слое возбуждались нейроны-понятия, связанные с нейронами 3 слоя, и никак не связанные между собой, то на 3 этапе каждый нейрон-понятие оказывается связан с другими. Весовые коэффициенты для новых связей генерируются произвольно. Создаются ассоциативные связи между понятиями, пришедшими одновременно или с установленным промежутком времени (тактов), соответственно, сила связи обратно пропорциональна времени между возбуждением нейронов (это направлено на то, чтобы сделать более сильными связи между «первичными» понятиями, так как в первые такты выявляются «прямые», несомненные понятия, а далее - родственные).
После обращения к 3 слою делается вывод о принадлежности к классу (разделу или области знаний), и закрепляется сложившая ассоциация с полученным классом.
Аналогично с первым слоем, устанавливаются побочные, более слабые связи между нейронами-словам«, входящими в определения проассоции-рованных понятий. Тогда наличие в тексте слов будет порождать в сети не только прямые взаимосвязи, установленные вначале, но и ассоциации, полученные сетью самостоятельно.
У сети появляется возможность выявлять побочные и неявные ассоциации, исходя из присутствия слов, несвязанных между собой в построенной ранее гибридной сети, в тексте, и относить к области знаний, исходя из возможных «сочетаний» слов в текстах, коррелировать результаты, поставив им в соответствие требуемые области знаний.
Таким образом, методами ассоциативной нейронной сети реализуется семантический подход - для каждого понятия формируется набор ассоциативных (смысловых) связей, т.е. список других понятий, в сочетании с которыми оно встречалось в предложениях текста. При этом считается, что чем чаще встречаются вместе два понятия в предложениях текста, тем выше вероятность того, что они связаны по смыслу.
Одной из главных отличительных особенностей предложенной новой модели является то, что последующие семантические образы области знаний создаются на базе ассоциаций и закономерностей, полученных ассоциативной нейронной сетью, а не на основе семантических же отношений или частотного анализа, как ранее, на начальном этапе.
На 3 этапе работы сети должны быть изменены параметры активаци-онной функции таким образом, чтобы весовые коэффициенты имели большее влияние на передачу сигнала. Таким образом, связи, установленные на первом этапе, будут практически безусловными, а новые ассоциативные связи смогут работать при наличии в тексте нужных сочетаний. Активационная функция становится более чувствительной, по сравнению с первым этапом, что позволяет сети порождать новые ассоциации, сохраняя установленные на втором этапе связи.
На третьем этапе создания гибридной модели классификатора, на вход подаются статьи, для которых заранее экспертным путем установлена область знаний.
Как было показано ранее, словари и соответствующие им матрицы инцидентности ставились в соответствие нужным областям знаний (классам). На третьем этапе также устанавливались дополнительные связи меяеду словами, пришедшими на вход вместе (более сильные), и всеми словами одного текста (более слабые). На этом же этапе было завершено обучение классификатора.
В сеть вложены базовые понятия определенных областей знаний. Исходя из присутствия или отсутствия их в тексте, можно сказать о степени принадлежности их к данной области знаний.
В случае, когда только малое количество терминов (слов, понятий) относится к областям знаний, использованным в модели, возможны два варианта:
1. Слова (и, следовательно, обращения к понятиям и областям знаний) часто повторяются, а остальные родственные понятия не используются (что возможно в статье, посвященной одной узкой теме);
2. Слова несколько раз упомянуты в тексте.
В таком случае, если слова являются значимыми в данной статье (по законам Зипфа), а также при наличии дополнительных связей слов и понятий, установленных на 3 этапе, принимается соответствующий им раздел. В противном случае текст относится к «чужим» для данных разделов классификации.
Нужно отметить, что модель может использоваться практически для всех областей, в которых существует четкая, сложившаяся терминология, и для смежных областей знаний. Преимуществом данной модели является также то, что она является классификатором или определяет ключевые темы, исходя из заложенной в текст терминологии. Эта черта отличает ее от статистических методов, а способность к выделению неявных ассоциаций, возникающая после преобразования сети на третьем этапе, отличает от классической семантической сети. Отметим также, что предложенная модель позволяет значительно упростить сложный и трудоемкий процесс обучения нейронной сети.
Четвертый раздел посвящен проведению вычислительного эксперимента. Приводятся результаты вычислительного эксперимента, проведенного с целью проверки правильности работы разработанного гибридного классификатора, и сравнения его с программами, основанными на наиболее популярных алгоритмах классификации. Проанализированы данные о работе классификатора, на основании которых делается вывод о его работоспособности.
Для сравнения результатов работы реализации разработанной модели (ГНК - гибридный нейросетевой классификатор) были использованы программы автоклассификации (авторубрикации), основанные на постоянно используемых и достаточно эффективных алгоритмах: «Наивный Байес» и алгоритм БУМ - Метод Опорных Векторов. Целью проведенного эксперимента являлась проверка работоспособности и эффективности разработанной модели, а также сравнение (сопоставление) ее с наиболее популярными алгоритмами классификации.
Общее количество документов в выборке составило 1213 документов. Они были разделены случайным образом на 2 части по 600 документа в каждой, с сохранением примерно равного количества документов по разделам (примерно по 85 документов в каждом).
Обучение программ-классификаторов (БУМ и НБ), используемых для сравнения с разработанным, проводилось на одном из этих двух наборов, а тестирование - на другом. Помимо этого в их обучении участвовали документы, использованные на третьем этапе разработки представленной в работе модели.
После этого наборы менялись местами и прогон повторяли. В итоговых данных представлено среднее арифметическое прогонов, что усиливает их объективность. В таблице представлены усредненные результаты 2 прогонов.
Тестовая выборка. В качестве основного материала для тестирования использовалась выборка, состоящая из 7 различных разделов:
• Физика
• Химия
• Математика
• Экономика
• Культура
• Медицина
• Спорт
Тексты документов брались из www.gotai.net,www.intuit.ru, www.referats.ru,www.fep.ru,www.allmed.ru, а также из новостей сайта Len-ta.ru, rbc.ru (и других). В каждой рубрике было примерно одинаковое количество документов - от 150 до 200, что обеспечивало равномерность абсолютных результатов - никакая из рубрик не выделялась только из-за количества документов в ней.
Нужно отметить, что документы, относящиеся к разделам «Культура» и «Медицина», должны быть отнесены разработанным классификатором к «чужим», неопознанным.
Целью проведенного эксперимента являлась проверка работоспособности и эффективности разработанной модели, а также сравнение (сопоставление) ее с наиболее популярными алгоритмами классификации. Для этого были использованы следующие характеристики:
• точность и полнота классификации;
• точность и полнота обнаружения «чужих» документов.
Точность - это отношение правильно полученных документов ко
всем полученным.
Полнота - отношение правильно полученных документов ко всем правильным.
Полученные характеристики приведены в таблицах 1- 4.
Таблица 1
Точность при нахождении «чужих» документов
Физика Ма тематика Хи- | Кио- МПЯ ЛОГ11Я Куль тура Медицина Спорт
SVM 0,35 0.42 0,33 0.42 0,51 0.42 0.39
Наивный Ьайсс 0,73 0.67 0,71 0.59 0,68 0.6 0.62
ГНК 0,85 | 0,76 1 0,92
Таблица 2
Полнота при нахождении «чужих» документов
Физика Математика Химия Биология Куль тура Медицина Спорт
БУМ 0,85 0,79 0,78 0,64 0,92 0,94 0,91
Наивный Байес 0,63 0,58 0,62 0,54 0,25 0,21 0,23
ГНК 0,91 0,83 0,94
Таблица 3
Точность при нахождении «своих» документов
Физика Математика Химия Биология Куль тура Медицина Спорт
БУМ 0,85 0,79 0,76 0,81 0,87 0,85 0,86
Наивный Байес 0,73 0,71 0,65 0,63 0,76 0,74 0,77
ГНК 0,96 0,95 0,93 0,91 распознаны как «чужие» (см. таблицу 1)
Таблица 4
Полнота при нахождении «своих» документов
Физика Математика Химия Биология Культура Меди ди- цина Спор Т.....
8УМ 0,76 0,74 0,75 0,69 0,77 : 0,66 0,68
Наивный Байес 0,84 0,81 0,77 0,64 0,8 0,78 0,79
ГНК 0,92 ■■г 0,91 • 0,89 0,91 распознаны как «чужие» (см. таблицу 2)
После анализа имеющихся данных, можно сделать следующие выводы. Разрабатываемый классификатор достаточно работоспособен и эффективен: способен отсеивать «чужие» документы, способен распознавать с высокой точностью документы, принадлежащие к его областям знаний, что является основной задачей классификатора. При сравнении разработанного ГНК с постоянно используемой и популярной как в нашей стране, так и за рубежом программой-классификатором 8УМ_%1И, (основанной на алгоритме БУМ), выяснилось, что ГНК по базовым показателям сопоставим с данной программой, и даже показывает более высокие результаты
Результаты экспериментов показали эффективность разработанной модели классификатора по сравнению с существующими аналогами. Главными
критериями являются точность и полнота распознавания «своих» и «чужих» документов.
Разработанная модель может сама создавать классы (например, на основании подобия набору указанных документов) опираясь на области знаний и сформированные с ней ассоциативные связи. Эта способность отвечает самому определению автоматической классификации как процесса образования классов. Помимо этого может быть применен библиотечный библиографический каталог (ББК) или какой-либо другой классификатор. Главное в выборе классификатора - четкое определение принадлежности и сформированный словарь терминов, входящих в рубрику. Данная реализация в качестве классификатора использует универсальную десятичную классификацию (УДК).
В заключении изложены основные выводы и результаты диссертационной работы.
В приложениях приведены копии актов внедрения, исходные тексты основных процедур программы автоматической классификации на языке Visual Basic, реализующей предложенную модель гибридной сети.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
В ходе выполнения работы получены результаты:
1. Разработана гибридная модель на основе нейронной и семантической сетей, предназначенная для автоматической классификации текста.
2. Разработана новая методика представления семантических связей между объектами на базе нейронной сети, позволяющая сохранять в ассоциативной нейронной сети отношения и характеристики объектов. Таким образом, методами ассоциативной нейронной сети реализуется семантический подход - для каждого понятия формируется набор смысловых связей.
3. Разработан обобщенный алгоритм поэтапного создания гибридной модели. Разработаны алгоритмы для реализации каждого этапа построения гибридного нейросетевого классификатора.
4. Разработана структура и определенны основные параметры гибридной модели сети для автоматической классификации текста. Сделан и обоснован выбор основных характеристик гибридной сети (структуры нейронов, сумматора, принципа передачи сигнала, активационной функции, установления синаптических весов, оптимального количества тактов передачи сигнала).
5. Разработана новая методика преобразования гибридной сети в ассоциативную нейронную сеть с сохранением семантических отношений. Благодаря преобразованию, нейронная сеть может выделять собственные закономерности исходя из предоставленных ей документов, устанавливать новые ассоциативные связи, формируя свои группы связанных нейронов, на основании которых будут получены новые закономерности отнесения текста к одной из категорий. У сети появляется возможность выявлять побочные и неявные ассоциации, исходя из присутствия слов, несвязанных между собой в построенной ранее гибридной сети, в тексте, и относить к конкретной области знаний.
6. Разработана новая методика построения гибридного классификатора, основанного на семантической и ассоциативной нейронных сетях, позволяющая значительно упростить трудоемкий процесс обучения нейронной сети.
7. Полученная сетевая модель была исследована с точки зрения ее соответствия выполнению задачи автоматической классификации текста. Были проведены сравнительные экспериментальные исследования, показавшие работоспособность и эффективность данной модели.
8. На основе новых научных результатов осуществлена программная реализация для автоматической классификации текстовых документов. Ее использование позволяет проводить классификацию текстов с большей точностью по сравнению с существующими аналогами, а также упростить процесс обучения нейронной сети. Разработанная модель способна как сама создавать классы, так и использовать готовую классификационную систему.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ
1. Мешкова Е.В., Светличный P.A. Применение нейронных сетей для поиска информации. Материалы Международной научно- практической конференции "Информационные технологии в науке и образовании", 9-15 сентября, 2001 г., Шахты, Россия.
2. Мешкова Е.В., Светличный P.A. Интеллектуальная поисковая система. Теория, методы и средства измерений, контроля и диагностики: Материалы II международной научно-практической конференции, г.Новочеркасск, 21 сентября 2001 г.: В 4 ч /Южно-Российский государственный университет (НПИ).-Новочеркасск: ООО НПО "Темп" ,2001. Ч. 4. - 76с.
3. Мешкова Е.В., Мешков В.Е. Автоматическая классификация текстов на основе ассоциативных нейронных сетей. Материалы международной научно-практической конференции «Информационные технологии и информационная безопасность в науке, технике и образовании» «ИНФОТЕХ - 2002» 30 сентября - 5 октября 2002г., Севастополь, Украина.
4. Мешкова Е.В., Мешков В.Е. Графическое представление ассоциаций в нейронной сети. // Моделирование. Теория, методы и средства: Материалы IV Международной научно-практической конференции./ ЮжноРоссийский государственный технический университет. - Новочеркасск: ЮРГТУ, 2003.
5. Мешкова Е.В., Мешков В.Е. Применение семантических сетей на начальном этапе обучения ассоциативных нейронных сетей. // Анализ и синтез как методы научного познания: Материалы Международной научной конференции - Ч.З, Таганрог: ТРТУ, 2004, 76 с.
6. Мешкова Е.В., Мешков В.Е. Построение гибридной модели на основе семантической и ассоциативной сетевых парадигм. Радиоэлектроника, телекоммуникации, информационные технологии: Межвузовский сб. науч. трудов / Южно-Российский государственный университет экономики и сервиса; Ред.кол.: H.H. Прокопенко и др. - Шахты: Изд-во ЮРГУЭС, 2004.-119 с.
7. Мешкова Е.В. Формализация процедуры синтеза нейросетевой конфигурации. Радиоэлектроника, телекоммуникации, информационные технологии: Межвузовский сб. науч. трудов / Южно-Российский государственный университет экономики и сервиса; Ред.кол.: Н.Н. Прокопенко и др. - Шахты: Изд-во ЮРГУЭС, 2004. -119 с.
8. Мешкова Е.В. Разработка гибридной нейросетевой модели для автоматической классификации текста. Информационные системы и технологии. Теория и практика: сб.науч.трудов/ под ред. А.Н.Береза. -Шахты, изд-во ЮРГУЭС, 2008.-188 с.
9. Мешкова Е.В. Методика построения классификатора текста на основе гибридной нейросетевой модели. Известия ЮФУ. Технические наука. Тематический выпуск «Интеллектуальные САПР». -Таганрог: Изд-во ТТИ ЮФУ, 2008, №4(81).-268 с.
Оглавление автор диссертации — кандидата технических наук Мешкова, Екатерина Владимировна
ВВЕДЕНИЕ
1 АНАЛИТИЧЕСКИЙ ОБЗОР СУЩЕСТВУЮЩИХ ПОДХОДОВ
К АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ТЕКСТА
1.1 .Постановка задачи автоматической классификации текстов
1.2.Анализ традиционных подходов к решению задачи^ автоматиче- 18 ской классификации текста
1.3.Решение задачи автоматической классификации текста на базе 42 ассоциативных нейронных сетей
1.4.0боснование выбора гибридного1 подхода к автоматической 49 классификации
1.5.Выводы >
2 РАЗРАБОТКА ГИБРИДНОГО-ПОДХОДА К ПОСТРОЕНИЮ^ 53 . НЕЙРОННОЙ СЕТИ.
2.1. Основные направления создания ^гибридных моделей
212. Принципы построения гибридной модели;
2.3. Разработка основных этапов создания гибридной модели<
2.4. Выбор архитектуры гибридной нейронной сети732.5. Выбор типов семантических отношений и связей для гибридной 82 сети
2.6.Вывод ы
3 ПОСТРОЕНИЕ ГИБРИДНОЙ МОДЕЛИ АВТОМАТИЧЕСКОГО 88 КЛАССИФИКАТОРА
3.1. Выбор формы представления текста в гибридной нейронной 88 сети
3.2. Разработка структуры гибридной нейронной сети
3.3. Разработка математической модели гибридной сети
3.41. Разработка обобщенного алгоритма создания гибридной модели. 111 автоматического классификатора
3.5. Реализация ! и 2 этапов создания гибридной модели
3.6. Разработка преобразование гибридной сети в сеть, аналогичную 125 ассоциативной нейронной сети
3.7. Выводы
4 ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ И АНАЛИЗ РАБОТЫ
РАЗРАБОТАННОГО ГИБРИДНОГО НЕЙРОСЕТЕВОГО КЛАССИФИКАТОРА
4.1. Результаты проведения вычислительного эксперимента на тес- 131 товых примерах
4.2. Выводы
Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Мешкова, Екатерина Владимировна
В настоящее время большое внимание уделяется повышению уровня интеллектуальности различного рода автоматизированных систем, исследованию и разработке методов и средств представления знаний, получению оптимальных решений на их основе. Это в полной мере относится к задаче автоматической классификации текстов, актуальность которой повышается по мере внедрения и развития информационных технологий.
Исследования и разработки в области автоматической обработки текста в Европе и США привлекают внимание крупнейших фирм и государственных организаций самого высокого уровня, в нашей стране это направления активно развивают различные научные школы. Особенное значение данное направление приобрело в связи с активным распространением^ глобальных, информационных сетей. В-связи с этим пристальное внимание привлекают также работа поисковых систем, систем классификации и реферирования, извлечения знаний, в общем, систем для обработки информации с целью повышения эффективности ее использования.
Развитие не только глобальных компьютерных сетей, но и полнотекстовых баз данных привело к постоянному наращиванию информационных текстовых ресурсов: образовательные центры организуют в Интернете базы научных статей, авторефератов, многие организации предоставляют доступ к ресурсам электронных библиотек, публикуются тысячи полных текстов докладов и т.п. При постоянном и интенсивном возрастании объемов текстовой информации, трудности поиска требуемых сведений среди множества доступных текстов значительно уменьшают ее ценность. Поэтому особенную значимость автоматическая классификация текстовых документов имеет для информационно-поисковых систем глобальных сетей, полнотекстовых баз данных. Исходя из этого, задача автоматической классификации текста, представляя собой частный случай задачи распознавания смысла, является в настоящее время актуальной проблемой, затрагивающей различные сферы человеческой деятельности, т.к. ее решение позволит полностью автоматизировать процесс обработки, классификации и поиска информации.
В настоящее время в мире существуют и активно развиваются системы автоматической классификации текста, специализированные системы полнотекстового анализа (например, в России это "Следопыт", "ТекстАналист") позволяющие проводить автоматическую классификацию и реферирование текстов.
Существует множество подходов к решению задачи автоматической обработки, распознания и классификации текстовой информации, однако внимание, уделяемое данной проблеме, однозначно свидетельствует, что ни-один из них не является исчерпывающим. Наиболее часто используемыми методами в таких направлениях, как распознавание и классификация (либо генерация) речи являются статистические методы. К ним относятся: статистические классификаторы на основе вероятностных методов, методы многомерного статистического анализа, в частности, факторного анализа, кластерного анализа, таксономии, распознавания образов без учителя, частотный анализ текста, математический анализ текста на основе законов Зипфа (Zipf) [1-5].
В некоторых областях, например, лексико-грамматическом анализе предложения, синтаксический анализ предложения, автоматическое реферирование, в большей степени применяются лингвистические методы.
Зачастую в системах автоматического реферирования применяются как лингвистические, так и статистические методы.
Лингвистические методы в современных приложениях автоматической классификации и распознания (анализа) часто используются совместно с методами искусственного интеллекта, особенно с семантическими сетями. Семантические сети строятся на основе выделенных лексических или синтаксических отношений.
Из методов искусственного интеллекта для решения данной проблемы применялись нейронные сети, семантические сети, экспертные системы.
Нейронные сети используются для решения таких задач, как распознавание, классификация, кластеризация. Семантические сети в эффективны не только с точки зрения классификации и реферирования, но и выделения смысла текста и зачастую опираются на лингвистический аппарат.
Так как автоматическая классификация является подзадачей распознавания смысла, для которой используются модели представления знаний, логичным будет совместить нейронные сети, осуществляющие классификацию (кластеризацию) по признакам, и семантические сети с заранее установленными связями между объектами, имеющими имя и значение.
Под ассоциативной нейронной сетью в данной работе понимается некая упрощенная математическая модель биологической нейронной сети [6]. Математическая модель нейронной сети является системой матричных преобразований, реализованной посредством цифровых вычислительных машин.
Семантическая сеть представляет собой иерархическую сеть, в вершинах которой находятся информационные единицы. Дуги семантической сети соответствуют различным связям между информационными единицами. При этом иерархические связи определяются отношениями структуризации, и могут описываться языком математики, например, логикой предикатов.
Классификация — указание некоторого класса или принадлежности к нему рассматриваемых объектов, в основе которой, как правило, лежит выбор в процессе предварительной обработки данных признаков, по которым осуществляется отнесение к какому-либо классу.
Можно условно представить вышесказанное в виде иерархии с точки зрения представлений следующего вида:
- нейронная сеть — уровень описания общей структуры системы, состоящей из объектов;
- семантическая сеть — уровень взаимодействия, отношений между объектами;
- классификация — уровень математических операций над объектами, между которыми уже установлены связи.
Фактически, автоматическая классификация представляет собой математические операции над объектами, представленными математически.
Исходя из вышесказанного, несмотря на принципиальные различия, нейронную и семантическую сети можно представить математическими преобразованиями, что позволяет найти некий универсальный математический аппарат для создания эффективного гибрида. Представляется интересным совместить в единой гибридной модели свойства различных подходов.
В настоящее время в связи с появлением новых возможностей, а также отсутствием новой принципиальной идеи, разработка гибридных моделей, совмещающих принципиально различные подходы, стала одним из наиболее актуальных направлений. В основном разрабатываемые гибридные модели носят прикладной характер, и направлены на наиболее эффективное решение какой-либо конкретной задачи в различных сферах деятельности. Интенсивно развиваются в настоящее время гибридные модели представления знаний в интеллектуальных системах [7-12].
Сфера применения разработанной модели достаточно обширна. Это информационно-поисковые системы, системы автоматической классификации, библиотечно-справочные системы, в роботах-поисковиках, системах обработки текстовой информации, Text Mining.
Гибкость разработанной модели позволяет как классифицировать текстовые документы по заранее заданному классификатору, так и выделять классы, основанные на подобии документов.
В данной работе осуществляется попытка отойти от традиционного направления классификации на нейронных сетях, как работы с признаками, и обратить большее внимание на смысловые единицы (слова), содержащиеся в тексте, и связи между ними, что традиционно является прерогативой семантических сетей. Проанализировав качества нейронных и семантических сетей, предложена модель, позволяющая частично компенсировать недостатки и сложности при построении обоих сетей, за счет поэтапного изменения конфигурации гибридной сети.
В работе предложена модель, использующая в своей основе семантические, смысловые связи, отраженные на ассоциативной нейронной сети. Таким образом, возникает возможность использовать преимущества ассоциативной нейронной сети, позволяющие выделять собственные закономерности, и обучаться, и возможности семантических связей при создании «семантического образа» области знания, раздела классификации или поискового запроса.
Разработанный подход дает значительное преимущество по сравнению со статистическими методами, и классификацией с помощью ключевых слов и содержащихся в тексте терминов. Это возможно, прежде всего потому, что в разработанной модели учитывается не только термины, собственно присутствующие в^ тексте, но и их семантическая связь с другими словами и понятиями; объединенными в семантические образы различных классово областей знаний. Таким образом, одни и те же термины могут входить в различные семантические образы, областей знаний, разделов, что дает более точную классификацию документа. Начальные семантические связи формируются с использованием принадлежности терминов к областям знаний. Особенностью разработанной модели является также то, что последующие семантиче-' ские образы создаются на базе ассоциаций и закономерностей, полученных ассоциативной нейронной сетью.
При классификации документа рассматривается не только входящая в него терминология, но и ее окружение, контекст. Учитывать связи между словами в документе можно с помощью ассоциативной нейронной сети, устанавливая ассоциативную связь между словами. Это позволяет, например, уточнять поиск «документа по подобию». Такая возможность позволяет обучать построенную гибридную сеть.
Таким образом, в предложенной модели делается попытка объединить семантические и ассоциативные связи на базе ассоциативной- нейронной сети.
Особенностью предложенной в работе модели является то, что в ней используется; заранее, установленные семантические отношения, семантические образы областей знаний и разделов, но при этом сохраняется возможность обучения сети, введения новых ассоциативных связей, выделения неявных закономерностей, что является чертой ассоциативных нейронных сетей. Составление семантического образа предметной области эффективно используется в классификации, однако в нем отсутствует возможность обучения, введения новых отношений, гибкость, которые являются отличительными чертами разработанной модели. Исходя из этого, использование предложенной в работе гибридной модели полезно и перспективно.'
Хотя существует множество различных алгоритмов для автоматической классификации, они не дают исчерпывающее решение. Ценность^ модели состоит также, помимо вышесказанного, в попытке решить задачи автоматической? классификации без выделения признаков и не подвергая: текст сложному лексико-грамматическому анализу.: Положительной чертой предложенного подхода является! то, что- он позволяет существенно упростить трудоемкий процесс обучения нейронной сети.
Таким образом, задача автоматической классификации текста, представляя собой частный случай задачи распознавания смысла, является в настоящее время актуальной проблемой, затрагивающей различные сферы; человеческой деятельности, т.к. ее решение позволит полностью автоматизировать процесс обработки, классификации и поиска информации.
Целью диссертационной работы является разработка и исследование новых методик, моделей и алгоритмов построения гибридных моделей нейронных и семантических сетей для применения их при автоматической классификации текста.
Для достижения поставленной цели необходимо решить следующие задачи:
1) Разработка гибридной модели на основе нейронной и семантической сетей;
2) Разработка методики представления семантических связей между объектами на базе нейронной сети;
3) Разработка обобщенного алгоритма создания гибридной модели;
4) Разработка структуры и параметров гибридной модели сети для автоматической классификации текста;
5) Выбор и обоснование основных характеристик гибридной сети (структуры нейронов, сумматора, активационной и пороговой функций, установление синаптических весов, оптимального количества тактов передачи сигнала);
6) Разработка методики преобразования гибридной сети в ассоциативную нейронную сеть;
7) Исследование* полученной сетевой модели, с точки зрения ее соответствия выполнению задачи.автоматической классификации текста.
Для решения поставленных задач* использовались, следующие* методьк исследований: элементы теории алгоритмов, методы теории искусственного интеллекта, методы теории, нейронных сетей, элементы статистического анализа.
Научная новизна диссертационной работы заключается в следующем:
1. Разработке гибридной модели на основе нейронной и семантической сетей, предназначенной для автоматической классификации текста;
2. Разработке новой методики представления семантических связей между объектами на базе нейронной сети;
3. Разработке обобщенного алгоритма создания гибридной модели;
4. Разработке структуры и параметров гибридной модели сети для автоматической классификации текста;
5. Разработке методики преобразования гибридной сети в ассоциативную нейронную сеть, особенностью которой является то, что последующие семантические образы создаются на базе ассоциаций и закономерностей, полученных ассоциативной нейронной сетью. Практические ценности работы представляют:
1. Пакет программ для выполнения автоматической классификации, разработанный на основе представленного в работе алгоритма создания гибридной модели сети, позволяющий проводить автоматическую классификацию текстовых документов;
2. Пакет программ, реализующих преобразование гибридной сети в ассоциативную нейронную сеть на основе разработанного алгоритма конвертации.
Реализация результатов работы. Основные теоретические и практические результаты диссертационной работы использованы в госбюджетной НИР «Применение интеллектуальных методов при разработке информационных систем в науке, технике и образовании» (Г-6.06.ВИС). Результаты работы были внедрены в научно-исследовательском институте перспективных технологий (НИИ ПТ) Волгодонского института сервиса Южно-Российского государственного университета экономики и сервиса (ВИС ЮРГУЭС), ООО НПФ «Южно-Российский информационной центр».
Материалы диссертации были использованы в учебном процессе на кафедре «Информатика» Волгодонского института сервиса (ВИС) (филиала ЮРГУЭС), при чтении лекций, проведении практических и лабораторных занятий по учебным дисциплинам: «Интеллектуальные информационные системы» и «Представление знаний», а также на кафедре «Прикладная информатика» Технологического института Южного Федерального университета в г. Таганроге, при выполнении курсовых и дипломных работах, чтении лекций, проведении практических и лабораторных занятий по учебным дисциплинам «Интеллектуальные интернет-технологии», «Методы интеллектуального анализа данных», а также в научно-исследовательской работе студентов.
Основные теоретические и практические результаты диссертационной работы использованы в научно-исследовательской работе, выполненной по гранту при финансовой поддержке Президента Российской Федерации (проект №МК-119.2003.01).
Апробация основных теоретических и практических результатов работы проводилась на IV Международной научно-практической конференции «Моделирование. Теория, методы и средства» (Новочеркасск, 2004г.), Международной научной конференции «Анализ и синтез как методы научного познания» (Таганрог, 2004г.), внутривузовской конференции ЮРГУЭС (2004 г.).
Публикации. Результаты диссертации отражены в 8 печатных работах.
Структура и объем диссертационной работы.
Диссертационная работа состоит из введения, 4 разделов, заключения, списка литературы из 155 наименований, стр. приложений и актов об использовании.
Заключение диссертация на тему "Разработка и исследование гибридных нейросетевых моделей для автоматической классификации текстовых документов"
4.2. Выводы
1. После ряда проведенных вычислительных экспериментов и анализа полученных данных сделан вывод о работоспособности разрабатываемого гибридного нейросетевого классификатора.
2. Разработанный классификатор способен отсеивать «чужие» документы, и распознавать с высокой точностью документы, принадлежащие к его областям знаний.
3. При использовании гибридный нейросетевого классификатора существенно возрастает точность классификации по сравнению с аналогичными используемыми программами-классификаторами.
ЗАКЛЮЧЕНИЕ
В ходе выполнения диссертационной работы получены результаты:
1. В ходе анализа существующих подходов к решению задачи автоматической классификации обоснована актуальность гибридного подхода; совмещающего ассоциативные нейронные и семантические сети, с помощью которого можно компенсировать недостатки каждого из механизмов. Выбран общий подход и основные принципы создания гибридной модели, выделены требуемые ее свойства.
2. Разработана и реализована методика создания гибридной нейросетевой' модели, позволяющая классифицировать текст на основе заложенной-в текст терминологии и выделения неявных ассоциаций. Представлена разработка гибридной модели, автоматическою классификации текстов. Выбраны формы представления и обработки текста для разработанной' модели.
3. Разработана структура гибридной нейронной сети; выбраны ее параметры. Разработаны ее составляющие, и механизм действия разработанной модели. Описан способ представления данных для нейронной' сети, отбора терминов и установления семантических связей, принципы формирования обучающей выборки.
4. Предложена модель нейронной сети, состоящая из трех слоев, которые выстроены иерархически, разработана ее математическая модель.
5. Разработан обобщенный алгоритм создания гибридной нейросетевой модели, реализующий поэтапный процесс создания гибридной сети. Также разработан набор алгоритмов, включающий в себя алгоритм установления семантических отношений и библиотек; алгоритм работы гибридной сети с установленными семантическими отношениями; алгоритм преобразования гибридной сети в гибридную ассоциативную нейронную сеть.
6. Разработана и реализована гибридная нейросетевая модель на основе созданных алгоритмов.
7. Разработана и реализована методика преобразования созданной гибридной модели в ассоциативную нейронную сеть с сохранением установленных семантических связей, позволяющая выделять неявные ассоциации и скрытые закономерности в тексте.
3. Разработан пакет программ для выполнения автоматической классификации, разработанный на основе представленного в работе алгоритма создания гибридной модели сети, позволяющий проводить автоматическую классификацию текстовых документов; и пакет программ, реализующих преобразование гибридной сети в ассоциативную нейронную сеть на основе разработанного алгоритма конвертации. ■
8. В результате вычислительного эксперимента позволило сделать вывод, что построенный на основе разработанной в работе модели гибридный классификатор способен отсеивать «чужие» документы, и распознавать с высокой точностью документы, принадлежащие к его областям знаний. При использовании гибридный нейросетевого классификатора существенно возрастает точность классификации по сравнению с аналогичными используемыми программами-классификаторами
Библиография Мешкова, Екатерина Владимировна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Прикладная статистика: Классификация и снижение размерности: Справ, изд. / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков, JI. Д. Ме-шалкин; Под. ред. С. А. Айвазяна. М.: Финансы и статистика, 1989. -607с.: ил.
2. Сигорский В.П. Математический аппарат инженера. — Киев: Техника, 1977.-768с.
3. Чубукова И.A. Data Mining. БИНОМ: Лаборатория знаний, Интернет-университет информационных технологий http://www.intuit.rui, 2008.
4. Sebastiani F. Machine Learning in Automated Text Categorization // ACM Computing Surveys. — 2002. -Vol: 34; No! 1.
5. Zipf G.K. Human Behavior and the Principle of the Last Effort. Cambridge, Mass., 1949.
6. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика: М., Мир, 1992.
7. Ерофеев А.А., Поляков А.О. Интеллектуальные системы управления: СПб.: Изд. СПбГТУ, 1999.
8. Колесников А.В. Гибридные интеллектуальные системы для поддержки принятия решений. Труды Междун. конф. "Интеллектуальное управление: новые интеллектуальные технологии в задачах управления (ICIT'99). М.: Наука. Физматлит, 1999.
9. Goonatilake S., Khebbal S.(eds.). Intelligent Hybrid Systems Wiley & Sons, 1995.
10. Medsker L.R. Hybrid Intelligent Systems. Kluwer Academic Publ., 1995.
11. Бутаков C.B. Рубцов Д.В. Разработка оболочки гибридной интеллектуальной системы. Алтайский государственный университет, Барнаул, 2006.
12. Классификация и кластер. — G6. ст./ Под ред. Дж. В. Райзина./М.: Мир, 1980.
13. Zadeh L.A. 'Fuzzy sets' // Information and control, 1965. V.8. P.338-353.
14. Friedman N., Geiger D., Goldszmidt M., etc. Bayesian Network Classifiers Machine Learning. 1997. 29. P: 131-165.
15. Андреев A.M., Березкин Д.В., Морозов B.B., Симаков K.B. Автоматическая классификация текстовых документов с использованием нейросете-вых алгоритмов и семантического анализа // Мир ПК, 2007, №9 стр. 56-64.
16. Коршунов, Ю. М. Математические основы кибернетики. М.: Энерго-атомиздат, 1987.
17. Чубукова JI.A. Лекции: Методы классификации и прогнозирования. Метод опорных векторов. Метод "ближайшего соседа'1. Байесовская! классификация. М.: Изд-во МГТУ имени Н.Э.Баумана, 2008.
18. D.M.Magerman. Natural Language Parsing as Statistical Pattern Recognition. // A dissertation submitted to the department of computer science at the committee on graduate studies of Stanford University, 1994.
19. Brand E., Gerritsen R. Naive-Bayes and Nearest Neighbor. DBMS, 1998. №7.
20. Мерков А.Б. О статистическом обучении. //«Информационные технологии», № 7, 2005.
21. Yang Y., Liu X. A re-examination of text categorization methods. // Proc. Of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 1999 pp. 42-49.
22. Колбецкая M.O., Пономарева Ю.П. Кластерный анализ как метод автоматической классификации текстовой информации. // Итоги науки и техники (серия "Вычислительные науки"). Т.6. —М.: ВИНИТИ, 1991.
23. Классификация и кластер: Сб. ст./ Под ред. Дж. В. Райзина./М.: Мир, 1980.
24. Дж Солтон. Динамические библиотечно-поисковые системы. М.: Мир, 1979.
25. Распознавание образов: состояние и перспективы: Пер. с англ./К.Верхаген, Р.Дёйн; Ф.Грун и др. —М.: Радио и связь, 1985. -104 е., ил
26. Хмелев Д.В. Классификация и разметка текстов с использованием методов сжатия»данных. Краткое введение — http:// www.compression.ru, 2003.
27. С. Burges, "A Tutorialon Support Vector Machines for Pattern Recognition," Knowledge Discovery and Data Mining, 2(2), 1998.
28. Greene, W. «Econometric Analysis», Prentice Hall, 1997.
29. Удо X., Мани И. Системы автоматического реферирования // «Открытые Системы», №12,2006.
30. Технологии анализа- и поиска текстовой информации // Научно-техническая информация. Сер. 4. — 2005. — № 12. — С. 32-34.
31. Дунаев Е.В. Шелестов А.А. Автоматическая рубрикация web-страниц в интернет-каталоге с иерархической структурой. Томский государственный университет систем управления и радиоэлектроники, 2008.
32. Пескова О. В. Методы автоматической классификации текстовых электронных документов // Научно-техническая информация. Сер. 2. 2006. — № 3. — С. 13-20.
33. Пескова О. В. Методы автоматической классификации электронных текстовых документов без обучения// Научно-техническая информация. Сер. 2. 2006. - № 12. - С. 21-32.
34. Дюк В.А., Самойленко А.П. Data Mining: учебный курс. СПб.: Питер, 2001.
35. Кулинцов Р., Первак A. RCO и UCO Semantic Network. Информация о технологии: Ассоциативно-статистический подход. — http://www.rco.ru, 2004.
36. Леонтьева Н.Н. К теории автоматического понимания естественных текстов. 4.2: Семантические словари: состав, структура, методика создания- М.: Изд-во МГУ, 2001.
37. Леонтьева Н.Н. К теории автоматического понимания естественных текстов. Ч.З: Семантический компонент. Локальный семантический анализ.- М.: Изд-во МГУ, 2002.
38. Тейз А., Грибомон П., Юлен Г. и др. Логический подхода искусственному интеллекту. От модальной логики к логике баз данных: Пер.с франц. — М.: Мир, 1998.
39. Кулинцов Р., Первак A. RCO и UCO Semantic Network. Информация о технологии: Синтактико-семантический подход. http://www.rco.ru, 2004.
40. Linda Van Guilder Automated Part of Speech Tagging: A Brief Overview (Handout for LING361, Fall 1995 Georgetown University) — Georgetown University, 1995.
41. Ермаков А.Е., Рябов Г.Н. Нейросетевая модель организации знаний в системах речевого общения аналог многомодального представленияинформации в человеческом мозге. // Интеллектуальные системы: Труды третьего международного симпозиума. М.: ООО "ТВК", 1998.
42. Гареев А.Ф. Применение вероятностной' нейронной' сети для задачи, классификации текстов. //«Информационные технологии», № 7, 1997.
43. Андреев A.M., Березкин Д.В., Брик А.В., Смирнов Ю:М. Об одном способе построения синтаксического анализатора текстов! на естественном, языке // Изв. вузов. Приборостроение, 1997. Т. 40, № 5 — стр. 34-—42.
44. Андреев* A.M., Березкин Д.В., Брик А.В., Лингвистический процессор для информационно-поисковой системы // Компьютерная хроника , 1998. № 11 стр. 79- 100.
45. Андреев A.M., Березкин Д.В., Симаков К. В. Особенности проектирования модели и онтологии предметной области для поиска противоречий в правовых электронных библиотеках. 6-ая Всероссийская научная конференция RCDL'2006.
46. Браславский П.И. Автоматическая классификация документов Internet по стилям: реализация макета. Доклады V рабочего совещания по электронным публикациям EL-PUB-2000, Новосибирск, Академгородок, ИВТ СО РАН, 21-23 июня 2000 г.
47. Дударь З.В., Шуклин Д.Е. Семантическая нейронная сеть, как формальный язык описания и обработки смысла текстов на естественном языке //
48. Радиоэлектроника и информатика. X.: Изд-во ХТУРЭ, 2000. No 3. С. 72-76.
49. Зайцев Н.Г. Технология обработки данных в языковой форме. -Киев.: Техника, 1989.
50. Искусственный интеллект. В 3-х кн. Кн.2.Модели и методы: Справочник. /Под ред. Д.А. Поспелова. -М.: Наука, 1990:
51. Джордж Ф. Основы кибернетики: Пер: с англ./Под ред. A.JI. Горелика. — М.: Радио и связь, 1984. -272 е., ил.
52. Куссуль Э.М. Ассоциативные нейроподобные структуры. Академия наук Украинской ССР Институт кибернетики имени В.М.Глушкова, Киев, Наукова думка, 1990.
53. Терехов С.А. Лекции по теории и приложениям искусственных нейронных сетей. Лаборатотория Искусственных Нейронных Сетей НТО-2, ВНИИТФ; Снежинск, 2004.
54. Grossberg S. 1973. Contour enhancement, short-term memory, and consistencies in reverberating neural networks. Studies in Applied5 Mathematics 52:217,257.
55. Kohonen T. Self-organization and associative memory. Series in Information Sciences, vol. 8. Berlin: Springer Verlag, 1984.
56. Hebb D. 0. 1961. Organization of behavior. New York: Science Edition.
57. Rosenblatt F. 1962. Principles of neurodynamics. New York: Spartan Books. (Русский перевод: Розенблатт Ф. Принципы нейродинамики. -М.: Мир., 1965.)
58. Widrow В., Angell J. В. 1962. Reliable, trainable networks for computing and control. Aerospace Engineering 21:78-123.
59. Widrow В., Hoff M. 1960. Adaptive switching circuits. I960 IRE WESCON Convention Record, pp. 96-104. New York: Institute of Radio Engineers.
60. Werbos P. J. 1974. Beyond'regression: New tools for prediction and analysis in the behavioral sciences. Masters thesis, Harward University.
61. Horfield J. J. 1982. Neural networks and physical systems with emergent collective computational abilities. Proceedings of the National Academy of Science 79:2554-58.
62. Parker D. B. 1987. Second order back propagation: Implementing an optimal-0(n) approximation to Newton's method as an artificial newral network. Manuscript submitted for publication.
63. Н;М: Амосов, A.M. Касаткин, JLM: Касаткина;,С.А. Талаев Автоматы и, разумное поведение. Опыт моделирования. Киев: "Наукова думка", 1973.-261с.
64. Егоров С.А. Сети нейронные или семантические? // Информационные технологии. 1999 8. С. 31- 34.
65. Гаврилов А.В. Проблемы обработки символьной информации в нейронных сетях// Радиоэлектроника и информатика. X.: Изд-во ХТУРЭ, 2008. -№3. С. 72-76.
66. Куссуль Э.М. Ассоциативные нейроподобные структуры. Академия наук Украинской ССР. Институт кибернетики имени В.М.Глушкова, Киев, Наукова думка, 1990.
67. Kolesnikov A. Computer Aided Design of Hybrid Models for Automation Ship Systems Konferencja Naukowo -Techniczna AUTOMATION 99. Warszawa, 1999.
68. Киселев M., Соломатин E. Средства добычи знаний в финансах и бизнесе // Открытые системы. — 1997 г., №4.
69. Масалович А. Нейронная сеть в арсенале банкира. Пакет Brain Maker на российском рынке.// Открытые системы. — 1998 г., №11.17/3.
70. Пятковский О.И., Рубцов Д.В., Бутаков С.В. Система анализа финансово хозяйственных показателей деятельности предприятия // Информационные технологии. - 1999 8. С. 31- 34.
71. Степанов B.C. Фондовый рынок и нейросети // Мир ПК — 1998, № 12, с.40-46.
72. Гибридная модель представления знаний, использующая сеть параметров. Методический комплекс по дисциплине "Проблемы современной науки"—М.: Горячая линия-Телеком,.2005. -78 с.:ил.
73. Honavar V., L. Uhr. Integrating Symbol Processing and Connectionist Networks. Invited chapter. In: Intelligent Hybrid Systems. 1995, pp. 177-208. Goonatilake, S. and Khebbal, S. (Ed.) London: Wiley.
74. MacGarry K., Wermter S., Maclntyre J. Hybrid neural system: from simply coupling to fully integrated neural network// Neural computing surveys, 2, 1999, pp. 62-93.
75. Mustajoki J., Hamalainen R.P. Web-HIPRE: Global decision support by value tree and AHP analysis, INFOR, Vol. 38, no. 3, Aug. 2000, pp. 208-220.
76. Уотерман Д. Руководство по экспертным системам. М.: Мир, 1989.
77. Попов Э.В. Экспертные системы. Решение информационных задач в диалоге с ЭВМ-М.: Наука, 1987.
78. Построение экспертных систем. Под ред. Ф. Хейес-Рота, Д. Уотермена, Д. Лената. М.: Мир, 1987.
79. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. -М.: Наука, 1989.
80. Нечеткие и гибридные системы -сб. ст/под.ред.Ирушиной,М.: 2008.
81. Honavar, V. & Uhr, L. (1994а). (Ed.) Artificial Intelligence and Neural Networks: Steps Toward Principled Integration. San Diego, CA.: Academic Press.
82. Соломатин H.M. Информационные семантические системы. // В уч. пос. Перспективы развития вычислительной техники в 11 кн. Кн. 1. — М.: Высшая школа, 1989.
83. Искусственный интеллект. Справочник, т.1, т 2, т.З — М. РиС, 1990.
84. Поспелов Д.А. Моделирование рассуждений Опыт анализа мыслительных актов -М. РиС, 1989.
85. Эндрю А. Искусственный интеллект. М.: Мир, 1985. - 178 с.
86. Представление и использование знаний. М: Мир, 1989.
87. Люггер Д.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем. 4- е издание.: Пер. с англ. — М.: Наука, 1980.
88. Мелихов А.Н., Бернштейн Л.С., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой. М.: Наука, 1990.
89. Обработка нечеткой информации в системах принятия решений./ А.Н.Борисов, А.В.Алексеев, и др. — М.: Радио и связь, 1989. 304с.
90. Искусственный интеллект; В 3 кн. Кн.2 Модели и методы; Справочник /Под ред. Д.А. Поспелова. М.: Радио и связь, 1990. - 304 с.
91. Моделирование языковой деятельности в интеллектуальных системах./ Под ред. А.Е.Кибрика и А.С.Нариньяни. М.: Наука, 1987.
92. Попов Э.В: Общение с ЭВМ на естественном языке. М:, Наука, 1986.
93. Шенк Р. Обработка концептуальной информации. М.: Энергия, 1980.
94. Минский М. Фреймы для представления знаний. М.: Энергия, 1979.
95. Дударь З.В., Шуклин Д.Е. Семантическая нейронная сеть, как формальный» язык описания и обработки смысла текстов на естественном языке.// Радиоэлектроника и информатика. X.: Изд-во ХТУРЭ, 2000. — № 3.
96. Мешкова Е.В., Светличный Р.А. Применение нейронных сетей для поиска информации. Материалы Международной научно- практической конференции "Информационные технологии в науке и образовании", 915 сентября, 2001г., Шахты, Россия.
97. Мешкова Е.В. Методика построения классификатора текста на основе гибридной нейросетевой модели. Известия ЮФУ. Технические наука.к
98. Тематический выпуск «Интеллектуальные САПР». -Таганрог: Изд-во ТТИЮФУ, 2008, №4(81). -268 с.
99. Кузнецов О.П., Адельсон-Вельский^ Г.М. Дискретная'математика для инженера М.: Энергоатомиздат, 1988. - 480 с.1
100. Клыков Ю.И. Ситуационное управление большими системами. — М.: Энергия, 1974. 213 с. '
101. Шабанов-Кушнаренко Ю.П. Теория интеллекта. Математические средства. X.: Вища школа, 1984. - 143 с.
102. Fernando S. OsoHrio, Bernard Amy. INSS: A hybrid system for constructive machine learning / Neurocomputing 28 (1999). P. 191-205.
103. Чугреев B.JL, Яковлев С.А., Выделение критериев поиска текста на основе подобия значимых документов: // ВУЗОВСКАЯ. НАУКА- РЕГИОНУ: Материалы 1-й Общероссийской нучн.-техн. конф. - Вологда: ВоГТУ, 2003. - стр. 200-202.
104. Чугреев В.Л., Яковлев С.А., Анализ структуры текста и прогнозирование нечисловых величин. // ВУЗОВСКАЯ НАУКА РЕГИОНУ: Материалы 1-й Общероссийской нучн.-техн. конф. - Вологда: ВоГТУ, 2003. — стр. 202-204.
105. Смирнов Ю.М., Андреев A.M., Березкин Д.В., Брик А.В. Вероятностный синтаксический анализатор текстов на естественном языке // Изв. вузов. Приборостроение, 1997. Т. 40, № 5 стр. 34-42.
106. Галеев Э.М., Тихомиров В.М. Оптимизация: теория, примеры, задачи. — М: Элиториал УРСС, 2000: 320 с.
107. Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1981.
108. Курейчик В.М. Генетические алгоритмы: Состояние. Проблемы. Перспективы. Теория и системы управления РАН, — Москва, N 1, 1999,. с. 144-160.
109. Hecht-Nielsen R. Kolmogorov's Mapping Neural Network Existence Theorem // IEEE First Annual Int. Conf. on Neural-Networks, San Diego, 1987, Vol.3, pp. 11-13.
110. Pineda F. J. 1988. Generalization of backpropagation to recurrent and higher order networks. In Newral information processing systems, ed. Dana Z. Anderson, pp. 602-11. New York: American Institute of Phisycs.
111. Rumelhart D. E., Hinton G. E., Williams R. J. 1986. Learning internal repren-tations by error propagation. In Parallel distributed processing, vol. 1, pp. 318-62. Cambridge, MA: MIT Press.
112. Sejnowski T. J., Rosenberg C. R. 1987. Parallel networks that learn to pronounce English text. Complex Systems 1:145-68.1143. Киселев M. В. Оптимизация- процедуры автоматического пополнениявеб-каталога. http://www.megaputer.com, - 2008.ч
113. Ермаков A.E., Плешко В.В. Синтаксический разбор в системах статистического анализа текста. // Информационные технологии. — 2002. N7.
114. Cover, Т. and Thomas, J. «Elements of Information Theory», Wiley, 1991
115. Труды РОМИП'2004, Санкт-Петербург: НИИ Химии СПбГУ, 214 с, сентябрь 2004 / Под ред. И.С.Некрестьянова.
116. Титов Ю. В., Фарсобина В. В. Сравнительное тестирование авторубрикаторов// Дистанционное образование. 2008. №7. С. 16-21.
117. Naive Bayes algorithm for learning to classify text. // http://www-2.cs.cmu.edu/afs/cs/project/theo-l 1/www/naive-bayes.html
118. Thorsten J. «SVM-light Support Vector Machine» //http://www.cs.cornell.edu/People/tj/svmlight/
119. Lewis D. Applying-Support Vector Machines to the TREC-2001 Batch Filtering and Routing Tasks. Proceedings of TREC-2001' conference.
120. Yang Y., Liu X. A re-examination of text categorization methods. // Proc. Of Int. ACM Conference on Research and Development in Information Retrieval (SIGIR-99), 1999 — pp. 42-49.
121. Yang Y., X. Liu. page classification through summarization. // Proceedings of the 27th annual international ACM SIGIR conference on Research and development in information retrieval, Sheffield, UK, 2004.
122. Хорошевский В.Ф. Оценка систем извлечения информации из текстов на естественном языке.// Материалы Международной научной конференции КИИ — 2006, Обнинск.
-
Похожие работы
- Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами
- Методы и алгоритмы структурно-параметрического синтеза нейросетевой модели для формирования интеллектуальных информационных технологий
- Информационно-поисковая система с ранжированием на основе нейронных сетей с бинарной функцией выхода
- Методы кодирования текстовой информации для построения нейросетевых классификаторов документов
- Оптимизация пространственных конструкций на основе гибридной нейросетевой программы
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность