автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методика извлечения структурных знаний из естественных текстов на основе нечетких семантических гиперсетей
Оглавление автор диссертации — кандидата технических наук Вохминцев, Александр Владиславович
ВВЕДЕНИЕ.
ГЛАВА 1. НАПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ИНФОРМАЦИИ С ПОМОЩЬЮ ТЕХНОЛОГИИ DATA MINING
1.1 Анализ уровней знаний.
1.2 Технология Data Mining.
1.3 Методы Data Mining.
1.4 Постановка задачи диссертационной работы.
Выводы по главе.
ГЛАВА 2. МОДЕЛЬ ЗНАНИЙ НА ОСНОВЕ НЕЧЕТКОЙ СЕМАНТИЧЕСКОЙ ГИПЕРСЕТИ
2.1 Выбор модели знаний для анализа естественных текстов.
2.2 Математическая формализация >1<5дели знаний на основе нечеткой семантической гиперсети . V. V". ."'.*.'.
2.2.1 Структура вершины и ребра семантической гиперсети.
2.2.2 Математическая формализация семантической гиперсети на основе теории нечетких множеств.
2.3 Методы извлечения ассоциаций из нечеткой семантической гиперсети.
2.4 Методы оценки ассоциаций.
Выводы по главе.
ГЛАВА 3. МЕТОДИКА ПОСТРОЕНИЯ БАЗЫ ЗНАНИЙ НА ОСНОВЕ НЕЧЕТКОЙ СЕМАНТИЧЕСКОЙ ГИПЕРСЕТИ ПРИ АНАЛИЗЕ ЕСТЕСТВЕННЫХ ТЕКСТОВ НА РУССКОМ ЯЗЫКЕ
3.1 Лингвистический анализ естественного текста.
3.1.1 Модель метатекста русского языка.
3.1.2 Формализация модели метатекста русского языка на основе теории нечетких множеств.
3.1.3 Структура лингвистического процессора.
3.2 Иерархия классов объектов.
3.3 Математическая модель дерева решений по модифицированному алгоритму С4.
3.4 Процедуры построения базы знаний на основе нечеткой семантической гиперсети.
Выводы по главе.
ГЛАВА 4. ПРИМЕНЕНИЕ НЕЧЕТКИХ СЕМАНТИЧЕСКИХ ГИПЕРСЕТЕЙ ПРИ АНАЛИЗЕ ЕСТЕСТВЕННЫХ ТЕКСТОВ НА
РУССКОМ
4.1 Технология работы с ИАС класса Data Mining на базе нечеткой семантической гиперсети
4.2 Архитектура информационно-аналитической системы.
4.2.1 Технологии обеспечения безопасности, надежности и эффективности в ИАС.
4.2.2 Технологии аналитической обработки информации в ИАС.
4.3 Пример анализа естественных текстов с использованием
ИАС на основе нечетких семантических гиперсетей.
Выводы по главе.
Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Вохминцев, Александр Владиславович
Современные достижения в области информационных технологий позволили за короткий промежуток времени скопить в хранилищах данных различных организаций большие объемы информации, которая содержит скрытые пласты информации в виде знаний, поэтому задача аналитической обработки больших объемов информации становится весьма актуальной.
Существующие информационно-аналитические системы можно поделить по уровню анализа знаний на системы класса OLTP, OLAP и Data Mining. OLTP технология направлена на поддержку документооборота, OLAP позволяет осуществлять проверку заранее сформулированных гипотез. Технология Data Mining [107, 119, 127] также умеет проверять гипотезы, но кроме этого позволяет получать закономерности, которые ранее были неизвестны аналитику и носят не универсальный характер. Системы на базе технологии Data Mining предоставляют мощный инструмент информационной поддержки принятия решений [2, 8, 13, 23, 35, 56, 65, 97, 108, 114, 121] в конкурентной борьбе и позволяют существенно улучшить состояние дел организации. Однако применение технологии Data Mining не исключает необходимости знания предметной области, понимания анализируемой информации и аналитических методов. Таким образом, внедрение системы Data Mining не заменяет полностью деятельность аналитиков, а предоставляет им мощный инструмент интеллектуального анализа информации и способствует повышению эффективности их работы.
Источниками исходной информации для аналитической обработки являются:
• СМИ: газеты, журналы, информационные агентства;
• Internet: поисковые системы, телеконференции, обмен информацией с другими агентствами, службами и организациями; 5
• Хранилища данных: органов государственной власти и регистрации, государственных и ведомственных служб, информационно-аналитических агентств.
Значительная часть информации в этих источниках представлена в виде естественных текстов, процесс аналитической обработки которых требует создания принципиально новых моделей, методик и систем интеллектуального анализа информации. Задача аналитической обработки естественных текстов является достаточно сложной и в общем случае связана с построением систем с искусственным интеллектом: автоматический перевод текстов, построение "думающих машин" [27, 28, 79, 81, 82, 98, 105, 137].
В области создания систем с искусственным интеллектом, направленных на автоматическую обработку естественных текстов, разработано много моделей, которые являются ЫР-полными и основываются на глубинном семантическом анализе естественного текста [40, 61, 70, 77, 101]. Однако информационно-аналитические службы, исходя из специфики своей работы, не нуждаются в извлечении всех закономерностей из естественных текстов, поэтому нет необходимости в построении моделей естественного текста, реализующих глубинный семантический анализ текстов.
Одной из актуальных задач, решаемых аналитиками, является определение отношений между объектами, которыми являются физические и юридические лица. Решение данной задачи основано на извлечении ассоциаций из естественных текстов. Данная задача является времяемкой и требует привлечения высококвалифицированных аналитических кадров, поэтому разработка моделей, методик и программных систем интеллектуального анализа естественных текстов представляет собой актуальную задачу в век смены парадигмы политической, экономической, социальной и культурной сферы жизни общества, связанной с качественным переосмыслением значения информации в развитии человека и общества. 6
В основе любой ИАС класса Data Mining находится модель знаний, которая описывает предметную область. За многие тысячелетия своего существования человечество приспособилось организовывать свои знания в страничном виде, такой подход реализован в глобальной сети Internet. С одной стороны, нелинейная структура сети обладает большой гибкостью, с другой - всегда существует опасность "уйти далеко" по информации, кроме того, нет гарантии того, что требуемая информация будет найдена вообще [64, 96]. Поэтому с начала 80-х годов ведутся многочисленные исследования по созданию альтернативной страничной архитектуры представления информации, например, группа ученых под руководством А. Канаса предлагает заменить систему Web-страниц на архитектуру концептуальных карт [117, 130, 131] (графовая модель), которые посвящаются какой-то проблеме предметной области и являются двумерным представлением набора понятий, описывающих объекты и отношения между ними. Необходимость построения графовой модели знаний обуславливается тем, что современный уровень представления информации достаточно низок, поэтому его следует повысить до уровня, который является естественным для мышления человека.
Наиболее адекватно отношения между объектами представляются семантическими сетями [26, 92, 93]. Традиционная интерпретация семантической сети позволяет получать только представление о структуре отношений между объектами, которой недостаточно для проведения полноценного аналитического исследования. Поэтому в диссертационной работе предлагается расширение семантической сети для представления информации о классификации отношений между объектами и о принадлежности объектов к классам предметной области. Таким образом, аналитику предоставляется возможность просмотра семантической сети в разрезах на основе иерархии классов объектов и отношений между ними. В основе модели знаний находится нечеткий неориентированный граф (нечеткая семантическая гиперсеть) [12, 57], вершины которого соответствуют физическим и юридическим лицам, а ребра соответствуют отношениям 7 между ними. Нечеткий и качественный характер отношений между объектами является концептуальной характеристикой при анализе политических и социальных ситуаций [1, 2, 24, 71, 73, 126, 128], когда аналитику недоступны точные числовые характеристики.
Для нечеткой семантической гиперсети должны быть организованы автоматические процедуры:
• построения базы знаний: классификация объектов модели знаний и определение отношений между ними;
• извлечения ассоциаций базы знаний.
Исходной информацией для построения базы знаний является естественный текст на современном русском языке, который преобразуется с помощью лингвистического процессора в метатекст. Информация в виде естественных текстов на русском языке является трудно формализуемой с преобладанием качественных отношений между именами собственными (объектами), которые носят нечеткий нелинейный характер. На основе целевой модели знаний можно сделать вывод, при анализе естественного текста интерес представляют только отношения между именами собственными. Поэтому модель метатекста русского языка [10] не требует проведения полноценного лингвистического анализа естественного текста. Метатекст представляет собой нормализованный естест-.венньщ текгх rrLкятором-Оiтел еля тая.пт.ч.ошенщт метилу.пасами, объехток R основе модели метатекста находится функция лингвистики, определяющая принадлежность синтаксической конструкции между именами собственными к терм-множеству нечеткой лингвистической переменной.
Для классификации объектов на основе анализа существующих методов Data Mining были выбраны деревья решений, которые обладают иерархичностью, гибкостью, наглядностью, производительностью и позволяют получать высоко качественные результаты. Определяющим фактором при выборе де8 ревьев решений является возможность анализирования нелинейных и качественных отношений, которая следует из гибкости деревьев решений. Классификация объектов в модели знаний позволяет аналитику осуществлять операции спуска и подъема по уровням иерархии классов, изменяя тем самым группировку объектов в базе знаний нечеткой семантической гиперсети.
Переход с уровня метатекста на уровень базы знаний осуществляется функцией семантики. Функция семантики определяется на основе: классов объектов в отношении, типа отношения, частоты появления отношения и лингвистической характеристики отношения. Такой подход в определении функции семантики позволяет адекватно представлять силу отношения между вершинами (объектами) в нечеткой семантической гиперсети, потому что учитывает влияние предметной области анализа и неравномерность распределения частоты появления объектов и отношений в естественных текстах.
Модель знаний в виде нечеткой семантической гиперсети позволяет перейти на более высокий уровень представления информации (естественный для мышления человека), который связан с введением качественных категорий отношений между объектами, определяемых множеством лингвистических переменных. Для нечеткой семантической гиперсети необходимо определить методы извлечения ассоциаций: глубина транзитивных отношений, принадлежность объекта к классу, сила отношения и тип отношения, которые позволяют существенно сократить объем анализируемой информации в базе знаний.
Полученный в результате применения методов извлечения ассоциаций [9, 11 ] подграф нечеткой семантической гиперсети поддается анализу, так как отношения между объектами наглядно представимы в виде матрицы отношений или в виде графа. После изучения структуры нечеткой семантической гиперсети аналитик обращается к естественным текстам, в которых встречается интересующее его отношение. 9
Использование нечетких моделей [57, 58, 59, 73, 128] при анализе является сравнительно новым и перспективным направлением в Data Mining, оно получило название FCM (Fuzzy Cognitive Maps) - нечеткие когнитивные схемы. Впервые FCM подход был предложен Б. Коско [126], который определил FCM как синтез нечетких множеств JI. Заде и системной динамики [51]. FCM подход позволяет существенно сократить время на обработку информации по сравнению с обычными методами математической статистики. FCM используются в ситуационных центрах при президенте РФ и западных стран, в сфере финансов и обслуживания, в крупных промышленных гигантах, таких как Motorola, General Electrics, Ford, которые используют продукцию на основе нечетких множеств фирм Hyper Logic, Intellegence Ware, InfralLogic, Aptronix(CIUA). Большинство программных продуктов этого класса используют в качестве исходной информации для анализа реляционные базы данных, и лишь незначительная часть данной продукции ориентирована на анализ информации из естественных текстов. Последние представляют огромную ценность для аналитиков, но их широкое распространение ограничено законодательством стран их разработки (Япония, США и Канада). Как правило, все новейшие разработки в области FCM становятся на вооружение военных и политических департаментов данных стран и лишь через несколько лет, обычно 5-6, становятся доступными для коммерческого использования с ограничением на экспорт, так, например, на продукцию фирмы Hyper Logic стоит запрет на ввоз в Россию. Впервые FCM продукт iThink использовался в России на выборах президента РФ в 1996 г [58, 59]. В целом разработка и внедрение проектов на основе FCM в РФ идет крайне низкими темпами, вследствие этого разработка программной продукции в данном направлении является перспективной и востребованной как для учреждений государственного управления, так и для коммерческих компаний. Разработка системы класса Data Mining на базе FCM подхода для анализа информации в виде естественных текстов на русском языке является новым направлением в сфере информационных технологий.
10
Проблемы при продвижении FCM систем, реализующих интеллектуальный анализ информации, были связаны с низкой платежеспособностью большинства российских компаний. Крупные российские компании, которые в состоянии платить за внедрение и разработку данных систем, находили много других эффективных способов для получения прибыли. Поэтому оснащение организаций системами класса FCM продвигалось низкими темпами и представлялось как покупка дорогого инструмента без ориентации на ее конкретных пользователей и с неясными перспективами принесения прибыли. Сейчас ситуация меняется и интерес к аналитическим системам класса FCM резко возрастает, к тому же он подкреплен потребностями рынка. Использование данных систем российскими организациями должно существенно помочь им в конкурентной борьбе с зарубежными компаниями, как на внутреннем, так и на мировом рынке.
Основной вопрос, который должны задавать руководители при выборе инструмента Data Mining (FCM), - это адекватность внедрения данной системы по отношению к задачам, которые решает организация. Эффективность системы может оцениваться с точки зрения системных характеристик, таких как производительность, способ хранения, качество получаемых результатов и с точки зрения экономического эффекта, т.е. прибыли получаемой до использования системы класса Data Mining в процессе принятия решений и после использования.
Технология Data Mining реализуется на базе концепции хранилища данных [6, 112, 121, 124, 133]. Применение аналитических методов Data Mining превращает хранилище данных из "свалки мусора" в информационное поле для принятия решений, которые предоставляются аналитикам в нужное время и в нужной форме. Информация, которая интересует аналитиков, представляется в виде естественных текстов в рамках определенной предметной области. Процесс получения ассоциаций [13] состоит из следующих этапов:
11
• Постановка аналитической задачи;
• Подготовка и загрузка информации;
• Лингвистический анализ информации;
• Построение базы знаний;
• Извлечение ассоциаций из базы знаний;
• Визуализация информации и анализ результатов;
• Восстановление естественных текстов по нечеткой семантической гиперсети.
Системы класса Data Mining являются требовательными к вычислительным ресурсам. Выбор аппаратной поддержки проекта определяется индивидуально для каждого конкретного случая. Практика внедрения подобных проектов на Западе показала, что возможности персональных компьютеров являются ограниченными, поэтому целесообразно использовать многопроцессорные рабочие станции типа Silcon Graphics Challenger или минисуперкомпьютер HNC Marks Man [58, 126]. Кроме того, существенное увеличение производительности может быть достигнуто за счет использования специализированных плат, реализующих аппарат нечеткой логики и методов Data Mining. Существуют и позитивные тенденции в сфере аппаратного обеспечения, связанные: с огромным падением стоимости на средства хранения информации и уменьшения времени доступа к ним, снижением цены на процессоры и резкое увеличение их производительности.
На основании сказанного выше сформулирована основная цель диссертационной работы и задачи исследования.
Цель диссертационной работы и задачи исследования. Целью диссертационной работы является разработка методики извлечения структурных знаний из естественных текстов на основе нечетких семантических гиперсетей.
Для достижения поставленной цели в диссертационной работе решаются следующие задачи:
1. Создание модели знаний для представления отношений между объектами в естественном тексте;
2. Создание модели метатекста, формализующей конструкции русского языка на основе неполного синтаксического анализа;
3. Разработка метода классификации объектов на основе деревьев решений;
4. Разработка процедур построения базы знаний на основе метатекста;
5. Разработка методов извлечения структурных знаний из базы знаний;
6. Разработка архитектуры программного комплекса ИАС для извлечения ассоциаций из естественных текстов.
Методы исследования. Теоретической и методологической основой диссертационного исследования являются методы теории нечетких множеств, теории графов, теории баз данных и знаний, методы искусственного интеллекта и прикладной лингвистики.
Научная новизна диссертационной работы заключается в следующем:
• Предложена новая формализация представления знаний в виде нечеткой семантической гиперсети, которая отражает дуальный характер отношений между объектами в естественных текстах;
• Разработана модель метатекста русского языка, которая позволяет формализовать процесс обработки естественного текста за счет отказа от глубинного семантического анализа естественного текста;
• Предложена методика на основе нечеткой семантической гиперсети и модели метатекста, которая позволяет извлекать структурные знания из естественных текстов в виде отношений между объектами при помощи многоуровневого подхода к процессу обработки информации.
13
Практическая ценность и реализация результатов работы заключается в создании методики извлечения структурных знаний из естественных текстов для решения актуальной задачи по автоматизации процессов аналитической обработки больших объемов информации в информационно-аналитических службах. Полученная методология закладывает основу для создания ИАС класса Data Mining, которая позволяет:
• существенно увеличить эффективность работы информационно-аналитических служб за счет автоматизации времяемких процессов аналитической обработки информации, требующих привлечения высококвалифицированных кадров;
• извлекать ассоциации, которые ранее были неизвестны аналитику и носят не универсальный характер, из информации в виде естественных текстов.
Предложенные в диссертационной работе методики, алгоритмы и программные компоненты использованы: в практической работе информационно-аналитических служб Южно-Уральской железной дороги, ЗАО "Интерсвязь", ЗАО "Цветлит", при получении дополнительного профессионального образования в Челябинском институте развития профессионального образования, а также составили основу спецкурса по технологиям Data Mining для направления 654600 "Информатика и вычислительная техника" и для специальности 220100 "Вычислительные машины, комплексы, системы и сети" Южно-Уральского государственного университета.
Апробация работы и публикации. Основные положения и результаты, полученные в диссертационной работе, представлены и обсуждены на:
• Международной конференции "Информационные технологии в управлении промышленностью и экономикой субъектов РФ" (Челябинск, 2002);
• Международной конференции "Актуальные проблемы современной науки" (Самара, 2002);
• Межрегиональном научно-практическом семинаре "Компьютерные системы поддержки принятия решения руководителей" (Челябинск, 2001);
• Межрегиональном научно-практическом семинаре "Информационно-аналитические компьютерные системы и технологии в региональном и муниципальном управлении" (Челябинск, 2000).
По теме диссертационной работы опубликовано 9 печатных работ [8, 9, 10, 11, 12, 13, 14, 15, 16].
Связь с государственными и региональными программами. Диссертационная работа связана с тематикой работ, осуществляемых в соответствии с Федеральной целевой программой "Электронная Россия".
Структура и объем работы. Диссертационная работа включает введение, четыре главы, заключение, список литературы (142 наименования), а также приложение. Диссертация содержит 210 страниц (181 страницу основного текста), 48 иллюстраций, 17 таблиц.
Заключение диссертация на тему "Методика извлечения структурных знаний из естественных текстов на основе нечетких семантических гиперсетей"
Выводы по главе
1. Разработана технология обработки естественных текстов в ИАС класса Data Mining на основе нечеткой семантической гиперсети. Показано, что основными ее этапами являются лингвистический анализ естественного текста, процесс построения базы знаний, процесс извлечения ассоциаций из базы знаний, которые последовательно реализуют переход с одного уровня представления информации на другой. Показано, что на сегодняшний день существуют программные системы, которые могут использоваться на отдельных этапах обработки информации в ИАС.
2. Рассмотрена общая информационная схема хранилища данных. Основными ресурсами хранилища данных являются ассоциации, модель знаний, база знаний, иерархия классов, метатекст, база данных словаря русского языка, естественный текст. Использование концепции хранилища данных закладывает основу для аналитической обработки естественных текстов.
3. Определена архитектура ИАС класса Data Mining на основе нечеткой семантической гиперсети, которая состоит из систем аналитической обработки информации и систем обеспечения безопасности, надежности и эффективности ИАС. Надежность и эффективность ИАС обеспечивается как использованием конструктивных и эффективных методов обработки информации при построении базы знаний и при извлечении из нее ассоциаций, так и техническими решениями на основе хранилища данных с использованием мощных информационных платформ и высокопроизводительных аппаратных средств.
4. Рассмотрен пример анализа естественного текста на русском языке при помощи ИАС класса Data Mining на основе нечетких семантических гиперсетей. Полученные в результате работы ИАС ассоциации представляют собой высоко агрегированную информацию, которая является естественной для мышления человека и используется для восстановления естественных текстов по нечеткой семантической гиперсети.
169
ЗАКЛЮЧЕНИЕ
Проведенные в диссертационной работе исследования позволили сформулировать следующие основные выводы и получить практические результаты:
1. Анализ современных концепций, методик, технологий и систем, связанных с интеллектуальным анализом естественных текстов, позволил сделать вывод о совершенно недостаточном уровне развития существующих моделей знаний, методов анализа информации, средств представления информации и соответствующего информационно-аналитического обеспечения. Особенно остро эти недостатки проявляются в области интеллектуального анализа естественных текстов на русском языке.
2. В диссертационной работе предлагается модель знаний в виде нечеткой семантической гиперсети, которая является основой для построения методов представления и анализа структурной информации с точки зрения иерархии классов и типов отношений. Целесообразность использования теории нечетких множеств определяется трудной формализацией исходной информации и свойствами мышления человека. Модель знаний в виде нечеткой семантической гиперсети позволяет перейти на более высокий уровень представления информации (естественный для мышления человека), который связан с введением качественных категорий отношений между объектами, определяемых множеством лингвистических переменных.
3. Разработана модель метатекста русского языка на основе теории нечетких множеств, которая позволяет формализовать процесс обработки естественного текста за счет отказа от глубинного семантического анализа естественного текста.
4. На основе проведенного анализа методов Data Mining обоснована целесообразность использования деревьев решений для классификации объектов в базе знаний. Показано, что для повышения производительности деревьев решений
170 их необходимо модифицировать введением несмещенного критерия разбиения и метода кросс-проверочного отсечения по минимальной цене.
5. Разработаны процедуры построения базы знаний основе метатекста. Переход с уровня метатекста на уровень базы знаний осуществляется на основе функции семантики, которая определяется на основе: классов объектов в отношении, типа отношения, частоты появления отношения и лингвистической характеристики отношения. Такой подход в определении функции семантики позволяет адекватно представлять силу отношения между вершинами НСГС, потому что учитывает влияние на силу отношения предметной области анализа и неравномерность распределения частоты появления объектов и отношений в естественных текстах.
6. Разработаны методы извлечения ассоциаций из базы знаний, которые позволяет существенно сократить объем анализируемой информации, как на основе формальных методов ("глубина транзитивных отношений" и "сила отношений"), так и на основе предметно-ориентированных методов ("принадлежность объекта к классу" и "тип отношения"). Полученный в результате применения методов извлечения ассоциаций подграф НСГС легко поддается анализу, так как отношения между вершинами НСГС наглядно представимы в виде матрицы отношений или в виде графа.
7. Практическим результатом исследования является разработка ИАС "Analyst Wizard" на основе нечеткой семантической гиперсети для анализа естественных текстов на русском языке, которая позволяет:
• существенно увеличить эффективность работы информационно-аналитических служб за счет автоматизации времяемких процессов аналитической обработки информации;
• извлекать ассоциации, которые ранее были неизвестны аналитику и носят не универсальный характер, из информации в виде естественных текстов;
172
Библиография Вохминцев, Александр Владиславович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Аверкин А.Н. Нечеткие множества в моделях управления и искусственного интеллекта-М.: Наука, 1986.-331 с.
2. Акофф P.JI. Искусство решения проблем.-М.: Мир, 1982.-220 с.
3. Алексеев П.М., Турыгина JI.A. Частотный англо-русский словарь-минимум газетной лексики.-М.: Воениздат, 1984.-312 с.
4. Богуславский И.М. Исследования по синтаксической семантике: сферы действия логических слов /АН СССР, Науч. совет по комплекс, пробл. "Кибернетика".-М.: Наука, 1985.-175 с.
5. Бондарко A.B. Проблемы грамматической семантики и русской аспектоло-гии /Рос. акад. наук, Ин-т лингвистич. исслед.-С-Пб: Изд-во С-Петербургского гос. университета, 1996.-218 с.
6. Бритов П.А., Липчинский Е.А. Практика построения Хранилищ Данных: Система SAS //СУБД.-№4.-1998.
7. Виноград Т.К. Программа, понимающая естественный язык.-М.: Мир, 1976.-294 с.
8. Вохминцев A.B. Модель естественного текста на русском языке //Интеллектика. Логистика. Системология: Сб. науч. тр.-Челябинск: Издание ЧНЦ РАЕН, РУО МАИ, ЧРО МАНПО, 2001.- Вып.6.- С.35-38.
9. Вохминцев A.B., Мельников A.B. Методика извлечения структурных знаний из естественных текстов //Известия Челябинского научного центра.-Челябинск: Издание ЧНЦ Уро РАН, РФЯЦ ВНИИТФ, ЮУрГУ, 2002.- Вып. 15.- С. 10-15.173
10. Вохминцев A.B., Мельников A.B. Архитектура информационно-аналитической системы (ИАС) на основе нечетких семантических гиперсетей //Системная интеграция в управленческой деятельности: Сб. науч. тр.-Екате-ринбург: УГТУ-УПИ, 2002-С.26-30.
11. Гладкий A.B. Синтаксические структуры естественного языка в автоматизированных системах общения.-М.: Наука, 1985.-143 с
12. Гловинская М.Я. Русский язык конца 20 столетия: 1985-1995/Рос. акад. наук, Ин-т рус. яз.-М.: Язык русской культуры, 2000.-473 с.
13. Горбатов В.А. Логическое управление информационными процессами.-М.: Энергоатомиздат, 1984.-304 с.
14. Губанов В.А., Захаров В.В. Введение в системный анализ: учеб. пособие.-Л.: Издательство ленинградского университета, 1988—232 с.
15. Добрускина Э.М., Берзон В.Е. Синтаксические сверхфразовые связи и их инженерно-лингвистическое моделирование-Кишинев: Штиница, 1986.-167 с.
16. Долинина И.Б. Системный анализ простого и сложного предложения-Л.: Наука, 1990.-156 с.174
17. Жуковский В.И., Молоствов B.C. Многокритериальное принятие решений в условиях неопределенности.-М.: Международный научно-исследовательский институт проблем управления, 1988.-131 с.
18. Искусственный интеллект. В 3-х кн. Кн. 2. Модели и методы: Справочник /Под ред. Поспелова Д.А. -М.: Радио и связь, 1990.-304 с.
19. Искусственный интеллект. В 3-х кн. Кн. 1. Системы общения и экспертные системы: Справочник /Под ред. Попова Э.В. .- М.: Радио и связь, 1990.-464 с.
20. Искусственный интеллект. В 3-х кн. Кн. 3. Программные и аппаратные средства: Справочник /Под ред. Захарова В.Н., Хорошевского В.Ф. .- М.: Радио и связь, 1990.-386 с.
21. Калинина В.Д. Лексические проблемы перевода: Учеб.-метод. пособие по пер. с англ. яз. на рус. -Ульяновск: УлГу, 1997.-85 с.
22. Кендалл М., Стьюарт А. В 3-х т. Т. 1: Теория распределений.-М.: Наука, 1966.-566 с.
23. Кендалл М., Стьюарт А. В 3-х т. Т. 2: Статистические выводы и связи.-М.: Наука, 1973.-899 с.
24. Кендалл М., Стьюарт А. В 3-х т. Т. 3: Многомерный статистический анализ и временные ряды.-М.: Наука, 1976.-736 с.
25. Кибрик А.Е. Очерки по общим и прикладным вопросам языкознания.-М.: Изд-во Московского университета, 2001.-336 с.
26. Кибрик А.Е. Стратегии организации базовой структуры предложения и интегральная типология языков //Вестник МГУ.-Сер.9. Филология 3.-1994.
27. Кини Р.Л., Райфа X. Принятие решений при многих критериях: предпочтения и замещения.-М.: Радио и связь, 1981.-560 с.
28. Киселев М., Соломатин Е. Средства добычи знаний в бизнесе и финансах //Открытые системы.-№ 4.-1997-с.41-44.175
29. Кнут Д.Э. Искусство программирования для ЭВМ. В 7-ми т. Т.1: Основные алгоритмы.-М.: Мир, 1976.-735 с.
30. Кнут Д.Э. Искусство программирования для ЭВМ. В 7-ми т. Т.2: Получисленные алгоритмы.-М.: Мир, 1977.-724 с.
31. Кнут Д.Э. Искусство программирования для ЭВМ. В 7-ми т. Т.З Сортировка и поиск.-М.: Мир, 1978.-844 с.
32. Кобозева И.М. "Смысл" и "значение" в наивной семиотике //Логический анализ языка. Культурные концепты.-М.: Изд-во Московского гос. университета, 1997.
33. Кобозева И.М. Фундаментальные направления современной американской лингвистики.-М.: Изд-во Московского гос. университета, 1997.-454 с.
34. Колодяжная Л.И. Принципы создания филологического словаря на персональном компьютере //Матер. III Всесоюзн. конферец. по созданию машинного фонда русского языка.-М., 1990.
35. Коршунов Ю.М. Математические основы кибернетики: Учеб. пособие для вузов.-М.: Энергоатомиздат, 1987.-496 с.
36. Крейдлин Л. Что такое UNL? // Компьютерра.-№13.-2001.-с.26-28.
37. Кречетов Н. Продукты для интеллектуального анализа данных //Рынок программных средств.-№ 14-15.-1997.-с.32-3 9.
38. Кристофидес К.Н. Теория графов. Алгоритмический подход.-М.: Мир, 1978.-434 с.
39. Кубрякова Е.С., Панкрац Ю.Г. Морфология в описании языков /АН СССР, Ин-т языкознания.-М.: Наука, 1983.-119 с.
40. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инже-нера.-М.: Энергоатомиздат, 1988.-480 с.
41. Кук Д., Бейз Г. Компьютерная математика.-М.: Наука, 1990.-384 с.
42. Кулагина О.С. Исследования по машинному переводу /АН СССР, Ин-т приклад. математики им. М.В. Келдыша, Науч. совет по комплекс, проблеме "Кибернетика".-М.: Наука, 1979.-320 с.
43. Лачинов В.М., Поляков А.О. Информодинамика.-С-Пб.: Изд.СПбГТУ, 1999.176
44. Леонтьев A.A. Семантическая структура слова. Психолингвистические ис-следования.-М.: Наука, 1971.
45. Лингвистическое проблемы перевода: Сб. ст. /Редкол: Гарбовский Н.К., Ефимов H.H., Ширяев А.Ф.-М.: Изд-во Московского гос. университета, 198178 с.
46. Лингвистические процессоры и представление знаний: Сб. науч. тр./Под ред. Нариньяни A.C. .-Новосибирск: ВЦ СО АН СССР, 1981.-138 с.
47. Лингвистическое обеспечение системы ЭТАП-2: Ин-т проблем передачи информации /Под ред. Апресян Ю.Д., Богуславский И.М. .-М.: Наука, 1989296 с.
48. Логиновский О.В. Управление и стратегии: Учебное пособие. Оренбург: издательство Оренбургского государственного университета.-Челябинск: издательство ЮУрГУ, 2001.-704 с.
49. Малышев Н.Г. Нечеткие модели для экспертных систем в САПР.-М.: Энер-гоатомиздат, 1991.-136 с.
50. Масалович А.И. Прогноз дает.компьютер //Софтмаркет.-№ 23.-1996.-c.6.
51. Масалович А.И. Этот нечеткий, нечеткий, нечеткий мир //PC Week/RE-№.16.-1995.
52. Мейер Д. Теория реляционных баз данных-М.: Мир, 1987.-445 с.
53. Мельчук И.А. Опыт теории лингвистических моделей "Смысл-Текст": Семантика, синтаксис-М.: Шк. языка русской культуры, 1999.-345 с.
54. Минский М. Фреймы для представления знаний.-М.: Энергия, 1979.-151 с.
55. Моделирование языковой деятельности в интеллектуальных системах /Под ред. Кибрика А.Е., Нариньяни A.C. -М.: Наука, 1987.-279 с.
56. Морозов В.П. Гипертексты в экономике. Информационная технология моде-лирования.-М.: Финансы и статистика, 1997.-254 с.
57. Мулен Э. Кооперативное принятие решений: аксиомы и модели.-М.: Мир, 1991.-463 с.
58. Научно-технический перевод /АН СССР, ВЦП; Отв. ред. Марчук Ю.Н. -М.: Наука, 1987.-139 с.177
59. Нейлор К. Как построить свою экспертную систему -М: Энергоатомиздат, 1991.-288 с.
60. Нейроинформатика /Горбань А.Н., Дунин-Барковский B.JI., Кирдин А.Н. .Новосибирск: Наука. Сибирское предприятие РАН, 1998.-296с.
61. Нейронные сети на персональном компьютере /Горбань А.Н., Россиев Д.А. .-Новосибирск: Наука. Сибирская издательская фирма РАН, 1996.-276 с.
62. Нелюбин JI.JI. Компьютерная лингвистика и машинный перевод: Метод, по-собие.-М.: ВЦП, 1991.-152 с.
63. Нечеткие множества и теория возможностей. Последние достижения: Сб. статей /Под ред. Ягера Р.Р. -М.: Радио и связь, 1986.-405 с.
64. Норенков И.П. Введение в автоматизированное проектирование технических устройств и систем.-М.: Высшая школа, 1986.-344 с.
65. Орловский С.А. Проблемы принятия решений при нечеткой исходной ин-формации.-М.: Наука, 1981.-206 с.
66. Осипов Г.С. Приобретение знаний интеллектуальными системами.-М.: Физматлит, 1997.-112 с.75.0суга С. Обработка знаний.-М.: Мир, 1989.-293 с. 76.0суга С. Приобретение знаний.-М.: Мир, 1990.-303 с.
67. Пиотровский Р.Г. Математическая лингвистика.-М.: Высшая школа, 1977383 с.
68. Поликарпов A.A., Бушуева О.В. Опыт построения контекстуального словаря и анализ его устройства //Теоретические и практические проблемы прикладной лингвистики.-М., 1988.-76 с.
69. Попов Э.Ю., Фридман Г.Р. Алгоритмические основы интеллектуальных роботов и искусственного интеллекта.-М.: Наука, 1976.-455 с.
70. Попов Э.В. Общение с ЭВМ на естественном языке.-М.: Наука, 1982.-360 с.
71. Представление знаний в системах искусственного интеллекта: Материалы семинара /О-во "Знание" РСФСР, Моск. дом науч.-техн. пропаганды им. Ф.Э. Дзержинского.-М.: МДНТП, 1980.-155 с.178
72. Представление знаний и моделирование процесса понимания: Сб. науч. тр. /АН СССР, Сиб. отделение, ВЦ; Под. ред. Нариньяни A.C. -Новосибирск: ВЦ СО АН СССР, 1980.-178 с.
73. Промышленные системы машинного перевода /Всесоюзный центр пер. науч.-техн. лит. и документации; Отв. ред. Нелюбин JI.JI. Вып 20.-М.: Наука, 1991.-103 с.
74. Ревунков Г.И. Базы и банки данных и знаний.-М.: Высш. шк., 1992.-367 с.
75. Решение проблемы комплексного оперативного анализа информации хранилищ данных //Коровкин С.Д., Левенец И.А., Ратманова И.Д. //СУБД.-№5-6-1997.-С.47-51.
76. Рихтер Д. Windows для профессионалов.-М.: Издательский отдел "Русская редакция" ТОО "Channel Trading Ltd", 1995.-720 с.
77. Ричарде М. Oracle: Энциклопедия пользователя.-К.: ДиаСофт, 1997.-832 с.
78. Розенталь Д. Э. Современный русский язык: Учеб. пособие.-М.: Айрис-пресс: ООО "Рольф", 1997.-443 с.
79. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах.-М.: Наука, 1989.-192 с.
80. Сепир Э. Язык: Введение в изучение речи.-М.: Прогресс, 1994.-126 с.
81. Системы управления базами данных и знаний: Справочное пособие /Под. ред. Наумова А.Н. -М.: Финансы и статистика, 1991.-320 с.
82. Скороходько Э.Ф. Семантические сети и автоматическая обработка текста-К.: Наук, думка, 1983.-218 с.
83. Скрэгг Г. Семантические сети как модели памяти /НЗJL-№ 12-1983.-е.228-271.
84. Соссюр Ф. Курс общей лингвистики.-Екатеринбург: Изд-во Уральского университета, 1999.-425 с.
85. Статические и динамические экспертные системы /Попов Э.В., Фоминых И. Б., Кисель Е. Б. -М.: Финансы и статистика, 1996.-125 с.
86. Субботин М.М. Гипертекст. Новая форма письменной коммуникации //Итоги науки и техники. Сер. Информатика Т.18.-М., 1994.-е. 11-53, c.l 11-117.
87. Теория выбора и принятия решений: Учеб. пособие.-М.: Наука, 1982.-327с.179
88. Уинстон П.Г. Искусственный интеллект.-М.: Мир, 1980.-519 с.
89. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика.-М.: Мир, 1992.-236 с.
90. Уэно X. Представление и использование знаний.-М.: Мир, 1989.-220 с.
91. Филлмор Ч. Основные проблемы лексической семантики //H3JI.-№ 121983.
92. Филлмор Ч. Фреймы и семантика понимания //НЗЛ.-№ 12.-1988.
93. Хаббард Дж. Автоматизированное проектирование баз данных.-М.: Мир, 1984.-293 с.
94. Хансен Г., Хансен Д. Базы данных. Разработка и управление.-М.: ЗАО "БИНОМ", 2000.-699 с.
95. Хант Э. Искусственный интеллект.-М.: Мир, 1978.-558 с.
96. Чепасова A.M., Чередниченко А.П. Современный русский язык Таблицы по грамматике.-М.: Высшая школа, 1999.-143 с.
97. Щавелёв Л.В. Способы аналитической обработки данных для поддержки принятия решений //СУБД.-№4-5.-1998.
98. Шапиро Д.И. Принятие решений в системах организационного управле-ния.-М.: Энергоатомиздат, 1983.-185 с.
99. Шенк Р. Обработка концептуальной информации.-М.: Энергия, 1980360 с.
100. Шеннон К. Работы по теории информации и кибернетике.-М.: Изд. иностранная литература, 1963.-829 с.
101. Яблонский С.В. Введение в дискретную математику-М.: Наука, 1987384 с.
102. Alexander Т., Bischoff J. Data Warehouse: Practical Advice from the Experts-Prentice Hall, 1997.-480 p.
103. Anderson O. Some interrelationships between constructivist models of learning and current neurobiological theory, with implications for science education //Journal of Research in Science Teaching.-№ 29.-1992.-p. 1037-1058.180
104. Bascones J., Novak J. Alternative instructional systems and the development of problem-solving skills in physics //European Journal of Science Education.-№ 7-1985.-p.253-261.
105. Chomsky N. Rules and representations-New York: Columbia Univerity Press, 1980.
106. Churchland P., Sejnowski T. The computational brain-Cambridge Mass.: MIT Press, 1992.
107. Edwards J., Fraser K. Concept maps as reflectors of conceptual understanding //Research in Science Education.-№ 13.-1983.-p. 19-26.
108. Fodor J. The modularity of mind.-Cambridge Mass.: MIT Press, 1983.
109. Fourth International Conferenceon Knowledge Discovery & Data Mining //New York 28 August, 1998.
110. Gold E. Language identification in the limit //Information and Control.-№ 10-1967.-p.447^474.
111. Gray P., Watson H. Decesion Support in the Data Warehouse-Prentice Hall, 1997.-350 p.
112. Hammound M., Noan M. Teoretical morpology: Approaches in modern linguistics-Orlando, 1988.
113. Hay D. Data Model Patterns: Conventions of Thought-Dorset House, 1996 .260 p.
114. Inmon B. Building the Data Warehouse.-Wiley, 1996.-400 p.
115. Keenan E. Relative clauses : Language typology and syntactic description. Vol.2.-Cambridge, 1985.
116. Kosko B. Neural Networks and Fuzzy Systems—N.Y: Prentice-Hall, 1991 — 186 p.
117. Lefebure R., Vincent G. Data Mining.-Eyrolles, 1998.
118. McNeill D., Freiberger P. Fuzzy Logic-Touchstone Rockefeller Center, 1993.
119. Minsky M. The Society of Mind.-N.Y: Simon and Schuster, 1986.-199 p.
120. Novak J. Clarify with concept maps //The Science Teacher.-№58-1991 -p.45^49.181
121. Novak J. Concept maps and Vee diagrams: Two metacognitive tools for science and mathematics education //Instructional Science.-№19.-1990-p.29-52.
122. Pinker S. Learnability and cognition: The acquisition of argument structure .Cambridge Mass.: MIT Press, 1989.
123. Poe V., Klauer P., Brobst S. Bulding a Data Warehouse for Decesion Support-Prentice Hall, 1997.-360 p.
124. Quinlan R. C4.5: Programs for Machine learning-Morgan Kaufmann Publishers, 1993.-165 p.
125. Schlagger B. Patterning of the barrel field in somatosensory cortex with implications for the specification of neocortical areas //Perspectives on Developmental Neurobiology.-№ 1 -1993.-p.81-91.
126. Text Mining Technology: Turning Information Into Knowledge White //IBM Software Solutions: Paper from IBM; editor Tkach D. February 17, 1998.
127. The Handbook of Artifical Intellegence /ed. by Barr A., Feigenbaum E.A. Vols.l-2.-N.Y, 1989.
128. Zade L.A. Fuzzy Sets //Information and Control.-№8.-1965 -p.338-53.
129. E-Mail: glimpse-request@cs.arizona.edu.140. http://www.htdig.org/.141. ftp://mch5.chem.msu.su/pub/russian/ispell/.142. http://www.think.com/html/products/products.htm.183
130. Кому принадлежит Россия. Черная металлургия 2001. Дмитрий Бутрин.
131. Из Казахстана в Москву на должность министра металлургии СССР переведен гендиректор Карагандинского меткомбината Олег Сосковец. С собой из Караганды он берет своего заместителя Владимира Лисина.
132. В июне 1991 года 400 предприятий металлургического комплекса СССР организуют ЗАО «Биржа металлов». Первоначальные вложения в нее стали стартовым капиталом для многих нынешних трейдерских структур.
133. Приватизация в отрасли начинается продажей 34,3% акций Салдинского металлургического завода (Свердловская область), самого старого предприятия отрасли.
134. В конце лета вице-премьер Олег Сосковец умудряется поссориться с реформаторами не только в РФ, но и в Казахстане — он лишается своего поста и возвращается в Москву.1. Черная металлургия -1993.
135. Зимой 1994 года вице-премьер Олег Сосковец достигает вершины своей карьеры. Накануне Нового года Борис Ельцин говорит, обращаясь к сотрудникам аппарата: «Сосковец — мой преемник». Тогда президент не шутил.1. Черная металлургия -1995.
136. РФФИ, выставляя в декабре на продажу госпакет НОСТА(12,7% акций), завершает первую в стране приватизацию металлургического предприятия.
137. Группа «Альфа», перекупив долги Кредобанка, пытается в июне ввести на «Запсибе» процедуру банкротства, пока неудачно — комбинат получает отсрочку.
138. В тот же день Инкомбанк при поддержке уволил главу Магнитки
139. Управление на КМК берет в руки новая команда во главе с Геннадием Юниным. Новый губернатор Кемеровской области Аман Тулеев намеревается объединить «Запсиб» и КМК.
140. Владимиром Потаниным), а пакет Т\У<л достается «Норникелю» и «Интерросу», то есть Потанину.14 августа Борис Кабак в последний раз отстранен от руководства «Запсибом». Его кресло занял Игорь Фролов из Кузбасспромбанка.
141. Некое всероссийское совещание в Нижнем Тагиле (в составе —депутаты Госдумы и академики РАН) рекомендует «Газпрому» и правительству подумать насчет создания на НТМК стана по производству труб большого диаметра — стана-5000.194
142. В октябре объявлено, что «Северсталь» приобрела 45% акций Ульяновского автозавода и почти все его долги. Начинается приход металлургов в автопромышленность.
143. Пока ни одна стратегия не дискредитировала себя. Пусть разными способами, но до 80% активов, имеющих отношение к металлургической отрасли, к середине 2001 года объединены в шесть-семь сверхкрупных альянсов-империй, которые и делают погоду на рынке.
144. На двух оставшихся предприятиях «девятки» — ОЭМК и «Мечеле» — процесс передела собственности завершился достаточно мирно. ОЭМК контролируется дочерней компанией «Газпрома» —
145. Газпроминвестхолдингом» ГИХ), а на «Мечеле» трейдинговая компания Glencore, реинкарнация знаменитой Mark Rich & Co., добровольно сдает власть Игорю Зюзину, хозяину угольной компании «Южный Кузбасс».
146. Немецкий Krupps от альянса с Glencore в России отказался, и с этого момента «Мечел» начали продавать.
147. Наверняка рано или поздно заинтересуется расширением своей империи и выходящий из комы «Российский кредит». Напомним, близкий к нему холдинг «Металлоинвест» до сих пор контролирует Михайловский и Стойленский205
148. С «Коксом» не договорились.
149. Окончательно выяснить, станет ли Игорь Зюзин новым владельцем «Мечела», удастся не ранее конца этого года. Но уже сейчас понятно: в стране достаточно претендентов на металлургический Олимп, чьи имена пока не известны широкой публике.
150. Интеррос» зря потратил деньги.
151. Летом 2001 года стало известно, что группа «Интеррос» фактически отказалась от претензий на контроль над НЛМК. Владимир Лисин, один из самых209известных менеджеров в российской металлургии, наконец смог стать владельцем НЛМК.
152. История о том, как поссорились Владимир Потанин и Владимир Лисин, выглядит запутанной и начинается еще в 1994 году (см. историю отрасли). Опишем вкратце лишь ту ее часть, которая имеет отношение к конфликту.
153. Председатель комиссии к.т.н., доц. каф. "Информатики"
154. Южно-Уральского государственногоуниверситета1. Конов В.А.1. Члены комиссии•) ,к.т.н., доц. каф. "ЭВМ" Южно-Уральского государственного университета Цытович П.Л.11начальникинформационно-аналитического отдела Службы пути ЮУЖД Плахотич Ю.И.
-
Похожие работы
- Вычисление показателей живучести информационных сетей на модели нестационарной гиперсети
- Исследование живучести телекоммуникационной сети на имитационной модели в условиях физических и информационных разрушающих воздействий
- Представление информации в базе знаний адаптивной экспертной системы и оценка ее аппроксимирующих свойств
- Разработка и исследование методов и алгоритмов для моделирования адаптивных веб-ресурсов на основе нечетких ультраграфов
- Нечетко-темпоральные модели структурного анализа и идентификации динамических процессов в слабо формализованных задачах принятия решений
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность