автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Автоматизация этимологического анализа

кандидата технических наук
Прохоров, Илья Викторович
город
Волгоград
год
2007
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Автоматизация этимологического анализа»

Автореферат диссертации по теме "Автоматизация этимологического анализа"

На правах рукописи

Прохоров Илья Викторович

□03063922

АВТОМАТИЗАЦИЯ ЭТИМОЛОГИЧЕСКОГО АНАЛИЗА

05 13 01 — «Системный анализ, управление и обработка информации»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Волгоград — 2007

о 7 И ЮН 2007

003063922

Работа выполнена на кафедре Системы автоматизированного проектирования и поискового конструирования Волгоградского государственного технического университета.

Научный руководитель доктор технических наук, профессор

Заболеева-Зотова Алла Викторовна

Официальные оппоненты доктор технических наук, профессор

Ковалев Сергей Михайлович,

кандидат технических наук, доцент Тарасов Валерий Борисович

Ведущая организация ГОУВПО «Волгоградский

государственный университет»

Защита состоится 29 июня 2007 г в 14 часов на заседании диссертационного совета Д 212 028 04 Волгоградского государственного технического университета по адресу 400131, г. Волгоград, пр Ленина 28

С диссертацией можно ознакомиться в библиотеке Волгоградского государственного технического университета

Автореферат разослан "¿5" мая 2007 г

Ученый секретарь ¿я .

диссертационного совета иЭ&тму Водопьянов В И

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Сохранение языка — важнейшая задача его носителей С этой целью ведутся постоянные исследования в области языкознания Но языки не статичны, процесс их развития продолжается и в настоящее время

В первую очередь, развитие языка сказывается на его лексике, что проявляется в виде образования новых слов средствами языка или путем заимствования Помимо этого, непрерывно идут процессы устаревания, опрощения, переразложения, усложнения и декореляции существующих слов

Базовым методом исследования лексических систем является этимологический анализ Он основывается на закономерных звуковых и морфологических изменениях слов в процессе эволюции языка, учшывает регулярные переходы одних типов лексического значения слова в другие

На сегодняшний день разработано множество методик этимологического анализа, но все они подразумевают кропотливый ручной труд, занимающий многие годы Примером тому служит десятилетие, затраченное Фасмером на составление этимологического словаря русского языка

В последние годы появился ряд программных систем позволивших автоматизировать выявление закономерных фонетических соответствий, изменений в лексическом, фонетическом, семантическом составе слов на разных этапах развития языка, однако самые объемные этапы — выяснение особенностей развития словообразовательной структуры слов и выяснение особенностей бытования слов остались неавтоматизированными Это связано с тем, что задача стоит на стыке нескольких областей лингвистики, математического моделирования и искусственного интеллекта При этом аппарата каждой из науки в отдельности недостаточно для автоматизации Однако, на современном этапе решение данной задачи представляется возможным на основе бурно развивающихся методов системного анализа

Таким образом, применение аппарата системного анализа для автоматизации методов выявления слов иноязычного происхождения является актуальной задачей

Цель и задачи исследования Целью работы является повышение эффективности моделей и методов этимологического анализа лексических систем естественных языков Для достижения цели необходимо решить следующие задачи

1 Анализ методик выявления слов иноязычного происхождения в лексических системах естественных языков,

2 Разработка математического аппарата, необходимого для автоматизации этимологического анализа,

3 Разработка нечетких критериев идентификации слов иноязычного

происхождения,

4 Разработка алгоритмического и программного обеспечения процесса

поиска слов иноязычного происхождения в лексических системах

естественных языков,

5 Анализ точности разработанных критериев,

6 Анализ эффективности разработанных алгоритмов

Объектом исследования является процесс этимологического анализа

Методы исследования Решение рассматриваемых в диссертации задач базируется на аппарате структурной и прикладной лингвистики, нечеткой математики, нечеткой логики, порождающих грамматик Хомского, системного анализа

Научная новизна состоит в следующем

— Разработан аппарат нечеткой литерной логики, позволяющий работать с лексическими системами естественных языков на основе семантики слов,

— Разработана модернизация аппарата нечетких порождающих грамматик, позволяющая строить нечеткие пространства цепочек над словарем за одну процедуру вывода,

— Разработана система нечетких критериев идентификации слов иноязычного происхождения,

— Формализована процедура выявления новых слов, их тематических групп, синонимов и переводов,

— Формализована методика выявления слов иноязычного происхождения

Практическая ценность работы заключается в следующем

— Полученные результаты формируют теоретическую и практическую базу для дальнейших лингвистических исследований,

— Аппарат нечеткой литерной логики может быть применен в экспертных системах, в системах семантического анализа текстов на естественном языке, в поисковых машинах, при анализе речи, и в других задачах

— Разработанная модификация аппарата нечетких порождающих грамматик может быть применена в поисковых машинах, при решении задач распознавания образов, при описании лексических систем и грамматик естественных языков, и в других задачах

— Формализованная процедура выявления новых слов может быть применена при создании автоматизированных словарей, новостных лент и ДР

— Разработанный алгоритм нечеткой кластеризации может применяться при создании автоматических рубрикаторов естественноязыковых ресурсов, анализе речи

— Система автоматизированного этимологического анализа позволяет существенно сократить время, требуемое на поиск слов иноязычного происхождения в лексических системах естественных языков

Достоверность полученных результатов основана на непротиворечивых исходных положениях и корректных выводах с подтверждением экспериментальной проверкой разработанных алгоритмов

Реализация результатов работы Теоретические результаты реализованы в виде программных модулей, позволяющих проверить работоспособность разработанных алгоритмов

Результаты работы внедрены в учебный процесс кафедры САПР И ПК Волгоградского государственного технического университета, а также в организации ОАО «Волгоградгоргаз», ООО КП «Комплекс», ООО «Геоцентр», ООО ПКЦ «Газстройсервис»

Положения выносимые на защиту

— Аппарат нечеткой литерной логики,

— Модернизация аппарата нечетких порождающих грамматик, позволяющая строить нечеткие пространства цепочек над словарем за одну процедуру вывода,

— Система нечетких критериев идентификации слов иноязычного происхождения,

— Алгоритмическое обеспечение процесса поиска новых слов,

—Нечеткие критерии выявления слов иноязычного происхождения,

— Алгоритмическое и программное обеспечение процесса поиска слов иноязычного происхождения в лексических системах естественных языков

Апробация работы Основные положения диссертационной работы докладывались на следующих конференциях Основные положения диссертации докладывались и обсуждались на следующих конференциях смотре-конкурсе научных, конструкторских и технологических работ студентов, ВолгГТУ, Волгоград, 10—13 мая 2004 г (работа заняла 3 место), УН-й всероссийской научной конференции с международным участием «Новые информационные технологии Разработка и аспекты применения», Таганрог, 25—26 ноября 2004 г, Ш-ей Всероссийской конференции «Инновационные технологии в обучении и производстве», Камышин, 20—22 апреля 2005 г (работа получила поощрительную

премию), смотре-конкурсе научных, конструкторских и технологических работ студентов, ВолгГТУ, Волгоград, 10—13 мая 2005 г (поощрительная премия), III-ем Международном научно-практическом семинаре «Интегрированные модели и мягкие вычисления в искусственном интеллекте», Коломна, 15—17 мая 2005 г, Ш-ей Всероссийской научно-пракгической конференции «Технологии Интернет на службе обществу», Саратов, 26—28 мая 2005 г, V-ой Международной научно-методической конференции «Дистанционное обучение — образовательная среда XXI века», Минск, 10—11 ноября 2005 г, Ш-ей Международной научно-технической конференции «Интеллектуальные системы (AIS' 06) Интеллектуальные САПР», Дивноморское, 3—10 сентября, 2006 г, IV-й международной научно-практической конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте», Коломна, 2830 мая 2007 г

По результатам исследований опубликовано 13 статей, из них 2 в журналах, рекомендованных ВАК

Структура и содержание диссертационной работы. Диссертационная работа состоит из введения, четырех глав с выводами, заключения, библиографического списка из наименований, и

приложений Общий объем работы страниц, в том числе ¿<-{ рисунков, f¡f) формул и 2. таблиц

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, дана общая характеристика работы

В первой главе приводятся обзор аналогов и результаты анализа методик выявления слов иноязычного происхождения в лексических системах естественных языков, признаков выявления неологизмов; алгоритмов кластеризации

На сегодняшний день не разработано ни одной программной системы автоматизации этимологического анализа, но существующие пакеты data-rmnmg позволяют частично автоматизировать процесс выявления закономерных фонетических соответствий и особенностей словообразовательной структуры слов К сожалению, наиболее трудоемкая часть этимологического анализа — выяснение особенностей бытования слов в языке проводится вручную

В целях автоматизации процесса поиска слов иноязычного происхождения был проведен анализ методик разработанных Н М Шанским, С В Ворониным, Л Л Касаткиным, в результате которого выявлены возможности распараллеливания вычислений и разработана модифицированная методика (представлена на рис 1), что позволяет существенно сократить время решения задачи

Рисунок 1 Модифицированная методика этимологического анализа

Для автоматизации первого шага модифицированной методики (см рис 1) проведен сравнительный анализ наиболее эффективных и распространенных алгоритмов кластеризации Результаты анализа приведены в таблице 1.

Таблица 1 Результаты сравнительного анализа алгоршмов кластеризации

Задание Работа с Уточнение Зависимость

Наименование числа неполными данных во от размерности

кластеров данными время раооты задачи

IVlIllv шжшя lier -

РАМ Ручное 4 Нет Поли

Jy Авт, agfcsisifsi t. Нес-г -

CLARA Авт 5 Нет Поли

шШШЙвЁз >Нет

DBScan Авт 7 Нет Лин

Hei

В целях автоматизации процесса поиска новых слов проведен анализ признаков выявления общеязыковых неологизмов предложенных О С Ахмановой, А В Калининым, С С Волковым и Е В Сенько, в результате которого выявлены наиболее значимые из них указание в словарях на новизну слова, контекстуальный комментарий, разъясняющий семантику лексемы, новое значение

На основе результатов исследования произведено уточнение цели работы и задач, которые необходимо решить для ее достижения

Во второй главе приводится описание математического аппарата нечеткой литерной логики и нечетких порождающих «ИУИЛИ» грамматик

Как показали последние исследования лексических систем современных языков, семантика слова определяется его морфологической структурой и буквенным (символьным — для иероглифических языков) составом [В Л Введенский, К А Тимофеев, и др ] На основе чего, автором разработана «нечеткая литерная логика» (НЛЛ) оперирующая понятиями, стоящими за лексикой естественных языков

Переменная нечеткой литерной логики характеризуется двойкой (и,Х), где 11 — многомерное позиционное множество символов, X — нечеткое многомерное подмножество множества и, представляющее собой нечеткие ограничения на значения переменных щ € 1} — степени значимости символов

В рамках НЛЛ к переменным могут применяться следующие операции Л — конъюнкция, V — дизъюнкция, - , — отрицание

При осуществлении логического вывода операции применяются слева направо, согласно приоритету 1)отрицание, 2)конъюнкция, 3)дизъюнкция

Конъюнкция в выражениях НЛЛ используется для отражения синонимии между понятиями, заданными переменными Входом операции является ж,,, — переменные НЛЛ, хранящие синонимичные понятия или объединения понятий Выходом операции является — переменная НЛЛ, описывающая объединенное понятие Выполнение операции конъюнкции осуществляется по следующему алгоритму

1) Совместить множества II1 £ и II} € так, чтобы совпало максимально возможное число символов,

2) Для каждой позиции к символа совмещенных множеств 1)1 и Уу

21) Если символы щ € 1!1 и и} 6 I/, равны, просуммировать соответствующие им степени принадлежности х1 6 Х1 и х; £ Х]; поместить результат суммирования и символ щ в к-ую позицию множеств е и е иъ,

2 2) Если символы «¡Е^и^е £/; не равны, поместить м1 и в & -ую позицию множества {/к £ ууя, а степени принадлежности х, 6 и е этих символов, в к-ую позицию множества 6

В ходе анализа и экспериментов было установлено, что подряд идущие символы переменной НЛЛ с максимальными степенями принадлежности составляют корень, если она получена в результате объединения операцией конъюнкции ряда однокоренных слов

Точность выделения корней данным методом прямопропорциональна проценту однокоренных слов в объединяемом ряде График зависимости приведен на рис 2

Из рис 2 видно, чго метод сильно чувствителен к проценту однокоренных слов В первую очередь это связано с высокой вероятностью совпадения аффиксов и суффиксов слов

объединяемого ряда, что может привести к повышению степени принадлежности входящих в них символов и ошибочному предположению о вхождении в корень

Дизъюнкция в выражениях НЛЛ используется для связывания разнородных синонимических групп при описании баз знаний Входом операции является нН) — переменные НЛЛ, хранящие разнородные понятия Выходом операции является \л/я — переменная НЛЛ,

1 0,9 0,8 0.7

ее 0,6

а0'5 О 0,4

х 0,3

од ОД о

20 40 «О

%однокоренных слов

Рисунок 2 График точности выделения корня

описывающая объединенное понятие Выполнение операции дизъюнкции осуществляется по следующему алгоритму

1) Поместить все значения мз и1 € ¡м^ ик Е чих,

2) Поместить все значения из Х1 Е \лг1 в Хк 6

3) Для каждого измерения множества 11 : 6 3 1) Создать в 11к 6 измерение йг/,

3 2) Поместить все значения из измерения с1) множества 1)} в измерение йя множества ик Е ц/й,

4) Для каждого измерения с^ множества Х} 6

4 1) Создать в Хк измерение

4 2) Поместить все значения из измерения й! множества Х; 6 \Н] в измерение с1я множества^ 6 Юв,

Отрицание в выражениях НЛЛ используется совместно с конъюнкцией для описания отношений антонимии между понятиями Входом операции является и^ — переменная НЛЛ, хранящая разнородные понятия Выходом операции является игд — переменная НЛЛ, описывающая объединенное понятие Выполнение операции отрицания осуществляется по следующему алгоритму

1) Изменить знак всех степеней принадлежности х1 6 X, на противоположный,

2) Поместить все элементы множества Х1 е ц/г в Хц е

3) Поместить все элементы множества 1}1 £ и/, в ик 6 м>д,

Важно отметить, что операция отрицания должна применяться к переменной содержащей вторичное понятие, которое должно быть исключено из основного понятийного поля

Вывод инициируется операцией сравнения «=», которая не является частью логической системы и имеет самый низший приоритет Перед ее выполнением осуществляется подготовка необходимых данных путем последовательного применения операций НЛЛ присутствующих в выражении Входом операции является , — переменные НЛЛ, хранящие сравниваемые понятия Выходом операции является х — степень соответствия понятий Выполнение операции дизъюнкции осуществляется по следующему алгоритму

1) Совместить множества ¿У1 Е и^ и £ так, чтобы совпало максимально возможное число символов,

2) Вычислить степень важности а позиций символов в пересечении,

3) Для каждой позиции к символов множеств и1 е и и} е входящих в пересечение

3 1) Вычислить Хъ — шах где и и и — /с -ая позиция

\ 1"11 К| ) '

символов в множествах II1 Е и и} € \я1 соответственно 3 2) Вычислить х = X + охк

Проведем пример сравнение синонимичных понятий

и (п, р, [е, у], [к, р], [р, о], (а, д], [с, л], [и, н], [в, ы], [ы, й], й), = {Х(1,1, [1, -1], [3, -1], [3, -1], [3, -1], [3,-1], [0,2], [0,2], [0,2],0/ (1)

([/(к, р, а, с, а, в, и, ц, а), Х{1,1,1,1,1,1,1,1,1)) Результат выполнения операции сравнения (1) — 0,98 Это значит, что сравниваемые понятия (красивый Л красный Л прекрасный Л уродливый) и (красавица) очень близки, но совпадают не полностью Нечеткие порождающие «И/ИЛИ» грамматики, описываются пятеркой б = (Т, N. Б, Я, М(Д)>, где Т — конечное непустое множество терминальных символов, N — конечное непустое множество нетерминальных символов Т п N = 0, Б — начальный символ грамматики (выделенный элемент нетерминального словаря); Д — конечное непустое множество продукций, М(/?) — функция, ставящая в соответствие каждому правилу из множества Я степень его принадлежности языку

Базовым типом правил нечетких порождающих «И/ИЛИ» грамматик является контекстно-зависимый аА@ —> ау@ , где а , р — цепочки символов словаря Т, у — цепочка из символов объединенного словаря Т и И, —»— разделитель

Для объединения правил продукций Я нечетких порождающих «И/ИЛИ» грамматик могут применяться операции «ИЛИ» и «И»

Логическое «ИЛИ» является стандартной операцией для объединения правил продукций При ее использовании, на каждой итерации вывода выбирается только одно из соединенных правил

Использование логического «И» для объединения правил продукций является новшеством, и принципиальным отличием нечетких порождающих «И/ИЛИ» грамматик от прочих При ее использовании, на очередной итерации вывода участвуют все объединенные правила, те происходит распараллеливание — инициация дополнительного процесса вывода по каждому из объединенных правил

При построении множества продукций Я нечетких порождающих «И/ИЛИ» грамматик необходимо соблюдать требования логическое «И» может объединять только правила с идентичными нетерминальными символами в левой части

Степень принадлежности каждого правила вывода языку находится в интервале ц = (0,1]

Вывод в нечетких порождающих «И/ИЛИ» грамматиках осуществляется по следующему алгоритму

1) Создать первый поток вывода Ра

2) Поместить в Р1 начальный нетерминальный символ 5,

3) Для каждого незавершенного потока вывода Р1

3 1) Если Pl п N = 0, остановить процесс Р1 с пометкой «вывод успешно завершен»,

3 2) Если |Р,|>тах(У) , остановить процесс Р1 с пометкой

«бесперспективная ветка вывода», 3 3) Найти в потоке PL крайний левый нетерминальный символ 3 4) Найти в множестве R продукции RN, левые части которых содержат

Nl(P, ) и соответствующий контекст применения, 3 5) Если = 0 , остановить процесс Pt с пометкой «вывод завершен с ошибкой»,

3 6) Найти в Rn оптимальную продукцию для вывода RP, 3 7) Если RP Ф 0, совершить вывод в потоке Р, по RP и вычислить степень принадлежности цепочки М(Р,) языку как произведение степеней принадлежности всех правил участвовавших в выводе, 3 8) Если существуют продукции объединенные операцией «И» с RP, создать дополнительный поток Р; для каждой из них, и осуществить вывод,

3 9) Если RP = 0, остановить процесс PL с пометкой «вывод завершен с ошибкой»,

4) Если число незавершенных потоков вывода Wn(Pj > 0, перейти к шагу 3,

5) Для всех цепочек yL Е Y, совпадающих со значениями потоков Р(, завершенных с пометкой «вывод успешно завершен», М(у,) = M(PJ Для прочих цепочек yl е К, M(yJ = О

Рассмотрим пример описания грамматики G Т = (а, Ь, с) , N = (А, В, С} , 5 = А , R = {Аг aSlSi ЬЬС&В2 —> е|Сг —» сВ> , М(Я) = (Лл 09,В1 1,Вг 08,Са 06)

На основе описанной грамматики С легко проверить принадлежность некоторой группы цепочек языку 1(C)

Пусть дано множество цепочек Y = (a, abbcbbb, abb) Для определения степени принадлежности осуществим вывод по правилам продукций R грамматики G

0 72

—> а

0 39

0 9 0 54 049 —Znhhrhhh

S->aB0 9 0 54 ^аЬЬсЬЬС^аЬЬсЬЬЬВ^эаЬЬсЬ1зЬ ,(2) -*аЬЬС—*аЪЪсВ abbcbbbbbC

0 43

—>abbc

i

где -» — степень принадлежности цепочки языку

Как видно из (2), вывод завершен, несмотря на то, что в сентенциальной форме одной из параллелей остался нераскрытый нетерминальный символ "С' Это связано с тем, что параллель считается

бесперспективной, поскольку число присутствующих в ней терминальных символов превышает длины всех цепочек множества X

В результате вывода получены следующие степени принадлежности Y = {а072, abbcbbb0 39, abb0)

В третьей главе приводится описание системы автоматизированного этимологического анализа

Формально система может быть представлена как пятерка V = (Z, С, Е, О, W) , где L — множество исследуемых языков, С — кластеризатор, Е — этимологический анализатор, О — обходящий робот, W — web-сервис этимологического словаря

На рисунке 3 приведена структура системы, и приняты следующие обозначения LB — множество описаний естественных языков, Su — множество адресов сайтов, Fu — множество файлов страниц сайтов, QB — запросы пользователей к этимологическому словарю, QtJ — запросы к сайтам, адреса которых содержатся в множестве Sv , RE — справки этимологического словаря, выдаваемые по запросам пользователей Qe

В ходе

функционирования системы параллельно решаются три задачи

1)поиск слов иноязычного происхождения в лексических системах языков /t е Z, 2)поиск в сети Интернет новых слов принадлежащих языкам ij е Е , 3)предоставление пользователям сети интернет

этимологических справок Рассмотрим подробно каждую из них

Решение задачи поиска слов иноязычного происхождения основано на модифицированной методике этимологического анализа За счет выявленных возможностей распараллеливания вычислений процесс поиска разделен на два этапа 1) Выявление закономерных фонетических соответствий и систематизация словообразовательной структуры слов,

2) Выяснение особенностей бытования слов в языке

За выполнение каждого из них отвечает выделенный модуль системы Кластеризатор С выявляет закономерные фонетические соответствия и словообразовательную структуру слов, а этимологический анализатор Е выясняет особенности бытования слов в языке

Рисунок 3 Структура системы автоматизирование» о этимолен ического анализа

Поиск слов иноязычного происхождения инициируется после появления на входе системы множества описаний естественных языков Ъв и занесения его в множество исследуемых языков I, а также в случае внесения в словари новых слов

Процесс выявления заимствований в языке 6 Г представляет собой итерации последовательного функционирования модулей С и Е , продолжающиеся до тех пор, пока в словаре % 6 присутствует хотя бы одно, вероятно заимствованное слово Взаимодействие модулей С и Е осуществляется через I

Для анализа каждого языка I, € Г используются отельные копии модулей С и Е

Кластеризатор С выявляет закономерные фонетические соответствия и словообразовательную структуру слов, за счет кластеризации лексической системы исследуемого языка по следующим признакам буквенный состав слов ра , звуковой состав слов (транскрипции) рт, морфологический состав слов рт , источник заимствования , путь заимствования рд, принадлежность к тематической группе рд.

Система признаков кластеризации сформирована на основе базовых методик выяснения закономерных фонетических соответствий и особенностей развития

Анализ наиболее

эффективных алгоритмов кластеризации показал, что ни один из них не позволяет

словообразовательной

структуры слов

(V», бЖ)[г<>,)] 054 еЮМ™,)}

I

уточнять лексических

разбиение систем при

поступлении новых данных Поэтому автором разработан новый алгоритм кластеризации на основе критерия оценки качества разбиения СЬОРЕ Блок-схема разработанного алгоритма представлена на рис 4

Нет

Поместить каждое слово м> &1¥ в новый, существующим или оставить в текущем кластереС1 еСу,стем чтобы }ЫС,1 ,г) = тах

Как видно из описания,

алгоритм результаты

использует

результаты предыдущей

работы при очередном запуске Данная особенность позволяет с минимальными временными

Рисунок 4 Блок-схема алгоритма клас геризации

затратами уточнять разбиение в случае появление новой информации (слов и/или этимологических пометок)

Этимологический анализатор Е ищет слова исследуемого языка, заимствованные из других языков ^ 6 Ь следующими базовыми способами лексико-словообразовательное калькирование, лексико-словообразовательное полукалькирование, семантическое калькирование, транскрипция, транслитерация

На основе признаков заимствований, произведенных по перечисленным способам, автором разработана следующая система нечетких критериев

(и'г,» — степень родства слов цг^ е УУ^ и ¡м^ е ¡/У^ по лексико-словообразовательному калькированию Значение критерия вычисляется по алгоритму 1) Повести морфологический разбор р1 = т(и>,) и р} — т(н}) слов 2) Найти все варианты переводов Т(р;) частей р],

3) Провести нечеткое сравнение нормализованных переводов или транслитераций всех частей N ^ с однотипными нормализованными частями ДГ(рг) , на основе НЛЛ, 4) Если в результате сравнения проведенного на шаге 3 обнаружен ряд переводов N образующих

слово \у1 с средней точностью / > 0,6 , Д/ (и^, и^) = X в противном случае ц^ = 0

Мл и^) — степень родства слов «'¡1 £ ^ и у/^еТ/У^ по лексико-словообразовательному полукалькированию Значение

вычисляется по алгоритму 1) Повести морфологический разбор р1 =

т(]л>1() и р} = слов w^l и , 2) Найти все варианты переводов

Г(р;) частей р} , 3) Провести нечеткое сравнение нормализованных переводов всех частей N с однотипными нормализованными

частями , на основе НЛЛ, 4) Если в результате сравнения,

проведенного на шаге 3, обнаружен ряд переводов образующих слово и^ с минимальной точностью более 0,6, или максимальная точность всех соответствий менее 0,6 , то (и^, и^) = 0 , 5) Если в результате

сравнения, проведенного на шаге 3, с точностью х > 0,6 возможно составить только часть слова м/г, а оставшаяся часть является суффиксами или аффиксами исследуемого языка с точностью более 0,6 , то

Иь (м/^, и^) = х, в противном случае (ю^, м^) = 0

/"¡г — степень родства слов н^ е И/^ и ^ £ Iпо

семантическому калькированию Значение вычисляется по алгоритму

1) Поместить все омонимы слов 1и ив множества 0№; и 0Ш1 соответственно, 2) Если |ои/( | = 1 и/или |оШ( | = 1, то ¡г$ (м^, = 0 , 3)Если | > 1 и |ои<( | > 1, то 3 1)Найги все синонимы для слов W| 6 01У( , 3 2) Найти все синонимы для слов \л/} е От1 , 3 3) Провести

нечеткое сравнения синонимов 51 и переводов синонимов Г(5;), на основе НЛЛ, 3 4) Если в результате сравнения синонимы хотя бы двух пар IV; и

совпали с точностью х > 0,6, то (и^.и^) = х, в противном случае Лг = 0

Ч^Щ^) — степень родства слов и и/^ е УУ^ по

транслитерации Значение вычисляется по алгоритму 1) Произвести транслитерацию

t(wl]J слова ,

2) Произвести нечеткое сравнение

и , на

основе НЛЛ, 3) Если в результате

сравнения и

получено совпадение с

точностью х > 0,6, то

¡Ч^Ь'Щ) =Х . в противном случае

^ (щ^) = о

степень родства слов м^ е И^ и е Ш1] по транскрипции Значение вычисляется по алгоритму

1) Построить транскрипции т(и/г[)

и слов и^ и

, 2) Провести

Рисунок 5 Блок-схема алгоритма этимологического анализа

нечеткое сравнение т(и^) и г (и7;,), на основе НЛП, 3) Если в результате сравнения т(и/г[) и г (и^) совпали с точностью х > 0,6 и значения слов и/г, и мг^ идентичны, то цх (и^и^) = ^ , в противном случае цт (и^, и/г;) = 0

Как показал анализ, описанная система критериев является полной и непротиворечивой На ее основе автором разработан алгоритм этимологического анализа (рис 5), на основе которого функционирует модуль Б

Поиск в сети Интернет новых слов — второстепенная задача системы автоматизированного этимологического анализа, введенная для подержания множества Ъ в актуальном состоянии Ее решение обеспечивается итерационной работой модуля обходящего робота О

9

/ /

®С

>

Посла 1ь запросы Q^ на выдачу всех ыраниц сай 1а по адресу зи

Кон гент анализ полученных страниц сайтов

Определить язык, к которому_

принадлежит каждое слово

Выделить додмножес! во Н множесиза \УЬ ,

_такое что

У>у, 6 И \у (\У = гу,)у(г(ц' ) = гО,))

Да

Занести все словау\, ,для которых верно утверждение в множество N Нет

Занеии все словам, &Н в множен во дг

6

е % занесенных в N на данной ш грации

, М>, Нет ^'-'присутствует

на(100-^(5^ ))% сайтов-" ;§матической группу

Да

Занести ^ в язык / в тематическую группу)

X

Выделить подмножество множества мкое, чю Ун-, е№^К(-№,)сК(уу,)

Пометить и\ еЖ,

как синонимы ц>

Поме(ить вое слова и} других языков, имеющие аналогичные синонимы, как переводы М?/

X

/1

7

Рисунок 6 Блок-схема алгоритма выявления общеязыковыч неологизмов

Модуль 0 функционирует на Основе разработанного автором алгоритма (см. рис. 6), идентифицирующего общеязыковые неологизмы двух типов: лексические; сем а in ическне.

Как видно из описания, алгоритм позволяет решить три основные проблемы, возникающие при автоматизации поиска общеязыковых неологизмов: отсечение шумов, создаваемых лексическими ошибками и опечатками; отсечение авторских неологизмов; определение семантики слова.

Отсечение авторских неолог измов и слов с лексическими ошибками м опечатками осуществляется за счет введения понятия степени доверия к содержимому сайта и требованию к распространенному применению слов. Определение семантики слова осуществляется на основе масок контекста применении.

Предоставление справок этимологического словаря осуществляет и'сЬ-серш.'е ИЛ который на основе запросов пользователей 0Е генерирует файлы в формате XML содержащие сведенья о словах, запрошенные пользователем.

Ii четвертой главе приводятся результаты анализа разработанных кри териев и алгоритмов.

В таблице 2 приведены результаты оценки качества разработанных критериев на выборке в 100000 слов русского языка, из них 60000 зии м ста г>ван н ы х.

___________ Таблица 2. Результаты сравни iс.ц-ити анализа алгирщлн)»

Крыт£рнЯ Точнсчп. выявления Вероятность ложные

воагшия_ срардтьтанчн

J]евхико-с.пodood раэо вате п ьное (} 43 (0 913 о 937,

калькирование

олоз йдаэй

Летсихо-словообрмоы.та.ьн« полу- ^ ^ о.ООЗ (0.ГОМЖМ8О9)

калькирование

Семачт!(ческск к*яЫсиррааш«; <Ш (0,947,0.9731 0.001 (О.ШПЬ. илИШИ)'

Транслитерация <Ш (0.968.0.992) 0.0009 (0.00082,0.00098)

Транскрипции_0.99 ¡0.984. 0.99.6) 0.0006 (0.00057, 0,00063)

В результате оценки эффективности разработанных алгоритмов получены следующие результаты:

Алгоритм выявления 061 не языковых неологизмов тестировался на массиве в 500 текстов, содержащих 875946 слов, в том числе 240 новых слов и ! 00000 слов содержащих лексические ошибки и опечатки. В результате тестирования получены следующие данные: выявлено новых: 100%; вероятность ложных срабатываний: 0.00018 (0.00013, 0,00023); вероятность корректного определения контекста: 0.92 (0.904, 0,936); вероятность корректного определения синонимов: 0.93 (0,916, 0.944): вероятность корректного определения перевода: 0.99 (0.982. 0,998): зависимость 01 размерности задачи: полиномиальная.

— Алгоритм кластеризации тестировался на задаче о грибах и выборке из 100000 слов русского языка В результате тестирования получены следующие данные число грязных кластеров после первой итерации на задаче о грибах 1, общее число итераций на задаче о грибах 3, среднее число итераций первой кластеризации словаря 4, среднее число итераций уточняющей кластеризации словаря 2, зависимость от размерности задачи линейная

— Алгоритм этимологического анализа тестировался на выборке в 100000 слов русского языка, из них 60000 заимствованных В результате тестирования получены следующие данные выявлено заимствованных слов в тестовом словаре 0 957 (0 948, 0 966), вероятность ложных срабатываний 0,0018 (0 0014, 0 0022), зависимость от размерности задачи полиномиальная

На основе проведенных экспериментов и анализа алгоритмов можно сделать вывод о том, что разработанная система позволяет с высокой скоростью и точностью выявлять слова иноязычного происхождения

В заключении приведены выводы и основные результаты работы В приложении приведены материалы о внедрении результатов диссертационной работы, а также материалы справочного и иллюстративного характера

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

— Разработан аппарат нечеткой литерной логики (НЛЛ), оперирующий семантикой слов на основе их символьного представления, что позволяет вычислять степень близости слов без словарей,

— Разработан аппарат нечетких порождающих «И/ИЛИ» грамматик, отличающийся от прочих возможностью параллельного вывода нескольких нечетких цепочек над словарем,

— Разработана система нечетких критериев, позволяющая с высокой точностью выявлять слова иноязычного происхождения в лексических системах естественных языков,

— Разработано алгоритмическое и программное обеспечение автоматизированного этимологического анализа, позволяющее существенно сократить время выявления заимствованных слов,

— Разработан алгоритм идентификации неологизмов, позволяющий с высокой точностью выявлять слова принадлежащие языку, но отсутствующие в словаре

— В ходе анализа и экспериментов подтверждена эффективность разработанных алгоритмов

— Алгоритмическое и программное обеспечение внедрено в организациях г Волгограда

ОПУБЛИКОВАННЫЕ РАБОТЫ

1 Прохоров ИВ Эволюционное моделирование арифметики натуральных чисел / ИВ Прохоров, А В, Заболеева-Зотова //Новые информационные технологии Разработка и аспекты применения тр VII всероссийская научная конференция с международным участием, 25—26 ноября 2004 г / Таганрог гос Радиотехнический университет и др — Таганрог, 2004 — С 226—228

2 Прохоров, ИВ Автоматический синтез нейронной сети оптимально подходящей для аппроксимации функций представленных обучающей выборкой данных/ ИВ Прохоров // Инновационные технологии в обучении и производстве сб научн трудов Ш-ей Всероссийской конференции —Камышин, 2005

3 Прохоров, И В Автоматический синтез нейронной сети оптимально подходящей для аппроксимации функций представленных обучающей выборкой данных/ И В Прохоров // Интегрированные модели и мягкие вычисления в искусственном интеллекте сб научн трудов Ш-его международного научно-практического семинара —Коломна, 2005

4 Прохоров И В Модель автоматического построения архитектуры нейронной сети по обучающей выборке данных/ И В Прохоров, А В Заболеева-Зотова// Технологии Интернет на службе обществу сб научн трудов Всероссийской научно-практической конференции —Саратов, 2005

5 Прохоров И В Автоматический синтез нейронной сети оптимально подходящей для аппроксимации функций представленных обучающей выборкой данных /ИВ Прохоров, А В Заболеева-Зотова // Интеллектуальные системы (AIS'05) Интеллектуальные САПР (CAD-2005) тр Международная научно-техническая конференция, Дивноморское, 3-10 сентября 2005г/ Таганрог гос Радиотехнический университет и др - M, 2005 —Т 1 — С411-413

6 Прохоров И В Синтез гибридных архитектур нейронных сетей //сборник трудов V Международной научно-методической конференции «Дистанционное обучение - образовательная среда XXI века», — Минск, 2005 - С 272-274

7 Прохоров ИВ Автоматизация процесса построения архитектуры гибридной нейронной сети с последующим ее обучением / И В Прохоров, А В Заболеева-Зотова // Педагогическая информатика — 2005 —№5 (спец выпуск)—С 167-173

8 Прохоров И В Минимизация архитектур гибридных нейронных сетей // В сб трудов Научной сессии МИФИ-2006, — М, 2006, ТЗ,—С180-181

9 Прохоров ИВ Автоматический этимологический словарь / ИВ Прохоров, А В Заболеева-Зотова // Интеллектуальные системы

(AIS'06) Интеллектуальные САПР (CAD-2006) тр Международная научно-техническая конференция, Дивноморское, 3-10 сентября 2006г/ Таганрог гос Радиотехнический университет и др —M Физматлит, 2006 —Т2 —С544-545

10 Прохоров И В Проблемы доступности сайтов для людей с ограничениями по зрению /ИВ Прохоров, А В Заболеева-Зотова // Известия Волгоградского государственного технического университета межвуз сб науч ст № 2(28)/ ВолгГТУ — Волгоград, 2007 — С 66-69

11 Прохоров ИВ Критерии выявления слов иноязычного происхождения / Прохоров И В, Заболеева-Зотова А В // Информационные технологии в науке, образовании, телекоммуникации и бизнесе (IT + S&E~07) Тез докл XXXIV междунар конф , 20-30 мая 2007 г / Научный Совет РАН «Супер-ЭВМ» и др — Ялта-Гурзуф, 2007

12 Прохоров ИВ Модель автоматического этимологического анализа // Интегрированные модели и мягкие вычисления в искусственном интеллекте сб научн трудов IV-й международной научно-практической конференции —Коломна, 2007

Подписано в печать 2Ъ 0К 2007 г Заказ № Тираж 100 экз Печ л 1,0 Формат 60 х 84 1/16 Бумага офсетная Печать офсетная

Типография РПК «Политехник» Волгоградского государственного технического университета 400131, г Волгоград, ул Советская, 35

Оглавление автор диссертации — кандидата технических наук Прохоров, Илья Викторович

Введение.

1 Состояние вопроса и постановка задачи исследования.

1.1 Анализ методик этимологического анализа.

1.2 Анализ существующих алгоритмов кластеризации.

1.3 Признаки выявления общеязыковых неологизмов.

1.4 Исследование методологии Контент-анализа.

1.5 Анализ логических систем.

1.6 Выводы. Постановка задачи исследования.

2 Математический аппарат.

2.1 Нечеткая литерная логика.

2.1.1 Интерпретация операции конъюнкции.

2.1.2 Интерпретация операции дизъюнкции.

2.1.3 Интерпретация операции отрицания.

2.1.4 Процедура вывода HJ1J1.

2.2 Нечеткая порождающая «И/ИЛИ» грамматика.

2.2.1 Определение грамматики «И/ИЛИ» грамматики.

2.2.2 Процедура вывода «И/ИЛИ» грамматик.

2.3 Выводы.

3 Система автоматизированного этимологического анализа.

3.1 Входные данные системы.

3.1.1 Определение множества описаний естественных языков.

3.1.2 Определение множества адресов сайтов.

3.1.3 Определение множества файлов страниц сайтов.

3.1.4 Определение множества запросов пользователей к этимологическому словарю.

3.2 Выходные данные.

3.2.1 Определение множества запросов к сайтам.

3.2.2 Определение множества справок этимологического словаря.

3.3 Описание задачи поиска слов иноязычного происхождения.

3.3.1 Определение множества исследуемых языков.

3.3.2 Описание модуля кластеризации.

3.3.3 Описание модуля этимологического анализатора.

3.4 Описание задачи поиска в сети Интернет новых слов.

3.5 Описание задачи предоставления этимологических справок.

3.6 Выводы.

4 Результаты испытаний системы автоматизированного этимологического анализа.

4.1 Оценка точности разработанных критериев.

4.2 Анализ эффективности разработанных алгоритмов.

4.2.1 Анализ алгоритма кластеризации.

4.2.2 Анализ алгоритма этимологического анализа.

4.2.3 Анализ алгоритма выявления общеязыковых неологизмов.

4.3 Выводы.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Прохоров, Илья Викторович

Актуальность темы исследования. Сохранение языка — важнейшая задача его носителей. С этой целью ведутся постоянные исследования в области языкознания. Но языки не статичны, процесс их развития продолжается и в настоящее время.

В первую очередь, развитие языка сказывается на его лексике, что проявляется в виде образования новых слов средствами языка или путем заимствования. Помимо этого, непрерывно идут процессы устаревания, опрощения, переразложения, усложнения и декореляции существующих слов.

Базовым методом исследования лексических систем является этимологический анализ. Он основывается на закономерных звуковых и морфологических изменениях слов в процессе эволюции языка, учитывает регулярные переходы одних типов лексического значения слова в другие.

На сегодняшний день разработано множество методик этимологического анализа, но все они подразумевают кропотливый ручной труд, занимающий многие годы. Примером тому служит десятилетие, затраченное Фасмером на составление этимологического словаря русского языка.

В последние годы появился ряд программных систем позволивших автоматизировать выявление закономерных фонетических соответствий, изменений в лексическом, фонетическом, семантическом составе слов на разных этапах развития языка, однако самые объемные этапы — выяснение особенностей развития словообразовательной структуры слов и выяснение особенностей бытования слов остались неавтоматизированными. Это связано с тем, что задача стоит на стыке нескольких областей: лингвистики, математического моделирования и искусственного интеллекта. При этом аппарата каждой науки в отдельности недостаточно для автоматизации. Однако, на современном этапе решение данной задачи представляется возможным на основе бурно развивающихся методов системного анализа.

Таким образом, применение аппарата системного анализа для автоматизации методов выявления слов иноязычного происхождения является актуальной задачей.

Цель и задачи исследования. Целью работы является повышение эффективности моделей и методов этимологического анализа лексических систем естественных языков. Для достижения цели необходимо решить следующие задачи:

1. Анализ методик выявления слов иноязычного происхождения в лексических системах естественных языков;

2. Разработка математического аппарата, необходимого для автоматизации этимологического анализа;

3. Разработка нечетких критериев идентификации слов иноязычного происхождения;

4. Разработка алгоритмического и программного обеспечения процесса поиска слов иноязычного происхождения в лексических системах естественных языков;

5. Анализ точности разработанных критериев;

6. Анализ эффективности разработанных алгоритмов.

Объектом исследования является процесс этимологического анализа.

Методы исследования. Решение рассматриваемых в диссертации задач базируется на аппарате структурной и прикладной лингвистики, нечеткой математики, нечеткой логики, порождающих грамматик Хомского, системного анализа.

Научная новизна состоит в следующем:

Разработан аппарат нечеткой литерной логики, позволяющий работать с лексическими системами естественных языков на основе семантики слов;

Разработана модернизация аппарата нечетких порождающих грамматик, позволяющая строить нечеткие пространства цепочек над словарем за одну процедуру вывода;

Разработана система нечетких критериев идентификации слов иноязычного происхождения;

Формализована процедура выявления новых слов, их тематических групп, синонимов и переводов;

Формализована методика выявления слов иноязычного происхождения.

Практическая ценность работы заключается в следующем:

Полученные результаты формируют теоретическую и практическую базу для дальнейших лингвистических исследований;

Аппарат нечеткой литерной логики может быть применен: в экспертных системах; в системах семантического анализа текстов на естественном языке; в поисковых машинах; при анализе речи, и в других задачах.

Разработанная модификация аппарата нечетких порождающих грамматик может быть применена: в поисковых машинах; при решении задач распознавания образов; при описании лексических систем и грамматик естественных языков, и в других задачах.

Формализованная процедура выявления новых слов может быть применена при создании автоматизированных словарей, новостных лент и др.

Разработанный алгоритм нечеткой кластеризации может применяться при создании автоматических рубрикаторов естественно-языковых ресурсов, анализе речи. J

Система автоматизированного этимологического анализа позволяет существенно сократить время, требуемое на поиск слов иноязычного происхождения в лексических системах естественных языков.

Достоверность полученных результатов основана на непротиворечивых исходных положениях и корректных выводах с подтверждением экспериментальной проверкой разработанных алгоритмов.

Реализация результатов работы. Теоретические результаты реализованы в виде программных модулей, позволяющих проверить работоспособность разработанных алгоритмов.

Результаты работы внедрены в учебный процесс кафедры САПР И ПК Волгоградского государственного технического университета, а также в организации: ОАО «Волгоградгоргаз»; ООО КП «Комплекс»; ООО «Геоцентр»; ООО ПКЦ «Газстройсервис»; ООО «ПРАЙМ».

Положения выносимые на защиту.

Аппарат нечеткой литерной логики;

Модернизация аппарата нечетких порождающих грамматик, позволяющая строить нечеткие пространства цепочек над словарем за одну процедуру вывода;

Система нечетких критериев идентификации слов иноязычного происхождения;

Алгоритмическое обеспечение процесса поиска новых слов;

Нечеткие критерии выявления слов иноязычного происхождения;

Алгоритмическое и программное обеспечение процесса поиска слов иноязычного происхождения в лексических системах естественных языков.

Апробация работы. Основные положения диссертационной работы докладывались на следующих конференциях: смотре-конкурсе научных, конструкторских и технологических работ студентов, ВолгГТУ, Волгоград, 10—13 мая 2004 г. (работа заняла 3 место);

VII-й всероссийской научной конференции с международным участием «Новые информационные технологии. Разработка и аспекты применения», Таганрог, 25—26 ноября 2004 г.;

III-ей Всероссийской конференции «Инновационные технологии в обучении и производстве», Камышин, 20—22 апреля 2005 г. (работа получила поощрительную премию); смотре-конкурсе научных, конструкторских и технологических работ студентов, ВолгГТУ, Волгоград, 10—13 мая 2005 г. (поощрительная премия);

Ш-ем Международном научно-практическом семинаре «Интегрированные модели и мягкие вычисления в искусственном интеллекте», Коломна, 15—17 мая 2005 г.;

III-ей Всероссийской научно-практической конференции «Технологии Интернет на службе обществу», Саратов, 26—28 мая 2005 г.;

V-ой Международной научно-методической конференции «Дистанционное обучение — образовательная среда XXI века», Минск, 10—11 ноября 2005 г.;

III-ей Международной научно-технической конференции «Интеллектуальные системы (AIS' 06). Интеллектуальные САПР», Дивноморское, 3—10 сентября, 2006 г.;

IV-й международной научно-практической конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте», Коломна, 28-30 мая 2007 г.

По результатам исследований опубликовано 12 статей, из них 2 в журналах, рекомендованных ВАК.

Структура и содержание диссертационной работы. Диссертационная работа состоит из введения, четырех глав с выводами, заключения, библиографического списка из 259 наименований, и приложений. Общий объем работы 151 страница, в том числе 32 рисунка, 82 формулы и 6 таблиц.

Заключение диссертация на тему "Автоматизация этимологического анализа"

4.3 Выводы

На основе экспериментов показана точность разработанных критериев выявления слов иноязычного происхождения в лексических системах естественных языков.

На основе анализа быстродействия и проведенных экспериментов показана эффективность разработанных алгоритмов.

Заключение

В ходе работы над диссертацией были получены следующие результаты:

Разработан аппарат нечеткой литерной логики (HJIJI), оперирующий семантикой слов на основе их символьного представления, что позволяет вычислять степень близости слов без словарей;

Разработан аппарат нечетких порождающих «И/ИЛИ» грамматик, отличающийся от прочих возможностью параллельного вывода нескольких нечетких цепочек над словарем;

Разработана система нечетких критериев, позволяющая с высокой точностью выявлять слова иноязычного происхождения в лексических системах естественных языков;

Разработано алгоритмическое и программное обеспечение автоматизированного этимологического анализа, позволяющее существенно сократить время выявления заимствованных слов;

Разработан алгоритм идентификации неологизмов, позволяющий с высокой точностью выявлять слова принадлежащие языку, но отсутствующие в словаре.

В ходе анализа и экспериментов подтверждена эффективность разработанных алгоритмов.

Алгоритмическое и программное обеспечение внедрено в организациях г. Волгограда (акты внедрения см. в. приложении А).

Библиография Прохоров, Илья Викторович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Лексикология современного немецкого языка : (Тексты лекций и практ. задания) / Гусева А. Е. ; Моск. пед. ун-т, Каф. герм, филологии, 108 е., М. МПУ 1998.

2. Современный русский язык. Изд.2.Розенталь Д.Э., Голуб И.Б., Теленкова М.А. 1995. Твердый переплет. 560 с.

3. Труды по этимологии: Слово. История. Культура. Т. 1.Трубачев О.Н. 2004. Твердый переплет. 800 с.

4. Y. Zhao and G. Karypis, Empirical and Theoretical Comparison of Selected Criterion Functions for Document Clustering. Machine Learning. Vol. 55, pp. 311—331, 2004.

5. A. Kolcz, A. Chowdhury, J. Alspector, Improved Robustness of Signature-Based Near-Replica Detection via Lexicon Randomization, in Proc. KDD'04, Seattle, 2004.

6. Sole R.V., Murtra B.C., Valverde S., Language Networks: their structure, function and evolution. — Working Paper №05—12—042 of Santa Fe Institute, 2005.

7. Gasevic D., Djuric D., Devedzic V. Model Driven Architecture and Ontology Development, Springer, 2006.

8. Li Jie, Gao Xinbo and Jiao Licheng, A fuzzy CLOPE algorithm and its optimal parameter choice. Springer, Volume 23, Number 3, May 2006, pp. 384-388.

9. Вагин В.II., Головина ЕЛО., Загорянская А.А. Достоверный и правдоподобный вывод в интеллектуальных системах, 2004.

10. Ю.Колмогоров А.Н., Драгалин А.Г. математическая логика. —М.: Едиториал УРСС, 2004.

11. Финн В.К. Об интеллектуальном анализе данных /Л1овости искусственного интеллекта №3, 2004.

12. Веденский В. Л. Математические закономерности словообразования в европейских языках // Нейроинформатика 2005, VII Всероссийская научно-тнхническая конференция. Сборник научных трудов, 2005, часть 2, —с. 263— 270.

13. П.Рыжов А.П. Модели поиска информации в нечеткой среде//М.: Издательство Центра прикладных исследований при механико-математическом факультете МГУ, 2005.

14. Коршаков А.В. Процедура построения пространства понятий как часть системы машинного перевода // Нейроинформатика 2006, VIII Всероссийская научно-техническая конференция. Сборник научных трудов, 2006, часть 3, —с 155—— 162.

15. Ярушкина Н.Г. Основы теории нечетких и гибридных систем. —М.: Финансы и статистика, 2004.

16. Корлякова М.О., Твердохлеб Н.С. Анализ подходов к определению информативности признаков. // Научная сессия МИФИ-2006. Сборник научных трудов. В 16 томах. Т.З. Интеллектуальные системы и технологии. М.: МИФИ, 2006. 256 с. С.146—147.

17. Гладков Л.А., Курейчик В.М., Курейчик В.В. Генетический алгоритмы. —М.: Физматлит, 2006.

18. Кнут Д. Искусство программирования для ЭВМ. В 3-х т. -М.: Мир, 1976. Т.1-3.

19. Вирт Н. Систематическое программирование. Введение.-М.: Мир, 1977. 183 с.

20. Вирт Н. Алгоритмы + структуры данных= программы: Пер. с. англ./Под ред. Подсивилова Д.Б-М.: Мир, 1985. 406 с.

21. Тыугу Э.Х. Концептуальное программирование.-М.:Наука,1984. 255 с.

22. Лавров С., Силагадзе Г. Автоматическая обработка данных. Язык ЛИСП и его реализация.-М.: Наука, 1978.-245 с.

23. Нильсон Н. Принципы искусственного интеллекта.-М.: Радио и связь, 1985. -634 с.

24. Клоксин У., Меллиш К. Программирование на языке Пролог.-М.: Мир, 1987.

25. Internet: http://www.ics.uci.edu/-juice

26. Evaluating natural language processing systems// Artificial intelligence. 1999. -Vol.107, №1.-C. 15-56.

27. Попов Э.В. Общение с ЭВМ на естественном языке.-М.: Наука, 1982.-360 с.

28. Брябрин В.М., Любарский А.Я., Микулич Л.И. и др. Диалоговые системы в АСУ./Под ред. Д.А. Поспелова.-М.: Энергоиздат, 1983-С.22-40.

29. Hobbs J.R., Stidcel М.Е., Appelt D.E. Interpretation as abduction// Artificial • intelligence. 1993. - Vol. 63. - C. 69-142

30. Пранц М.Г. ТАСС диалоговая система обработки текста // Разработка и применение лингвистических процессоров/ВЦ ОС АН СССР-Новосибирск, 1983.- С.37-43.

31. Palmer M.S., Passonnean R.J., Weir С., Finin Т. The KERNEL text understanding system// Artificial intelligence. 1993. - Vol. 63. - C. 17-68

32. Давтян А. Дружба с умным алгоритмом// Компьютерра-1996.-№20( 147).— С.36-38

33. Bonnie J. Porr, Pamela W. Jordan, John W. Benoit A survey on current paradigms in machine translation //Advances in computer science. 1999. - Vol.49. - C.2-68

34. Булатов О. Translation Office квартет для переводчика// Компыотерра-1996-№22(149).-С.ЗО

35. Лурия А.Р. Язык и сознание./Под ред. Е.Д. Хомской.-Ростов н/Д.: Изд-во Феникс, 1998.-416 с.

36. Слобин Д., Грин Дж. Психолингвистика: Пер. с англ. М.: Прогресс, 1976. -350 с.

37. Выготский Л.П. Мышление и речь М.: Лабиринт, 1999. - 416 с.

38. Гийом Г. Принципы теоретической лингвистикн.-М.: Культура, 1992.-218 с.

39. Мельчук И.А Опыт теории лингвистических моделей "Смысл<=>Текст". Семантика, синтаксис.-М.: Наука, 1974.-436 с.

40. Цейтин Г.С. К вопросу о построении математических моделей языка.//Тезисы Совещания по математической лингвистике. Л.: Изд-во ЛГУ, 1959. - С. 45.

41. Моделирование языковой деятельности в интеллектуальных системах/Под. ред. Кибрика А.Е., Нариньяни А.С. -М.: Наука, 1987 280 с.

42. Поспелов Д.А. Продукционные модели//Искусственный интеллект. Т.2. Моделии методы.-М.: Радио и связь, 1990.-С.28-4 9129

43. Лозовский B.C. Сетевые модели//Искусственный интеллект. Т.2. Модели и методы.-М.: Радио и связь, 1990.-С.28-49.

44. Шенк Р., Хантер Л. Познать механизмы мышления//Реальность и прогнозы искусственного интеллекта.: Пер. с англ.-М.: Мир, 1987.-С. 15-26.

45. Шенк Р. Обработка концептуальной информации: Пер. с англ. -М.: Мир, 1987.-С. 274

46. Хачатрян А.Р. Неточный вывод на знаниях.//Искусственный интеллект. Т.2. Модели и методы.-М.: Радио и связь, 1990.-С. 105-110.

47. Paul S. Jacobs, Lisa F. Ran Innovations in text interpretations// Artificial intelligence.- 1993.-Vol. 63.-C. 14-25.

48. Зализняк А.А. Русское именное словоизменение.-М.: Наука, 1967 153 с.

49. Морфологический анализ научного текста на ЭВМ// АН СССР, Ин-т языковедения им А.А. Потебки -Киев: Наук, думка, 1989.-262 с.

50. Мальковский М. Г. Диалог с системой искусственного интеллекта-М.: Изд-во МГУ, 1985.-214 с.

51. Jane Morris, Graeme Hirst Lexical cohesion computed by thesaural relations as an indicator of the structure of text// Computational linguistics. -1991. Vol. 17, № 1. -C. 21-48

52. Кулагина O.C. О проблемах автоматической обработки текстов на естественном языке// Интеллектуальные системы. 1996. - Том 1, Вып. 1-4. -С. 109-116

53. Giorgio Satta, Oliviero Stock Bidirecrtional context-free grammar parsing for natural language processing//Artificial intelligence. 1994.-Vol. 69, №1-2. - C. 123-162

54. Walter Daelemans, Gerald Gozdar, Koenraad De Smedt Inheritance in natural language processing// Computational linguistics. -1992. Vol. 18, № 2. - C. 201214

55. Sippu, Soisalon-Soininen Parsing theory Berlin: Kluvver, 1988. - 692 c.

56. Shieber S. An introduction to unification-based approaches to grammar//CSLI lecture notes Chicago: Chicago University Press, 1986. - Vol.4- 510 c.

57. Robert F. Simmons, Yeong-Ho Yu. The acquisition and use of context-dependent grammars for English// Computational linguistics. -1992. Vol.18, №4. - C. 43-57.

58. Oliviero Stock. Parsing with flexibility, dynamic strategies and idioms in mind// Computational linguistics. -1989. Vol.15, №1. - C.67-79.

59. Antony J. Fisher. Practical parsing of generalized phrase structure grammars// Computational linguistics. 1989. - Vol.15, №3. - C.45-56.

60. Fernando C.N. Pereira, David H.D. Warren Definite clause grammars for language analysis survey of the formalism and a comparison with augmented transition networks//Artificial intelligence. - 1980. - Vol.13, №3. - C. 231-278

61. Anton Nijholt. CFG: covers, normal forms, and parsing. Berlin: Springer-Verlag, 1980.-235 c.

62. Andrew Haas. A parsing algorithm for unification grammar// Computational linguistics. -1989. Vol. 15, №4. - C.219-232

63. Walter I. Savitch. A formal method for context-free languages augmented with reduplication//Computational linguistics. -1989. Vol. 15, №4. - C.250-261

64. J.G. Carbonell, P.J. Hayes. Robust parsing multiple construction-specific strategies//Natural language parsing systems/ Ed. by Leonardo Bole Berlin: Springer-Verlag, 1987.-C. 1-32

65. T.W. Finin, M. Store Palmer. Parsing with logical variables// Natural language parsing systems/ Ed. by Leonardo Bole Berlin: Springer-Verlag, 1987. - C. 33-48

66. J.G. Neal, S.C. Shapiro Knowledge-based learning// Natural language parsing systems Berlin: Springer-Verlag, 1987. - C. 49-92

67. J. Pitrat Using declarative knowledge for understanding natural language// Natural language parsing systems Berlin: Springer-Verlag, 1987 - C. 93-136

68. M. Thiel Weighted parsing//Natural language parsing systems Berlin: Springer-Verlag, 1987-C. 137-160

69. Paulo T. Sato A common parsing scheme for left- and right-brunching langugages// Computational linguistics. 1988. - Vol.14, №1. - C. 20-30

70. A.K. Joski An introduction to TAG. Mathematics of language// International journal: computers and mathematics with application. 1992. - Vol.23, №2-5. - C. 87-115

71. Susan L. Graham, Michael A. Harrison. Parsing of general context-free languages// Advances in computers. 1976. - Vol.14. - C. 77-186

72. Masaru Tomita. An efficient augmented context-free parsing algorithm// Computational linguistics. 1987. - Vol.13, №1-2. - C. 31-46

73. Allan Kamsay. Computer-aided syntactic description of language systems// Computational linguistics. An international handbook on computer-oriented language research and applications Boston: Walter de Giuyter, 1989. - C.204-218

74. Revised report on algorithmic language Algol-68/ Ed. by A. Wijngaarden Berlin: Springer, 1976-345 c.

75. Natural language parsing and linguistic theories/ Ed. by U. Reyle Berlin: Rohrer Dordrecht, 1998.-625 c.

76. Jerry R. Hobbs, Mark E. Stidcel, Doughlas E. Appelt. Interpretation as abduction// Artificial intelligence. 1993. - Vol. 63. - C. 69-142

77. Поляков B.H. Синтез формальных моделей языка и смысла как проблема семантической обработки естественного языка// Новости искусственного интеллекта. 1997. - №1. - С. 23-34

78. Невзорова О.А. Машинное обучение и задачи обработки естественного языка// Новости искусственного интеллекта. 1998. -№1. - С.35-42.

79. Johanna D. Moore, Martha Е. Pollack. A problem for RST: the need for multi-level discourse analyses// Computational linguistics. 1992. - Volume 18, № 4. - C. 537544

80. Дворянкин A.M. Основы трансляции: Учеб. пособие Волгоград: Волгоград, гос. тех. ун-т., 1997. - 80с.

81. Гиляревский Р.С., Старостин Б.А. Иностранные имена и названия в русском тексте. Справочник. М.: Высшая школа, 1985. - 134 с.

82. Апресян Ю. Д. Избранные труды, том I. Лексическая семантика: 2-е изд., испр. и доп. М.: Школа «Языки русской культуры», Издательская фирма «Восточная литература» РАН, 1995. - VIII е., 472 с.

83. Апресян Ю. Д., Богуславский И. М., Иомдин Л. Л. и др. Лингвистическое обеспечение системы ЭТАП-2. М.: Наука, 1989. - 296 с.

84. ЭТАП-3:Информация из Internet. [2001]//http://proling.iitp.ru

85. Цинман Л. Л. Язык для записи лингвистической информации в системе автоматического перевода ЭТАП. // Семиотика и инфоматика, №27. М.: ВИНИТИ, 1986.-С. 82-120.

86. Новое в зарубежной лингвистике.Вып.ХХ^.-М.: Прогресс, 1989.-432с.

87. Гвепцадзе М.А. Коммуникативная лингвистика и типология текста.-Тбил иси.:Ганатлеба, 1986.-316с.

88. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения.-М.: Наука. Гл.ред.физ.-мат.лит., 1985.-144с.

89. Карпилович Т.П. Алгоритмы порождения предложений естественного языка (обзор и анализ)// Романское и германское языкознание. Вып.1: Вопросы экспериментальной фонетики и прикладной лингвистики.-Минск,1977.-С.205-218.

90. Вудс В.А. Сетевые грамматики для анализа естественных языков // Кибернетический сборник. Новая серия. М.: Мир, 1978. - Вып. 13. - С. 120158.

91. Глушак В. М. Когнитивные основы категории атрибутивности // http://interlingua.narod.ru/projekt3.htm. 2001.

92. Дмитров В. И., Макаренков В. М. Аналитический обзор международного стандарта ISO 13584 // http://www.osp.ru/ap/! 997/03/31 .htm. 2001.

93. Кузнецов В. Е. Представление в ЭВМ неформальных процедур: продукционные системы / С послесловием Д. А. Поспелова. М.: Наука, 1989. - 160 с.

94. Кузнецов И. П., Кузнецов В. П., Мацкевич А. Г. Система выявления из документов значимой информации на основе лингвистических знаний в форме семантических сетей // http://www.dialog-21 .ru/Archive/2000/Dialogue 2000-2Z232.htm, 2001.

95. Манаков II. А., Москальчук Г. Г. Текст как природный объект // http://bspu.ab.ru/Journal/pedagog/pedagog7/al2.html, 2001.

96. Нариньянн А. С. Проблема понимания ЕЯ-запросов к базам данных решена // http://www.artint.ru/article/kazan-rep.asp, 2000.134

97. Нильсон Н. Принципы искусственного интеллекта. М., 1985. - 322 с.

98. Ножков И. Процессор автоматизированного морфологического анализа без словаря // http://www.dia1og-21 .ru/Archive/2000/Dialogue 2000-2/284.htm. 2001.

99. Пещак М. М., Широков В. А. Структурные модели словарных систем // http://www.gpntb.ru/win/inter-events/crimea94/report/prog 26r.html, 2001.

100. Заде J1. Роль мягких вычислений и нечеткой логики в понимании, конструировании и развитии информационных/интеллектуальных систем//Новости искусственного интеллекта.-2001.-№2-3.-С.7-11.

101. Мелихов А.Н., Берштейн JI.C., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой. -М.: Наука. Гл.ред.физ.-мат.лит., 1990.- 272 с.

102. Осипов Г.С. Приобретение знаний интеллектуальными системами.- М.: Наука, 1997.-256 с.

103. Осипов Г.С. Динамика в системах, основанных на знаниях//Известия РАН:

104. Нечеткие множества и теория возможностей. Последние достижения:Пер. с англ./Под ред. Р.Р.Ягера.- М: Радио и связь, 1986.-408с.

105. Прихожий А.А.,Толкачев А.А. Экспертная система как средство поддержки проектно-конструкторских работ/У СиМ.-1989.-№.3-С.68-73.

106. Бабошин Н.П. Разработка и применение многомерных логико-лингвистических моделей нечетких систем(На примере катализа и автоматизированного обучения):Канд.дис./ МЭИ.- М.,1986.

107. Клир Дж. Системология. Автоматизация решения системных задач .- М.: Радио и связь, 1990 .- 544 с.

108. Фейс Р. Модальная логика.-М.: Наука, 1974.-520 с.

109. Крипке С.А. Семантический анализ модальной логики. I. Нормальные модальные исчисления высказываний// Модальная логика.-М.: Наука, 1974.- С. 254-303.

110. Пойа Д. Как решать задачу. Гос. уч. пед. изд-во Мин.Прос. РСФСР, М., 1959. 206 с.

111. Пойа Д. Математика и правдоподобные рассуждения /Пер. с англ. М.: Наука, 1975.-464 с.

112. Финн В. К. О машинно-ориентированной формализации правдоподобных рассуждений в стиле Бэкона-Милля// Семиотика и информатика. 1983. Вып.20.-С.35-101.

113. Финн В.К. Искусственный интеллект: идейная база и основной продукт// Сб. трудов Девятой национальной конференции по искусственному интеллекту с международным участием. Том I., С. И-21.

114. Reiter R. A Logic for Default Reasonings// Artificial Intelligence.- 1980 Vol. 13,1 1-2.-P. 81-132.

115. McDermott D. Non-Monotonic Logic. II. Non-monotonic Modal Theories // Journal of Association Comput. Machinery. 1982. -Vol. 29,1 1. - P. 33-57.

116. Ginsberg M. L. Multi-Valued Logics: Stanford Knowledge System Laboratory. Report1 KSL-86-29, 1986.

117. Artificial Intelligence. 1980. - Vol.13,1 1-2.

118. Gabbay D. M. Intuitionistic Basis for Non-Monotonic Logic// Lecture Notes Сотр. Science. -1982. Vol.138. - P. 260-273.

119. Вагин В. H. Дедукция и обощение в системах принятия решений. М.: Наука. Гл. ред. физ.-мат. лит., 1988. - 384 с.

120. Вагин В.Н., Головина ЕЛО., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах/ Под ред. В.Н. Вагина, Д.А. Поспелова.-М.: ФИЗМАТГИЗ, 2004.-704 с.

121. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика.-М.: Эдиториал УРСС, 2002.-352 с.

122. Смирнов А. В., Шереметов JI. Б. Многоагентная технология проектирования сложных систем // Автоматизация проектирования 1998 - №3 - С.45.

123. Смирнов А. В., Шереметов JI. Б. Многоагентная технология проектирования сложных систем// Автоматизация проектирования 1999.-№1-С.42.

124. Преображенский А. Б., Рыбина Г. В., Хорошевский В. Ф. Генерация многоцелевых интеллектуальных вопросно-ответных систем // Изв. АН СССР. Техн. Кибернетика. 1979. - № 6. - С. 142-151.

125. Кибрик А.Е. Константы и переменные языка.-СПб.: Алетейя, 2003.-720 с.136

126. Приближенная машинная морфология // http://www.medialingua.com/, 2001.

127. Хомский Н. Формальные свойства грамматик // Кибернетика. Сб. Новая сер. 1966.-Вып. 2.-С. 121-130.

128. Хомский Н. Язык и мышление.-М.: МГУ, 1972

129. Хомский Н. Язык и проблемы знания.// Вестник МГУ. Сер.9.Филология, №4,1995.-С.130-157.

130. Котов Р.Г. Прикладная лингвистика и информационная технология. М.: Наука, 1987.- 161с.

131. Киров Е.Ф. Теоретические проблемы моделирования языка. Казань.: Изд-во Казан, ун-та., 1989. - 255 с.

132. Кузнецова А.И. Понятие семантической системы языка и методы ее исследования. М.: Изд-во МГУ, 1963. - 59 с.

133. Технология системного моделирования / Е.Ф. Аврамчук, А.А. Вавилов, С.В. Емельянов и др.; Под общ. ред. С.В. Емельянова и др.- М.: Машиностроение; Берлин: Техник, 1988 .- 520 с.

134. Буш Г.Я. Методические основы научного управления изобретательством.-Рига : Лиесма, 1974. 167 с.

135. Буш Г.Я. Методы технического творчества. Рига : Лиесма, 1972. - 94 с.

136. Буш Г.Я. Аналогия и техническое творчество. Рига : Лиесма, 1979. - 128 с.

137. Альтшуллер Г.С. Алгоритм изобретения. М.: Московский рабочий, 1973. -296 с.

138. Альтшуллер Г.С. Творчество как точная наука. М.: Советское радио, 1979. -184 с.

139. Методы поиска новых технических решений /Под ред. А. И. Половинкина.-Йошкар-Ола: Маркнигиздат,1976. 193 с.137

140. Воинов Б.С. Принципы поискового проектирования. Горький: ГГУ, 1982. -80 с.

141. Мюллер И. Эвристические методы в инженерных разработках /Пер. с нем. -М.: Радио и связь, 1984. 144 с.

142. Zwichy F. Morphology and nomenclature of jet engines. Aeron. Eng. Rew., June, 1947., p.16.

143. Zwichy F. Morfologycal astronomy. Berlin, 1957., 299 p.

144. Шмаков Э.М. Основные проблемы и перспективы развития комплексного подхода к проектированию средств измерений // Измерения, контроль, автоматизация.- М.: ЦНИИТЭИ приборостроения, 1979, №3(19), С.18-24.

145. Бабанов Ю.Н., Воинов Б.С. Поиск новых технических решений в радиоэлектронике СВЧ /Уч. пособие.- Горький: ГГУ, 1981. 76 с.

146. Диксон Д. Проектирование систем: изобретательство, анализ, принятие решений /Пер. с англ.- М.: Мир, 1989. 440 с.

147. Нуждин В.Н. Автоматизация проектирования систем электропривода на основе эвристического подхода. Иваново: ИВГУ, 1980. - 76 с.

148. Глушков В.М., Мясников В.А.,Половинкин А.И. Автоматизация поискового конструирования //Вестн. АН СССР Л 979. №7.

149. Алгоритмы оптимизации проектных решений/Под ред. Половинкина А.И.-М.:Энергия,1976.

150. Карпунин Н.Г., Майданчик Б.И. Функционально-стоимостной анализ в электротехнической промышленности.- М.: Энергоиздат, 1984. 288 с.

151. Rodenacker W.G. Methodisches Konstruieren. Berlin, Heidelberg, New York, Springer-Verlag, 1976.

152. Rodenacker W.G., Slaussen V. Regeln des methodischen Konstruierens. Teil I.Meinz Krausskopf Verlag, 1973.

153. Presse G. Aufbau und Anwendung lines Katalogs physikalisher Effekts. Berlin, Maschinenbantechnik, 1977.7,P. 330 333.

154. Krumhauer P. Moglichkeiten der Rechnerunterstutzung fur die Konzeptphaseder Konstruction.- Z.wirtscaftl.Fertigung, 1973, N 3, s.l 19-126.

155. Krumhauer P. Recherunterstutzung fur die Konzeptphase der Konstruktion. Ein Beitrag zur Entwicklung eines Programmsystems fur die Losungsfidung Konstruktiver Teilaufgaden.: Diss./W.Berlin.TV, 1974.-164s.

156. Михалевич B.C., Волкович В.JI. О некоторых математических и эвристических особенностях процесса проектирования сложных систем,-УСиМ, 1976., N2.

157. Арайс Е.А., Дмитриев В.М. Автоматизация моделирования многосвязных систем. М.: Машиностроение, 1987.-238 с.

158. Мамиконов А.Г., Пискунова А.II., Цвиркун А.Р. Модели и системы проектирования информационного обеспечения АСУ.- М.: Статистика, 1978.

159. Глазунов В.Н. Поиск принципов действия технических систем. М.: Речной транспорт, 1990. -111 с.

160. Анкудинов Г.И. Синтез структуры сложных объектов (логико-комбинаторный подход). Л.: Изд-во ЛГУ, 1986. - 258 с.

161. Дворянкин A.M., Половинкин А.И., Соболев А.Н. Методы синтеза технических решений.- М.: Наука, 1977. 103 с.139

162. Дворянкин A.M., Половинкин А.И., Соболев А.Н. Об автоматизации поиска принципов действия технических систем на основе банка физических явлений.-Кибернетика, 1978., №1, С.80-86.

163. Половинкин А.И., Соболев А.Н. Автоматизация синтеза принципов действия технических систем на основе банка данных по физическим эффектам.- РАН СССР, 1979., т. 246, N 3, С.557 560.

164. Половинкин А.И., Камаев В.А., Фоменков С.А. и др. Методические указания к составлению описаний физических эффектов.- Волгоград: ВолгПИ, 1989.-32 с.

165. Методы поиска новых технических решений /Под ред. А.И. Половинкина.-Йошкар-Ола: Маркнигоиздат, 1976. 192 с.

166. Гришин В.А.,Камаев В.А. Математическое моделирование изделий и технологий. Учебное пособие, Волгоград, 1986.-193 с.

167. Фоменков С.А., Гришин В.А., Камаев В.А. Представление и использование физических знаний при поисковом конструировании изделий машиностроения. Учебное пособие. Волгоград: ВолгГТУ,, 1994. - 121 с.

168. Камаев В.А., Колесников С.Г., Фоменков С.А. Физические эффекты из материалов заявок на открытия по физике, ч.1. Учебное пособие. Волгоград: ВолгГТУ,, 1994.-200 с.

169. Бутенко JI.H., Дворянкин A.M., Камаев В.А., Фоменков С.А. и др. Техническое творчество: теория, методология, практика. Энциклопедический словарь-справочник. / Под ред. А.И. Половинкина, В.В. Попова. М.: НПО "Информ-систем", 1995. - 408 с.

170. Яшин Я. М. Вопросы теории построения систем автоматизированного управления. JL: Изд-во Ленингр. Ун-та. 1978.

171. Основы автоматизации управления производством: Учеб. пособие для студ. техн. вузов / Макаров И. М., Евтихиев Н. Н., Дмитриева Н. Д. и др.; Под ред. И. М. Макарова М.: Высш. школа, 1983 - 504 с.

172. А. Костин. Автоматизация и человек: мечты и реальность//Компьютерра. 2001, №12(389).

173. Девятое Б. Н., Демиденко Н. Д. Теория и методы анализа управляемых распределенных процессов-Новосибирск: Наука, 1983.

174. Мелик-Гайказян И. В. Информационные процессы и реальность М.: Наука. Физматлит, 1998 - 192 с.

175. А. с. 13371148 СССР, МКИ3 B06BI/18. Пневматический вибровозбудитель / Гришин В. А., Сальникова Н.А., Аиткаримов В.Н.; Опубл. 15.09.87, Бюл. № 34.

176. Сальникова Н.А. Разработка автоматизированной системы поискового конструирования сложных технических устройств (на примере генераторов механических колебаний): Канд.дис. / ВолгПИ.- Волгоград, 1986.- 267 с.

177. Вибрация в технике. Справочник. Т.1,-М.Машиностроение, 1978. 352 с.

178. Вибрация в технике. Справочник. Т.1У,-М.:Машипостроение, 1981.- 455 с.

179. Кобринский А.Е., Кобринский А.А. Виброударные ситемы.- М.: Наука, 1973. - 591 с.

180. Кононенко В.О. Колебательные системы с ограниченным возбуждением. -М.: Наука, 1964.-254 с.

181. Рагульскис B.JI. Виброударные системы. Вильнюс: Минтис,1974.- 320 с.

182. Фурунжиев Р.И. Автоматизированное проектирование колебательных систем. Минск: Вышэйшая школа, 1977.- 452 с.

183. Заболеева-Зотова А.В. Лингвистические системы: модели, методы, приложения. Монография.- ВолгГТУ, 2004.- 220 с.

184. Заболеева-Зотова А.В Естественный язык в автоматизированных системах. Семантический анализ текстов. Волгоград: ВолгГТУ, 2002. - 228 с.

185. Заболеева-Зотова А.В Введение в системологию. Волгоград: ВолгГТУ, 1999.- 109 с.

186. Заболеева-Зотова А.В, Камаев В.А. Санжапов Б.Х. Математическое обеспечение САПР, ч.1 Волгоград: ВолгГТУ,, 1997. - 72 с.

187. Заболеева-Зотова А.В. Математическое обеспечение САПР, ч.2 Волгоград: ВолгГТУ, 1998, -72 с.

188. Заболеева-Зотова А.В., Набока М.В. Моделирование процесса концептуального проектирования в целях применения в интеллектуальной многоагентпой системе\\ Информационные технологии №8, 2004, С.2-6.

189. Заболеева-Зотова А.В., Набока М.В. Агентный подход к концептуальному проектированию технических объектов\\ Автоматизация и современные технологии № 6, 2004, С.29-31.

190. Попов М.Ю., Фоменков С.А., Заболеева-Зотова А.В. Реализация семантико-синтаксического анализатора естественного языка в системе классификации полнотекстовых текстов\\ Успехи современного естествознания №5, 2004, С.87-89.

191. Заболеева-Зотова А.В., Пастухов А.Ю., Козлова Н.А.,Сердюков П.В., Чернов С.А Задача автоматизированной категоризации текстов при создании Web-сайта \\ Автоматизация и современные технологии №6, 2003.

192. Заболеева-Зотова А.В., Пастухов А.Ю., Козлова Н.А., Сердюков П.В., Чернов С.А LSA в гипертекстовых массивах \\Инновации №4(41-42), 2001, С.76-78.

193. Заболеева-Зотова А.В., Пастухов А.Ю., Козлова Н.А., Сердюков П.В.,Чернов С.А Система оптимизации структуры Web-сайта \\ КомпьюЛог& Мой компьютер №1, 2001.

194. Заболеева-Зотова А.В., Пастухов АЛО., Козлова Н.А.,Сердюков П.В., Чернов С.А. Латентный семантический анализ: новые решения в InternetW Информационные технологии №6, 2001, С. 16-19.

195. Миляев Н.Ю., Заболеева-Зотова А.В. АРМ технического писателя: подходы к описанию технических систем\\ Информационные технологии №3, 2000, С.36-44.

196. Миляев НЛО., Заболеева-Зотова А.В. АРМ технического писателя: структура репозитория\\ Информационные технологии №5, 2000.

197. Базельцева И.В., Заболеева-Зотова А.В., Пастухов АЛО. Разработка программных средств активного эмоционально-ориентированного интерфейса\\Труды международной конференции IS-2003, Ульяновск, 2003

198. Заболеева-Зотова А.В., Пастухов А.Ю., Козлова Н.А. ,Сердюков П.В. ,Чернов С.А Система оптимизации структуры Web-сайта \\ Труды XXIX

199. Международной конференции "Информационные технологии в науке, образовании телекоммуникации и бизнесе (IT+SE"2002)" Украина, Ялта-Гурзуф,сентябрь, 2002.

200. Попов М.Ю., Заболеева-Зотова А.В. Концепция системы семантического анализа текста \\Труды Международного семинара Диалог'2002 по компьютерной лингвистике и ее приложениям. Том 1. Теоретические проблемы. Протвино, 2002.

201. Заболеева-Зотова А.В., Пастухов А.Ю. Учет психолингвистических особенностей процесса чтения при разработке языков программирования Сб. научн. трудов ВолгГТУ "Концептуальное проектирование в образовании, технике и технологии". Волгоград, 2001,6с.

202. Миляев Н.Ю., Заболеева-Зотова А.В. Автоматизация технического текстнрования\\ Труды Международного семинара Диалог'2000 по компьютерной лингвистике и ее приложениям.Том 2. Прикладные проблемы., Протвино, 2000, 2с.

203. Заболеева-Зотова А.В., Кузнецов А.В. Численное моделирование словообразования \\Трудьт Международного семинара Диалог'2000 по компьютерной лингвистике и ее приложениям.Том 2. Прикладные проблемы. Протвино, 2000, 6с.

204. Заболеева-Зотова А.В., Миляев НЛО. АРМ технического писателя. Новые пути развития информации. Сб. научн. трудов ВолгГТУ "Концептуальное проектирование в образовании, технике и технологии", Волгоград, 1999, 4с.

205. Заболсева-Зотова А.В., Набока М.В. Разработка модели технической системы как нечеткой решетки. Сб. трудов 12 Международной научной конференции."Математические методы в технике и технологиях ММТТ-12". Том 5. Великий Новгород, 1999, 2с.

206. Заболеева-Зотова A.B., Миляев 11.10. Object-oriented CATW.// "Application of the conversion research results for international cooperation SIBCONVERS'99" /ProceedingsVolume 2, may 18-20, 1999, Tomsk, Russia., 2 p.

207. Заболеева-Зотова A.B., Кузнецов A.B. Системный подход к формализации физических знаний Сб. трудов 12 Международной научной конференции."Математические методы в технике и технологиях ММТТ-12". Том 3. Великий Новгород, 1999, Зс.

208. Заболеева-Зотова А.В. Определение вида и уровня информации при описании структуры технической системы. Сб. научн. трудов ВолгГТУ "Концептуальное проектирование в образовании, технике и технологии", Волгоград, 1997, 5с.

209. Заболеева-Зотова А.В. Моделирование текстообразования при описании структуры технической системы. Сб. научн. трудов ВолгГТУ "Концептуальное проектирование в образовании, технике и технологии", Волгоград, 1997, 7с.

210. Заболеева-Зотова А.В. Определение вида и уровня информации при описании структуры технической системы. Сб. научн. трудов ВолгГТУ "Концептуальное проектирование в образовании, технике и технологии", Волгоград, 1997, 7с.

211. Заболеева-Зотова А.В. Архитектура лингвистического процессора для описания структуры технической системы.Сб. научн. трудов ВолгГТУ "Концептуальное проектирование в образовании, технике и технологии", Волгоград, 1997, Юс.

212. Заболеева-Зотова А.В. Интеллектуальная среда для решения изобретательских задач в проектирования новых технических систем. Сб."Восток-запад. Информационные технологии в проектировании". Материалы международной конференции. М.: 1-5 июля 1996, 5 с.

213. Камаев В.А., Гришин В.А., Заболеева-Зотова А.В. Принципы построения и инструментальные средства системы поискового конструирования.// Межвуз.сб. научн. трудов "Методы и системы технической диагностики", Саратов, Изд-во Саратовского ун-та, 1989, 4с.

214. Заболеева-Зотова А.В. Моделирование текстообразования при описании функциональной структуры технической системы. Часть I. Определение вида и уровня информации, содержащейся в формируемом тексте \\Депонировано в ВИНИТИ, № 2344 -В 97 от 10.07.97, 16 с.

215. Заболеева-Зотова А.В. Структурный синтез сложных технических систем: формализация и алгоритмы \\ Депонировано в ВИНИТИ, № 1487 -В 95 от 24.05.95,61 с.

216. Заболеева-Зотова А.В., Гришин В.А Формализация знаний для экспертной системы поддержки изобретательской деятельности \\Депонировано в ВИНИТИ, №6821 В 89 от 14.11. 89

217. Заболеева-Зотова А.В., Гришин В.А. Экспертная система, реализующая новую компьютерную технологию проектирования. Депонировано в ЦИНТИ-ЦНТБ,НРБ, Варна, 1989, 8 с.

218. Прохоров И.В. Синтез гибридных архитектур нейронных сетей //сборник трудов V Международной научно-методической конференции «Дистанционное обучение образовательная среда XXI века», -— Минск, 2005. - С 272-274.

219. Прохоров И.В. Автоматизация процесса построения архитектуры гибридной нейронной сети с последующим ее обучением / И.В. Прохоров, А.В. Заболеева-Зотова // Педагогическая информатика. — 2005. —№5 (спец. выпуск).—С. 167173.

220. Прохоров И.В. Минимизация архитектур гибридных нейронных сетей // В сб. трудов Научной сессии МИФИ-2006, — М, 2006, ТЗ, —С180-181.

221. Прохоров И.В. Модель автоматического этимологического анализа // Интегрированные модели и мягкие вычисления в искусственном интеллекте: сб. научн. трудов IV-й международной научно-практической конференции. — Коломна, 2007.f*7

222. ООО «Компания Прайм-Волгоград»

223. Общество с ограниченной ответственностью1. ООО ПКЦ «ГАЗСТРОЙСЕРВИС»

224. Адрес: 400005, г. Волгоград, пр. Ленина, д. 102. т./факс: 8 (8442) 73-06-69,24-20-33.

225. ИНН 3441001927 КПП 344201001 р/сч 40702810711150100140 Волгоградское ОСБ №8621 г.Волгоградк/сч 30101810100000000647 БИК 041806647 ОКПО 22473394 ОКВЭД 74.20.11 E-mail: GazStroyServis@coltel.ru

226. Я, Акимова Татьяна Ивановна, директор ООО ПКЦо

227. Общество с ограниченной ответственностью1. ГЕОЦЕНТР»

228. ИНН 3444120016, Р/с 40702810200500142910 в Волгоградском Ф Банка «Возрождение» {ОАО}, г, Волгоград, К/с 30101810800000000824 БИК 41806824

229. КПП 344405001 Тел.: 33-39-11 факс: 33-39-11 E-mail: m5d@tele-kom.ru1. На №от1. ТЕХНИЧЕСКИЙ АКТ ВНЕДРЕНИЯ1. Директор ООО «Геоцент;1. Архипов Д.В.1. Jti.оргаЗ

230. Министерство энергетики Российской Федерации1. ОАО ВОЛГОГРАДГОРГАЗ400131, г. Волгоград, ул. Коммунистическая, 38 тел.: (8442) 24-20-66, 24-20-55; факсы: (8442) 24-20-58, 24-20-68; эл. почта: voq(avlg-aaz.ru200г. №на №от1. ТЕХНИЧЕСКИЙ АКТ ВНЕДРЕНИЯ

231. Зам. генерального директора главный инженер1. И.В. Крапивин

232. Настоящим подтверждаем, что программные модули, разработанные в рамках диссертационной работы Прохорова Ильи Викторовича «Автоматизация этимологического анализа», используются в системе автоматизации документооборота ООО КП «Комплекс».1. М.С. Кондратьев