автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Теоретические и прикладные аспекты применения метода аналогии в системах автоматической обработки текстовой информации
Оглавление автор диссертации — доктора технических наук Зеленков, Юрий Григорьевич
Введение.
Глава 1. Компьютерная лингвистика в системе НТИ.
Выводы.
Глава 2. Метод аналогиии в компьютерной лингвистике.
2.1. Предварительные замечания.
2.2. Метод аналогии в морфологии.
2.3. Метод аналогии в синтаксисе.
2.4. Метод аналогии в семантике.
2.4.1. Дистрибутивно-статистический анализ текстов.
2.4.2. Автоматическая классификация текстов.
2.4.3. Автоматическое установление парадигматических отношений между словами на основе известных парадигматических отношений между словосочетаниями.
2.4.4. Автоматическое установление переводных соответствий между словами на основе переводных соответствий между русскими и английскими именными словосочетаниями.
2.4.5. Дистрибутивно-статистический метод установления переводных соответствий между русскими и английскими словами и словосочетаниями по параллельным текстам (билингвам).
2.4.5.1. Установление переводных соответствий между словами.
2.4.5.2. Установление переводных соответствий между словсочетаниями.
2.5. Фразеологический машинный перевод.
Выводы.
Глава 3. Морфологический анализ русских и английских текстов на основе метода аналогии.
3.1. Морфологический анализ русских слов.
3.2. Морфологический анализ английских слов.
Выводы.
Глава 4. Системы фразеологического машинного перевода.
4.1. Предварительные замечания.
4.2. Лексический состав современных языков.
4.3. Переводные соответствия между лексическими единицами.
4.4. Концепция фразеологического машинного перевода.
4.5. Системы машинного перевода RETRANS и ERTRANS.
4.6. Перспективы развития фразеологического машинного перевода.
Выводы.
Глава 5. Другие примеры применения метода аналогии в системах автоматической обработки текстовой информации.
5.1. Автоматизированная словарная служба ВИНИТИ.
5.2. Системы автоматизированного обнаружения и исправления орфографических ошибок в текстах (русских и английских).
5.3. Система пословной нормализации (лемматизации) русских текстов.
5.4. Система избыточного пословного индексирования русскоязычных библиографических баз данных.
5.5. Системы автоматического индексирования русскоязычных документов ключевыми словами и словосочетаниями на русском, английском и вьетнамском языках.
5.6. Политематический ассоциативный тезаурус ключевых слов и словосочетаний по естественным и техническим наукам.
5.7. Система автоматизированного реферирования документов на основе словаря стандартных фраз.
Выводы.
Введение 1999 год, диссертация по информатике, вычислительной технике и управлению, Зеленков, Юрий Григорьевич
Естественный язык является универсальным средством общения. В нем отражается все богатство материальной и духовной культуры человечества. Он не отделим от процесса мышления и является его инструментом. Он служит также инструментом накопления, хранения и передачи информации. Словарь таких развитых языков как русский и английский имеет объем более одного миллиона слов, а количество фразеологических единиц (в том числе терминов) исчисляется сотнями миллионов. Поэтому почти все задачи, связанные с разработкой средств автоматической обработкой текстовой информации, трудны и трудоемки. Но, с другой стороны, прогресс в разработке этих средств повышает эффективность информационной работы.
По мнению многих отечественных и зарубежных ученых 21-ый век будет веком бурного развития информационных технологий, а компьютерная лингвистика станет локомотивом этого развития. Но чтобы она на деле стала таким локомотивом требуется приложить большие усилия. Задачи, стоящие перед компьютерной лингвистикой, чрезвычайно сложны и трудно поддаются алгоритмизации. Поэтому необходимо искать альтернативные пути решения этих задач. На наш взгляд одним из альтернативных путей является широкое применение метода аналогии.
К такому выводу пришел, в частности, профессор Макото Нагао, который в течение многих лет руководил в Японии работами по машинному переводу. В статье [167] он противопоставляет традиционному алгоритмическому подходу, который он называет "rule based approach" ("подход, основанный на правилах"), другой подход "example based approach" ("подход, основанный на примерах").
Метод аналогии ни в коей мере не противостоит алгоритмическому подходу. Более того, он в значительной мере опирается на алгоритмический подход, но акцент здесь делается не на сложные алгоритмические процедуры, а на индуктивные умозаключения по аналогии. К сожалению, метод аналогии пока еще не занял должное место в исследованиях и разработках по компьютерной лингвистике.
Компьютерная лингвистика как наука возникла на рубеже 1950-х -1960-х годов прежде всего в связи с необходимостью решения задач машинного перевода и информационного поиска. Крупный вклад в решение этих задач внесли российские ученые Ю.Д. Апресян, Г.Г. Белоногов, Г.Э. Влэдуц, Р.С. Гиляревский, О.С. Кулагина, Д.Г. Лахути, Ю.Н. Марчук, И.А. Мельчук, Е.В. Падучева, Р.Г. Пиотровский, В.А. Успенский, В.К. Финн, А.И. Черный, Ю.И. Шемакин, Ю.А. Шрейдер и многие другие.
В настоящей диссертации предпринята попытка рассмотреть теоретические и прикладные аспекты применения метода аналогии в системах автоматической обработки текстовой информации. Ее автор в течение полутора десятков лет занимался применением этого метода к задачам компьютерной лингвистики и накопил здесь определенный опыт. Этот опыт и опыт других исследователей в обобщенном виде представлен в предлагаемой работе. Целью исследования является изучение возможностей применения метода аналогии в системах автоматической обработки текстовой информации и разработка эффективных процедур и систем, реализующих этот метод. Предметом исследования являются закономерности языка и речи, позволяющие применять этот метод и на его основе создавать перспективные системы автоматической обработки текстовой информации. Исследования проводились путем формулировки гипотез о закономерностях, имеющих место в языке и речи, проверки этих гипотез путем моделирования на ПЭВМ, построения и испытания систем автоматической обработки текстовой информации.
Основные научные результаты
В процессе исследований получены следующие основные научные результаты:
1. Дано теоретическое обобщение опыта применения метода аналогии в компьютерной лингвистике. Сформулированы основные направления использования этого метода при создании систем автоматической обработки текстовой информации.
2. Разработаны конкретные методы, алгоритмы и программы морфологического и синтаксического анализа русских и английских текстов, основанные на использовании метода аналогии.
3. На основе проведенных исследований, автором лично и при его участии создан ряд систем автоматической обработки текстовой информации, базирующихся на широком использовании принципа аналогии. В частности:
- две системы автоматизированного обнаружения и исправления орфографических ошибок в текстах - в русских и в английских;
- система автоматического индексирования русских текстов ключевыми словами и словосочетаниями на русском и на английском языках; две системы фразеологического машинного перевода политематических текстов:
1) система перевода с русского языка на английский (система RETRANS) и
2) система перевода с английского языка на русский (система ERTRANS);
- политематический ассоциативный тезаурус ключевых слов и словосочетаний по естественным и техническим наукам.
Научная новизна работы
Научная новизна работы состоит в том, что автором впервые разработаны и на обширном текстовом материале исследованы методы, алгоритмы и программы морфологического, синтаксического и семантического анализа текстов, основанные на принципе аналогии. Эти методы открывают в компьютерной лингвистике принципиально новые возможности для построения перспективных систем автоматической обработки текстовой информации.
Практическая значимость работы
Практическая значимость работы определяется тем, что результаты исследований автора нашли широкое применение в промышленных системах автоматической обработки информации (см. п.З). Так, система автоматизированного обнаружения и исправления орфографических ошибок в русских и английских текстах используется в России (в ВИНИТИ и в ряде других организаций), во Франции (Центр CEDOCAR) и в США (фирма Access Innovations Inc.). Системы русско-английского и англо-русского машинного перевода (RETRANS и ERTRANS) используются в ВИНИТИ, ВНТИЦентре, ВНИИККИ, в Министерстве Науки и технологий РФ, в Министерстве Обороны РФ (Генштаб, Главный военный госпиталь им. Бурденко и др.), в библиотеке Президента, в Верховном Суде России, в Медицинском Диагностическом Центре г. Барнаула и в других организациях России. Система RETRANS вот уже более пяти лет используется во Франции (Центр CEDOCAR) и в США (фирма Access Innovations Inc., Госдепартамент).
Диссертация состоит из пяти глав и приложения. Первая глава является вводной. В ней рассматриваются проблемы компьютерной лингвистики, возникающие при создании систем автоматической обработки текстовой информации. Обосновывается целесообразность применения метода аналогии в тех случаях, когда получение точного алгоритмического решения задачи затруднительно.
Во второй главе формулируются общие принципы применения метода аналогии в компьютерной лингвистике, эффективность которых демонстрируется на ряде задач морфологического, синтаксического и семантического анализа и синтеза текстов.
В третьей главе описываются разработанные автором конкретные алгоритмы морфологического анализа русских и английских слов, построенные на основе метода аналогии.
В четвертой главе рассматриваются принципы построения систем русско-английского и англо-русского фразеологического машинного перевода (систем RETRANS и ERTRANS), одним из создателей которых является автор диссертации (см. Приложения 1, 2). В основу построения этих систем положен метод аналогии.
В пятой главе описывается ряд других систем автоматической обработки информации, созданных либо автором диссертации лично, либо при его участии. Все описанные в этой главе системы построены с использованием метода аналогии.
Заключение диссертация на тему "Теоретические и прикладные аспекты применения метода аналогии в системах автоматической обработки текстовой информации"
Выводы
1. Рассмотренные в настоящей главе примеры применения метода аналогии (наряду с примерами, описанными в главах 3, 4) показывают, что этот метод может плодотворно применяться для решения широкого класса актуальных задач компьютерной лингвистики. Большинство из этих разработок (см. п.п. 5.1-5.4, 5.6) практически используются в различных отечественных и зарубежных организациях (Англия, Франция, США). Автор диссертации лично разработал принципы построения и комплексы алгоритмов и программ морфологического анализа русских и английских текстов (см. главу 3) а также принципы построения и комплексы алгоритмов и программ для систем, описанных в п.п. 5.2, 5.6, 5.7. В создании других систем, описанных в главах 4 и 5, он принимал активное участие в качестве одного из ведущих разработчиков.
2. Применение метода аналогии в компьютерной лингвистике является новым перспективным направлением научных исследований и разработок, позволяющим эффективно решать сложные задачи, которые трудно решаются обычными алгоритмическими методами.
Заключение
В диссертации, как это следует из ее названия, рассмотрены теоретические и прикладные аспекты применения метода аналогии в системах автоматической обработки текстовой информации. Теоретическая часть работы представлена, в основном, главами 1, 2, прикладная - главами 3-5.
Теоретическая часть работы представляет собой обобщение результатов личных исследований автора, результатов исследований его коллег по совместной работе и результатов исследований ученых за пределами коллектива, в котором работал автор. Ее существо заключается в следующем:
1. Сформулированы общие принципы применения метода аналогии в компьютерной лингвистике;
2. Определены направления и конкретные способы применения метода аналогии для ряда задач морфологического, синтаксического и семантического анализа и синтеза текстов. Описание способа решения каждой задачи предваряется формулировкой гипотезы, на основе которой осуществляется процедура логического вывода по аналогии.
Прикладная часть работы представляет собой описание конкретных процедур и систем, построенных либо автором лично, либо при его участии, что четко оговаривается в соответствующих главах.
Результаты исследований автора получили широкое применение в России и за рубежом. Подробные сведения о практическом использовании работ автора приведены во Введении к диссертации.
Библиография Зеленков, Юрий Григорьевич, диссертация по теме Теоретические основы информатики
1. Вопросы информационной теории и практики, N 53. Автоматизированная словарная служба. Автоматическое индексирование документов. Под ред. проф. Г.Г. Белоногова, ВИНИТИ, 1985 г.
2. Вопросы информационной теории и практики, N 58. Компьютерная лингвистика в системе научно-технической информации. Под ред. проф. Г.Г. Белоногова, ВИНИТИ, 1989 г.
3. Действующие системы машинного перевода и автоматические словари. Обзорная информация, сер. "Машинный перевод и автоматизация информационных процессов", вып. 3, ВЦП, Москва, 1979 г.
4. Лингвистические исследования по машинному переводу. Сообщения ОМАИР, вып. 2, ВИНИТИ, 1961.
5. Промышленные системы машинного перевода. Обзорная информация. Сер. "Машинный перевод и автоматизация информационных процессов", вып. 17, 1979 г., вып. 20,1991 г., ВЦП, Москва.
6. Абрамова Н.Н., Бевзенко Е.А., Ю.Г. Зеленков. Алгоритм нормализации именных словосочетаний. Сб. "Вопросы информационной теории и практики", N 53, ВИНИТИ, 1985 г.
7. Алыдванг В.Д. и др. Математическое обеспечение системы автоматического перевода ЭТАП-1. Сб. "Прикладные и экспериментальные лингвистические процессоры". ВЦ СО АН СССР, Новосибирск, 1982 г.
8. Андреев Н.Д. Статистико-комбинаторные методы в теоретическом и прикладном языкознании. Л., "Наука", 1967.
9. Андреевски А., Дебили Ф., Флур К. Об одном важном свойстве лексики естественных языков и его использовании при автоматическом исправлении опечаток. Сб. "Прикладные и экспериментальные лингвистические процессоры". ВЦ СО АН СССР, Новосибирск, 1982 г.
10. Андрющенко В.М. Концепция и архитектура машинного фонда русского языка. Дисс. докт. филол. наук, ВИНИТИ, 1989 г.
11. Анно Е.И. Система морфологического анализа с синтезом словоформ. Сб. "Семиотика и информатика", вып. 10, Москва, 1978 г.
12. Апресян Ю.Д. Идеи и методы современной структурной лингвистики (краткий очерк). "Просвещение", Москва, 1966 г.
13. Апресян Ю.Д. Лексическая семантика и синонимические средства языка. "Наука", Москва, 1974 г.
14. Апресян Ю.Д. и др. Лингвистическое обеспечение системы автоматического перевода ЭТАП-2. "Наука", Москва, 1989 г.
15. Апресян Ю.Д. и др. Лингвистическое обеспечение системы французско-русского автоматического перевода ЭТАП-1. II. Французская морфология. Французский комбинаторный словарь. Препр. Ин-та рус. яз. АН СССР, N 154, 1984 г.
16. Арский Ю.М., Гиляревский Р.С., Черный А.И., Туров И.С. "Инфосфера: информационные структуры, системы и процессы в науке и обществе." М., ВИНИТИ, 1996 г.
17. Бакулов А.Д., Леонтьева Н.Н. Теоретические аспекты машинного перевода. В кн. Справочник. Искусственный интеллект. "Радио и связь", Москва, 1990 г.
18. Бевзенко Е.А., Зеленков Ю.Г. Синтаксическая структура словосочетаний. Сб. "Вопросы информационной теории и практики", N 53, ВИНИТИ, 1985 г.
19. Бежанова О.М. Система электронных словарей Polyglossum. Компьютеры + Программы, N 1, 1996 г.
20. Бежанова О.М. Электронный инструмент научного перевода. Компьютеры + Программы, N 1,1997 г.
21. Бежанова О.М. Электронный толковый словарь английского языка. Компьютеры + Программы, N 4, 1996 г.
22. Белоногов Г.Г. О некоторых статистических закономерностях в русской письменной речи. Вопросы языкознания, N 1, 1962 г.
23. Белоногов Г.Г. Распределение частот появления флективных классов русских слов. Сб. "Проблемы кибернетики", вып. 11, 1961 г.
24. Белоногов Г.Г. Два подхода к автоматическому отождествлению форм слов. Сб. "Цифровая вычислительная техника и программирование", вып. 1, "Сов. радио", Москва, 1966 г.
25. Белоногов Г.Г., Давыдова И.М. О возможности определения грамматических классов по буквенным кодам слов. Сб. "Научно-техническая информация", Серия 2, N 8, ВИНИТИ, 1967.
26. Белоногов Г.Г., Котов Р.Г. Автоматизированные информационно-поисковые системы. "Сов. радио", Москва, 1968 г.
27. Белоногов Г.Г., Богатырев В.И. Автоматизированные информационные системы. "Сов. радио", Москва, 1973 г.
28. Белоногов Г.Г. Об использовании принципа аналогии при автоматической обработке текстовой информации. Сб. "Проблемы кибернетики", No 28, 1974 г.
29. Белоногов Г.Г., Губарь Н.Т., Новоселов А.П. Морфологический анализ слов на основе словаря словоформ. Сб. "Научно-техническая информация", сер. 2, N 9, ВИНИТИ, 1975 г.
30. Белоногов Г.Г., Загика Е.А., Новоселов А.П. Автоматизация лингвистической обработки словарей в системе научно-технической информации. "Вопросы кибернетики". Прикладные аспекты лингвистической теории. Под редакцией акад. A.JI. Ершова. М., ВИНИТИ, 1987.
31. Белоногов Г.Г., Зеленков Ю.Г. Алгоритм морфологического анализа русских слов. Вопросы информационной теории и практики, N 53, М, ВИНИТИ, 1985.
32. Белоногов Г.Г., Зеленков Ю.Г. Еще раз о принципе аналогии в морфологии. Сб. "Научно-техническая информация", Серия 2, No 3, ВИНИТИ, 1995 г.
33. Белоногов Г.Г., Кузнецов Б. А. Языковые средства автоматизированных информационных систем. "Наука", М., 1983.
34. Белоногов Г.Г., Загика Е.А., Зеленков Ю.Г., Новоселов А.П. Автоматический морфологический анализ на основе обратных словарей. Тезисы XV Всесоюзного семинара "Системные исследования ГАСНТИ", ВИНИТИ, 1985 г.
35. Белоногов Г.Г., Зеленков Ю.Г., Кузнецов Б.А., Новоселов А.П, Панова Н.С., Рыжова Е.Ю., Хорошилов А.А., Штурман Я.П. Большой машинный политематический словарь ВИНИТИ. Тезисы XVI Всесоюзного семинара "Системные исследования ГАСНТИ", ВИНИТИ, 1987 г.
36. Белоногов Г.Г., Зеленков Ю.Г., Кузнецов Б.А., Новоселов А.П., Панова Н.С., Рыжова Е.Ю., Хорошилов А.А., Штурман Я.П. Машинный политематический словарь основ слов. Сб. "Научно-техническая информация", сер. 2, N 9, ВИНИТИ, 1988 г.
37. Белоногов Г.Г., Зеленков Ю.Г., Кузнецов Б.А., Новоселов А.П., Пащенко Н.А., Хорошилов А.А. Компьютерная лингвистика в системе НТИ. Сб. "Вопросы информационной теории и практики", N 58, ВИНИТИ, 1989 г.
38. Белоногов Г.Г., Зеленков Ю.Г., Кузнецов Б.А., Хорошилов А.А. Автоматизация процессов обнаружения и исправления ошибок в текстах. Сб. "Научно-техническая информация", сер. 1, NN 7-8, ВИНИТИ, 1991 г.
39. Белоногов Г.Г., Зеленков Ю.Г., Новоселов А.П., Хорошилов Ал-др А., Хорошилов Ал-сей А. Защита окружающей среды и языковые барьеры. Круглый стол "Информационная поддержка устойчивого развития", Институт промышленного развития, Москва, 1998 г.
40. Белоногов Г.Г., Зеленков Ю.Г., Новоселов А.П., Хорошилов Ал-др А., Хорошилов Ал-сей А. Системы фразеологического машинного перевода. Состояние и перспективы развития. Сб. "Научно-техническая информация", сер. 2, N 12, ВИНИТИ, 1998 г.
41. Белоногов Г.Г., Зеленков Ю.Г., Новоселов А.П., Хорошилов Ал-др А., Хорошилов Ал-сей А. Метод аналогии в компьютерной лингвистике. Сб. "Научно-техническая информация", сер. 2, N 1, ВИНИТИ, 2000 г.
42. Белоногов Г.Г., Кузнецов Б.А., Новоселов А.П. Автоматизированная обработка научно-технической информации. Лингвистические аспекты. Сб. "Итоги науки и техники", сер. "Информатика", т. 8, ВИНИТИ, 1984 г.
43. Белоногов Г.Г., Кузнецов Б.А., Новоселов А.П., Пащенко Н.А. Лингвистическое обеспечение автоматизированных информационных систем. Вопросы языкознания, N 5, 1990 г.
44. Белоногов Г.Г., Новоселов А.П. Автоматизация процессов накопления, поиска и обобщения информации. "Наука", Москва, 1979 г.
45. Березин Ф.М., Головин Б.Н. Общее языкознание. М., "Просвещение", 1979.
46. Бернштейн Э.С., Лахути Д.Г., Чернявский B.C. О критериях оценки поисковых систем. Сб. "Научно-техническая информация", No 3, ВИНИТИ, 1964.
47. Волошин И.А., Белоногов Г.Г., Кузнецов Б.А. Проблемы преодоления языковых барьеров в разноязычных базах данных. Сб. "Проблемы информационных систем", N 1, МЦНТИ, 1986 г.
48. Большаков И.А. Количественный анализ методов сжатия крупных машинных морфологических словарей. Сб. "Научно-техническая информация", сер. 2, N 3, ВИНИТИ, 1990 г.
49. Большаков И.А. Минимизация перебора альтернатив при автоматизированном исправлении искаженных слов. Сб. "Семиотика и информатика", вып. 31, 1990 г.
50. Большаков И.А. Проблемы автоматической коррекции текстов на флективных языках. Сб. "Итоги науки и техники", сер. "Теория вероятностей. Математическая статистика. Техническая кибернетика", т. 28 ВИНИТИ, 1988 г.
51. Большаков И.А. Русский морфологический словарь для IBM-совместимых персональных компьютеров. Сб. "Научно-техническая информация", сер. 2, N 1, ВИНИТИ, 1990 г.
52. Варга Д. Проблемы осуществления морфологического анализа при машинном переводе. Сб. "Научно-техническая информация", сер. 2, N 4, ВИНИТИ, 1964 г.
53. Виноград Т. Программа, понимающая естественный язык. М., "Мир", 1976.
54. Влэдуц Г.Э. О некоторых сторонах исследований по созданию информационно-поисковых систем. Сб. "Научно-техническая информация", No 1, ВИНИТИ, 1961.
55. Гельбух А.Ф. Минимизация количества обращений к диску при словарном морфологическом анализе. Сб. "Научно-техническая информация", сер. 2, N 6, ВИНИТИ, 1991 г.
56. Гельбух А.Ф. Минимизация числа гипотез и обращений к дисковой памяти при словарном исправлении опечаток. Сб. "Научно-техническая информация", сер. 2, N 5, ВИНИТИ, 1993 г.
57. Гельбух А.Ф. Эффективно реализуемая модель морфологии флективного естественного языка. Дисс. канд. техн. наук, Москва, 1994 г.
58. Гельбух А.Ф. Эффективно реализуемая модель морфологии флективного языка. Сб. "Научно-техническая информация", сер. 2, N 1,1. ВИНИТИ, 1992 г.
59. Добрушина Е.Р., Савина Г.Б., Гельбух А.Ф. Система точного морфологического анализа и синтеза. Сб. "Программное обеспечение новой информационной технологии", АН СССР и НПО ЦПС, Калинин, 1989 г.
60. Ефременко И.Л., Зеленков ЮГ., Старизный А.Е., Тимошенко А.И., Хорошилов А.А. Машинный политематический словарь английского языка. Сб. "Вопросы информационной теории и практики",1. N58, ВИНИТИ, 1989 г.
61. Жуков Д.А. Мы переводчики. "Знание", Москва, 1975 г.
62. Зализняк А.А. Грамматический словарь русского языка. Словоизменение. "Русский язык", Москва, 1987 г.
63. Зарецкий Д.А. Дистрибутивно-статистический метод установления парадигматических отношений между понятиями. Сб. "Вопросы информационной теории и практики", N 58, ВИНИТИ, 1989 г.
64. Звегинцев В.А. История языкознания XIX-XX веков в очерках и извлечениях. В 2-х частях. "Просвещение", Москва, 1964-65 гг.
65. Звегинцев В.А. Теоретическая и прикладная лингвистика. М., "Просвещение", 1968.
66. Звегинцев В.А. Язык и лингвистическая теория. МГУ, 1973 г.
67. Зеленков Ю.Г. Быстродействующий алгоритм приближенного морфологического анализа слов. Тезисы XV Всесоюзного семинара "Системные исследования ГАСНТИ", ВИНИТИ, 1985 г.
68. Зеленков Ю.Г. Исследование эффективности различных способов хеширования при поиске информации в словарях. Сб. "Вопросы информационной теории и практики", N 51, ВИНИТИ, 1984 г.
69. Зеленков Ю.Г. О совместном использовании метода аналогии и методов теории вероятностей при решении задач компьютерной лингвистики. Сб. "Научно-техническая информация", сер. 2, N 2, ВИНИТИ, 2000 г. (в печати).
70. Зенгер С. "Дж. Ст. Милль, его жизнь и произведения." Изд. редакции журнала "Образование", С.-Петербург, 1903 г.
71. Иорданская Л.Н. Морфологические типы основ русского языка (для различения омонимии морфем в процессе анализа при машинном переводе). В сб. "Проблемы кибернетики", вып. 6, "Физматгиз", 1961.
72. Капанидзе О.Г. Современные зарубежные системы машинного перевода. Обзорная информация. Сер. "Машинный перевод и автоматизация информационных переводов", вып. 17, ВЦП, Москва, 1989 г.
73. Коровина Т.И., Румшинский Б.Л., Семенова В.Э., Цинман JI.JI. Аппарат для описания морфологии флективных языков. Препр. Ин-та рус. яз. АН СССР, N91, 1977 г.
74. Котов Р.Г. Машинный фонд русского языка и автоматизация словарно-терминологического обеспечения информационной службы. Сб. "Машинный фонд русского языка: идеи и суждения", "Наука", Москва, 1986 г.
75. Криницкий Н.А., Миронов Г.А., Фролов Г.Д. Автоматизированные информационные системы. "Наука", Москва, 1982 г.
76. Кулагина О.С. Исследования по машинному переводу. "Наука", Москва, 1979 г.
77. Кулагина О.С. Морфологический анализ русских глаголов. Препринт ИПМ им. М.В. Келдыша, АН СССР, No 195, 1985.
78. Кулагина О.С. Морфологический анализ русских именных форм. Препринт ИПМ им. М.В. Келдыша, АН СССР, No 10, 1986.
79. Кулагина О.С. Об автоматическом синтаксическом анализе русских текстов. Препринт ИПМ им. М.В. Келдыша, АН СССР, No 205, 1987.
80. Кулагина О.С., Мельчук И.А. Машинный перевод с французского языка на русский. "Вопросы языкознания", No 5, 1956.
81. Курбаков К.И. Кодирование и поиск информации в автоматическом словаре. "Сов. радио", Москва, 1968 г.
82. Лайонз Дж. Введение в теоретическую лингвистику. "Прогресс", Москва, 1975 г.
83. Лахути Д.Г, Федоров Е.Б., Добронравов Н.С., Пархоменко В.Ф. Автоматическое индексирование текстов в документальных ИПС. Сб. "Кибернетическая лингвистика". М., "Наука", 1983.
84. Лахути Д.Г. Проблемы интеллектуализации информационно-поисковых систем. Диссертация в форме научного доклада на соискание ученой степени доктора технических наук. ВИНИТИ, М., 1999.
85. Лахути Д.Г, Блюменау Д.И., Гендина Н.И., Добронравов Н.С., Леонов В.П., Федоров Е.Б. Формализованное реферирование с использованием словесных клише. ВИНИТИ, НТИ, сер. 2, No 2, 1981.
86. Лебедев С.А. Индукция как метод научного познания. Изд. Московского университета, 1980 г.
87. Леонтьева Н.Н. Информационная модель машинного перевода. Сб. "Научно-техническая информация", сер. 2, N 10, ВИНИТИ, 1985 г.
88. Леонтьева Н.Н., Никогосов С.П. Принципы организации и основные компоненты системы ФРАП. Тезисы международного семинара по машинному переводу, Москва, 1979 г.
89. Леонтьева Н.Н., Шаляпина З.М. Современное состояние машинного перевода. В кн. Справочник. Искусственный интеллект. "Радио и связь", Москва, 1990 г.
90. Ломоносов М.В. Вечернее размышление о божьем величестве при случае великого северного сияния. Русская поэзия XVIII века. Библиотека всемирной литературы, серия первая, том 57. Изд-во "Художественная литература", М., 1972.
91. Лубенская С.И. Русско-английский фразеологический словарь. Изд. "Языки русской культуры", М., 1997.
92. Мальковский М.Г. Анализатор программы, понимающей естественный язык. Сб. "Обработка символьной информации", вып. 2, ВЦ АН СССР, 1975 г.
93. Мальковский М.Г. Диалог с системой искусственного интеллекта. МГУ, 1985 г.
94. Мальковский М.Г., Волкова И.А. Анализатор системы TULIPS-2. Морфологический уровень. Вестник Моск. Ун-та, сер. 15, N 1, 1981 г.
95. Марчук Ю.Н., Тихомиров Б.Д., Щербинин В.И. Система машинного перевода с английского языка на русский. Сб. "Машинный перевод и автоматизация информационных процессов", Москва, 1975 г.
96. Марчук Ю.Н. Проблемы машинного перевода. "Наука", Москва,1983 г.
97. Мельчук И.А. Морфологический анализ при машинном переводе (преимущественно на материале русского языка). В сб. "Проблемы кибернетики", вып. 6, "Физматгиз", 1961.
98. Мельчук И.А. Опыт разработки фрагмента системы понятий и терминов для морфологии. Сб. "Семиотика и информатика", вып. 6, 1975 г.
99. Мельчук И.А. Опыт теории лингвистических моделей "Смысл <=> текст". "Наука", Москва, 1974 г.
100. Милль Д.С. Система логики. Изложение принципов доказательства в связи с методами научного исследования. Издание магазина "Книжное дело", дом Бенкендорф, г. Москва, 1900 г.
101. Михайлов А.И., Черный А.И., Гиляревский Р.С. Основы информатики. "Наука", Москва, 1968 г.
102. Михайлов А.И., Черный А.И., Гиляревский Р.С. Научные коммуникации и информатика. М., "Наука", 1976.
103. Молошная Т.Н. Алгоритм перевода с английского языка на русский. В сб. "Проблемы кибернетики", вып. 3, "Физматгиз", I960.
104. Москович В.А. Дистрибутивно-статистический метод построения тезаурусов: современное состояние и перспективы. Сб. "Научно-техническая информация", сер. 2, NN 3-4, ВИНИТИ, 1972 г.
105. Нелюбин JI.JL Перевод и прикладная лингвистика. "Высшая школа", Москва, 1983 г.
106. Нестеров П.В., Белоногов Г.Г., Зеленков Ю.Г., Кузнецов Б.Л., Пащенко Н.А. Интерактивная система автоматизированного реферирования документов на основе словаря стандартных фраз. Сб. "Научно-техническая информация", сер. 2, N 7, ВИНИТИ, 1991 г.
107. Новоселов А.П., Хорошилов А.А. Алгоритм автоматической нормализации слов. Сб. "Вопросы информационной теории и практики", No 53, ВИНИТИ, М.-1985 г.
108. Новоселов А.П., Хорошилов А.А. Алгоритм автоматической нормализации слов. Сб. "Вопросы информационной теории и практики" N 53, ВИНИТИ, 1985 г.
109. Панов Д.Ю., Ляпунов А.А., Мухин И.С. Автоматизация перевода с одного языка на другой. Сессия по научным проблемам автоматизации производства. Изд-во АН СССР, 1956.
110. Панов Д.Ю. Автоматический перевод. Изд-во АН СССР, 1956.
111. Пась Р. Состояние и тенденции развшия машинного перевода в мире. Сб. "Проблемы информационных систем", N 10, Ml ЦП И, 1991 i.
112. Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика. "Высшая школа", Москва, 1977 г.
113. Пиотровский Р.Г. Инженерная лингвистика и теория языка. "Наука", Москва, 1979 г.
114. Попов Э.В. Общение с ЭВМ на естественном языке. "Наука", Москва, 1982 г.
115. Поспелов Г.С. Искусственный интеллект. Новая информационная технология. "Наука", Москва, 1986 г.
116. Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перевода. М., "Высшая школа", 1964.
117. Рецкер Я.И. Теория перевода и переводческая практика. "Международные отношения", Москва, 1974 г.
118. Рогожникова Н.П. Машинный фонд русского языка и словарное дело. Сб. "Машинный фонд русского языка: идеи и суждения", "Наука", Москва, 1986 г.
119. Сиокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития. Сб. "Новое в зарубежной лингвистике", "Прогресс", Москва, 1989 г.
120. Ф. де Соссюр. Курс общей лингвистики. В кн. Ф. Де Соссюр "Труды по языкознанию. М. "Прогресс", 1972.
121. Субботин М.М. Гипертекст. Новая форма письменной коммуникации. Сб. "Итоги науки и техники", сер. "Информатика", т. 18, ВИНИТИ, 1993 г.
122. Убин И.И. Автоматический переводной словарь. Принципы построения. ВЦП, Москва, 1989 г.
123. Убин И.И. ЭВМ и словарь. ВЦП, Москва, 1992 г.
124. Успенский В.А., Шрейдер Ю.А. К проблематике теории научной информации. Сб. "Научно-техническая информация", ВИНИТИ, No 3, 1963.
125. Финн В.К. Правдоподобные выводы и правдоподобные рассуждения. "Итоги науки и техники". Сер. "Теория вероятностей и математическая статистика. Теоретическая кибернетика." Т. 28, М., ВИНИТИ, 1988.
126. Финн В.К. Синтез познавательных процедур и проблема индукции. НТИ, сер.2, Логика и методология интеллектуальных систем, NN 1-2, 1999.
127. Хорошилов Ал-сей А., Штурман Я.П., Хорошилов Ал-др А. Анализ фонда иноязычных слов в ретроспективных базах данных ВИНИТИ. Сб. "Вопросы информационной теории и практики", N 58, ВИНИТИ, 1989 г.
128. Цинман Л.Л. Язык для записи лингвистической информации в системе автоматического перевода ЭТАП (опыт "практической логики"). Сб. "Семиотика и информатика", N 27, Москва, 1986 г.
129. Цинман Л.Л. и др. Алгоритм синтаксического анализа в системе ЭТАП-2. Препр. Ин-та рус. яз. АН СССР, N 174, 1986 г.
130. Черный А.И. Введение в теорию информационного поиска. М., "Наука", 1975.
131. Шайкевич А.Я. Дистрибутивно-статистический анализ в семантике. Принципы и методы семантических исследований. "Наука", Москва, 1976 г.
132. Шемакин Ю.И. Введение в информатику. "Финансы и статистика", Москва, 1985 г.
133. Шемакин Ю.И. Начала компьютерной лингвистики. МГОУ, "Росвузнаука", 1992 г.
134. Шенк Р. Обработка концептуальной информации. М., "Энергия",1980.
135. Шмелева А., Курбатов А. Еще раз о машинном переводе. HARD'n'SOFT, N 3, 1996 г.
136. Шрейдер Ю.А. Лингвистический подход к теории информационных систем. ВИНИТИ, НТИ, сер. 2, No 9, 1962.
137. Штурман Я.П., Родионов А.Я., Левштейн М.И, Кузнецов Б.А., Зеленков Ю.Г., Белоногов Г.Г. Система автоматизированного обнаружения орфографических ошибок, разработанная в ПИК ВИНИТИ. Сб. "Научно-техническая информация", сер. 2, N 7, ВИНИТИ, 1988 г.
138. Б.В. Якушин. Слово, Понятие, Информация. "Молодая гвардия",1975.
139. Отчет по теме 0.80.18.08.02.04.Н1: "Разработать типовые методы автоматизированного обнаружения и исправления случайных ошибок при вводе текстов в АСНТИ". ВИНИТИ, 1988.
140. Отчет по теме 0.80.18.08.02.05.Н1: "Разработать типовые системы автоматического индексирования документов для АИПС разного типа". ВИНИТИ, 1988.
141. Machine translation of languages. Edited by W. Locke &A. Booth,1955.
142. Y. Bar-Hillel. Can translation be mechnised? "American scientist", 1954, 42, No 2, p.p. 248-260.
143. A. Booth. Calculating machines and mechanical translation. "Discovery", 1954, 15, No 7, p.p. 280-285.
144. Elliston J.S.G. Computer-aided translation: a business viewpoint. In Barbara M. Shell (ed.) Translating and the Computer, Amsterdam (1979): North-Holland, p.p. 149-158.
145. Harold L. Somers. Current Research in Machine Translation In.: The Third International Conference on Theoretical and Methological Issues in Machine Translation of Natural Language, 11-13 June 1990< Austin, Tex.
146. Hutchins W.J. Machine translation: Past, present, future. Chichester (1988): Ellis Horwood.
147. Hutchins W.J. Recent Developments in Machine Translation. A review of the last five years. Jn., New Directions in Machine Translation, Coference proceedings, Budapest, Aug 18-19, 1988.
148. JEIDA (Japan Electronic Industry Development Association). A Japanese view of Machine Translation in light of the considerations and recomendations reported by ALP AC, U.S.A., Tokyo, July 1989.
149. Karttunen, L. KIMMO: a general morphological processor. Texas Linguistic Forum 22, 1983, p.p. 163-186.
150. Karttunen, L. Wittenburg, K. A two-level morphological analysis of English. Texas Linguistic Forum 22, 1983, p.p. 217-228.
151. E. Lehmann. Computersimulation des Verstehens natuerlicher prache. Nova Acta Leopold. 1981, 54, No 245.
152. R.S. Mareus, J.F. Reintjes. A translating Computer Interface for Enduser Operation of Heterogeneous Retrieval Systems. J. Amer. Soc. Inform. Sci., 1981, 32, No 4.
153. Maxwell Dan, Shubert Klaus & Witkam Toon (eds.) New Directions in Machine Translation (Distributed Language Translation 4), Dordrecht, 1988: Firis.
154. Nagao, M. A framework of a mechanical translation between Japanese and English by analogy principle, in Artificial and Human Intelligence, ed. A. Elithorn and R. Banerji, p.p. 173-180, North Holland, 1984.
155. Nirenburg Sergei (ed.) Machine Translation: Theoretical and methodological issues, Cambridge (1987): Cambridge University Press.
156. A. Oettinger. Automatic Language Translation. Harward Monographs in Applied Science. Nassachusetts. 1960.
157. J.L. Peterson. Computer Programs for Spelling Correction. Lect. Notes Comput. Sci., 1980.
158. Polloc, J., Zamora, A. Collection and characterization of spelling errors in scientific and scolarly text. J. Amer. Soc. Inf. Sci., 1983, v. 34, no. 1, p.p. 51-58.
159. Polloc, J., Zamora, A. System Design for detection and correction of spelling errors in scientific and scolarly text. J. Amer. Soc. Inf. Sci., 1984, v. 35, no. 2, p.p. 104-109.
160. Practical Experience of Machine Translation / V. Lawson (ed.). Amsterdam etc.: North-Holland Publ. Co., 1982.
161. Proceedings of the National Symposium on Machine Tanslation. Ed. by H.P. Edmundson, Englewood, Prentice-Hall, 1961.
162. P.M. Roget. Thesaurus of English Words and Phrases. London, 1953.
163. Russel, G. at al. A dictionary and morphological analizer for English. Proceedings of Coling'86, Association for Computational Linguistics, 1986, p.p. 277-279.
164. Salvo Meli. Informationsmarkt der Maschinellen Ubersetzung. Linguistischer Hintergrund, Typologie, system, Ubersetzungshilfen, Projekte und Ubersetzungsdienste. Terminologie et Traduction, 1989, N 3, p.p. 63-107.
165. Slocum Jonathan. A survey of Machine Translation: its history, current status, and future prospects. Computational linguistics 11 (1985), p.p. 1-17.
166. R.C. Schank, M. Lebowitz, L. Birnbaum. An integrated understander. Amer. J. Comput. Ling., 1980, 6, No 1.
167. Jones Karen Spark. Natural Language Access to Databases: Some Questions and Specific Approach. J. Amer. Soc. Inform. Sci., 1982, 4, No 1.
168. Vauquois Bernard, Christian Borret. Automated translation at Grenoble University. Computational Linguistics 11 (1985), p.p. 28-36.
169. M. Wettler. Semantisches Langezeit-gedaechtnis und das Verstehen von Sprache. Working Papers, Fondatione Dalle Moll, 1979.
170. Zamora, A. Automatic detection and correction of spelling errors in large data base. J. Amer. Soc. Inf. Sci., 1980, v. 31, no. 2, p.p. 51-57.1. РОССИЙСКАЯ ФЕДЕРАЦИЯ
171. РОССИЙСКОЕ АГЕНТСТВО ПО ПРАВОВОЙ ОХРАНЕ ПРОГРАММ ДЛЯ ЭВМ, БАЗ ДАННЫХ И ТОПОЛОГИЙ ИНТЕГРАЛЬНЫХ МИКРОСХЕМ (РосАПО)1. СВИДЕТЕЛЬСТВО
172. ОБ ОФИЦИАЛЬНОЙ РЕГИСТРАЦИИ ПРОГРАММЫ ДЛЯ ЭВМ950342
173. ПРОГРАММА для ЭВМ: Программный комплекс "Системафразеологического машинного перевода политематичеоких текстов о русского языка на английский" (система RETRAMS)1. ПРАВООБЛАДАТЕЛЬ:1. СТРАНА:1. АВТОР (АВТОРЫ):
174. Белоногов Герольд Георгиевич Зеленков Юрий Григорьевич Новоселов Алексей Прокопьевич Хорошилов Александр Алексеевич Хорошилов Алексей Алексеевич1. Российская Федерация
175. Белоногов Г.Г. Зеленков Ю.Г. Новоселов А.П. Хорошилов А. А. Хорошилов А.А.1. Заявка № 96025?
176. Зарегистрировано в Реестре программ для ЭВМ1. SO О? 19961. Дата регистрации
177. Генеральный директор РосАПОчисло месяцгод-Щ1. РОССИЙСКАЯ ФЕДЕРАЦИЯ
178. РОССИЙСКОЕ АГЕНТСТВО ПО ПРАВОВОЙ ОХРАНЕ ПРОГРАММ ДЛЯ ЭВМ, БАЗ ДАННЫХ И ТОПОЛОГИЙ ИНТЕГРАЛЬНЫХ МИКРОСХЕМ ( РосАПО)1. СВИДЕТЕЛЬСТВО
179. ОБ ОФИЦИАЛЬНОЙ РЕГИСТРАЦИИ ПРОГРАММЫ ДЛЯ ЭВМ9702761. ПРОГРАММА ДЛЯ ЭВМ:
180. Система фразеологического машинного перевода политематических текстов с английского языка на русский" (система ERTRANS)1. ПРАВООБЛАДАТЕЛЬ
181. Белоногов Герольд Георгиевич, Зеленков Юрий Григорьевич, Новоселов Алексей Прокопьевич, Хорошилов Александр Алексеевич, Хорошилов Алексей Алексеевич1. СТРАНА:1. АВТОР (АВТОРЫ):1. Российская Федерация
182. Белоногов Г.Г. Зеленков Ю.Г. Новоселов А.П. Хорошилов А.А. Хорошилов А.А.1. Заявка № 970188
183. Зарегистрировано в Реестре программ для ЭВМ
184. Дата регистрации ^ число q^ месяц
185. Генеральный директор РосАПО1. Б. М. Асфандиаров
186. Результаты перевода текстов различной тематикифрагменты)
187. Пример перевода фрагмента БД по автоматике и радиоэлектронике срусского языка на английский1. ИСХОДНЫЙ ТЕКСТ:1. D 1.
188. А06. Управленческий труд, организационные системы.
189. А21. Актуальные проблемы автоматизации управления организационно-техническими системами в органах внутренних дел.
190. А06. Преобразователи, термочувствительные элементы, измерительные системы.
191. А21. Электронные термочувствительные элементы в измерительных и управляющих системах.
192. А06. Managerial labour, organizational systems.
193. A21. Problems of current interest of control automation of organization-technical systems in internal affairs bodies.
194. A06. Transformers, thermo sensitive elements, measuring systems.
195. A21. Electronic thermo sensitive elements in measuring and control systems.
196. BOO. On the basis of thermal effects, useful application of which in many cases f>allows to find the most rational solutions in the design, different devices of automatics and control systems with unique characteristics have beenconsidered.
197. Пример перевода фрагмента БД по робототехнике с русского языка на английский1. ИСХОДНЫЙ ТЕКСТ:1. D 1.
198. АО6. Мехатронные системы, виртуальные датчики, мобильные роботы.
199. А21. Концепция виртуальных датчиков в задачах управления мобильными мехатронными системами.
200. А06. Mechatronics systems, virtual sensors, mobile robot.
201. A21. Conception of virtual sensors in problems of mobile mechatronics systems control.
202. Пример перевода текста по медицине с английского языка на русский1. ИСХОДНЫЙ ТЕКСТ:1.TRODUCTION
-
Похожие работы
- Параллельная система тематической текстовой классификации на основе метода опорных векторов
- Модели и алгоритмы семантической фильтрации текстовой информации в информационно-аналитических системах предприятия
- Методы, алгоритмы и средства автоматического управления процессом формирования изображений в системах распознавания текстовых меток реального времени
- Методы автоматической классификации и статистического анализа входного потока текстовой информации в информационных системах
- Метод обеспечения аудита и мониторинга информационной безопасности открытых источников сети Интернет
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность