автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Моделирование интеллектуальных компонент класса текст-видео информационных систем

кандидата технических наук
Нгуен Дык Тхао
город
Москва
год
2002
специальность ВАК РФ
05.25.05
цена
450 рублей
Диссертация по документальной информации на тему «Моделирование интеллектуальных компонент класса текст-видео информационных систем»

Оглавление автор диссертации — кандидата технических наук Нгуен Дык Тхао

ВВЕДЕНИЕ

ГЛАВА 1. ОБЩИЕ ВОПРОСЫ МОДЕЛИРОВАНИЯ ИКТВ

§ 1. Обзор публикаций по теме диссертации

§ 2. Основные определения

§ 3. Синтаксический анализ и упрощение структуры описания сцены

ГЛАВА 2. ОБРАБОТКА СТАТИЧЕСКОЙ ЧАСТИ ОПИСАНИЯ СЦЕНЫ

§ 4. Семантический анализ и выявление полноты и формальной непротиворечивости

§ 5. Восстановление подтекста

§ 6. Выявление геометрической непротиворечивости кадра.

ГЛАВА 3. НАХОЖДЕНИЕ ТИПОВ И ПАРАМЕТРОВ ДВИЖЕНИЙ ОБЪЕКТОВ

§ 7. Семантический анализ предложений второго класса

§ 8. Восстановление подтекста в предложениях третьего класса .-т.

§ 9. Восстановление подтекста в предложениях четвертого класса

§ 10. Восстановление подтекста в предложениях пятого класса

ГЛАВА 4. ФОРМИРОВАНИЕ ПРЕДИЗОБРАЖЕНИЯ СЦЕНЫ

§ 11. Определение минимальных экранных размеров объектов

§ 12. Формирование начального предвидеокадра

§ 13. Формирование последовательности предвидеокадров

Введение 2002 год, диссертация по документальной информации, Нгуен Дык Тхао

Обработка различных форм представления информации, в частности графической, является одной из центральных проблем в теории и практике построения современных информационных систем. Графическое представление информации используется для моделирования когнитивных процессов, базирующихся на пространственных или пространственно-временных (динамических) отношениях между объектами.

Сцену, объекты которой неподвижны, обычно называют статической. Под динамической понимают сцену, содержащую движущиеся объекты. Визуализацией сцены называют отображение ее текстового описания на экран монитора компьютера.

Использование графического изображения сцен, особенно динамических. повышает степень усвоения материалов, используемых в электронных учебных пособиях. В связи с этим вопросы визуализации динамических сцен, в которых присутствуют объекты в полноценном наборе пространственных и пространственно-временных отношений представляют в настоящий момент большой научный и практический интерес.

Пространство является важным элементом во многих информационных системах. Проблемой отображения пространственных отношений активно занимался ряд ученых в области искусственного интеллекта и интеллектуальных систем.

Авторами наиболее значительных работ в этом направлении, по мнению диссертанта, являются Поспелов Д.А., Кандрашина Е.Ю. и Литвинцева А.В.

В [23, 31] они рассматривали проблему визуализации пространственных сцен по их текстовым описаниям. В результате их научных ра5 бот были разработаны основные принципы представления знаний о пространстве и времени. Описаны логики и модели времени и пространства. Рассмотрен ряд свойств пространства (ненаправленность, непрерывность, бесконечность и гомогенность) в контексте интеллектуальных систем. Ими были выявлены базовые статические отношения взаиморасположения объектов в пространстве.

Ильин Г.М. и Игнатова В.Н [20, 21] занимались проблемой автоматического синтеза текстов на естественном языке и проблемой построения модели системы перехода от текста к его графическому представлению.

Был разработан ряд систем, обрабатывающих текстовую и графическую информацию. Целью таких систем является усиление выразительных средств представления информации в ЭВМ. Эти системы обладают рядом недостатков: они не способны визуализировать широкий набор динамических отношений, в них отсутствуют функции анализа сцены на основе знаний о физических и геометрических свойствах объектов, в них отсутствуют средства восстановления подтекстов.

В диссертации рассматриваются вопросы создания компонент класса текст-видео. Особое внимание уделено моделированию компонент такого класса, обладающих способностью восстанавливать присущие естественным языкам умолчания, т.е. интеллектуальных компонент класса текст-видео (ИКТВ).

Известно много работ по созданию интеллектуальных систем. Обычно для таких систем характерны большие затраты на их разработку. В диссертации сделан акцент на разработку таких моделей ИКВТ, применение которых доступно широкому кругу пользователей, например, разработчикам обучающих систем, которые не всегда являются специалистами в области проектирования информационных систем. Это достигается путем тщательного отбора элементов предметной области 6 и использования ее специфики.

Целью исследования является разработка моделей интеллектуальных компонент класса текст-видео информационных систем.

Методы исследования. Для решения поставленных задач в работе использованы известные и разработанные автором методы анализа и синтеза информационных систем, лингвистического анализа текстов на естественных языках, теории графов, аналитической геометрии, инженерии знаний, физики.

Научная новизна.

- Введены понятия полноты, формальной и геометрической непротиворечивости статической части текстового описания сцены.

- Получен критерий выявления полноты и формальной непротиворечивости статической части текстового описания сцены, в виде свойств соответствующего сцене графа.

- Предложен эффективный подход к выявлению геометрической непротиворечивости статической части текстового описания сцены, в основе которого лежит использование введенных понятий габаритного и минимального радиусов объекта.

- Введено понятие пропадания объектов сцены и предложена методика нахождения минимальных экранных размеров объекта, использующая разбиение предметной области на подклассы похожих объектов.

- Разработаны процедуры интеллектуального восстановления подтекстов в текстовом описании сцены, которые характеризуют следующие типы движений: по наклонной плоскости: тела, брошенного под углом к горизонту; тел после соударения.

- Разработан метод расширения предметной области ИКТВ без увеличения библиотеки геометрических образов за счет их закраски и полуподобных трансформаций на время трансляции. 7

Достоверность научных положений, выводов и практических рекомендаций подтверждается использованием математического аппарата, адекватного решаемым задачам, использованием современных методов анализа и синтеза информационных систем и результатами практического внедрения предложенных в диссертации методов, алгоритмов и программ.

Полученные в работе результаты позволяют облегчить труд широкого круга разработчиков информационных систем, использующих видеоматериалы. Предлагаемые модели интеллектуальных компонент класса текст-видео доступны для реализации разработчикам электронных учебников и других информационных систем.

Разработанные алгоритмы функционирования блоков прототипа ИКТВ доведены до уровня получения числовых соотношений.

Основные положения диссертации изложены и получили одобрение на II Международном Конгрессе ЮНЕСКО по информационным технологиям в образовании, Москва, РГГУ, 1-5 июня 1996г., XIII Международной Конференции "Проблемы теоретической кибернетики", Казань, 27-31 мая 2002г., семинаре в ВЦ РАН, спец. семинаре "Математическое моделирование сложных систем и процессов" (мехмат МГУ).

Все основные результаты диссертации опубликованы в четырех печатных работах.

Диссертация состоит из введения, пяти глав, заключения, списка литературы и приложений. Список литературы состоит из 54 наименований. Общий объем диссертации 133 страницы текста. Изложение иллюстрируют 27 рисунков.

Заключение диссертация на тему "Моделирование интеллектуальных компонент класса текст-видео информационных систем"

ЗАКЛЮЧЕНИЕ

В результате теоретических и практических исследований по решению сформулированных во введении настоящей диссертации задач получены новые результаты, имеющие высокую научную и практическую ценность.

Первым этапом визуализации динамических сцен является обработка входной информации (текстовое описание сцены).

При построении моделей большое внимание уделяется ограничениям, которые накладываются на структуру входных и выходных данных.

Ограничения на структуру текстового описания сцен объясняются сложностью разработки лингвистических процессоров и наличием большого числа работ в этом направлении.

Для проверки корректности входной информации в работе введены понятия полноты, формальной и геометрической непротиворечивости статической части текстового описания сцены и получены необходимые и достаточные условия полноты и формальной непротиворечивости статической части текстового описания сцены. Эти условия сформулированы в виде свойств введенного графа, который строится по описанию сцены.

Большое внимание уделенное в работе вопросам автоматического выявления пересечения прямоугольников и кругов связано с разбиением динамической сцены на большое число кадров, каждый из которых проверяется на геометрическую непротиворечивость. Для упрощения этих проверок введены понятия габаритного и минимального радиусов объекта.

Выявлена возможность пропадания объектов сцены, обусловленная наличием объектов, имеющих существенно различные размеры. Сцены, содержащие пропавшие объекты, недопустимы при адекватной визуализации. Предложена методика автоматического нахождения минимальных экранных размеров объекта, использующая разбиение предметной области на подклассы похожих объектов.

Встречающиеся в текстах на естественном языке умолчания о взаимном расположении объектов и о типах и параметрах их движения раскрываются с помощью разработанных процедур интеллектуального восстановления подтекстов. Описаны процедуры восстановления подтекстов, которые характеризуют следующие типы движений: по наклонной плоскости; тела, брошенного под углом к горизонту; тел после соударения.

Разработан метод существенного увеличения предметной области интеллектуальных компонент класса текст-видео без расширения библиотеки геометрических образов. В основе этого метода лежит полу подобная трансформация (с возможно различными коэффициентами сжатия по горизонтали и вертикали) и закраска библиотечного образа предка объекта на время трансляции.

Полученные в работе результаты позволяют облегчить труд широкого круга разработчиков информационных систем, использующих видеоматериалы. Предлагаемые модели интеллектуальных компонент класса текст-видео доступны для реализации разработчикам электронных учебников и других информационных систем.

Для подтверждения адекватности предложенных моделей разработан прототип ИКТВ, который успешно прошел испытания на факультете информатики РГГУ, в Московском научном центре по культуре и информационным технологиям и на кафедре математической теории интеллектуальных систем (мехмат МГУ).

Библиография Нгуен Дык Тхао, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Аверкин А. Н. Батыршин И. 3., Блишун А. Ф., Силов В. Б, Тарасов В. Б. Нечеткие множества в моделях управления и искусственного интеллекта // Под ред. Д. А. Поспелова. М.: Наука, 1996.

2. Аверкин А. Н., Гвида Дж., Поспелов Д. А., Сомальвико М. Обобщенные стратегии в решателях проблем // Известия АН СССР. Техническая кибернетика, 1978. №5. - С. 71-83.

3. Антончик В. С. Методы стабилизации программных движений. СПб. Изд. С.-Петерб. ун-та, 1998.

4. Апресян Ю. Д, Богуславский И. М. Лингвистический процессор для сложных интеллектуальных систем. -М. Наука, 1992

5. Апресян Ю. Д. Лексическая семантика. Семиотические средства языка. М.: Наука, 1975.

6. Апресян Ю. Д. Экспериметальное исследование семантики русского языка. М.: Наука, 1977.

7. Букаченко А. И. Интеллектуальная технология проблемы и перспективы. Вильнюс - 1989г.

8. Вертгеймер М. Продуктивное мышление // пер. с нем. М.: Прогресс, 1987.

9. Винер Н. Кибернетика или управление и связь в животном и машине. Сов. Радио, 1958.

10. Виноград Т. Программа, понимающая естественный язык // пер с англ. М.: Мир, 1976.

11. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем Учебное пособие, СПб: Питер, 2000. - 384 е.: ил.

12. Гафуров Д. 3. Отделимость образов в пространстве объектов. -Новосибирск. 1991.

13. Гергей Т., Финн В. К. Об интеллектуальных системах. // Экспертные системы: состояние и перспективы. М. Наука, 1989.

14. Голякова J1. А. Подтекст и его экспликация в художественном тексте. Перм. гос. ун-т. Пермь, 1996г.

15. Голякова JI. А. Подтекст как полидетерминированное явление. Перм гос. ун-т. Пермь, 1999г.

16. Гражданников Е. Д. Классификация интеллектуальных систем // Интеллект, человек и компьютер, Новосибирск, 1994.

17. Заде Л. Лингвистическая переменная. М.: ФизМатгиз, 1972.

18. Зекин А. А. Основы когнитивной компьютерной графики. М.: Наука, 1991.

19. Зубова О. В. Математические основы управления движением. Ис-след. равномерной устойчивости по Ляпунову: Учеб. Пособие. СПб. Изд. С.-Петерб. ун-та, 1997.

20. Ильин Г.М., Игнатова В.Н. Модель системы перехода от текстового описания трехмерной сцены на естественном языке к ее графическому изображению. // Труды 2-ой всесоюзной конференции по искусственному интеллекту, Т.2, Минск 1990г.

21. Ильин Г. М., Игнатова В. Н. Система "рисунок"-"текст" // Прогр. продукты и системы. Калинин, 1992. - №2.

22. Кандрашина Е. Ю. Средства представлений темпоральной информации в базах знаний // Известия АН СССР. Техническая кибернетика, 1984. №5. - С. 15-22.

23. Кандрашина Е. Ю., Литвинцева Л. В., Поспелов Д. А. Представление знаний о времени и пространстве в интеллектуальных системах. М.-Наука 1989г.

24. Кравченко А. В. Когнитивные структуры пространства и времени в естественном языке // Известие РАН, серия литературы и языка, Т.55, №3. РАН-1996г.

25. Кулагина О. С. О проблемах автоматической обработки текстов на естественном языке // Интеллектуальные системы Том 1 выпуск 1-4, -М.: 1996, с. 109-116.

26. Кулагина О. С. О синтаксическом анализе на основе предпочтений / Препринт ИМП им. М.В. Келдыша АН СССР, №3, М.: 1990.

27. Кулагина О. С. Об автоматическом синтаксическом анализе русских текстов / Препринт ИМП им. М.В. Келдыша АН СССР, №205, М.: 1987.

28. Лавров С. С. Представление и использование знаний в автоматизированных системах // Микропроцессорные средства и системы 1986г., №3, с.14-19

29. Ладенко И. С. Методология и практика освоения интеллектуальных систем // Интеллект, человек и компьютер, Новосибирск-1994г.

30. Лекант П. А., Диброва Е. И., Касаткин Л.Л., Клобуков Е.В. Современный русский язык. -М.: Дрофа, 2000.

31. Литвинцева Л. В. Концептуальная модель систем визуализации трехмерных динамических сцен. // Прогр. продукты и системы. Калинин, 1992. - №2, с. 27-33.

32. Литовченко Ц. Г. 'Компьютерная информационная система распознавания динамических образов в потоке изображений на основе128алгоритмической технологии. // Интеллектуальные системы Том 1 выпуск 1-4. -М.: 1996, с. 117-123.

33. Литовченко Ц. Г. Компьютерная информационная система распознавания динамических образов в потоке изображений с предельными требованиями по качеству распознавания // "Вестник НОУ-ХАУ", 1992. № 1.

34. Ловцов Д. А., Калашников Ю.В. Информационная технология автоматизированного ситуационного функционального контроля сложных динамических объектов. // НТИ/ВИНИТИ, Сер.2, Информационные процессы и системы.-М., 1997.-№3

35. Лутманов С. В. Программное оптимальное управление динамическими объектами. -М. 1999.

36. Мартынова Т. Л. Система поддержки процесса формирования интеллектуальных умений в области практической информатики: автореферат диссертации на соискание ученной степени к.т.н: 05.13.13. Моск. гос. ин-т радиотехники, электроники и автоматики.-М., 1999.

37. Матвеев Л. А. Системы поддержки принятия решений. Санкт-Петербург 1993г.

38. Мешалкин Л. Д., С. И. Гольдберг. Интеллектуальные системы -освоение новых методов // Природа 1994г., №10, с.66-76

39. Мостепаненко А. М. Пространство в макро-, мега и микромире. М.: Изд-во политической литературы, 1974 240 с.

40. Нгуен Д.Т. О восстановлении подтекста при трансляции мультимедиа языков // Интеллектуальные системы Том 5 выпуск 1-4, -М.: 2000, с. 187-196.129

41. Нгуен Д.Т. О динамической графической компоненте интеллектуальных систем // Актуальные проблемы современной науки. № 2. -М.: Спутник+, 2001. с. 210-214.

42. Нгуен Д.Т. О компьютерной трансляции динамических сцен // Тезисы докладов XIII Международной конференции "Проблемы теоретической кибернетики". Казань, 27-31 мая 2002 г., с. 132.

43. Нгуен Д.Т., Орлов В.А., Шимко Н.А. О проектировании интеллектуальных трансляторов текст-видео // Актуальные проблемы современной науки № 6, -М.: Спутник+, 2002, с. 221-227.

44. Обработка динамической информации в интеллектуальных системах: Сб.науч.тр./Рос.Акад.наук, Ин-т физ.-техн. пробл., МНТК "Прогресс"; под редакцией Лупичева Л.Н.-М.: ИФТП, 1992.

45. Ованесбеков Л. Г. База знаний МЕТ научный отчет - 1995-1997гг.

46. Ованесбеков Л. Г. База знаний МЕТ описание для пользователей - 1996г

47. Поспелов Г. С., Поспелов Д. А. Искусственный интеллект // Прикладные системы.-М.:Зиание, 1985.-48 с.

48. Поспелов Д. А. Ситуационное управление // Теория и практика. -М.: Наука, 1996. 284 с.

49. Рубашкин В. Ш. Представление и анализа смысла в информационных интеллектуальных системах. Наука 1979г.

50. Смординский С. С. Алгоритмы и программные средства интеллектуальных систем принятия решения Ч.2.- 1994.

51. Соколов Н. А. Системы автоматизированной обработки экономической информации // Интеллектуальные системы основа новейших технологий. М - 1992г.130

52. Тыугу Э. X. Концептуальное программирование. М.: - Наука, 1984. - 255 с.

53. Финн В. Л. О машинно-ориентированной формализации правопо-добных рассуждений в стиле Ф. Бэкона. Д. С. Милля //' Семиотика и информатика. - С. 5-45.

54. Хорошевский В. Ф., Шерстнев В.Ю. Программный инструментарий представления знаний в экспертных системах. // Экспертные системы: состояние и перспективы. М. Наука 1989г.

55. УТВЕРЖДАЮ Проректор РГГУ по научной работе4:\ , * ib

56. Настоящий акт составлен в том, что методы автоматического выявления пересечений прямоугольников и кругов использованы в лекционной части курса «Основы машинной графики», читаемого на факультете информатики РГГУ.

57. Разработанная компонента класса текст-видео, использована при проведение практических занятий по курсу «Основы машинной графики».

58. Модели и методы синтаксического и семантического анализа текстового описания сцен использованы при проведении занятий по курсу "Автоматическая обработка текстов на естественном языке", читаемому на факультете информатики.

59. На факультет информатики были представлены: 1 . Программное обеспечение интеллектуальной компоненты класса текст-видео (ИКТВ), на CD-ROM.2. Инструкция пользователя.

60. Материалы по автоматическому выявлению пересечений прямоугольников и кругов и методические указания по их использованию, на CD-ROM.

61. Апробация представленных материалов показалаработоспособность и эффективность предложенных в диссертации моделей визуг- . „зации динамических сцен.

62. Состав комиссии, принимавшей материалы:1. Председатель

63. На кафедру «Математической теории интеллектуальных систем» мехмата МГУ были переданы:

64. Программное обеспечение прототипа интеллектуальной компоненты класса текст-видео (ИКТВ) на CD-ROM.

65. Краткое изложение диссертации Нгуен Дык Тхао.

66. Инструкция по установке и использованию прототипа ИКТВ.

67. Испытания показали работоспособность предъявленного прототипа ИКТВ.

68. Планируется использование предоставленных материалов в учебном процессе.1ТИСw0 5 » ноября 2 0 02г.1. АКТ ПРОВЕДЕНИЯ ИСПЫТАНИЯ

69. В сентябре 2002 г. МНЦКИТ переданы:

70. Программное обеспечение прототипа интеллектуальной компоненты класса текст-видео (ИКТВ) на CD-ROM.

71. Инструкция пользователя ИКТВ.

72. Краткое изложение диссертации Нгуен Дык Тхао

73. Моделирование интеллектуальных компонент класса текст-видео информационных систем". На дискете в формате LaTex.

74. Проверена работа всех предложенных в диссертации процедур интеллектуального восстановления подтекста.

75. Прототип ИКТВ был использован при разработке электронных учебников по физике и механике твердого тела.