автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Развитие технологии анализа деловых текстов путем учета эмоциональных оценок
Автореферат диссертации по теме "Развитие технологии анализа деловых текстов путем учета эмоциональных оценок"
На правах копией
□ОЗОБТЭЗЬ
Шарова Татьяна Внмороина
УДК 519 6
РАЗВИТИЕ ТЕХНОЛОГИИ ДИАЛИЗА ДЕЛОВЫХ ТЕКСТОВ ПУТЕМ УЧЕТА ЭМОЦИОНАЛЬНЫХ ОЦЕНОК
(на примерах применения в банковском и строительном секторах экономики)
Специальность 05 13 01 - Системный аналич управтение и обработка информации
Диссертация в виде научного доктада на соискание ученой степени кандидата экономических наук
Научный руководитель действительный член РАГН доктор технических на\к профессор Гольдштейн Сергеи Лю тигович
Ркатерннбург 2006
003067936
Работа выполнена в Уральском Межакалемическом Союзе
Официальные оппоненты - действительный чтен РАЕН проф лэн
Кчюев Юрий Борисович - действительный член МАНПО, проф д э н Внуковский Николай Иванович
Защита состоится 15 января 2007 г в 13 00 на заседании Диссертационной) Совеы Д02 017 PCO ММС 0191 по адресу 620077, г Екатеринбург, ул Володарского 4 НИИЦВЕТМЕТ/УМС
С диссертацией в виде научного доклада можно ознакомиться в НП «УМС» Диссертация в виде научного доклада разослана 15 декабря 2006 г
Ученый секретарь
диссертационного совета проф к ф-м н
В И Рогович
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность исследования
Для эффективного управления органи нацией необходима самая разнообразная информация Она служит фундаментом для формирования тюбых документов (докладов, отчетов, служебных записок предложений и т п ), которые лежат в основе управления Любые действия руководителей исполнителей, клиентов/потребите пей опираются на информацию Il s\чепие отечественного и зарубежного опыта показало, что важны не тотько синтаксис и семантика документа, но и эмоциональное восприятие Такая оценка имеет под собой наработанную психолого-лингвистическую базу При этом областью приложения служат, как правило, тексты вербатыю-г\млппирпо! о и mim Работа же с деловыми текстами ограничиваем cían мртым набором средин компьютерной подготовки документов с использованием юридической и финансовой поддержек
Проблемы анализа текстов относятся к нескопьким научно-техническим дисциплинам теории сложных систем, психолого-лингвистическим пачкам, разработке и использованию программных продуктов и т п Исследования по анапизу сложных систем отражены в работах как зарубежных ученых G Good R Makcole, M N Rabin и др, так и отечественных H П Бусленко, В В Дружинин, Д С Конгоров, H H Моисеев, Д А После юн ГС 1 loci к юн и ip Психолою-лингвистическому направлению анализа текстов посвящены рабош зарубежных G В Mangaim, R К Rich и др и отечественных АН Алексеева, ЮА Асеева, РМ Габитовой, А А Харламнова и др авторов При анапизе текстов используют компьютерные программы, связанные с анализом текстов и вычислительной лингвистикой, разработанные как зарубежными M Bai low, M Scott, J J Paijmans, R J С Watt и др , так и отечественными В П Бетянин Л M Делицын, С В Логичев, В П Сысуев, В И Шалак и др специалистами
Однако в этих трудах и разработках технология анализа деювых текстов представтена пока еще весьма фрагментарно В юле время имейся социальный заказ на подобные работы Поэюму 1ема тиссеркщионною исследования актуальна
Авторские разработки по этой тематике были скоординированы следующими программами
- Программа развития Свердловской области на период до 2015 года
- Прогноз социально-экономического развития города Екатеринбурга и основные направления бюджетной и налоговой полишки на период ю 201
- Концепция развития ОАО «Банк «Екатеринбург» на 2006-2008 гг
- План развития ЗАО «Нова Строй», г Екатеринбург, на 2005-2010 гг
Объект исследования - технология анализа документов
Предмет исследования - развитие технологии анализа деловых текстов путем
учета эмоциональных оценок
Цель - развитая технология анализа документов
Задачи:
- анализ проблематики с выходом па прототипы,
- развитие и структуризация понятийного аппарата технологии анализа текстов,
- развитие технологии анализа текстов,
- развитие подсистемы подготовки документов,
- апробация развитой технологии анализа текстов и подготовки доку мен гов
Методы исследования- экономико-математического моделирования, системного подхода, менеджмента, теории управления, теории экономической эффективности, компьютерного анализа текстов Научная новизна*
- на основе литературно-аналитического обзора предложен пакет прототипов по средствам подготовки деловых текстов, по типологии основных понятий, по моделям анализа и подготовки текстов,
- предложены иерархические тезаурусы основных понятии по технологии анализа текстов и коммуникациям,
- получены пакеты алгоритмических, кортежных и функционально-структурных моделей технологии анализа текстов,
- проведен фоносемантический и фоноколористический анализы экономического текста, позволившие развить прототипный метод,
- развита подсистема подготовки документов путем учета эмоциональных оценок
Практическая значимость: результаты разработок использованы на 2-\ предприятиях, о чем имеются акты внедрения
Апробация работы: основные положения и полученные результаты докладывались на Научно-практической конференции с международным участием «Экономическая культура в условиях развития рыночной экономики отечественная практика и опыт международного сотрудничества», 2006 г, г Екатеринбург, X отчетной конференции молодых ученых ГОУ ВПО УГТУ-УПИ, 2006 г , г Екатеринбург, заседаниях топ-менеджеров ЗАО «Нова-Строй», 2005-2006 гг, г Екатеринбург, совещаниях руководитепей структурных подразделений ОАО «Банк «Екатеринбург», 2006 г , г Екатеринбург Публикации: По материалам диссертации имеется 8 публикаций в научных изданиях
Структура диссертационного исследования включает в себя введение, 5 глав глава 1 — проблематика технологии анализа тексюв е \чеюм эмоциональных оценок (литературно-аналитический обзор), глава 2 - развитие и структуризация понятийного аппарата техночогии анализа текстов, глава 3 -развитие технологии анализа текстов, глава 4 - пример анализа экономического текста, глава 5 - развитие подсистемы подготовки документов путем учета эмоциональных оценок, заключение и список* основных публикаций по теме диссертации
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
ГЛАВА 1. ПРОБЛЕМАТИКА ТЕХНОЛОГИИ АНАЛИЗА ТЕКСТОВ С УЧЕТОМ ЭМОЦИОНАЛЬНЫХ ОЦЕНОК (ЛИТЕРАТУРНО-АНАЛИТИЧЕСКИЙ ОБЗОР) 1.1 Поиск информации
По ключевым словам просмотрено 130 библиографических источников в тч 45 зарубежных, а также отобрано 86 адресов Internet Оценены по июта релевантность и пертинентность этой информации
1.2 Аналоги и выход на прототип
В результате литературно-аналитического обзора выявлены основные аналоги (таблица 1)
Таблица 1
Аналоги, отражающие основные аспекты технологии анализа текстов_
№ Наименование Аналоги
' 1 Средства подготовки документов 1 1 Текстовые процессоры MS Word AbiWord, Kword Openoffice org writer Polvedit Text Tlnnkfiee oftkc wiitc
1 2 Системы документооборота Directum documentum 1 фр ч - юк\muiюиборш БОСС-рефер1_нт DocsVision Mlectotlke 1 anDocs Дето-предприятие Company Media/ottice media Hummingbird enterprise Naudoc
1 3 Юридическая поддержка Консутьтант плюс Гарант, Бтиц-договор
1 4 Даталогическая поддержка Архстройконсатт (строительство) Банк XXI - век (банковская)
1 5 Финансовая поддержка «Универсатьная бухгатгерия» R-st\ II 1С Бухгалтерия LFADFR classic ИН Ж Анатитик Audit Expert, Onvision Альт - Финансы АБФИ - предприятие
2 Типология понятий и дефиниция 2 1 Коммуникации Словари энциклопедии монографии
2 2 Теория текста
2 3 Контент-анали 1
3 Методы анализа текстов 3 1 Вербально-описательные ВААЛ-2000 Программа Я Л Либермана для анализа поэтических текстов
3 2 Лингвистические Морфологический анализатор Monoconc АОТ Fresh Eye, Lingsoft ,
3 3 Математические Tecktit, Hermit Crab Лингвоанализатор
4 Модели функционирования технологии анализа текстов 4 1 Функционально-структурные SADT-ногации кортежные модети
4 2 Алгоритмические Язык блок-схем
1.3 Критика прототипов и гипотезы о предполагаемых решениях
Недостатки прототипов и гипотезы о предпоаагаемых решениях представлены в таблице 2
Таблица 2
_Недостатки прототипов и гипотезы о предполагаемых решениях_
Ранг прототипа
Прототип
Наименование п рототи па/анал о га
Недостатки
Предполагаемое решение
I
Система и технология подготовки документов
Ограниченная функциональность
Развитие системы подготовки юкчменюв л счет ввода блоков «Компьютерная оценка»
«Оценка восприятия» «Модификация» _«Компьютерный подсказчик»_
Типотогии понятий и дефиниций «Коммуникация»
по В С Мичалевичу Контент анализ по Ю А Асееву В А Владыкину Дж Б Мангейму Р К Ричу Теория текста из словаря по кибернетике 1989 г лингвистического •энциклопедического словаря 1990 по С А Рейсеру
Фрагментарность
Инвариантная часть тезауруса по терминам «Комм\никация» «Кон ген г шти» и
V I ШрИЯ I I
Методы анализа текстов по змониональным оценкам по В И Шалаку Я Л Либерману
Модели функционирования технологии анализа текстов
Недостаточная адаптированность
к деловым и научным текстам
Ограниченная функциональное
Мо шфиклиия
Модель преобразования информации в эмоционально-информационный куб ф\гнкционально-стр\кпрные модели
KOpieAHI.il. И ,П[ОрН!\!11'К(.К1К МО К Ш
Глава 2. РАЗВИТИЕ И СТРУКТУРИЗАЦИЯ ПОНЯТИИНОГО
АППАРАТА
2Л Постановка задачи
Одной из опорных точек в области работы с инфосырьем мог\т бьпь технологии анализа текстов При этом список ключевых слов данного вида анализа включает в себя термины текст, текстология, теория текста, критика текста, текстовый анализ, лингвистика, семиотика, синтаксис, семантика, прагматика герменевтика, экзегетика контенг-анализ риторика китенка и I 1 Единого взгляда на этот конпомераг понятий пег ни и тпокиии Сформпрнна икь несколько отдельных теоретических аспектов философский ттератчрныи филологический и т п Привлекаются разные парадигмы гуманитарная техническая
естественно-научная Практические аспекты отличаются объектами приложения (художественная литература религиозные тексты научные фу и.1 и 11) субъектами (автор текста, редактор, издатель, читатель) и методиками анализа (от вербально-описательных до строгих математических) Актуальность наведения хотя бы субпорядка в этой области очевидна 2 2 Создание тезаурусов-предпосылок
Разработан пакет фрагментов иерархических тезаурусов по нескольким основным понятиям коммуникация, теория текста, герменевтика, контентный анализ, риторика, семиотика, кинесика, математическая лингвистика (примеры на рис 1-5)
О Иронии
Рис 1 Фрагмент иерархии понятий по термину «Коммуникация» по В С Михатевичу (1-аспекты 2-типы, 1 1-технический, 1 2-семантический 1 3 - прагматическим 2 - человек / четовек 2 2 - четовек/ЭВМ 2 3-ЭВМ/ЭВМ)
„ Уровни
Рис 2 Фрагмент тезауруса понятий к термину «Теория текста»
(1 - лингвистика, 1 1 - внешняя лингвистика, 1 1 1 - язык в связи с историей народа и цивилизации 1 1 2 - язык в связи с политикой, I 1 3 - язык в связи с литературой, 1 1 4 - язык в связи с его географическим распространением и тд,12 - внутренняя лингвистика (языкознание) I 2 1 - устройство языка 1 2 2 - структура языка 1 3 - интерпингвистика 111-международный язык как средство межязыкового нее ¡едования 2 - с1р\кт\ра км и 2 I графическое деление текста 2 I I - рубрикация 22 - смыстовля оркшшацич к кем 2 2 I информационная 2 2 2 - логическая 2 2 3 - психологическая 2 2 4 - эстетическая 3 -герменевтика (толкование) текста 3 1 - традиционная классическая герменевтика 3 11-синтаксический анализ 3 1 2 - семантический анализ 3 1 3 - прагматический анализ 3 2-современная литературная герменевтика 3 2 1 - анализ внутренней логики единой констр>кции
текста. 3 2 1 — анализ значения текста 3 2 3 - контент-анализ текста 4- грамматика текс га 4 1-словообразование 41 1 - слово как отдетьпая единица 4 I 2 - с твообра «тле и.пая ии км I 413 — способы словообразования 42 - морфою! ия 42 1 мирфо пи им |шм 42^ чорфозогия грамматических изменений слова 4 2 3 - морфочшия I рамма! ически\ характеристик слова, 43 - синтаксис 43 1 - синтагматика слова 4 3 2 - синтаксис словосочетания 4 3 3 - синтагматика предложения, 4 3 4 - синтаксис форм слова)
Рис 3 Тезаурус понятий по термину «Контентный анализ» (1 - тнпотогия текстов для анализа 2 - задачи анализа, 3 - методы анализа 1 1 - по жанру I 2 -по способу фиксации информации 1 3 - по целевому назначению 1 4 - по чисзу авторов 2 1-изелечение информации 2 2 - анализ информации 23 - разносторонний аначиз прешсга (проблемы ситуации), 3 1 - традиционные методы 3 2 - контекстные методы 1 1 I - на\ чиые 112 - художественные 113 - общественно-политические 114 - информационно-документальные, I 2 I - письменные 1 2 2 - устные 12 3 - фонетические (рассчитанные па слуховое восприятие), 124 - аудиовизуальные 13 1 - естественно функционирующие (це ей внешние по отношению к исследованию) 13 2 - «целевые» документы (полученные исследоватеie\i, согзасно исследовательской программе), 1 4 1 - один автор / составитель) 1 4 2 - два и бозее авторов / составителей), 2 1 1 - извчечение открытой для понимания информации 2 12 - извлечение суггестивной (внушенной) информации, 2 2 1 - реферирование 2 2 2 -экспертиза 23 1 - интегральный аначиз 2 3 2 - ситуационный .шиш 2 33 пробивший анализ 31 I - статистический ана 1из 312- пни вис шчсскии ли ш ' 3| 3 мирфоmi пчч i пи анализ, 3 2 1 - информационный анализ 3 2 2 - структурный (темопичсскии) ана ш' 3 2 > пробпемно-мотивационный анализ 3 2 4 -контент-анапиз)
Уровни О
(1 - коммуниканты 2 - тексты 3 - диалог в парадигмах 1 1 - неживой природы 1 2 -живой природы 2 1 - по жанру 2 2 - по способу фиксации информации 2 3 - по целевому назначению 2 4 - по авторству 3 1 - системной, 3 2 - естественно-научной 3 3 - в
гуманитарной, 3 4- бытовой 1 1 I - первой природы 1 1 2 - второй природы 12 1 с первой сигнальной системой, 1 2 2 - со второй сигнапыюй системой (речью) 2 11-научные 2 1 2 - художественные 2 1 3 - техническая, 2 1 4 - общественно-политическая 2 1 5 - документально-информационная 2 1 6 - бытовые 2 2 1 - письменные 2 2 2 - устные
2 3 1 - по типу 2 3 2 - по виду 2 4 1 - ранг 2 4 2 - котичество 3 1 1 - в сис гечотогии 3 1 2 - в системотехнике 3 2 1 - в математике 3 2 2 - в информатике > 2 > » фи - пи '24 н химии 3 2 5 —в астрономии—3-2-6-в науках о зечте 3 2 7 - в био ioi ии 32 8 к >ко ioi ии
3 2 9 - в экономике 3 2 10 - в медицине 3 3 1 - в фичософии 3 3 2 - в психотогни 3 3 3 в социо ioi ии 3 3 4 - в истории 3 3 5 - в культурологии 3 3 6 - в политологии 3 3 7 - р юриспруденции 3 3 8 - в теории текста 3 4 1 - дом 3 4 2 - работа 3 4 3 - общество)
Глава 3. РАЗВИТИЕ ТЕХНОЛОГИИ АНАЛИЗА ТЕКСТОВ
3.1 Кортежная модель функционирования и развития технологии анализа
текстов (ФР TAT)
Кортежная модель задачи ФР TAT в SADT-формализма может быть представлена в виде
ФР TAT = (С, Р, МУ, МР, П, R), ( 1)
где С — инфосырье, Р - инфопродукт, МУ - механизм } правления, МР -механизм реализации, П - технологический передел
Для поставленной задачи
С = (Cl, С2, СЗ, R1), (2)
где С1 - анализируемый текст, С2 - задача анализа, СЗ - задача развития систем и подсистем,
МУ = (Tl, Т2, ТЗ, Т4, R2), (3)
где требования к качеству Т1 - решения задачи анализа текста, Т2 -
технологии анализа текста, ТЗ - развития подсистем, Т4 - анализа совместимости (понимаемой по Г В Ложкину 1980 г),
МР = (И1, И2, R3), (4)
где И1 - исполнители, И2 - инструментарий поддержки 1ея1етьност исполнителей,
П = <П1,П2, R4), (5)
где технологические переделы П1 - анализа текстов, оценки качества анализа текстов, оценки технологии анализа текстов, П2 - развития технологии анализа текстов, R, R1-R4 - матрицы связи
3 2 Функционально-структурные модели
Создан пакет функционально-структурных моделей в нотации BPWin, фрагменты которого представлены на рис 5-8
14 п и [ \MIIOR щи 11*114 та, РпиЮч1\0 шил и\ич>\п\1
(ПчОЦ (. I I XI \ 141'и, м | . .
I ,1!1 МЛ1М1 МП N 1 1
Кпггч I ^_I ■. (| : ч щ_____.11 щ и м IIIX
Печь ново!. клч^тво Т \Т пц ре тьтатов Т4 Заинтересованные ница-потьзоватеть ТАТ
Обеспечить функционирование и развитие ТАТ
Кй ■ т 1X1 и Обеспечить ф\ нкционирование ира?витие М \lBhR
А-0 ! ТАТ [
Рис 5 5АОТ-нотация задачи ФР ТАТ уровня АО
IV 1) А1 АННСК РАТЬ 08 « 2006 Р \URM4i ШШ |)\П ,1 (1М1 \|
ГТОШ ЫЛ 0^ 2006 га АН |
йртммр\прп |
1 ЖШ. 1 714^67X9 10 РПШГЛТНЛ 1 но 1
мте Т111Р Цчссгеч иьфлнк'тонироваш'е и рпвнтис Г\Т |М1 \В! и
-----
Рис 6 БАОТ-нотация задачи ФР Г А 1 уровня А1-А2
NODE
TITLE Обеспечить фуикционирование TAT
NUMBER
Рис 7 S M) I-нотация задачи ФР 1Л1 уровня А11-Л 14
USfD AT AUTHOR DAT С 08 04 2006 PRO IECT 1 RrV 15 05 2006 NOTF.S 1 "> "5 4 5 f, 7 К 0 1(1 WORKING READER DA ГЕ CONTEXT cu AO
DRAFT R Г COMMENDED
PlIRI 1ГЛТ1ПМ
NODi
\2
riTLl
Обеспечш ь развитие TAT
NUM1SI l<
Рис 8 SAD l-шпация задачи ФР ГА1 уровня А21-А24
При этом технологию анализа текстов предложено развить за счет введения блоков модификация, эмоциональная оценка, подсказчик
ГЛАВА 4. ОПЫТ АНАЛИЗА ЭКОНОМ И ЧБХКО! О Т1 КС I Л С ПРИМЕНЕНИЕМ ПРОГРАММЫ «ВААЛ-2000»
Учитывая повышенный интерес к проблеме системной интеграции, в качестве примера для анализа был выбран текст, относящийся к экономической интеграции Для проведения анализа использовали компьютерную психолингвистическую программу лексического и контент-анализа текстов «ВААЛ-2000», ориентированную на прогноз воздействия гуманитарного текста на массовую аудиторию с выявлением личностно-психологических качеств автора текста по А П Журавлеву Объектом приложения служила книга С Г Важенина и др, Интеграционные процессы инсшты кп кмции перспективы - Екатеринбург Ин-т экономики УрО РАН, 2004, - 89 с 4Л Первичное некомпьютеризнрованное восприятие текста
В анализируемом тексте рассматриваются теоретические основы экономической природы территориальной и производственной интеграции и институционной структуры данного явления, выявляются основные тенденции интеграционного взаимодействия как региональных социально-экономических систем, так и предпринимательских сообществ Предлагается обзор наиболее перспективных в настоящее время организационно-экономических технопогий и инструментов активизации региональных интеграционных процессии
Текст состоит из введения, пяти глав и заключения Его первичные экспертные оценки, полученные в некомпьютеризированном варианте приведены в таблице 3
Таблица 3
Субъективная первичная оценка восприятия экономического текста
Объект оценки Оценки от 0 до 1 по признакам
интереса/ важности непонятности/
необычности затрудненности восприятия
1 2 3 4
Введение 06 0 8 11 X
1 2 3 4
Гтава 1 06 06 0 8
Глава 2 05 06 08
Глава 3 0 7 0 X ч 0
Глава 4 Об 06 0 7
Гтава 5 06 0,5 0,7
Закпючение 07 06 0 5
Видно, что субъективные впечатления от текста противоречивы
4.2 Алгоритм компьютеризированного анализа текста.
Алгорита (рис 9) отражает работу прототипа (блоки 1-13, 17-22) и предлагаемую нами его модификацию (блоки 14-16)
Испотнитечь Т В Шарова
Заказчик УМС
Итерация 0 1 2 3(4)5 6 7 8 9 10
Начало цикла по текстам
Информация о тексте авторах намерениях критериях
12
По критерию непротиворечивости двух оценок
Ислотьзование ВААЛ 2000
13 1
Итоги 1
Начало цик!а по разбивке
К КС ы
оценка I фоносемантическая оценка 2 фонокоюристическая
см. рис. 10 текст: а неленив. 5 глав.
разделы глав, заключение
M однф акация программы ВААЛ 2000 нее использование
~Г7 Р
П г
L к<
J п<
Конец цикла по текстам
20
Коней цикла по разбивке
22
Результаты, Отчет.
( )1Ш I
с
Рис.9 Алгоритм анализа текста
4.3 Результаты анализа по ВААЛ-2000
Анализ выполнен по всей книге по главам, по разделам, по абзацам. Весь текст, как единое целое, получил опенки от BAAJ1-2000, приведенные на рисунке 10.
K^jl-ISHÎ: La я s naci luû lipan T П44
яоСфдо
- fiytKSi
li '- Т-Чк H H*+J
Lluuiuiç
i JJUV."
-Э0. 1 -45 , -31
y
-51 , 1. 0,1
ПЛОХОЙ ■inir» K№
»tpSJ^JtvS!
могучий
KCu.<lW'l IlojBinaWi Йий-трол aKTJtfciiiat
Й^СИз! pMOf*H4('
и, ч
31. * ЛЯГХ4,
Г>. г.
20,0 С. гь>Лий
05.2
. ^ЩЩЙШ т««иА
Tf'V
-^.^яймммм Щ кицы*
iCAfJlHTwJIlliLBI
-5з, гДриДДИИ
-11. г{■
J
А. ft
ДЙНУ.ЧЙ tc,Ki:î !»|КЖа»с9>>[ »¡¡ечиГг^х^-ч ПЛОХОГО, UK-f-T^rf., ¿KP-JXOtL-. УГЛСПЛТОГО, ЭЛСГО. СВЦТЛОГС,
erJtîWËCTBLniWvtl, ГНХК^ГО, CHSlbknZb, ХС/Ю£([СчС, ги>;сго,
ТГУСЯКССГО, xnroi-o. KWtWbMCJl4>r HKCiJtWtt, .адиИШМЙГО, тДЛЕкЯОГС, IIACOJ3HW>г<?
^ li'/КЛ -I ! !»/■ M (V.KV.IK .J ïf.KL Тч1
Рис.10 Экранная форма программы ВААЛ-2000 для текста в полном объеме (фоноколористическая оценка внизу жрана слева направо: желтый, синий, коричневый)
t6
Общая фоносемантическая оценка (рис 10) положительное восприятие -270 баллов, отрицательное - 611, фоноколористическая оценка желтый - 1, синий - 1, коричневый - 1
Видно, что фоносемантическая оценка в целом отрицательна Дтя интерпретации же фоноколористической оценки учли исходные посылки методики Я Л Либермана, суть которой в истолковании цветов типа желтый, синий, зеленый - интерес/удивление, коричневый, фиолетовый - \том перше' отвращение Тогда фоноко юристическая оценка суммарно ик I I I с положительна, что противоречит фоносемантической оценке
Для уточнения противоречий/совпадений (п/с) фоноколористических и фоносемантических оценок экспериментальный материал проанализирован нами с разбивкой текста по разделам, абзацам Пример результатов анапиза всей книги с разбивкой по главам приведен в таблице 4 Общая картина, сведенная в таблицу 5, подтверждает вывод, полученный по оценке текста в целом, а именно фоносемантическая и фоноколористическая оценки противоречивы
I 10 пни 4
Оценка глав книги
№ ОЦЕНКА Итог
павы фоносеманти ческая фоноколористическая
книги + - Д цвет доля цвета Д
ВВ 50 118 -68 ж 0,45
с 1,00 0 45 п
к 1,00
1 102 325 -223 ж 1,00
с 1 00 1 20 п
к 0,80
2 119 360 -241 с 1,00 0 00 п
к 1,00
3 282 236 46 ж 1,00
с 1 00 1 00 с
к 1 00
4 82 254 - 172 ж Г 1 00
с 1 00 1 00 н
к 1,00
5 104 254 - 150 ж 0 75
с 1,00 0 75 п
к 1 00
ЗК 78 175 -97 ж 0 75 п
с 1,00 0 95
к 0 80
цвета жетгый - ж, синий - с, коричневый - к, зеленый, совпадения =1/7 = 0 14
f do IHUd 5
Анализ совпадения (с) фоносемантической и фоноколористической оценок _фрагментов текста_
Фрагменты текста с,%
по главам 14
по раздетам и абзацам глав 28
по отдельным абзацам <62
4.4 Модификация алгоритма
Модификация прототипа 3 (блок 16 на рис 9) связана с допопшк и.ноп
обработкой (рис 11), например, по правилам
If Л< 0 then Л* а, (1)
If А> 0 then А* Д (2)
If А - 0 and а = 0 then А = 0, (3)
If А> 0 and 0 then А - 0, (4)
где а - доля коричнево-фиолетовых цветов, Р - доля желто-зеленых цветов
Ачгоритм работы прототипа после его модификации представтен на рис 11
Исполнитеть Т В Шарова
Заказчик УМС
Итерация 0 1 2 3 4 5 6 9 10
С
Начало 16
_L
3
Начало цикла по развитию программы BAAJI-2000
р
Например, по моделям (1-4)
По критерию непротиворечивости двух оценок
Дополнит обработка
Прсилн п ин крир
10 11
Итоги 2
Информация о критериях
I р )фнн I
Рис И Алгоритм модификации про1рачмы BAAJ1-2000
4 5 Результаты модифицированных оценок
Материал по модифицированным оценкам представлен на рис 12-19 Видно, что противоречия в оценках сняты максимумы в оценке «удивление» совпадают с минимумами в оценке «утомтение» Таким образом нос ie модификации программа BAAJI-2000, ориентированная первично на художественные тексты, оказалась пригодной для анализа научного экономического текста
Pitt 12 OlltHM ti-Htu. VK14 IMIItt - PIIL П OllUII Ii , |\ IllHIUlllc \i.imiuiml \) 110 p IUL I IM (ll„) вне 11.Н11Я Mimpni I IM III ........
19
40
150
120
90-
Л п!\
- выделенные предпосылки технологии анализа деловых текстов,
- получен пакет из апоритмическнх п ф> пмшопл п>по-с I р\ к 1 \ рт ^ моделей технопогии анализа текстов
На основе предложений разработаны рекомендации персона 1у генерирующему документы, апробированные на 2-х предприятиях с положительным эффектом ЗАО «Нова-строй» - сфоитетьный сек юр экономики, ОАО «Банк «Екатеринбург» - кредитно-финансовым сек юр экономики
В результате создан задел для дальнейших исследований и разработок в области анализа документов
Пубчнкации по теме исследования
1 Филющенко J1 И , Шарова (Московских) Т В Правовые проблемы подбора кадров //Сб научных статей «Инновационные процессы экономика и управчение» Екатеринбург УГТУ. 2000, с 507-513
2 Гольдштейн С Л Московских В А Шарова Т В Состояние проб юмы сиысмиоп интеграции в жилищном ыроитечьстве и up*, i ui icmoc решение Ike i инк M |\. УПИ Серия строительство и образование - Ькагеринб\р| 1 OV ВПО >1 li-УПИ 2005 с 98-104
3 Moskovskikh V A Goldshtein S L Sharova T V Frolova E D Hierarchical thesaurus of terms m the field of system integration in house building (for top-managers purposes) //Сб научных трудов международной научно-практической конференции «Экономическая культура в условиях развития рыночной экономики отечественная практика и оныг сотрудничества», вып 8 ,-Екатеринбург ГОУ ВПО УГТУ УПИ 2005 с 215-217
4 Sharova Т V Algorithmic modeling activity on opening the settlement accounts in the bank // International scientific and practical conference "Economic culture under the conditions of development of market economy home practice and experience of intelnational cooperation", вып 9, - Екатеринбург ГОУ ВПО УГТУ УПИ, 2006, с 67-70
5 Гольдштейн С J1, Московских В А, Шарова Т В Информационная основа Российского рынка гражданского строительства'/Сб научных трудов международной научно-практической конференции «Экономическая кучьтура в условиях развития рыночной экономики отечественная праюика и оныг coip\ цшчсыва» пмн 9
-Екатеринбург ГОУ ВПО УГТУ-УПИ с 232-235
6 Гольдштейн С Л , Шарова Т В Технология анализа гексюв imiojioi ия поия1ий ./Со научных трудов X отчетной конференции молодых ученых ГОУ ВПО УГ 1У-УПИ ч 1 - Екатеринбург ГОУ ВПО УГТУ-УПИ, 2006 с 153-158
7 Шарова ТВ, Гочьдшгейн С Л Московских В А Модечи функционирования и развития технологии анализа текстов // Сб научных трудов «Современные техночогии и бизнес», вып 1,-Челябинск ЧНЦ РАЕН 2006 с 96-106
8 Гольдштейн СЛ, Шарова ТВ Развитие технологии анализа текстов n\ie\i \чыа эмоциональных оценок в печати
Подписано в печать О ? Об Формат 60x84 /]6
Бумага типографская Плоская печать Уел печ л {, 62
Уч-изд л 1Ъ5 Тираж Заказ 6/2
Ризография НИЧ ГОУ ВПО УГТУ - УПИ 620002, Екатеринбург, ул Мира, 19
о 1 _
-
Похожие работы
- Архитектурная типология центров делового туризма
- Основные тенденции развития официально-делового стиля служебного документа в постсоветский период
- Биотехническая система мониторинга эмоций человека по речевым сигналам и электроэнцефалограммам
- Служебное деловое письмо
- Моделирование эмоциональных реакций пользователя при речевом взаимодействии с автоматизированной системой
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность