автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Информационно-семиотические модели распределенных систем переработки информации
Автореферат диссертации по теме "Информационно-семиотические модели распределенных систем переработки информации"
. о*
л МПС РФ
.. государственный университет путей сообщения
На правах рукописи
Ляпунцова Елена Вячеславовна
Информациошго-ссмиотическне модели распределённых систем переработки информации
05.13.17. "Теоретические основы информатики".
Автореферат диссертации на соискание учёной степени доктора технических наук.
Москва 1996 г.
Работа выполнена в Московском государственном, университете путей сообщения МПС РФ. • '
ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ: доктор технических наук, профессор
Фомин А.Ф.
доктор технических наук, академик МАИ
Резср С.М.
доктор технических наук, профессор, академик МАИ Мамзелсв И.А.
ВЕДУЩАЯ ОРГАНИЗАЦИЯ: Внешнеэкономическое Акционерное Общество "Иитертранс"
Защита состоится "«¿<5 " 1996 г. в час на засе-
дании разового диссертационного совета ДР 114.05.98 при Московском государственном университете путе!! сообщения по адресу: 101473, Москва, ГСП-4, ул. Образцова, 15, аудитория 4517. Телефон совета; 281-61-01.
С диссертацией можно ознакомиться в библиотеке Московского государственного университета путей сообщения.
Автореферат разослан " 2.Ц " *МлхЛ- 1996 г.
Учёный секретарь разового диссертационного совета, к.т.н.
V
Н. А. Казанский
1. Общая характеристика работы
актуальность темы. Подавляющее большинство существующих на сегодня методов проектирования технических устройств содержат в своем составе также методы оптимизации, обеспечивающие получение проектов, оптимальных или близких к оптимальным в смысле некоторых критериев. Исключение составляют методы проектирования вычислительных систем и вообще систем переработки информации. Здесь, как правило, дйже не ставится задача оптимизации и считается достаточным, чтобы изготовленная по проекту система отвечала техническим условиям. Если и проводится выбор некоторой наилучшей конфигурации, то делается это почти всегда на основе содержательных рассуждений без применения строгих математических методов. Для случая проектирования ЭВМ известное объяснение сказанному можно найти в следующем. Современные ЭВМ строятся на основе больших и сверхбольших интегральных схем (БИС и СБИС), у которых стоимость и другие аналогичные характеристики (например, энергоёмкость) лишь в малой степени зависят от степени интеграции (т.е. количества транзисторов в составе СБИС). Поэтому основное внимание при проектировании уделяется лишь соображениям удобства пользователей, ради чего подчас идут на введение поистине гигантской избыточности.
Но аналогичное положение имеет место и при проектировании многопроцессорных распределённых вычислительных сетей, где стоимость системы, наоборот, очень бы-
стро возрастает с ростом количества оборудования, в первую очередь оборудования подсистем передачи данных. Каждая отрасль, более того, каждое предприятие или учреждение обязательно стремятся иметь собственную независимую систему информационного обслуживания, и это приводит к многократному совершенно неоправданному
дублированию в пределах одного и того же географического
в
района всех технических средств и, -в первую очередь, наиболее дорогостоящих, энергоёмких и требующих особого внимания при эксплуатации, каналов связи. Противоположным подходов является современный метод multimedia, т.е. множественной среды, предусматривающий использование интегрированных телекоммуникационных технологий. Сети multimedia именно в силу своей универсальности всегда имеют (и это совершенно правильно) коммерческий характер. Каждый пользователь может лишь арендовать определённое количество ресурсов. И вот тут и возникает основной вопрос: в каких единицах следует измерять это количество? На сегодня имеются следующие решения:
1) арендуется определённое количество физических ресурсов (телефонный канал) независимо от потенциальной интенсивности их использования (самое невыгодное);
2) арендуется определённое количество времени пользования данным объёмом физических или логических ресурсов;
3) арендуется или в данном случае, точнее, покупается определённое количество информации.
Очевидно, третье решение экономически наиболее выгодно, так как оно потенциально обеспечивает минимум затрат при требуемом качестве обслуживания. Но здесь снова возникает один из центральных вопросов: в каких единицах измерять количество информации и какова должна быть сама методика измерения? Сегодня чаще всего количество информации измеряется, например, в килобайтах (т.е. в объёмах физических сигналов), в то время как ясно, что байт (или килобайт) может вообще не нести с собой никакой информации. С еще большей серьёзностью тот же вопрос возникает перед проектировщиком сети multimedia, который должен правильно оценить потенциальную потребность данного региона в информационных ресурсах как на данный момент, так и на перспективу.
Для информационных систем (в отличие от систем связи) общепринятая на сегодня (шенноновская) теория информации оказывается непригодной, поскольку она всегда требует знания вероятностей и их распределений, а получение такого знания или сопряжено с большими трудностями или вообще невозможно (для случая однократных явлений).
Цель диссертационной работы. В свете сказанного автором данной работы были предприняты фундаментальные исследования с целью:
а) разработать аксиоматику и предложить математический аппарат теории информации, свободной от недостатков существующей (шенноновской) теории и, главным
образом, не требующей вычисления вероятностей и их распределений;
б) разработать методы моделирования многопроцессорных распределённых информационных систем, пригодные для постановки и решения задач оптимального проек- . тирования;
в) разработать практические методы теории информации, позволяющие получать оценки количества именно информации, т.е. некоторого продукта, обладающего в том числе и стоимостью в денежном выражении, а не количества абстрактных символов, которые могут и не передавать информации.
Методы исследования. Теоретические и практические исследования, проведённые в диссертации, базируются на объединении определённой части математической теории энтропии (классической теории информации) и семиотики. При этом основные усилия были направлены на формализацию ряда положений семиотики с тем, чтобы предлагаемая теория была в одинаковой степени применимой как к самим ЭВМ, так и к каналам связи и другим элементам распределённых мультипроцессорных систем. Использовались также элементы теории конечных автоматов и теории моделирования.
Научная новизна. В диссертации лично автором получены следующие научные результаты, обладающие существенной новизной:
1. На основе анализа существующей теории логических сетей и конечных автоматов построена универсальная
модель распределенной сети переработки информации, на которую могут быть наложены информационно-семиотические оценки.
2. Доказана неправомерность существующего определения вычислительного процесса, как процесса обязательно (в отличие от процесса передачи по каналу связи) сопровождающегося разрушением информации.
3. Рассмотрены классы объектов, входящих в состав сетей переработки информации, и показано, что каждому такому классу может быть поставлена в соответствие некоторая алгебра.
4. На основе анализа математической теории энтропии введено понятие дефекта статистического веса, логарифм которого может быть принят в качестве искомой
. оценки количества информации. Введено понятие информации как физической сущности, допускающей непосредственное измерение и не зависящей от свойств приёмника.
5. Показано, что реально количество информации не может не быть связано со смысловым (семантическим) содержанием соответствующих сообщений.
6. На основе анализа современной семиотики построен ряд частных моделей семиотических объектов и предложена универсальная формальная модель знака, получаемого в процессе семиозиса.
7. Сформулированы три основных принципа и доказано 9 теорем, позволяющих полностью формализовать процесс семиозиса.
8. Установлено формальное соответствие между моделью семантического измерения семиозиса и шеннонов-ской моделью канала связи, что может быть принято за основу при создании семиотических моделей сетей переработки информации.
9. Введены семиотико-информационные оценки количества информации.
10. Проведены оценки ряда алгоритмов, в том числе алгоритмов, основанных на методах тейлоровских и разрядных преобразований.
Достоверность и обоснованность полученных в диссертации результатов, положений и выводов обеспечивается прежде всего тем, что основные результаты и положения сформулированы в виде предложений, сопровождаемых строгими математическими доказательствами. В пользу достоверности и обоснованности результатов, 'положений и выводов диссертации свидетельствуют также результаты экспериментов и внедрения..
Практическая ценность. Полученные в диссертации научные и практические результаты направлены на получение практических методов оптимального. проектирования распределённых интегрированных сетей переработки информации (систем multimedia). Результаты, полученные в диссертации, позволяют ставить и решать задачи построения процедур формализованного синтеза таких сетей. Первые успехи на этом пути уже получены, что следует из приложенных к диссертации документов о внедрении.
Внедрение результатов работы. Основные положения результаты и выводы диссертации внедрены в Таганрогском государственном радиотехническом университете, ОКБ "Миус",НИИ "БРИЗ", НИИ МВС , МИИТе и Институте проблем информатики (ИСА) РАН.
Аппробпния. Основные положения диссертации докладывались на Международном форуме "Информатизация 93", Международном форуме "Информатизация 94", на Всероссийской конференции "Интеллектуальные САПР", на Всероссийской конференции "Персональные и исследовательские комплексы и АРМ - 94", на "Региональной научно-технической конференции по использованию вычислительной техники" и на заседании кафедры МИИТ.
Публикации. Основные результаты, положения и выводы диссертации опубликованы в 22 статьях, в том числе и в международных изданиях.
Структура и объём диссертации. Диссертация состоит из взедения, четырех основных глав, заключения, списка использованных источников и приложений. Диссертация содержит 261 стр. машинописного текста, в том числе 46 рис., 2 табл. и списка источников 172 наим.
2. Содержание работы
Первая глава представляет собой введение к работе, в котором определяется актуальность предпринятых автором исследований, анализируется современное состояние проблемы, указываются основные моменты, подтверждающие новизну и обоснованность полученных в диссертации основных результатов, положений и- выводов, кратко описывается состав и содержание диссертации, а также формулируются положения, выносимые на защиту.
' Во второй главе проводится исследование существующих теоретических подходов к описанию логических сетей (включая абстрактные машины типа машины Тьюринга), нейроноподобных сетей (включая персептроны) и конечных автоматов (включая коллективы подобных автоматов). Предложена классификация логических сетей, показанная на рис. 1.
Подробный анализ позволил сделать вывод, что каждый из перечисленных классов объектов может быть представлен в виде некоторой алгебры. Найдены условия, при которых эти алгебры оказываются изоморфными, предложена универсальная модель, в равной степени пригодная для описания вычислительных процессов (процессов переработки информации) и распределённых мультипроцессорных вычислительных сетей. Эта универсальная модель, названа в работе обобщенной логической сетью (ОЛС). Даётся следующее определение.
Рис. 1
Определение 2.15, Обобщённой логической сетью называется ориентированный бихроматический граф С1/={Р, Т, Л, К, в, М, Е, I}, в котором Р и Т - два множества вершин, причём Р={р,) - множество вершин мест /?,-, Т={/,} -множество вершин переходов t (РпТ=0), соединённых между собой дугами К=РхТихР по функциональным правилам Б. В ОЛС местам />,- соответствуют состояния, а переходам /,• - операции или микрокоманды; Л - функция инцидентности. Важную роль в ОЛС имеет понятие метки /иеМ и разметочной функции т:Р->Ми{0}. Эта функция ставит в соответствие каждому месту еР целое число меток N или 0. В ОЛС каждый переход представляет собой следующее.
1. Элемент, выполняющий одну из операций булевой алгебры; элемент задержки на один интервал дискретного времени; элемент, выполняющий одну операцию любой функционально полной двоичной алгебры, представляет собой переход.
2. Если /,• - переход, то конструкция, получаемая в результате добавления к нему любого из элементов, перечисленных в п.1, таким образом, чтобы'каждый вход нового элемента оказался подсоединённым к любому выходу любого из элементов С,- или остался свободным, а выход нового элемента оказался подсоединённым к любому свободному входу любого из элементов t, или оказался свободным, также представляет собой переход.
3. Оставшиеся свободными входы элементов перехода представляют собой входы перехода.
4. Выходами перехода могут быть любые выходы любого из его элементов.
5. С каждым выходом каждого перехода tj связывается направленная дуга kt еК, ведущая к одной из вершин мест Pi. Каждой такой дуге ставится в соответствие метка теМ и информационная посылка /е1.
6. Каждый переход может находиться в одном из двух состояний: активном и пассивном. Пока переход находится в активном состоянии все метки на дугах, связанных с его
выходами, имеют значение 0. В момент смены состояния
%
перехода с активного на пассивное все метки на дугах, связанных с его выходами, приобретают значения 1.
Каждая вершина р,-, связанная направленной дугой с моделирует одно из множества условий £}<=Е, при которых может начать выполняться операция в одном из переходов, связанных направленными дугами с этой вершиной, а одна метка в указывает на наличие одного частичного условия Вершины р, в общем случае обладают свойствами памяти. Они накапливают условия вплоть до момента, когда будет дан сигнал, разрешающий начало выполнения операции в одном из связанных с данной вершиной места переходов. Они могут также временно хранить информационные посылки, поступающие от переходов.
7. В каждый момент времени внутреннее состояние ОЛС определяется метками и информационными посылками, хранящимися в вершинах мест.
В работе доказываются следующие предложения.
Предложение 2.1. Все входящие в приведенную выше классификацию варианты логических сетей могут рассматриваться как частные случаи ОЛС.
Теорема 2.2. Для каждой конечной машины Тьюринга существует изоморфная ей булева логическая сеть.
Следствие 1. Поскольку ОЛС включает в себя булевы логические сети, положение теоремы 2.2 распространяется и на ОЛС.
Следствие 2. Из известного изоморфизма множества машин Тьюринга множеству алгоритмов непосредственно следует, что булева логическая сеть, а следовтельно, и ОЛС способна моделировать любой вычислительный процесс.
Показано, что распространённое мнение о том, что любой вычислительный процесс обязательно должен сопровождаться разрушением информации, не соответствует действительности. Таким образом, был определён единый формальный объект, относительно которого можно было строить дальнейшие теоретические построения.
На основе исследований, описанных во второй главе, делаются следующие выводы.
1. Все известные на сегодня варианты логических сетей можно свести к единой обобщённой логической сети. Более того, в силу индуктивного характера определения 2.15 любой другой вариант сети, если только он описывается графом, можно также свести к ОЛС.
2. Стохастические автоматы по существу являются детерминированными, если, конечно, при их реализации не используются физические генераторы шумов (например, на шумящих резисторах), что в современных условиях мало вероятно.
3. Из теоремы 2.2 следует, что в целях анализа (в том числе информационного) любой вычислительный процесс можно моделировать с помощью ОЛС.
В третьей главе анализируется современное состояние математической теории энтропии. Центральное в згой теории понятие вероятностного пространства (П, Р), где множество точек О представляет собой пространство, на котором задана с-ачгебра (иначе, некоторая совокупность # подмножеств), замкнутая относительно операций дополнения и счётного объединения и содержащая в себе всё П. На
ст-алгебре у задана счётно-аддитивная мера Р, относительно которой вводится требование: ДП)=1. Если отбросить это последнее требование, то определённое выше пространство может не иметь ничего общего с вероятностью и распределениями вероятностей. С другой стороны, вводимое в рассматриваемой теории понятие энтропии измеримого разбиения пространства (О, .</, Р) оказывается весьма плодотворным.
Пусть С, - счётное измеримое разбиение пространства (П, У, Р). Через /(£) обозначают информационную функцию разбиения понимая под этим заданную на О функцию, значение которой для любого элемента гае О равно количеству информации, получаемой при реализации содержащего о элемента А разбиения С,. Таким образом,
(1)
Ле;
где - обозначает индикатор (характеристическую функцию) множества А; в данном случае 1^=1, если множество А содержит со, и равно 0, если множество А не содержит а. На языке факторпространств, ДО есть функция на факторпространстве (Г^, Р-), дающая количественную меру неопределённости каждого элемента этого факторпро-странства. Ясно, что функция /(,) определена и конечна почти всюду на П. Кроме того, она ¿¡-измерима.
Энтропией счётного измеримого разбиения С, пространства Лебега (О, Р) называется математическое ожи-
дание информационной функции этого разбиения. Энтропия разбиения. Энтропия разбиения С, обозначается Н(С) и составляет
Н(с,) = ¡P(dQ)I(r)(a) = -b £ Р(А) log Р(А) (2)
П Aeq
Таким образом, в математической теорий энтропии энтропия счётного разбиения - это среднее количество информации, приходящееся на один элемент разбиения.
Далее в диссертации делается попытка установить связь между семиотикой и математической теорией энтропии. С этой целью вводится понятие синтактической энтропии. Пусть имеется пара множеств и ¡Л. Множество S3 состоит из одного единственного элемента ЬеЗ), а множество во избежание дополнительных математических трудностей, считается содержащим счётное число элементов {a¡ e.V: ¿=1, 2.....}. Будем считать, что существует отображение у: ,х/=><й такое, что элементу b ставится в соответствие элемент a¡e.¿ (неизвестно какой). Далее рассматривается ансамбль подобных отображений, Г. Каждое ууеГ ставит в соответствие элементу ¿ей? строго определённый элемент 0,6.г/. Для каждого может существовать счётное множество различных отображений из Г, ставящих этот элемент в соответствие элементу Ь. Теперь можно рассмотреть про-
I
странство (оно не называется и не считается вероятностным) (Q, J, 1У), где Q - множество, У - некоторая совокуп-
ность подмножеств множества О, & - определённая на у неотрицательная вещественнозначная функция. В работе показывается, что это пространство может служить моделью только что рассмотренного ансамбля отображений. Поскольку £1 - произвольное множество, то, очевидно, его можно рассматривать как множество всех возможных отображений из Г. Нужно лишь доказать, что имеется возможность построить неотрицательную функцию & , удовлетво-
*
ряющую требованию к аддитивности. Для этого в ансамбле Г выделяется подмножество отображений {Г* |ууеГл: Ъ=эак\ /=1, 2, ...}. Статистической мерой в работе называется такая функция У „ определённая на :/ , что Г/ (Г*) равно количеству элементов в подмножестве Г*, т.е. мощности множества Г*.
В работе доказываются следующие леммы.
Лемма 3.3. Определённая выше статистическая мера " отвечает требованию к аддитивности
^(уг*}=£ (3)
Лемма 3.4. Разбиение су пространства (О., У) такое, что его элементами являются множества Тк, измеримо.
Две доказанные леммы позволяют утверждать, что пространство (О., У, У), сзойства которого подробно изучены в третьей главе работы, может служить моделью ан-
самбля Г, который называется в работе статистическим ансамблем. Понятие статистического ансамбля лежит в основе аксиоматики современной теории вероятностей. Для того, чтобы перейти к вероятностям, необходимо каждому элементу А некоторого разбиения £ пространства (□,.'/, г/>) сопоставить меру Р, которая может быть получена из выражения .
Р(Л) = Нт (4)
(£1)-+® (П)
где РР (П) - определённая выше мера ,<У для всего пространства П. Заметим, что мера (4) отвечает условию 0<Р<1.
Условия существования предела (4) достаточно хорошо изучены в теории вероятностей. Всё это даёт возможность утверждать, что мера (4) может быть использована в качестве меры количества информации, содержащейся в конечных результатах применения рассмотренных выше последовательностей отображений. Легко показать, что подобная процедура последовательных отображений в точности совпадает с процедурой вывода в формальной грамматике. Это даёт основание считать меру (4) мерой синтактической информации.
Наконец, можно ввести в рассмотрение физическую или формальную систему общего вида, способную принимать N различных состояний. Величину ¿»"(А) называют статистическим весом такой системы. Предположим, что после введения в систему определённого количества информации
её статистический вес уменьшился и стал равным а? (А). В таких условиях величину (4) можно назвать дефектом логарифма статистического веса или, короче, дефектом статистического веса. В подавляющем большинстве случаев переход к пределу при определении дефекта статистического веса не является обязательным. Логарифм дефекта статистического веса предлагается в диссертации в качестве универсальной меры количества информации.
На основании исследований, описанных в третьей главе диссертации, делаются следующие выводы.
1. Современный аппарат математической теории энтропии достаточно развит и может быть использован в качестве есновы для создания альтернативной теории информации, не использующей вероятностные представления.
2. Основным условием применимости аппарата математической теории энтропии является удовлетворение требованиям к лебеговости исходного пространства и измеримости соответствующих разбиений этого пространства. Такое условие почти всегда удовлетворяется применительно к системам получения и переработки информации.
3. Интуитивно понятие информации совпадает с. понятием смысл оного содержания сообщений. Это позволяет поставить задачу создания альтернативной теории информации, аксиоматика которой базировалась бы на семиотических объектах.
4. Предложенная в диссертации универсальная мера количества информации - логарифм дефекта статистического веса - может быть использована в большом числе случаев
и, в частности, в качестве меры количества информации, содержащейся в некоторой строке терминальных символов грамматического вывода.
Основной же вывод из данного цикла исследований состоит в том, что информация есть объективная физическая сущность, допускающая однозначное измерение и не зависящая от свойств потребителя (приёмника).
В четвёртой главе проводится анализ современного состояния семиотики. Делается попытка создания количественной семиотики, опирающейся на систему оценок самого процесса семиозиса и его синтактического, семантического и прататнческого измерений. Формулируются три основных принципа: принцип представления, согласно которому знак может представлять собой тринарное отношение и, следовательно, состоять из трёх компонент, принцип внутренне-внешнего баланса, согласно которому каждой внутренней компоненте знака должна соответствовать внешняя компонента и наоборот, и принцип дополнительной структуры, задающий правила наращивания.знаковой таксономии. Далее вводится базовая классификация знаков, причем каждое утверждение о принадлежности знака тому или иному базовому классу строго доказывается в виде теоремы. В диссертации вводятся следующие определения и доказываются следующие теоремы.
Определение 1. Знак, который существует как абстрактная единичная сущность как сам по себе, так и по отношению к другим знакам, называется тон (lone).
2'J
Автор диссертации стремился сохранить принятую в литературе терминологию даже в тех случаях, когда она не представлялась удачной.
Определение 2. Знак, который с>щестпует как общий тип (представитель некоторого класса) как сам по себе, так и по отношению к другим знакам, называется типом (type).
Определение 3. Знак, который существует как реальная, единственная физически существующая индивидуальность, называется признаком (token).
Здесь также можно было бы выбрать более удачные эквиваленты (например, след, мета и т.п.), но слово "признак" более всего подходит как перевод token.
Определение 4. Знак, для которого существует реальная, единственная существенная причинно-следственная связь со своим денотатом (объектом), называется индексом (index).
Определение 5. Знак, который связан со своим объектом конкретной схожестью формы знака и формы объекта, называется изображением или иконкой (icon).
Определение 6. Знак, который связан со своим денотатом (объектом) произвольным- условием, соглашением или общим законом, называется символом.
Определение 7. Знак, обладающий тем свойством, что его вид позволяет некоторому интерпретанту определить его как знак без каких-либо дополнительных подробностей, называется реме (rheme).
Определение 8. Знак, обладающий tew свойством, что его интерпретант определяет этот знак как объективно
имеющий отношение к некоторому денотату, называется феме (рИеше).
Определение 9. Знак, обладающий тем свойством, что его интерпретант определяет этот знак на основе тех или иных рассуждений как имеющий отношение к некоторому денотату, называется долеме (¿о1ете от греческого беЯсоц).
Теорема 1. Знак представляет собой тон, если его синтактическая структура имеет в точности один уровень. В этом случае он имеет одну компоненту синтактического значения (тагмензии) и одну внешнюю синтактическую компоненту (семиотический контекст).
Теорема 2, Знак представляет собой тип, если он имеет в точности два уровня синтактической структуры. Следовательно, он имеет также две компоненты синтактического значения (тагмензию и эйдензию (е'к1еп$1оп)) и две внешние синтактические компоненты (семиотический контекст и форму знака).
Теорема 3 Знак представляет собой признак, если он имеет три уровня синтактической структуры. Следовательно, он имеет три компоненты синтактического значения (тагмензию, эйдензию и онтозию (опШ'юп)) и три внешних синтактических компоненты (семиотический контекст, знаковую форму и носитель, на котором он существует).
Теорема 4. Знак представляет собой индекс, если он имеет в точности один уровень семантической структуры. Следовательно, он имеет одну компоненту семантического значения (экстензию) и одну внешнюю семантическую компоненту (денотат). 22
Теорема 5. Знак представляет собой иконку (icon), если он имеет в точности два уровня семантической структуры. Следовательно, он имеет также две компоненты семантического значения (экстензию и интензию), а тс.;же две внешние семантические компоненты (объект знака и его основа (ground)).
Теорема 6. Знак представляет собой символ, если он имеет все три уровня семантической структуры. Следовательно, он имеет также три компоненты семантического значения (экстензию, интензию и когнезшо (cognesion)), а также три внешние семантические компоненты (объект, основу и когнитивный ментеллект знака).
Теорема 7. Знак является ремой, если он имеет в точности один уровень прагматической структуры. Он имеет, следовательно, одну компоненту прагматического значения (контензию) и одну внешнюю прагматическую компоненту (социально/бихевиористический контекст).
Теорема 8. Знак представляет собой (рему, если он имеет в точности два уровня прагматической структуры. Следовательно, он имеет также две компоненты прагматического значения (контензия и порпозия), а также две внешние прагматические компоненты (соцшиьно/бихевиорис-тический контекст знака и его интерпретатор).
Теорема 9. Знак представляет собой долему, есш он имеет все три уровня прагматической структуры. Следовательно, он имеет также три внутренние прагматические компоненты (контезию, порпозию и эмозию), а также три внешние прагматические компоненты (социально/бихевиори-
стический контекст, интерпретатор и эмотивный ментел-лект знака).
Саммтачкко* Прягматачаско*
сущестюмма равлсого при*М(М
НАЛГМЙ
Рис.2.
Всё это приводит к универсальной классификации, схема которой приведена на рис. 2. Показано, что каждому из базовых классов может быть поставлена в соответствие мера. Таким образом, автор приходит к понятиям семиотического пространства, его разбиения и энтропии этого разбиения. В качестве искомой меры количества информации предлагается именно энтропия разбиения семантического
Смтмптасоа
пространства, что иллюстрируется рядом примеров, в том числе примером, в котором определяются информационные характеристики понятия (знака) "электрон". Пример доказывает реалистичность коже- Ут0" развитых теоретических положений. Кроме того, на этом примере хорошо видно, как надо ставить задачу выбора предмет-Рис ной области.
Модель универсальной знаковой структуры вводит в обращение три уровня синтактической структуры: онтоти-ческий, эйдонтический и тагматический. В сигактике естественных языков этим уровням соответствуют (в том же порядке) фонетический, морфологический
Денотат Основа Когнитивный мен-теллект
и
тагматический. Неод-Рис. 4 • нократно предприни-
мались усилия в направлении создания статистической теории синтактической передачи данных. Покажем, что универсальная модель знаковой структуры наиболее естественным образом может быть использована для объяснения подобных теорий. В системах связи используют, как правило, реально существующие и определённым образом воплощённые знаки. Таким образом, для систем связи требуются знаки, отнесённые выше к категории признаков. Именно эта синтактическая структура и будет интересовать нас в дальнейшем при построении синтактической теории связи.
Согласно теореме 3, структура связи может быть проиллюстрирована рис. 3. В общепринятой теории связи, предложенной Шенноном, смысл передаваемых сообщений полностью исключается из рассмотрения. Таким образом, исключая из рис. 3 внутренние компоненты и оставляя только внешние, мы приходим к схеме, показанной на рис. 4.
Теперь мы можем интерпретировать эту модель в терминах шенноновской теории связи. В процессе функционирования системы связи (сегодня правильнее было бы говорить - системы передачи данных) мы начинаем с семиотического контекста, поскольку он представляет собой самый внутренний уровень (в соответствии с принципом дополнительной структуры). Таким образом, мы начинаем с того, что генерируем семиотический контекст знака, подлежащего передаче по каналу связи. Затем мы сообщаем это-
Шум 1
¡Источник" 1__*Г"коаёо ' Канал ! ¡сообщений) ]
Дакодвр |-►¡сообщвнид;
Рис. 5
му знаку и его контексту определённую форму. Наконец, на последнем этапе знак снабжается физическим носителем для того, чтобы акт передачи действительно мог осуществиться. Элемент этой схемы, генерирующий контекст знака, получил название источника сообщений. Элемент, придающий знаку выбранную форму, получил название кодера. Наконец, физический носитель называется каналом связи. Принимая по внимание, что реальная система передачи 2 о
данных включает в свой состав также такие технические средства, как передатчик и приёмник, получаем традиционную модель системы передачи данных, показанную на рис. 5. Как всегда, эта модель включает в свой состав источник шумов, представляющий собой физическое свойство каждой реальной физической модели.
Таким образом, получена возможность достаточно строго вывести модель шенноновского канала связи из того факта, что теория синтактических коммуникаций представляет интерес исключительно с точки зрения внешней структуры признаков. С нашей точки зрения традиционная теория связи (мы не говорим: теория информации, поскольку последнее название присвоено теории Шеннона его последователями без достаточных к тому оснований) представляет собой теорию физических процессов в каналах связи, без какого-либо обращения к семиотической теории связи. Есть все основания ожидать, что дальнейшее развитие теории коммуникаций (одно из возможных наименований альтернативной теории связи) потребует, в свою очередь, развития общих семиотических теорий.
Семиотические свойства, связанные с понятиями тона, типа и признака, удобно использовать для выяснения сущности ' оммуникативных процессов, связанных с каждой из компонент.
Введём тегхерь следующее определение.
Определение 10. Информация есть универсальная физическая сущность, определяющая структуру любой физи-
ческой системы и характер протекающих в этой системе процессов.
Информация во многом подобна энергии. Если энергия (она же масса) определяет интенсивность процессов, протекающих в физической системе, то информация определяет направление этих процессов. При этом мы считаем, что, как это принято в статистической физике, любая физическая система в любой момент времени обладает некоторым состоянием, а процесс, происходящий я любой физической системе, есть не что иное, как последовательная смена состояний. Сформулируем теперь следующую теорему.
Теорема 10. Каждому состоянию любой физической системы можно поставить в соответствие индекс. Для любой пары отличающихся друг от друга состояний существуют два ошичных друг от друга индекса.
Итак, каждому состоянию любой физической системы может быть поставлен в соответствие знак, а точнее, селантнческая структура знака - индекс. Но не всякое состояние физической системы является наблюдаемым, во всяком случае, на данном уровне развития науки. Следовательно, индекс, как и само состояние, является некоторым внутренним атрибутом системы. В соответствии с принципом внутреннего/внешнего баланса внешней компонентой индекса является денотат (объект), а внутренней компонентой - компонента значения, в данном случае экстензия. Приходим к окончательному выводу, что процессу в физической системе соответствует последовательность экстензий
индексов, причем эти экстензии могут быть известными лишь постольку, поскольку состояние физической системы (денотат) является наблюдаемым. С другой стороны, сама экстензия содержит исчерпывающую информацию о состоянии в силу теоремы 10.
Предположим теперь, что хотя бы часть состояний некоторой физической системы является наблюдаемой и, хотя бы частично, известны закономерности протекающих в системе процессов. Тогда будет справедлива следующая теорема.
Теорема 11. Доступная информация о физической системе и протекающих в ней процессах может быть выражена через последовательность символов.
Остаётся нерешённым вопрос о втором уровне семантической структуры и, следовательно, об иконке. В общем случае этот уровень может быть проигнорирован. Однако если не говорить о таких очевидных вещах, как графики, диаграммы и т. п., человеку вообще свойственно образное мышление и промежуточный этап между экстензией и ког-незией можно без потери общности считать, если не обязательным, присутствующим, почти всегда. Всё сказанное приводит к структуре источника сообщений, показанной на рис. 4.
Исследования, описанные в четвёртой главе, позволяют сделать следующие выводы.
1. Информация представляет собой физическую сущ-, ность, определяющую (в том числе к количественно) струк-
тур у физических и формальных объектов и направление протекающих в них процессов.
2. Носителями информации всегда являются знаки в общем семиотическом смысле этого слова, причем термины "информация" (переносимая данным знаком) и "значение" (опять-таки в семиотическом смысле этого слова) суть синонимы.
3. Любой вариант теории информации может иметь право на существование лишь постольку, поскольку он опирается на семиотические представления.
4. Универсальную меру количества информации, свободную от недостатков существующих мер, можно получить, вводя в рассмотрение понятие семиотического пространства и задавая на нём соответствующую Меру.
5. Универсальная теория информации может. быть приложена к задачам, возникающим в системах связи, однако следует отдавать себе отчёт, что в этом случае всегда будет использован только один из трёх семиотических уровней.
Пятая глава работы посвящена приложениям построенной теории к анализу и оценкам конкретных вычислительных процессов. Здесь ставится и решается задача оптимального в определённом смысле синтеза алгоритма вычислительного процесса. В качестве основных объектов исследований выбраны современные методы дифференциальных (тейлоровских) преобразований, используемых при решении обыкновенных диференциалъных уравнений и уравнений в" частных производных, метод точечных преобразований, а ,
также метод разрядных преобразований. Все перечисленные методы ещё недостаточно полно освещены в литературе. Кроме того исследование метода разрядных преобразований позволяет сделать вывод, что наиболее естественно строить семиотическое пространство, рассмотренное в четвёртой главе, как множество двоичных разрядов, участвующих в реализации данного алгоритма.
3. Результаты работы
В диссертации получены следующие основные научные результаты.
1. На основе анализа существующей теории логических сетей и конечных автоматов построена универсальная модель распределенной сети переработки информации, на которую могут быть наложены информационно-семиотические оценки.
2. Доказана неправомерность существующего определения вычислительного процесса, как процесса обязательно (в отличие от процесса передачи по каналу связи) сопровождающегося разрушением информации.
3. Рассмотрены классы объектов, входящих в состав сетей переработки информации и показано, что каждому такому классу может быть поставлена в соответствие некоторая алгебра.
4. На основе анализа математической теории энтропии введено понятие дефекта статистического веса, логарифм которого может быть принят в качестве искомой оценки количества информации. Введено понятие инфор-
мацни как физической сущности, допускающей непосредственное измерение и не зависящей от свойств приёмника.
5. Показано, что реально количество информации не может не быть связано со смысловым (семантическим) содержат^! соответствующих сообщений.
6. На основе анализа современной семиотики построен ряд частных моделей семиотических объектов и предложена универсальная формальная модель знака, получаемого в процессе ссг>1 лезшей.
7. Сформулированы три основных принципа и доказано 9 теорем, позволяющих полностью формализовать процесс семнозиса.
8. Установлено формальное соответствие между моделью семантического измерения семнозиса и шеннонов-ской моделью канала связи, что может быть принято за основу при создания семиотических моделей сетей переработки информации.
9. Введены семиотико-информационные оценки количества информации.
10. Проведены оценки ряда алгоритмов, в том числе алгоритмов, основанных на методах тейлоровских и разрядных преобразований.
4. Список публикаций автора
1. Ляпунцова Е.В. О реализации алгоритмов логического управления в распределенных муль'пшикропроцес-сорных системах// Материалы конференции "Разработка и применение средств вычислительной техники ". Таганрог, 1986. с. 40-41.
2. Ляпунцова Е.В. Об автоматизации проектирования программируемого логического контроллера на базе матричного кристалла// Материалы Межреспубликанского семинара "Интеллектуальные САПР СБИС ". Ереван, 1988. с. 128.
З; Ляпунцова Е.В. Промышленный микропроссорный контроллер для реализации параллельных граф-схем алгоритмов управления технологическими процессами и оборудования// Материалы научно-технической конференции "Миропроцессорные средства локальной автоматики". Гродно, 1989. с. 23.
4. Ляпунцова Е.В. Технология разработки параллельных граф-схем алгоритмов управления и реализации их на специализированном логическом микропроцессоре// Материалы симпозиума "Логическое управление с использованием ЭВМ". М„ 1989. с. 104-108.
5. Ляпунцова Е.В. Некоторые особенности моделирования и автоматизированного синтеза на БМК специализированного логического микропроцессора// Многопроцессорные вычислительные структуры. Таганрог, 1989, вып. 11. с. 37-39.
1ч
6. Ляпунцова E.B. Методика разбиения схем с минимизацией максимального числа выводов// Материалы научно-технического семинара. М., Радио и связь, 1990. с. 3637.
7. Ляпунцова Е.В. Инструментальные и программные средства автоматизированного проектирования специализированных логических микропроцессоров// Материалы симпозиума "Логическое управление с использованием ЭВМ". М., 1990. с. 34-38.
8. Ляпунцова Е.В. Аксиоматика линейной комбинаторной логики// Межвузовский сборник научных трудов "Научные решения актуальных задач на транспорте". М., МИИТ, 1993. с. 56-64.
9.Ляпунцова Е.В., Шилейко A.B. Комбинаторно-логические основы вычислительных сетей// Материалы Международного Форума "Информатизация 93", "Информационные коммуникации, сети, системы, технологии". -М., 1993. с. 2.
10. Ляпунцова Е.В., Шилейко A.B. Информационные оценки логических сетей// Научно-техническая информация "Информационные процессы и системы", серия 2, вып. 11. М., 1994. 3 с.
11. Ляпунцова Е.В., Эль-Гафи А.И. Стратегия организации радиосвязи в условиях преднамеренных помех// Депонировано в ВИНИТИ РАН № 836 - В 94 от 6 04 . М., 1994.-Зс.
12. Ляпунцова Е.В., Эль-Гафи А.И. Адаптивный линейный коррелятор// Депонировано в ВИНИТИ РАН № 837 - В 94 от 6 04 М.( 1994. с. 3.
13. Ляпунцова Е.В. Информационные оценки вычислительных процессов// Материалы конференции" Интеллектуальные САПР ". Таганрог, 1994. с. 27-33.
14. Ляпунцова Е.В,, Шилейко А. В. Семиотика и информация// Сборник научных трудов Московского государственного университета путей сообщения "Электронные информационные устройства железнодорожной автоматики", вып. 886. М., 1995. с. 10-24.
15.Ляпунцова Е.В., Шилейко А.В. Семиотический анализ информационных свойств элементарных частиц// Сборник научных трудов Московского государственного университета путей сообщения "Электронные информационные устройства железнодорожной автоматики ", вып. 886.М..1995. с. 35-51.
16.Бучирин В.Г., Ляпунцова Е.В. Переработка информации в вычислительных процессах// Сборник научных трудов Московского государственного университета путей сообщения "Электронные информационные устройства железнодорожной автоматики ",вып. 886. М. 1995. с. 60-61.
П.Буьирин В.Г., Ляпунцова Е.В. Информационные характеристики нейроноподобнных . вычислительных сетей/Дворник научных трудов Московского юсу дарственного университета путей сообщения "Электронные информационные устройства железнодорожной 'автоматики, нын. 886. М„ 1995., с. 97-107.
18.Ляпунцова Е.В., Титов Е.В. Формальные грамматики и информация// Сборник научных трудов Московского государственного университета путей сообщения "Электронные информационные устройства железнодорожной автоматики" вып. 886.М.Д995, с. 108-114.
19. Ляпунцова Е.В., Мамедов Г.А. Информационные опенки и точечные преобразования// Сборник научных трудов Московского государственного университета путей сообщения "Электронные информационные устройства железнодорожной автоматики" вып. 886.М.,1995, с. 128-140.
20. Ляпунцова Е.В., Мамедов Г.А. Алготитмы решения Т-уравнений// Электронное моделирование, 1995, №3.-с.86-88.
21. Ляпунцова Е.В. Индуктивные выводьг и информация// Многопроцессорные вычислительные структуры.-Таганрог, 1995, вып. 15. с. 33-35.
22. Lyapunsova E.V., Shileiko A.W. Informational estimates of logical nets// Automatic documentation and matuematical linguistic. 1994, vol. 27, №6. p.p. 8-14.
ЛЯПУНЦОВА Елена Вячеславовна Информационно-семиотические модели распределённых систем переработки информации.
Сдано в набор SZ.0S.9S. Подписано к печати 22. 05.96.
Формат бумаги 60x90 1/16 Объём ¿><?5п.л. Заказ-З.З^Тпраж 100 экз.'
Тл км рафия МИИТа. Москид. ул. Образцова. 15.
-
Похожие работы
- Семиотическая модель управления распределением ресурсов в отрасли ( на примере отрасли заготовок ГССР)
- Метод представления знаний на семиотическом пространстве для проектирования моделей сложных систем. Том 1
- Семиотическая модель языка архитектурных форм
- Архитектурный образ города - столицы государства
- Формально-логический подход к построению процедуры принятия решения по управлению пожарно-спасательными формированиями города
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность