автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.07, диссертация на тему:Разработка алгоритмов и методов автоматического речевого оповещения обслуживающего персонала железнодорожного транспорта

кандидата технических наук
Шаповалов, Василий Витальевич
город
Ростов-на-Дону
год
2000
специальность ВАК РФ
05.13.07
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка алгоритмов и методов автоматического речевого оповещения обслуживающего персонала железнодорожного транспорта»

Автореферат диссертации по теме "Разработка алгоритмов и методов автоматического речевого оповещения обслуживающего персонала железнодорожного транспорта"

МИНИСТЕРСТВО ПУТЕЙ СООБЩЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

РОСТОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

На правах рукописи

гг: ОД

- 5 спи

ШАПОВАЛОВ Василий Витальевич

РАЗРАБОТКА АЛГОРИТМОВ И МЕТОДОВ АВТОМАТИЧЕСКОГО РЕЧЕВОГО ОПОВЕЩЕНИЯ ОБСЛУЖИВАЮЩЕГО ПЕРСОНАЛА ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

Специальность: 05.13.07 - Автоматизация технологических процессов и

производств (на транспорте)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Ростов-на-Дону - 2ООО

Диссертация выполнена на кафедре «Автоматика и телемеханика на железнодорожном транспорте» Ростовского Государственного Университета Путей Сообщения.

НАУЧНЫЙ РУКОВОДИТЕЛЬ: Кандидат технических наук,

доцент Ковалев С.М.

ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ:

1 .Доктор технических наук, профессор Лябах H.H.

2.Кандидат технических наук, доцент Родзин С.И.

Ведущее предприятие: Московский государственный

университет путей сообщения

Защита состоится «.{£» уМЬЯ— 2000 г. в /3 часов в конференц-зале РГУПС на заседании диссертационного совета К 114.08.02 при Ростовском Государственном университете путей сообщения (344038, г.Ростов-на-Дону, пл. Народного ополчения, 2, РГУПС.)

С диссертацией можно ознакомиться в библиотеке РГУПС.

Автореферат разослан «_» _ _ г. Отзывы на

автореферат в двух экземплярах, заверенные печатью, просим направлять е адрес совета: 344038, Ростов-на-Дону, пл.Народного Ополчения,2, РГУПС).

Ученый секретарь

диссертационного совета К114.08.02, кандидат технических наук, доцент

ОШ.чьш,

Бутакова М.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Процесс технического перевооружения объектов ж.-д. транспорта неразрывно связан с ростом числа технологических процессов (ТП), подлежащих автоматизации, и усложнением микропроцессорных систем ж.-д. автоматики. Следствием этого является рост потоков информационных сообщений субъектам ТП. Расширяется номенклатура сообщений о внештатных ситуациях, возникающих при функционировании ТП, о результатах диагностики узлов и элементов микропроцессорных систем и т.п.

Специфика деятельности обслуживающего персонала на ж.-д. транспорте заключается в том, что большую часть информации люди получают посредством зрения. Это приводит к перегрузке канала визуального восприятия. Актуальным и логически обоснованным представляется перераспределение и перенос части информационных сообщений в канал слухового восприятия.

Наиболее информативны сообщения, выдаваемые в естественной для человека форме - речевые сообщения (РС). Использование речевого вывода информации представляется наиболее перспективным, а в некоторых системах ж.-д. автоматики единственно возможным способом общения. Особенно роль РС возрастает с внедрением автоматизированных рабочих мест (АРМ), экспертных систем, автоматов-советчиков.

Известные исследования в области обработки речевых сигналов не снижают актуальность проблемы. До сих пор задача оптимального выбора между словарем, качеством синтезируемой речи и ресурсами ЭВМ остается нерешенной. Актуальны также проблемы оценки качества синтезированных РС, структурирования речи, подготовки предметно-ориентированных словарей систем автоматического речевого оповещения (АРО). Кроме того, использование систем АРО на объектах ж.-д. транспорта имеет свою специфику, затрудняющую использование стандартных подходов к построению систем синтеза речи. Требуются новые эффективные алгоритмы оповещения и методы «сжатия» речевых сигналов.

Особенно важным и мало исследованным случаем применения устройств формирования РС является их использование в составе подсистем, обеспечивающих безопасность движения на ж.-д. транспорте.

Одним из примеров является процесс оповещения машиниста о неисправности в составе поезда, обнаруженной системой автоматического контроля типа ДИСК. Совершенствование данного ТП актуально и важно, так как позволяет повысить технологическую дисциплину и ответственность обслуживающего персонала, снизить влияние «человеческого фактора» на процесс оповещения, увеличить оперативность и достоверность оповещения. Это повышает безопасность движения на ж.-д. транспорте.

Объект исследований. Объектом исследования являются автоматизация ТП речевого оповещения машиниста локомотива о неисправности в подвижном составе и совершенствование алгоритмов АРО.

Предмет исследования. Предметом исследования являются методы структурирования речевых сигналов на основе модели линейно-предикатного кодирования (ЛПК), проблема подготовки предметно-ориентированного словаря систем АРО, а также нечеткая модель оценки качества PC.

Цели и задачи работы. Основной целью диссертационной работы являются разработка и исследование алгоритмов и методов АРО обслуживающего персонала технологических объектов ж.-д. транспорта и построение программно-аппаратных средств их реализации.

Для достижения поставленной цели решены следующие задачи:

- усовершенствован ТП оповещения машиниста локомотива о неисправности в подвижном составе, предложен алгоритм АРО с подтверждением оповещения, архивированием речевых ответов машиниста и уточнением характера и места неисправности;

- исследованы базовые подходы к анализу и синтезу речевых сигналов на основе модели ЛПК;

- предложена нечеткая модель оценки качества синтезированной речи;

- разработан и исследован метод структурирования PC;

- разработан АРМ подготовки предметно-ориентированных словарей аппаратуры АРО и оценки качества синтеза PC;

- разработаны программное обеспечение (ПО) и технические средства (ТС) аппаратуры АРО на основе предложенных и исследованных алгоритмов и методов оповещения.

Методы исследования. Для решения поставленных задач использованы современные теоретические и экспериментальные методы моделирования и оптимизации с использованием ЭВМ. Исследования в области обработки

речевых сигналов базируются на методах, описанных з работах Итакуры Ф., Атала Б., Маркела Д., Грея А., Макхоула Д., Рабинера Л., Шафера Р., Винцюка Т.К., Прохорова Ю.Н. и др. Теоретические исследования выполнены с использованием положений теории нечетких множеств, представленных в работах Мелихова А.Н., Берштейна Л.С., и др., а также теории матричного анализа. Проектирование, разработка и внедрение микропроцессорных систем на ж.-д. транспорте производились с использованием методик, разработанных Иванченко В.Н., Лисенковым В.М., Барановым Л.А., Сапожниковым В.В., Сапожниковым Вл.В., Дмитренко И.Е., Жарковым Ю.И., Лябахом H.H., Шилейко A.B. и др.

Экспериментальные исследования проведены с использованием теории и классических методик проведения экспертных оценок.

Основные положения, выносимые на защиту. На защиту выносятся следующие положения и результаты:

- на ж.-д. транспорте существует целый ряд ТП, в рамках которых возможна автоматизация речевого оповещения обслуживающего персонала. В первую очередь это относится к процессам, связанным с безопасностью движения;

- существующий процесс речевого оповещения машиниста о неисправности в составе поезда имеет недостатки, связанные с влиянием «человеческого фактора», с особенностями организации симплексного канала поездной радиосвязи (ПРС). Алгоритм оповещения требует улучшения;

t

- усовершенствованный алгоритм АРО машиниста о неисправности в составе поезда, позволяющий повысить оперативность, достоверность и надежность оповещения;

- нечеткая модель оценки качества синтезируемой речи;

- метод глубокого структурирования речевых сигналов на основе композиции матриц локальных степеней стационарности;

- АРМ подготовки и оценки качества предметно-ориентированных наборов PC аппаратуры АРО.

Научная новизна. Научная новизна заключается в следующем:

- предложен алгоритм АРО машиниста о неисправности в составе поезда с подтверждением оповещения, архивированием речевых ответов машиниста и уточнением характера и места неисправности,

позволяющий повысить оперативность, достоверность и надежность оповещения;

- впервые предложена нечеткая модель оценки качества синтезированной речи, позволяющая повысить качество подготовки предметно-ориентированных наборов РС;

- разработана методика построения и кодирования предметно-ориентированных словарей аппаратуры АРО, снижающая затраты памяти при сохранении высокого качества синтезированной речи;

- предложен и формализован метод структурирования и сжатия речевых сигналов на основе композиции матриц локальных степеней стационарности речевых сигналов, позволяющий оптимизировать разбиение речевого сигнала на квазистационарные подинтервалы.

Практическую ценность работы представляют:

- исследование специфики автоматизации процессов речевого оповещения в условиях ТП ж.-д. транспорта;

- практически реализованный алгоритм АРО машиниста локомотива о неисправности в составе поезда с подтверждением и уточнением места и характера неисправности;

- программно-инструментальные средства подготовки предметно-ориентированных словарей аппаратуры АРО;

- алгоритмы и программные модули, реализующие как базовые подходы к кодированию речевых сигналов на основе ЛПК-модели, так и предложенный метод структурирования речевых сигналов.

Использование результатов работы. Теоретические и практические результаты диссертационной работы использованы:

- при разработке аппаратуры АРО «Радиоинформатор» и «Речевой информатор» по договору с Управлением СЮКД. На сети дорог МПС РФ внедрено 62 комплекта аппаратуры (акты внедрения прилагаются). Аппаратура демонстрировалась на выставке, посвященной расширенной коллегии МПС РФ по безопасности движения и получила высокую оценку руководителей служб ЦШ, ЦВиЦРБ;

- в подсистеме формирования РС комплекса КГМ РИИЖТ, разработанного РФ НИИЖА (акт внедрения прилагается);

- при разработке аппаратуры многоканальной низкоскоростной передачи речевой информации с использованием контроллера канала Е1 в Научно-производственном предприятии «Мультибит» (акт прилагается);

- в учебном процессе на кафедрах «Автоматика и телемеханика на ж,-д. транспорте» и «Управление эксплуатационной работой» РГУПС.

Апробация работы. Основные положения и научные результаты работы докладывались и обсуждались на семинарах кафедр «Автоматика и телемеханика на ж.-д. транспорте», «Связь на ж.-д. транспорте» РГУПС, отраслевой научно-технической конференции «Актуальные проблемы развития железнодорожного транспорта и роль молодых ученых в их решении» (РГУПС, г.Ростов-на-Дону, 1998); 58-ой научной конференции профессорско-преподавательского состава РГУПС. - (РГУПС, г.Ростов-на-Дону, 1999); международной научно-теоретической конференции «Проблемы и перспективы развития железнодорожного транспорта» - (РГУПС, г.Ростов-на-Дону, 1999); 5-ой межвузовской научно-методической конференции «Актуальные проблемы и перспективы развития железнодорожного транспорта» - (РГОТУПС, г. Москва, 2000). Аппаратура АРО «Речевой информатор РИ-1В», в которой использованы результаты диссертационного исследования, неоднократно демонстрировалась на выставках: в МПС РФ, посвященной расширенному заседанию Коллегии МПС по безопасности движения в декабре 1996 г., на выставке «Ресурсосберегающие технологии» (на испытательном кольце ВНИИЖТа, ст.Щербинка) в феврале 1997 г., на Ассамблее начальников железных дорог России (на ст. Минеральные Воды) в мае 1998 года, и получила положительные отзывы руководителей отрасли (соответствующий акт прилагается).

Публикации. По результатам диссертационной работы опубликовано одиннадцать печатных работ, из них шесть статей (одна - без соавторов, пять в соавторстве) и пять тезисов докладов на конференциях.

Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения и приложений. Основное содержание диссертации изложено на 167 страницах, содержит 35 рисунков и 3 таблицы. В библиографию включено 105 наименований отечественной и зарубежной литературы.

s

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертационной работы, сформулированы цель и задачи выполненных научных исследований, отмечена практическая ценность полученных новых научных результатов. Приведена структура изложения материала в диссертационной работе. Приводятся сведения об апробации и степени опубликования основных положений работы.

В первой главе проведен анализ специфики деятельности субъектов ТП на ж.-д. транспорте. Проведен анализ технологических объектов ж.-д. транспорта на предмет возможности автоматизации процесса оповещения обслуживающего персонала. Детально исследован ТП, связанный с оповещением дежурным по станции (ДСП) машиниста локомотива о неисправности в подвижном составе. Описаны разработанные на основе исследования ТП структура аппаратуры АРО и алгоритм оповещения. Проанализированы временные соотношения функционирования аппаратуры.

В настоящее время применение средств АРО на ж.-д. транспорте ограничивается несколькими технологическими задачами, не оказывающими существенного влияния на повышение безопасности движения. Такое слабое развитие на ж.-д. транспорте средств АРО не может считаться допустимым. Многие ТП ж.-д. транспорта требуют автоматизации речевого оповещения.

Особым случаем применения устройств формирования PC является их работа в системах, обеспечивающих безопасность движения. ТП, связанные с безопасностью движения требуют протоколирования формируемых PC, записи и архивирования ответных PC. Поэтому целесообразно использовать для построения аппаратуры АРО технологические микро-ЭВМ с развитой периферией. Специфика использования систем АРО на ж.-д. транспорте делает невозможными или экономически нецелесообразными известные стандартные подходы к построению систем синтеза речи (например, принцип «цифрового магнитофона»).

С учетом вышесказанного постановка задачи выглядит следующим образом. Требуется разработать устройство, которое способно хранить в памяти достаточно большой набор предметно-ориентированных сообщений, «говорить», записывать в архив речевые сигналы, причем делать все это в жестких условиях функционирования ТП ж.-д. транспорта. В данной постановке задача имеет альтернативное решение; основанное на использовании носителей информации высокой надежности и эффективных методов «сжатия» речевых сигналов.

Одной из технологических цепочек, обеспечивающих безопасность движения, является оповещение машиниста о наличии неисправностей в составе поезда, обнаруженных системой ДИСК. Автоматическая передача информации машинисту возможна двумя способами: с помощью выносных указателей неисправности и через канал ПРС. Первый способ не оптимален по причине относительно высокой стоимости. Второй - отличается простотой проектирования и ввода в эксплуатацию, так как не требует изменений существующих систем контроля состояния подвижного состава и ПРС.

Указанные факторы послужили причиной разработки и внедрения в 1993-1994 годах в РГУПС аппаратуры «Радиоинформатор», в создании которой активное участие принимал автор настоящей работы, а в 1996-1997 году в НИИЖА - устройства «Речевой информатор РИ-1М».

Функция данных устройств заключается в однонаправленной передаче машинисту речевой информации о наличии перегретых букс в составе поезда. Указанная аппаратура повышает безопасность движения, однако она не лишена недостатка. Отсутствует гарантия того, что машинист поезда примет сообщение, выданное аппаратурой в симплексный канал ПРС.

Для того, чтобы избавиться от указанного недостатка, предлагается система оповещения с записью и архивированием ответного речевого сообщения машиниста, уточнением характера и места неисправности.

Структурная схема предлагаемой системы представлена на рис.1.

Сущ естеующая

_^ система _

Пиния

—у-у-^—

-Л—Л__^ -т.

Станционная

часть аппаратуры ДИСК/ПОНАБ

дсп

Аппаратура автоматического речевого оповещения

X

Стационарная радиостанция поездной радиосвязи

поездной

оадиоканал <--

т

Локомотивная радиостанция

^ речевой сигнал оповещения

»ответный речевой сигнал машиниста

Рис. 1. Структурная схема системы оповещения машиниста локомотива.

Предлагается следующий алгоритм оповещения машиниста локомотива. При появлении в линии связи системы ДИСК информации о первой неисправности в составе поезда аппаратура АРО голосом по радиоканалу ПРС посылает машинисту сообщение и переходит в режим ожидания ответного РС. Машинист, приняв сообщение аппаратуры, посылает в канал

. ПРС вызов и голосом подтверждает прием сообщения. Аппаратура АРО, обнаружив в радиоканале ПРС тональный вызов от машиниста локомотива, записывает в электронный журнал речевой ответ машиниста.

Получив от системы ДИСК информацию о результатах контроля всего поезда, аппаратура АРО формирует в радиоканал сообщение о готовности передать машинисту локомотива полную информацию о неисправностях в составе поезда, об их местонахождении и характере.

Получив это сообщение, машинист локомотива при необходимости повторной посылкой в радиоканал тонального вызова запрашивает подробную информацию о неисправностях. Обнаружив в радиоканале повторный тональный вызов, АРО передает в радиоканал информацию о характере неисправности, номере вагона, оси и стороне.

Предложенный способ оповещения позволяет увеличить оперативность, достоверность и надежность передачи машинисту локомотива подробной речевой информации о неисправностях в подвижном составе, повысить ответственность персонала и технологическую дисциплину.

Итак, разработка систем АРО и их применение на ж.-д. транспорте с целью повышения безопасности движения является актуальной задачей. Результатом первой главы являются предложенные структура и алгоритм функционирования аппаратуры АРО, а также требования, предъявляемые к способам и методам речевого оповещения на ж.-д. транспорте.

Во второй главе исследуются базовые подходы к цифровой обработке речевых сигналов на основе модели ЛПК, приведены алгоритмы и программные модули, реализующие базовые процедуры анализа и синтеза речевых сигналов на основе метода ЛПК.

Особенность современного состояния использования алгоритмов сжатия речи состоит в том, что методы, основанные на представлении речевых сигналов в виде мгновенных значений или их приращений (импульсно-кодовая модуляция (ИКМ), различные виды дельта-модуляции (ДМ)), вытесняются методами, основанными на глубокой математической обработке (различные модификации ЛПК).

Метод ЛПК состоит в том, что отсчет речевого сигнала аппроксимирует« линейной комбинацией М предшествующих отсчетов (М - порядок модели) Коэффициенты предсказания, используемые в комбинации, определяются минимизацией среднего квадрата разности между отсчетами речевого сигналг и их предсказанными значениями. Достоинства метода" состоят в высоком

качестве синтезированной речи, значительном «сжатии» речевых сигналов, и при этом относительной простоте вычислений.

Основные проблемы, решаемые при анализе речи с использованием метода ЛПК: определение вектора ЛПК-параметров речевого тракта; определение основного тона; определение степени вокализации интервала речевого сигнала; определение энергии возбуждающего импульса.

Все перечисленные выше параметры являются переменными во времени, на отдельных интервалах речевых сигналов их можно считать постоянными. Инерционность голосового тракта такова, что продолжительность этих квазистационарных участков равна 5-20 мс.

Для квазистационарного интервала речевого сигнала 8(п0),.«18(1Ч-1) параметры а1,...,ам ЛПК-модели порядка М могут быть определены путем минимизации среднеквадратической погрешности е системы линейных уравнений:

ЛГ-1 М

I 1))2=г. (1)

п - по ( = 1

Существуют автокорреляционный и ковариационный подходы к реализации модели ЛПК, отличающиеся способом определения интервала анализа, свойствами получаемых систем линейных уравнений и соответствующих им матриц.

Автокорреляционная матрица является симметрической и теплицевой, что позволяет применять эффективные специальные методы решения, такие как рекурсивный алгоритм Левинсона и др. Ковариационная матрица является симметрической, но не теплицевой. Это не позволяет использовать специальные методы, применяемые при решении автокорреляционной системы уравнений. Объем вычислений при решении автокорреляционной матрицы меньше, методы решения проще.

Особенностью метода на основе лестничного фильтра является то, что в нем процедуры построения матрицы и ее решения объединены в рекурсивный алгоритм определения параметров линейного предсказания. Метод позволяет непосредственно по погрешностям предсказания получить коэффициенты лестничного фильтра к(.

Физический смысл коэффициентов к| - степень корреляции между погрешностью предсказания и возвратной погрешностью. Поэтому к; называют коэффициентом частных корреляций. Частные корреляции всегда удовлетворяют условию

-1<&<1, (2)

т.е. фильтр на основе коэффициентов ^ всегда устойчив (доказано Бургом).

При использовании алгоритма Бурга

/¿'«"-"(,)>»-"(„-,) _ где (3)

л = 0 ч=0

- погрешность предсказания на выходе обратного фильтра ¡-го порядка; Ь^'Цп) - погрешность возвратного предсказания на выходе обратного фильтра ¡-го порядка.

Метод на основе лестничного фильтра обладает рядом достоинств: устойчивость фильтра без использования временных окон; коэффициенты частных корреляций не требуют высокой точности представления, их можно усекать до требуемого числа бит, проводить линейную интерполяцию при синтезе, что не приводит к потере устойчивости синтезирующего фильтра.

Таким образом, подход на основе лестничного фильтра является наиболее предпочтительным.

Одной из основных задач, решаемых при построении вектора ЛПК-параметров, является определение основного тона (ОТ). В работе исследован и использован модифицированный корреляционный метод, впервые предложенный Итакурой, и позволяющий устранить влияние формант на точность оценки ОТ. Анализу подвергается автокорреляционная функция последовательности погрешности линейного предсказания.

Для увеличения точности метода применены следующие решения:

- перед использованием метода последовательность погрешности предсказания пропускается через цифровой ФНЧ с частотой среза около 900 Гц. Фильтр с такой частотой среза позволяет подавить формантные частоты, не оказывая влияния на основной тон;

- проводятся логическая коррекция результатов и линейная интерполяция периода ОТ смежных сегментов;

- применен переменный порог, при котором фиксируются пики автокорреляционной функции.

Признак «вокализованный/фрикативный» определялся при анализе речевых сигналов на основе комбинации двух методов: по функции числа переходов через ноль и по величине пика автокорреляционной последовательности погрешности предсказания, соответствующего ОТ.

Для снижения влияния излучения губ и формы сигнала голосовой щели на выделяемые ЛПК-параметры исходный речевой сигнал подвергался

предыскажению. В качестве предыскажения использована фильтрация при помощи фильтра с характеристикой 1 -цг"1 (ц=0.935). Синтез речевого сигнала проводился с использованием операции, обратной предыскажению.

При синтезе речевого сигнала с использованием модели ЛПК в качестве исходных элементов использованы вектора параметров, включающие в себя: энергию; частоту основного тона; признак вокализованный/фрикативный и набор ЛПК-коэффициентов синтезирующего фильтра.

Реализованы и исследованы два способа представления синтезирующего фильтра - прямая и лестничная формы. Для каждой из форм фильтра получены зависимости относительной интегральной ошибки, процента неустойчивых сегментов и субъективного восприятия качества синтезированной речи от точности представления коэффициентов.

Зависимости качества синтезированной речи от точности представления коэффициентов представлены на рис. 2 и 3 для фильтра прямой формы и лестничного фильтра соответственно. Зависимости получены с использованием нечеткой модели оценки качества синтезированной речи 9=(8,Ь), где Б - речевой сигнал, Ь ~ множество лингвистических значений переменной "качество" с их функциями принадлежности на базовой шкале Б.

8 ,

"отлично "хорошо 'средне 'удютегеорталш "плащ

"Неряб0|ИИ80'-

средне

"плата "нгразбо(»»о"-

Т

"Г"

4 8 8 10 12 14 16

Рис.2. Зависимость качества синтезированной речи от точности представления коэффициентов фильтра прямой формы

2 4 6 8 18 12 14 16 1! я

Рис.3. Зависимость качества синтезированной речи от точности представления коэффициентов лестничного фильтра

Исследования выявили достоинства и недостатки каждого из подходов.

Достоинством фильтра прямой формы являются простота реализации, незначительный объем вычислений, недостатком - высокие требования к точности представления коэффициентов, и, следовательно, больший объем памяти для их хранения. С точки зрения чувствительности к точности представления коэффициентов лучшие результаты дает использование синтезирующего фильтра лестничной структуры со всеми полюсами.

Важным фактором, позволяющим повысить качество синтезированной речи, является интерполяция частоты основного тона, энергии импульса возбуждения и ЛПК-коэффициентов. При построении процедуры синтеза речевого сигнала использовалась интерполяция параметров двух смежных сегментов. Проведенные исследования свидетельствует о том, что для интерполяции более подходят параметры лестничного фильтра.

С учетом вышеизложенного базовым методом синтеза, который использовал автор, был метод лестничного фильтра. Порядок модели М был выбран равным десяти. При этом период основного тона кодировался пятью битами (если значение - 0, то звук фрикативный), логарифм энергии -шестью, коэффициенты - логарифм к] и кг - шестью битами, к3 ,к4 - пятью. к5 ,к« - четырьмя, к7 ,ка - тремя, и к9 ,кю - двумя битами. Таким образом, вектор параметров имеет размер 51 бит. Период смены кадров выбрал равным 15 мс. Скорость передачи речи составила 67 векторов в секунду или примерно 3400 бит/секунду. Отметим, что эта скорость несколько выше, чек определяемая стандартом ЬРК-10 скорость в 2400 бит/секунду. Однакс автором предполагалось дальнейшее структурирование речевых сигналов с использованием методов, изложенных в главе 3.

Реализованный и исследованный метод кодирования-восстановленш речевого сигнала, основанный на базовых процедурах ЛПК, послужил £ диссертации отправной точкой в реализации более сложных алгоритма обработки речи, основанных на глубоком структурировании речевы? сигналов.

В третьей главе предложена модель оценки качества синтезированной речи, основанная на положениях теории нечетких множеств, предложен формализован и исследован метод глубокого структурирования речевы> сигналов, основанный на процедуре композиции матриц локальных степеней стационарности сегментов. Изложены методики определения нечетки; локальных степеней стационарности сегментов речевых сигналов и поиск; . наилучшего представителя квазистационарного сегмента. Указанны! процедуры реализованы в виде алгоритмов и программных модулей.

Специфика устройств синтеза РС, предназначенных для АСУ ТП ж.-д транспорта, заключается в том, что разборчивость РС должна быть высока так как они должны прослушиваться субъектами ТП в условия: повышенного шума, в произвольные моменты времени, бе: предварительного предупреждения.

В связи с вышеизложенным важнейшей проблемой синтеза речевы; сообщений является задача "сжатого" представления сигнала, с одно!

и

стороны, и достаточно детального его описания с тем, чтобы сохранить качество и естественность синтезированной речи - с другой.

Классический подход к решению данной задачи базируется на разбиении речевого сигнала на квазистационарные участки, на каждом из которых параметры речевого сигнала неизменны. Увеличение числа участков при разбиении временного интервала звучания позволяет точнее описать реальный сигнал, однако это достигается большими затратами памяти.

Требуется найти такое разбиение R={S(,S2,—>SK} сигнала S на квазистационарные участки, у которого количество интервалов S¡eS минимально, и при этом последующий синтез .удовлетворяет некоторому критерию качества. Критерий зависит от предметной области использования синтезатора. Однако независимо от сферы применения "конечным потребителем" синтезированной речи является человек. Поэтому целесообразно в качестве критерия принять субъективно-экспертную оценку на некоторой качественной шкале. Нечеткая модель оценки качества позволяет формализовать процедуру определения разборчивости и качества звучания синтезированной речи экспертом-оператором.

Введена нечеткая шкала качества L={li,...,l6} со следующими лингвистическими значениями: 1г"отлично", 12-"хорошо", 13-"средне", 14-"удовлетворительно", 15-"плохо", 16- "неразборчиво".

Следующим шагом в построении нечеткой модели является выбор объективной количественной шкалы. Нечеткая качественная модель определена на базовой шкале ошибки линейного предсказателя ro(es).

m(es)= ЕФ)2. (4)

Введем в рассмотрение некоторое пороговое значение е ошибки ra(es). Тогда представляет интерес задача поиска такого разбиения RE сигнала S, для которого m(es)<s на любом из подинтервалов S¡eRE. При этом количество подинтервапов S¡ должно быть минимально.

Нечеткая модель оценки сигнала S определяется как пара

a=(S,L),rae (5)

L - множество лингвистических значений нечеткой переменной "качество" с их функциями принадлежности на шкале е.

В результате многочисленных исследований и работы с экспертами над словарем типовых фраз ж.-д. терминологии были установлены функции принадлежности для приведенных лингвистических значений.

Построение функции качества осуществляется по классическо! процедуре экспертных оценок.

Далее поставлена и решена задача укрупненного разбиения интервал! речевого сигнала на квазистационарные участки. Мера качества определяете; нечеткой моделью на базовой шкале - ошибки фильтра предсказания.

Речевые сигналы в представлены последовательностью элементов речи, каждый из которых является вектором ЛПК-параметров полученным в результате анализа на интервале 15 мс, т.е. 8=^1^2,...^,,}.

Пусть для некоторого К < п задано разбиение И последовательности £ на К непересекающихся сегментов —(¡=1,—,К) и:

расположенных друг за другом элементов geS. Для произвольных е 8 определим меру близости р^.ёк).

Тогда существуют элементы ё-^еЗ! , для которых на основе выбранной меры близости р величина 2 , являющаяся суммарным

расстоянием между g¡j и всеми элементами из в., принимает минимальное значение. Назовем такие элементы эталонными и обозначим как е^ тогда последовательность Е(8)={е1,е2,...,ек} назовем эталоном реализации § относительно разбиения II.

Приведенное определение позволяет для любой реализации речевого сигнала в и любого ее разбиения И. на сегменты Si (¡=1,...,К) построить конструкцию:

8(Е(8)Д) = еье1,...,е1, е2,е2,..,,е2,..., ек,ек,...,ек , (6)

V -V- -V-

¡1-раз ¡граз ¡к-раз

которая получена путем замещения в в всех элементов, входящих в один сегмент S¡ разбиения К, на эталонный элемент

к

Определим величину

характеризующую

суммарное расстояние эталонных элементов от всех остальных элементов в реализации в. Расстояние р(Е(8),8) несет количественную информацию о «похожести» звучания реализации 8(Е(8)Д)"на звучание исходной в.

Задачу сжатия речевого сигнала можно сформулировать следующим образом. Для исходной последовательности Б требуется найти минимальное разбиение И на К сегментов (минимум значения К), для которого минимизировано расстояние р(Е(8),8).

Далее применим К-сегментадию для исходной реализации S(n-l) раз для kr=n-l,k=n-2,...,k=l. Очевидно, что в каждом k-том случае (к=1,2,...) мы будем получать разбиение Rk, зависящее от К. Каждое разбиение индуцирует соответствующий эталон Ек со своей мерой близости p(Ek(S),S). Понятно, что с уменьшением К расстояние р будет увеличиваться. Построенная таким образом зависимость позволяет установить для заданной меры р минимальное разбиение и, наоборот, для заданного числа сегментов в разбиении найти такое, которое минимизирует ошибку р.

Далее предлагается метод структурирования речевого сигнала на основе композиции матриц локальных степеней стационарности. Метод основан на замечательном свойстве композиции матриц, которая позволяет за счет свертки максиминных произведений найти глобальный экстремум в условиях аддитивности критерия. В данной постановке задачи критерий аддитивен.

Введем понятие степени стационарности V¡,- интервала речевого сигнала S¡j=S¡,Si+i,...,Sn,Sj. Степенью стационарности интервала S¡j, где i, j -порядковые номера элементов речевого сигнала, назовем величину, определяющую равномерность, однородность данного интервала.

Примем степень стационарности V¡¡ интервала S¡¡ равной 1, а степени стационарности V¡j=0, при i>j=0. Тогда степень стационарности V¡j интервала речевого сигнала Sy при i<=j будет находиться в диапазоне от 0 до 1 и будет стремиться к 0 при увеличении разности между i и j.

Введем в рассмотрение матрицу Mv размером N х N (где N - число элементов речевого сигнала)

Mv = (Vi/j, где l<i<N, l<j<N. (7)

При этом элемент ¡-ой строки и j-ro столбца V¡¡ является степенью стационарности фрагмента речевого сигнала S(n), состоящего из смежных элементов, от элемента S¡ до S¡. Очевидно, что элементы главной диагонали матрицы равны 1, а элементы, лежащие под диагональю матрицы, равны 0.

Определим произведение степеней стационарности: V¡¡ • VU1 как mm(V¡j, Vkl).

Определим сумму степеней стационарности: Vy + Vkl как шах (Vy, Vkj).

«Худшим» из подинтервалов речевого сигнала S(n) назовем подинтервал, имеющий наименьшую степень стационарности. «Лучшим» из подинтервалов речевого сигнала S(n) назовем подинтервал, имеющий наивысшую степень стационарности.

«Лучшим» разбиением RK речевого сигнала S(n) на заданное числ сегментов К назовем разбиение, при котором степень стационарност худшего из подинтервалов наибольшая.

Определим композицию матрицы Mv на себя:

Mv(1)=MvoM,. (8)

Результатом процедуры является матрица Mv(1) размером NxI4, каждый элемент V¡j(,) которой определяется в соответствии с

Vy(1)= t ViaVBj. (9)

и = i

Нетрудно заметить, что элементы матрицы Mv*1' обладают следующим свойствами:

V¡j(1) - максимальная степень стационарности интервала исходно! речевого сигнала S¡j при его разбиении на два подинтервала. При этом индеЕ п, при котором достигнута максимальная степень стационарности, являете координатой оптимального разбиения интервала на две части .

Особый интерес вызывает элемент

N

V1N(1)= I VlBVBN (10)

л = 1

матрицы Mv(l), который характеризует максимальную crenei стационарности всего исходного речевого сигнала при его оптимально разбиении на два подинтервала.

Результатом последовательных композиций исходной матрицы степеш стационарности Mv и матрицы-результата композиции предыдущего уров] Mv<K"l) является матрица Mv(k) = Mv о Mv(K"4 При этом элемент матрицы Mv(k) является максимальной степенью стационарности речево сигнала S(n) при его разбиении на К подинтервалов или степеш стационарности оптимального К-разбиения речевого сигнала S(n).

Координаты оптимального разбиения запоминаются на каждом ша композиции юга могут быть определены путем обратной рекурсии.

Предложенный метод исследован автором. В работе представлен способ определения локальных степеней стационарности интервалов; пои наилучших представителей подинтервалов; рекомендации по сокращен! объема вычислений. В качестве примера произведено разбиение интерва речевого сигнала на заданное число сегментов. Построены зависимое качества синтезированной речи от числа подинтервалов при сегментации д слов из словаря сообщений ж.-д. тематики (представлены на рис. 4 и 5).

Рис.4. Зависимость качества синтезированной Рис.5. Зависимость качества синтезированной

речи от количества интервалов речи от количества интервалов

разбиения слова «ВАГОН» разбиения слова «ВОЛОЧЕНИЕ»

Степень сжатия описанным методом речевого сигнала, представленного векторами ЛПК-параметров, зависит от свойств реализации речевого сигнала, глубины первичного ЛПК-кодирования, требований, предъявляемых к качеству синтеза речи, и составляет 1,5-2,5 раза. Дальнейший резерв в «сжатии» заключается в замене эталонных элементов речи на элементы, извлекаемые из некоторого постоянного для данного диктора словаря.

Пусть задана некоторая достаточно длинная реализация в одного или нескольких речевых сигналов и некоторое ее разбиение на К сегментов. При достаточно большой последовательности в значение К может быть также велико. Следовательно, велико число эталонных элементов. Введем в рассмотрение некоторую величину е, характеризующую порог близости между элементами речи. Если для некоторых ei и е; имеет место р(в| е^е, то эти элементы соответствуют похожим на слух участкам речи. Тогда на множестве эталонов Е={е1,е2,...,е„} можно определить граф Се=(Е,Г), соединив дугами те и только те пары вершин е^, для которых р(е|

Любое внешне устойчивое множество графа в соответствует такому подбору элементов из Е, которого достаточно для описания эталона Е с точностью е. Практический интерес представляют минимальные внешние устойчивые множества, поскольку в этом случае мы приходим к минимальным «функционально полным» словарям.

В четвертой главе предложен и разработан АРМ подготовки наборов РС аппаратуры АРО, описаны результаты исследований, полученные с использованием АРМ.

Установлено, что оптимальный выбор метода кодирования РС невозможен без оценки качества синтеза. Проблема оценки качества

синтезированной речи решена путем создания специализированного АРМ подготовки словарей PC АРО.

АРМ предназначен для ввода и редактирования в интерактивном режиме речевой информации. Предусмотрена возможность составления фраз предметно-ориентированного словаря из элементов базы данных PC.

Подготовленные PC могут быть подвергнуты программной обработке следующими методами: адаптивная дельта-модуляция; ЛПК; динамическое программирование (ДП); сегментация на основе композиции матриц.

ПО АРМ обеспечивает анализ речевых сигналов с выделением таких основных параметров как: частота ОТ; энергия; признак вокализации сегмента речевого сигнала; коэффициенты линейного фильтра-предсказателя; число и границы сегментов при сегментации речевого сигнала; темпоральная, тональная и акустическая транскрипции.

Возможно построение следующих графиков: представления синтезированного речевого сигнала во времени; функции ошибки синтезированного сигнала от времени; спектральной функции речевого сигнала; спектрограмм (зависимости спектра сигнала от времени); зависимости интегральной ошибки от количества сегментов при сегментации и др.

При структурировании речевых сигналов, представленных векторам!: ЛПК-параметров могут задаваться: допустимые интегральная ошибка у степень стационарности при разбиении речевого сигнала ш квазистационарные сегменты; количество сегментов, на которые делите; исходный речевой сигнал; мера сходства элементов речевого сигнала.

Результаты исследований речевых сигналов могут быть сохранены i базе знаний системы и использованы при последующем синтезе.

В АРМ предусмотрена возможность оценки влияния внешних фактора на разборчивость синтезированной речи. С этой целью в базу знанш включены программные модели мешающих воздействий и реальны* фонограммы шумового оформления рабочих мест объектов ж.-д. транспорт: (помещение ДСП, кабина локомотива, диспетчерский пункт, пуню технического обслуживания вагонов и др.). Суммирование синтезированно! речи и мешающих воздействий позволяет тфинять решение о возможное^ использования исследуемого метода кодирования речи в реальных условиях.

Программы, реализующие базовые процедуры обработки речевы сигналов, написаны на языке ассемблера сигнального процессора Analo: Devices ADSP-2186-KST160 и загружаются на выполнение в блок обработк: сигналов из технологической микро-ЭВМ.

Структура АРМ подготовки PC для систем АРО приведена на рис.6.

о>

сн

Кааек речевой

Блок цифровой обработки аналоговых сигналов База данных и база знании* на и>шр,

*

АЦП

Технолопмеаоя микроэвм

ЦаЛ1

ЦАП2

пгге

н>-<

УС

ГПФ - программируем^ поооооеой фильтр РУ - УЬилигель с регулируем**» коэффициектом передачи ЦАЛ1 - преобраэоеагепь речевого сигнала ЦАЛ2-

X

вьесд наРС вывод в ТПФ линию

ВЬвОД 8 ЛИНИЮ

громсоговорящвй саязи

Рис. 6. Структурная схема АРМ подготовки речевых сообщений

Применение АРМ подготовки РС позволило:

- повысить оперативность подготовки РС для аппаратуры АРО;

- повысить качество и разборчивость РС, что подтверждают экспертные оценки по нечеткой шкале качества;

- проводить исследования перспективных методов сжатия речи.

В пятой главе приведен пример практической реализации предложенных алгоритмов и методов, а также результатов исследований, описанных в предыдущих главах. Разработаны: предметно-ориентированный словарь, комплект ТС и ПО аппаратуры АРО машиниста о неисправностях в подвижном составе.

Аппаратура "Речевой информатор" предназначена для увеличения оперативности и надежности оповещения машиниста локомотива о наличии неисправностей в подвижном составе. В аппаратуре реализованы основные режимы работы: контроль состояния систем типа ДИСК с автоматическим оповещением машиниста локомотива и ДСП о неисправностях в подвижном составе; прием из канала ПРС ответного РС машиниста; уточнение места неисправности в составе поезда с указанием номера вагона, оси, стороны и признака неисправности; формирование РС тревоги; изменение конфигурации ПО; диагностика ТС аппаратуры; работа с архивом РС.

С целью уменьшения требуемой емкости архива записываемые РС подвергаются анализу с выделением параметров речевого сигнала, «сжатию» с использованием метода ЛПК, описанного в главе 2, и последующего структурирования, описанного в главе 3.

При извлечении из архива речевые сигналы восстанавливаются пр, помощи фильтра лестничной структуры со всеми полюсами. Усредненны затраты памяти на хранение речевых сигналов составляют 2500 бит секунду. Приемлемое качество восстановленных РС подтверждено рядог экспертных оценок, а также в процессе эксплуатации аппаратуры н станциях Северо-Кавказской и Северной железных дорог.

Аппаратура "Речевой информатор" представляет собой аппаратнс программный комплекс, который включает в себя пакет прикладны: программ и ТС, и работает совместно с системой ДИСК-Б и стационарно) радиостанцией ПРС. ТС аппаратуры "Речевой информатор" состоят из блок управления на основе технологической микро-ЭВМ и блока ввода-вывод технологических сигналов, обеспечивающего гальваническую развязку согласование сигналов. ПО аппаратуры "Речевой информатор" обеспечивае ее настройку, контроль и диагностику, а также работу во всех режимах.

За период с октября 1994 года по настоящее время на Севере Кавказской и Северной ж.-д. были введены в эксплуатацию 62 комплект аппаратуры "Речевой Информатор", в которых были использованы принцип! формирования и архивирования РС, описанные в главах 2 и 3. За врем эксплуатации аппаратура зарекомевдовала себя законченным изделие?, способным существенно повысить безопасность движения на ж.-д транспорте. Высокие качество и разборчивость синтезированных Р< подтверждены актами по итогам опытной эксплуатации на Ростовскои Лиховском, Кавказском и Минераловодском отделениях СКЖД. Эт подтверждает эффективность и практическую ценность предложенных работе способов оповещения и методов синтеза и архивирования РС Экономический эффект от внедрения аппаратуры АРО достигается за сче повышения безопасности движения и уменьшения числа аварий.

В приложениях представлены тексты разработанных программ и акт) о внедрении результатов диссертационной работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

- исследован технологический процесс оповещения машинист локомотива, выявлена возможность его совершенствования;

- разработан алгоритм АРО машиниста локомотива с возможность] подтверждения и уточнения места и характера неисправности;

- исследованы и реализованы в виде алгоритмов и программных модулей базовые процедуры цифровой обработки речевых сигналов на основе ЛПК-модели;

- предложена и формализована модель оценки качества синтезированной речи, основанная на положениях теории нечетких множеств;

- предложен, формализован и исследован метод глубокого структурирования речевых сигналов на основе композиции матриц нечетких локальных степеней стационарности;

- разработан АРМ, предназначенный для подготовки предметно-ориентированных словарей аппаратуры АРО и оценки их качества;

- разработаны предметно-ориентированный словарь, комплекс технических средств и программное обеспечение аппаратуры автоматического речевого оповещения машиниста локомотива о неисправности в подвижном составе.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Кульбикаян Х.Ш., Лопатин В.Ф., Шаповалов В.В. Устройство "РАДИОИНФОРМАТОР" для передачи сигналов ПОНАБ по радиоканалу машинисту локомотива. "Вопросы совершенствования систем автоматики, телемеханики' и связи на железнодорожном транспорте". Межвуз. сб. научн. тр. Под редакцией проф. Явна А.А; РГУПС. Ростов-на-Дону, 1995.198 с.

2. Шаповалов В.В. К вопросу применения систем' автоматического речевого оповещения на железнодорожном транспорте. Применение современных технических средств в системах железнодорожной автоматики и телемеханики. Междунар. межвуз. сб. научн. тр./ Под редакцией к.т.н. доя. Л.В.Пальчика; Ростов-н/Д, РГУПС, 1998.159 с.

3. Ковалев С.М., Шаповалов В.В. Нечеткая модель оценки синтезированной речи в системах оперативно-диспетчерского управления. Применение современных технических средств в системах железнодорожной автоматики и телемеханики. Междунар. межвуз. сб. научн. тр./ Под ред. к.т.н. доц. Л.В.Пальчика;. Ростов-н/Д, РГУПС, 1998.159 с

4. Шаповалов В.В. Проблема разработки систем автоматического речевого оповещения для систем железнодорожного транспорта. Актуальные проблемы развития железнодорожного транспорта и роль молодых ученых в их решении: Материалы отраслевой науч.-техн. конф., поев. 70-летию РГУПС. -Ростов н/Д.: РГУПС, 1998.

5. Шаповалов В.В. Поиск локальных степеней стационарности речевого сигнала на основе модели линейно-предикатного кодирования. Материалы 58-ой научной конференции профессорско-преподавательского состава РГУПС. - Ростов н/Д.: РГУПС, 1999

6. Ковалев С.М., Шаповалов В.В., Зозуля В.А. Минимизация числа эталонных элементов в модели ЛПК-синтеза речевых сообщений. Известия ТРТУ Тематический выпуск. Интеллектуальные САПР. «Материалы Международной научно-технической конференции «Интеллектуальные САПР»: Таганрог, 1999 №3(13). 335 с.

7. Шаповалов В.В. Драган М.П. Организация многоканальной низкоскоростнс передачи речевой информации с использованием контроллера канала Е1. Проблем и перспективы развития устройств автоматики, связи и вычислительной техники t ж.-д. тр-те: Междунар. межвуз. сб. науч. тр. - Ростов н/Д.: РГУПС, 1999.

8. Шаповалов В.В., Шаповалова Ю.В. Автоматизированное рабочее место подготовь речевых сообщений для аппаратуры автоматического речевого оповещена Проблемы и перспективы развития устройств автоматики, связи и вычислительно техники на ж.-д. тр-те: Междунар. межвуз. сб. науч. тр. - Ростов н/Д.: РГУПС, 1999.

9. Хорошавин А.И., Шаповалов В.В., Пустовой Ю.Е., Драган М.П. Цифровь процессоры сигналов в аппаратуре технологической связи. Проблемы и перспектив развития ж.-д. тр-та. Труды междунар. научно-теор. конф.:-Ростов н/Д.:РГУПС, 199!

10. Ковалев С.М., Шаповалов В.В., Ковалев B.C. Метод сегментации речевых сигнале на основе композиции матриц степеней стационарности. Актуальные проблемы перспективы развития железнодорожного транспорта. Материалы 5-ой межву: научно-мелод. конф.: - Москва: РГОТУПС, 2000.

И. Хорошавин А.И., Шаповалов В.В., Березин Д.В., Пустовой Ю.Е., Драган М.Г Организация сети контроля и управления системами «Диск» на базе аппаратур автоматического речевого оповещения. Актуальные проблемы и перспектив: развития железнодорожного транспорта. Материалы 5-ой межвуз. научно-метод. конф.: - Москва: РГОТУПС, 2000

В работах, написанных в соавторстве, личный вклад автора состоит: в [1] - предложен и исследован алгоритм функционирования аппаратуры; [3,6] - формализованы модель оценки качества синтезированной речи : метод сегментации речевого сигнала; в [7] - предложен и реализован спосо кодирования PC, предложена структура контроллера; в [8] - предложен структура АРМ, определены его основные функции, проведен! исследования; в [9,11] - разработаны методы кодирования PC, в [10] • формализован метод структурирования речевых сигналов на основ композиции матриц локальных степеней стационарности.

Соискатель

Шаповалов В.В.

Шаповалов Василий Васильевич

Разработка алгоритмов и методов автоматического и речевого оповещения обслуживающего персонала железнодорожного транспорта

Автореферат диссертации на соискание ученой степени кандидата технических наук

Подписано к печати 6.04.2000 Формат 60x84/16 Бумага офсетная. Печать офсетная. Усл.печ.л.1,45. Уч.-издл 1,39Тираж100 Изд №104 Заказ №11

Ростовский государственный университет путей сообщения. Ризография АСУ РГУПС. Лицензия ПЛД №65-10 от 8.08.1999 г.

Адрес университета: 344038, г. Ростов н/Д, пл. им. Ростовского Стрелкового полка народного ополчения, 2

Оглавление автор диссертации — кандидата технических наук Шаповалов, Василий Витальевич

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. ТЕХНОЛОГИЧЕСКИЕ АСПЕКТЫ ИСПОЛЬЗОВАНИЯ СИСТЕМ АВТОМАТИЧЕСКОГО РЕЧЕВОГО ОПОВЕЩЕНИЯ НА ЖЕЛЕЗНОДОРОЖНОМ ТРАНСПОРТЕ

1.1. Исследование специфики деятельности персонала, обеспечивающего технологические процессы на объектах железнодорожного транспорта

1.2. Принципы построения систем автоматического речевого оповещения на железнодорожном транспорте

1.3. Анализ технологических объектов железнодорожного транспорта на предмет целесообразности дополнения ' 'средствами автоматического речевого оповещения

ГЛАВА 2. ИССЛЕДОВАНИЕ БАЗОВЫХ МЕТОДОВ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ НА ОСНОВЕ МОДЕЛИ ЛИНЕЙНО-ПРЕДИКАТНОГО КОДИРОВАНИЯ

2.1. Алгоритмы, программная реализация и исследование базовых процедур анализа речевых сигналов методом линейно-предикатного кодирования ^ 2.2. Исследование и особенности реализации алгоритмов синтеза речевых сигналов на основе Модели линейного предсказания

ГЛАВА 3. НЕЧЕТКИЕ МОДЕЛИ СТРУКТУРИРОВАНИЯ СООБЩЕНИЙ В СИСТЕМАХ АВТОМАТИЧЕСКОГО РЕЧЕВОГО ОПОВЕЩЕНИЯ

3.1. Субъективная модель восприятия синтезированной речи. Нечеткая модель оценки качества синтезированной речи в системах оперативно-диспетчерского управления

3.2. Модель сегментации речевого сигнала. Нечеткое разбиение на квазистационарные участки

3.3. Метод сегментации речевого сигнала на основе композиции матрицы локальных степеней стационарности

3.4. Определение степени стационарности интервала речевого сигнала

3.5. Определение наилучшего представителя интервала речевого сигнала

3.6. Исследование результатов применения метода

ГЛАВА 4. ОРГАНИЗАЦИЯ ПРОГРАММНО-ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ ПОДГОТОВКИ ДАННЫХ ДЛЯ СИСТЕМ АВТОМАТИЧЕСКОГО РЕЧЕВОГО ОПОВЕЩЕНИЯ

4.1. Структура и возможности автоматизированного рабочего места подготовки речевых сообщений для аппаратуры автоматического речевого оповещения

4.2. Общий алгоритм подготовки речевых сообщений '

4.3. Организация базы данных и базы знаний

4.4. Описание программных средств подготовки наборов речевых сообщений и сервисных утилит интерактивного структурирования речи

4.5. Опыт использования АРМ подготовки наборов речевых сообщений

ГЛАВА 5. СИСТЕМА АВТОМАТИЧЕСКОГО РЕЧЕВОГО ОПОВЕЩЕНИЯ МАШИНИСТА ЛОКОМОТИВА И ОБСЛУЖИВАЮЩЕГО ПЕРСОНАЛА СТАНЦИИ О НЕИСПРАВНОСТЯХ В ПОДВИЖНОМ СОСТАВЕ

5.1. Принцип формирования и протоколирования речевых сообщений, принятый в аппаратуре

5.2.Алгоритм функционирования аппаратуры

5.3. Структура аппаратуры

5.4.Технические средства аппаратуры

5.5. Программное обеспечение аппаратуры

5.6. Анализ результатов опытной эксплуатации аппаратуры автоматического речевого оповещения

Введение 2000 год, диссертация по информатике, вычислительной технике и управлению, Шаповалов, Василий Витальевич

В основе развития и совершенствования технологических процессов (ТП) на железнодорожном транспорте лежит широкое использование автоматических систем управления (АСУ) с интеграцией различных сообщений. Увеличивается число процессов, подлежащих автоматизации, растут потоки информационных сообщений субъектам ТП.

Использование речевого вывода информации представляется наиболее перспективным, а иногда и единственно возможным способом общения. Роль речевых сообщений существенно возрастает с внедрением автоматизированных рабочих мест (АРМ), экспертных систем, автоматов-советчиков.

Исследования в области обработки речевых сигналов не уменьшают актуальность проблемы. До сих пор задача оптимального выбора между словарем, качеством синтезируемой речи и ресурсами ЭВМ остается нерешенной. Актуальны проблемы оценки качества синтезированных речевых сообщений, структурирования речи, подготовки предметно-ориентированных словарей систем автоматического. речевого оповещения (АРО). Кроме того, использование систем АРО на объектах' железнодорожного транспорта имеет свою специфику, затрудняющую использование стандартных подходов к построению систем синтеза речи. Требуются новые эффективные алгоритмы оповещения и методы «сжатия» речевых сигналов.

Особым случаем применения устройств формирования речевых сообщений является их работа в составе систем, обеспечивающих безопасность движения на железнодорожном транспорте. Внедрение систем автоматического речевого оповещения позволяет повысить оперативность, достоверность и надежность оповещения обслуживающего персонала и, следовательно, безопасность движения в целом.

Объектом диссертационного исследования являются автоматизация ТП речевого оповещения машиниста локомотива о неисправности в подвижном составе, совершенствование алгоритмов АРО.

Предметом исследования являются методы структурирования речевых сигналов на основе модели линейно-предикатного кодирования (ЛПК), проблема подготовки предметно-ориентированного словаря систем АРО, а также нечеткая модель оценки качества речевых сообщений.

Целью настоящей диссертационной работы является разработка и исследование алгоритмов и методов автоматического речевого оповещения обслуживающего персонала технологических объектов железнодорожного транспорта и построение программно-аппаратных средств их реализации.

Для достижения поставленной цели решены следующие задачи:

- исследован технологический процесс оповещения машиниста о неисправности в составе шезда, выявлена возможность его совершенствования, предложен алгоритм оповещения с подтверждением;

- исследованы базовые подходы к анализу и синтезу речевых сигналов на основе модели линейно-предикатного кодирования;

- предложена нечеткая модель оценки качества синтезированной речи;

- разработан и исследован метод структурирования речевых сигналов;

- разработано автоматизированное рабочее место для подготовки предметно-ориентированных словарей аппаратуры АРО и оценки качества формирования речевых сообщений;

- разработаны программное обеспечение и технические средства аппаратуры АРО, работающей на основе предложенных и исследованных алгоритмов и методов оповещения.

В процессе работы над темой диссертации был выработан комплексный подход к решению проблемы совершенствования алгоритмов и методов автоматического речевого оповещения на железнодорожном транспорте, разработки и внедрения на объектах железнодорожного транспорта систем АРО. Основные направления решения проблемы, методы исследований и полученные результаты поясняет схема, представленная на рис. 1. автоматического речевого оповещения

Методы исследования. Для решения поставленных задач использованы современные теоретические и экспериментальные методы моделирования и оптимизации с использованием ЭВМ. Исследования в области обработки речевых сигналов базируются на методах, описанных в работах Итакуры .Ф, Атала Б., Маркела Д., Грея А., Макхоула Д., Рабинера Л., Шафера Р., Винцюка Т.К., Прохорова Ю.Н. и др. Теоретические исследования выполнены с использованием положений теории нечетких множеств, представленных в работах Мелихова А.Н., Берштейна Л.С. [43,46-48] и др., а также теории матричного анализа. Проектирование, разработка и внедрение микропроцессорных систем производились с использованием методик, разработанных Иванченко В.Н [26,28], Лисенковым В.М., Сапожниковым В.В., Сапожниковым Вл.В., Дмитренко И.Е., Жарковым Ю.И., Лябахом H.H., Шилейко A.B. и др.

Экспериментальные исследования проведены с использованием теории и классических методик проведения экспертных оценок [9,19,30,74].

Основные положения, выносимые на защиту. На защиту выносятся следующие положения и результаты:

- на железнодорожном транспорте существует целый ряд ТП, в рамках которых возможна автоматизация речевого оповещения обслуживающего персонала. В первую очередь, это относится к процессам, связанным с безопасностью движения;

- существующий процесс речевого оповещения машиниста о неисправности в составе поезда имеет недостатки, связанные с влиянием «человеческого фактора», с особенностями организации симплексного канала поездной радиосвязи (ПРС). Алгоритм оповещения требует улучшения;

- усовершенствованный алгоритм АРО машиниста о неисправности в составе поезда, позволяющий повысить оперативность, достоверность и надежность оповещения;

- нечеткая модель оценки качества синтезируемой речи;

- метод глубокого структурирования речевых сигналов на основе композиции матриц локальных степеней стационарности;

- АРМ подготовки и оценки качества предметно-ориентированных наборов речевых сообщений аппаратуры АРО.

Научная новизна диссертационного исследования заключается в следующем:

- предложен алгоритм АРО машиниста о неисправности в составе поезда с подтверждением оповещения, архивированием речевых ответов машиниста и уточнением характера и места неисправности, позволяющий повысить оперативность, достоверность и надежность оповещения;

- впервые предложена нечеткая модель оценки качества синтезированной речи, позволяющая повысить качество подготовки предметно-ориентированных наборов речевых сообщений;

- разработана методика построения и кодирования предметно-ориентированных словарей аппаратуры АРО, снижающая затраты памяти при сохранении высокого качества синтезированной речи;

- предложен и формализован метод структурирования и сжатия речевых сигналов на основе композиции матриц локальных степеней стационарности речевых сигналов, позволяющий оптимизировать разбиение речевого сигнала на квазистационарные подинтервалы.

Апробация работы. Основные положения и научные результаты работы докладывались и обсуждались на семинарах кафедр «Автоматика и телемеханика» и «Связь на железнодорожном транспорте» РГУПС, отраслевой научно-технической конференции «Актуальные проблемы развития железнодорожного транспорта и роль молодых ученых в их решении» (РГУПС, г.Ростов-на-Дону, 1998); 58-ой научной конференции профессорско-преподавательского состава РГУПС. - (РГУПС, г.Ростов-на-Дону, 1999); международной научно-теоретической конференции «Проблемы и перспективы развития железнодорожного транспорта» - (РГУПС, г.Ростов-на-Дону, 1999); 5-ой межвузовской научно-методической конференции «Актуальные проблемы и перспективы развития железнодорожного транспорта» - (РГОТУПС, г. Москва, 2000). Аппаратура АРО «Речевой информатор РИ-1В», в которой использованы результаты диссертационного исследования, демонстрировалась на выставках: в МПС РФ, посвященной расширенному заседанию Коллегии МПС по безопасности движения в декабре 1996 г., «Ресурсосберегающие технологии» (на испытательном кольце ВНИИЖТа, ст.Щербинка) в феврале 1997 г., на Ассамблее начальников железных дорог России (на ст. Минеральные Воды) в мае 1998 года и получила положительные отзывы руководителей отрасли (соответствующий акт прилагается).

Публикации. По результатам диссертационного исследования опубликовано одиннадцать печатных работ, из них шесть статей (одна - без соавторов, пять - в соавторстве) и пять тезисов докладов на конференциях (два - без соавторов, три в соавторстве).

Диссертация состоит из введения, пяти глав, заключения и приложений.

Заключение диссертация на тему "Разработка алгоритмов и методов автоматического речевого оповещения обслуживающего персонала железнодорожного транспорта"

Основные результаты работы позволяют совершенствовать процессы оповещения обслуживающего персонала, что позволяет повысить эффективность и безопасность эксплуатации железнодорожного транспорта.

ЗАКЛЮЧЕНИЕ

Диссертационная работа посвящена исследованию комплексной проблемы совершенствования алгоритмов и методов автоматического речевого оповещения на железнодорожном транспорте, включая вопросы разработки и внедрения на объектах железнодорожного транспорта систем АРО. В работе изложены основные направления решения проблемы, методы исследований и достигнутые результаты.

Научная новизна. Научная новизна заключается в следующем:

- впервые предложена нечеткая модель оценки качества синтезированной речи, позволяющая повысить качество подготовки предметно-ориентированных наборов речевых сообщений;

- разработана методика построения и кодирования предметно-ориентированных словарей аппаратуры АРО, снижающая затраты памяти при сохранении высокого качества синтезированной речи;

- предложен и формализован метод структурирования и сжатия речевых сигналов на основе композиции матриц локальных степеней стационарности речевых сигналов, позволяющий оптимизировать разбиение речевого сигнала на квазистационарные подинтервалы.

Практическую ценность работы представляют:

- предложенный и практически реализованный алгоритм АРО машиниста локомотива о неисправности в составе поезда с подтверждением принятого сообщения и уточнением места и характера неисправности, программные модули, его реализующие;

- АРМ подготовки предметно-ориентированных словарей аппаратуры АРО;

- алгоритмы и программные модули, реализующие как базовые подходы к кодированию речевых сигналов на основе ЛПК-модели, так и предложенный метод структурирования речевых сигналов.

Использование результатов работы. Теоретические и практически результаты диссертационной работы использованы:

- при разработке аппаратуры АРО «РЕЧЕВОЙ ИНФОРМАТОР» по договору с Управлением Северо-Кавказской железной дороги. К настоящему моменту на сети МПС РФ внедрено 62 комплекта аппаратуры (акт внедрения прилагается.). Аппаратура демонстрировалась на выставке, посвященной расширенной коллегии МПС РФ по безопасности движения, и получила высокую оценку руководителей служб ЦШ, ЦВ и ЦРБ (соответствующий акт прилагается);

- в подсистеме формирования речевых сообщений микропроцессорного информационно-управляющего комплекса КГМ РИИЖТ, разработанного РФ НИИЖА (акт внедрения прилагается);

-при разработке аппаратуры многоканальной низкоскоростной передачи речевой информации с использованием контроллера канала Е1 в Научно-производственном предприятии «Мультибит» (соответствующий акт прилагается);

-в учебном процессе в Ростовском государственном университете путей сообщения (соответствующий акт прилагается).

Библиография Шаповалов, Василий Витальевич, диссертация по теме Автоматизация технологических процессов и производств (в том числе по отраслям)

1. Аппаратура железнодорожной автоматики и связи: Общие технические условия: РД 32 ЦШ 03.07 90: Утв. 5.10.90/МПС РФ -М.: ВНИИЖА, 1991.

2. Инструкция по движению поездов и маневровой работе на железных дорогах Российской Федерации: ЦД/206: Утв. 02.10.93/МПС РФ М.: Транспорт, 1995.

3. Инструкция по размещению, установке и эксплуатации средств автоматического контроля технического состояния подвижного состава на ходу поезда: ЦВ-ЦШ-453: Утв. 30.12.96/МПС РФ М.: Транспорт, 1997.

4. Аблазов В.И. Преобразование, запись и воспроизведение речевых сигналов. -Киев: Лыбидь, 1991.

5. Автоматическое распознавание и синтез речевых сигналов: Сб. научн. тр./Под ред. Т.К. Винцюка. Киев: ИК, 1989.

6. Адаптивные фильтры: Пер. с англ./Под ред. К.Ф.Н. Коуэна и П.М. Гранта. -М.: Мир, 1988.-392 с.

7. Анализ речевых сигналов: Сб.ст. АН СССР/Под ред. В.Н. Трунина-Донского. М.: ВЦ АН СССР, 1984.

8. Афанасьев В.П. Проблемы построения промышленных речевых терминалов.//Автоматическое распознавание и синтез слуховых образов. -М.: ВЦ АН СССР, 1987 с. 37 - 46.

9. Бешелев С.Д., Гуревич Ф.Г. Экспертные оценки. М.: Наука, 1973. - 159 с.

10. Борисов А.Н. и др. Обработка нечеткой информации в системах принятия решений М.: Радио и связь, 1989. - 302с.

11. Брауде Золотарев Ю. Сжатие речи.//Компьютерра , № 15, 1999.

12. Валуева Н.М., Каничева Е Б. Автоматическая сегментация речевого сигнала по динамическим спектрограммам. М.: ВЦ АН СССР, 1988.

13. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. -Киев: Наук, думка, 1987. 264 с.

14. Взаимодействие с ЭВМ на естественном языке: Сб. научн. тр. АН СССР, Сиб. отд., ВЦ/Под ред. A.C. Нариньяни. Новосибирск: ВЦ СОАН СССР, 1978.

15. Гарсиа В. Новые возможности встраиваемых компьютеров Octagon Systems.//CoBpeMeHHbie технологии автоматизации. №3, 1997. - С. 6 - 10.

16. Гигиена и физиология труда на железнодорожном транспорте./ Под ред. A.A. Прохорова. М., «Транспорт», 1973. 264 с.

17. Глушков В.М. Говорящие ЭВМ. Речевой ввод и вывод информации. М.: Знание, 1975.

18. Гончаров C.JI. Интерактивная графическая система для исследования речевых сигналов. М.: ВЦ АН СССР, 1988.

19. Гохман О.Г. Экспертное оценивание: Учеб. Пособие. Воронеж: Изд. Вор. Ун-та, 1991.-150 с.

20. Гультяев A. Matlab 5.2. Имитационное моделирование в среде Windows. Визуализация. Программирование. Анализ данных.: Практическое пособие.- СПБ.: Корона-принт, 1999.

21. Дегтярев Н.П. Параллельно-последовательная модель анализа, обнаружения и интерпретации сигналов слитной речи.//Анализ и синтез речи. Минск, 1991.-С. 4-24.

22. Децюк В. Фирма SIEMENS в мире автоматизации. //Современные технологии автоматизации. №3, 1998. С. - 34 - 35.

23. Динамические спектры речевых сигналов/Под ред. М.Ф. Деркача. Львов: Вища шк., 1983.

24. Дискретные системы. Одноплатный микроконтроллер ДС 1001 ДАРЦ.467444.902ТО. Техническое описание и инструкция по эксплуатации.- 1997.

25. Иванченко В.Н., Лябах H.H., Сепетый A.A. Принципы построения горочного микропроцессорного комплекса.//Вестник ВНИИЖТа, 1984. № 8.

26. Иванченко В.Н. Методика исследования, разработки, проектирования и внедрения микропроцессорных информационно-управляющих систем: Учебное пособие Ростов н/Д: РИИЖТ, 1986.

27. Иванченко В.Н. Микропроцессорные информационно-управляющие системы автоматизации сортировочных процессов: Учебное пособие -Ростов н/Д: РИИЖТ, 1984.

28. Иванченко В.Н. Разработка и внедрение микропроцессорной информационно-управляющей системы на сортировочной горке.//Автоматика и связь (ЦНИИТЭИ МПС), 1986.

29. Калинцев Ю.Н. Разборчивость речи в цифровых вокодерах. М.: Радио и связь, 1991.

30. Китаев Н. Н. Групповые экспертные оценки. М.: Знание, 1975. - 60 с.

31. Ковалев С.М. О нахождении минимальных покрытий в гиперграфах.//Методы построения алгоритмических моделей сложных систем. Таганрог, 1980.

32. Козадаев Б.Л. Исследование речевого сигнала на основе выделения параметров синхронно с основным тоном.//Автоматическое распознавание и синтез слуховых образов. М.: ВЦ АН СССР, 1987 - с.68 -73.

33. Коркмазский Ф.Е. Модуль автоматического распознавания речи, использующий функции Уолша.//Автоматическое распознавание и синтез слуховых образов. М.: ВЦ АН СССР, 1987 - с. 47 - 52.

34. Косарев Ю.А. Естественная форма диалога с ЭВМ. JL: Машиностроение, 1989.

35. Кофман А. Введение в теорию нечетких множеств: Пер. с фр. В. Б. Кузьмина /Под ред. С.И. Травкина М.: Радио и связь, 1982. - 432 с.

36. Кузнецов А. Все, что вы хотели узнать о флэш-дисках, но боялись спросить.// Современные технологии автоматизации. №2, 1998. - С. 6 - 10.

37. Кузнецов. А. Промышленные компьютеры фирмы Advantech.//CoBpeMeHHbie технологии автоматизации. №1, 1997 г. С.-12-20.

38. Левкович-Маслюк Л. Дайджест вейвлет-анализа. //Компьютерра, № 8, 1998.

39. Лябах H.H. Математические основы разработки и использования машинного интеллекта. Ростов н/Д: Изд. Ростовского университета, 1989. 112 с.

40. Малышев Н.Г., Берштейн Л.С., Боженюк A.B. Нечеткие модели для экспертных систем САПР. Москва.: Энергоатомиздат, 1991.-136 с.

41. Маркел Дж., Грей А.Х. Линейное предсказание речи: Пер. с англ./Под ред. Ю.Н. Прохорова и B.C. Звездина. М.: Связь, 1980. - 308 с.

42. Марков С. Цифровые сигнальные процессоры. Книга 1. М.: Микроарт, 1996.- 144 с.

43. Мелихов А.Н., Берштейн Л.С. Конечные четкие и расплывчатые множества.- Таганрог: ТРТИ, 1980. 101 с.

44. Мелихов А.Н., Берштейн Л.С., Коровин С.Я. Расплывчатые ситуационные модели принятия решений. Учеб. Пособие по прогр. ЦИПС ТРТИ -Таганрог: ТРТИ, 1986 92 с.

45. Мелихов А.Н., Берштейн Л.С., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой. Москва.: Наука, 1990. -272 с.

46. Мелихов А. Н., Карелин В. П., Ковалев С. М. Моделирование процессов принятия решений на основе нечетких классификационных систем//Электронное моделирование. -Таганрог: ТРТИ, 1984.-№ 3. С. 3-6.

47. Методы автоматического распознавания речи: В 2-х книгах. Пер. с англ./Под ред. У. Ли. -М.: Мир, 1983. Кн. 1. 328 с.

48. Методы автоматического распознавания речи: В 2-х книгах. Пер. с англ./Под ред. У. Ли. М.: Мир, 1983. - Кн. 2. 360 с.

49. Методы и средства информатики речи: Сб. научн. тр. АН Украины, Ин-т Кибернетики. Киев: ИК, 1991.

50. Михайлов В.Г., Златоустова Л.В. Измерение параметров речи/Под ред. М.А. Сапожникова. -М.:Радио и связь, 1987.

51. Миюсов П.В. Модели скрытых марковских процессов и их использование при автоматическом распознавании речи. М.: ВЦ АН СССР, 1988.

52. Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов, М.: Радио и связь, 1985. - 176 с.

53. Нечеткие множества в информатике: Сб. тр. М.: ВНИИСИ, 1988. - 63 с.

54. Нечеткие множества и теория возможностей: Последние достижения: сб. ст./Под ред. P.P. Ягера: Пер. с англ. В. Б. Кузьмина/Под ред. С.И. Травкина М.: Радио и связь, 1986. - 405 с.

55. Обжелян Н.К. Трунин-Донской В.Н. Машины, которые говорят и слушают./Под ред. Ю.Н. Журавлева. Кишинев: Штиинца, 1987.

56. Оппенгейм А.В., Шаффер Р.В. Цифровая обработка сигналов: Пер. с англ./Под ред. С.Я. Шаца. М.: Связь, 1979. - 416 с.

57. Плотников В.Н. Речевой диалог в системах управления. М.: Машиностроение, 1988.

58. Попов Э.В. Общение с ЭВМ на естественном языке.- М.: Наука, 1982.

59. Потапова Р.К. Речь: коммуникация, информация, кибернетика: Учеб. Пособие для вузов. М.: Радио и связь, 1997. - 528 с.

60. Потапова P.K. Тайны современного кентавра: Речевое взаимодействие с человеком. М.: Радио и связь, 1992.

61. Применение измерительно-вычислительного комплекса для цифровой обработки речевых сигналов./Под ред. В. Н. Трунина-Донского М.: ВЦ АН СССР, 1985.

62. Прохоров Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов. М.: Радио и связь, 1984. - 240 е., ил. - (Стат. теория связи. Вып. 20).

63. Пушкин Э.И., Саженин А.И., Вериго A.M., Климова Т.В. Речевой информатор РИ- 1 .//Автоматика, связь, информатика 1998. № 6.

64. Рабинер JI.P.,Шафер Р.В. Цифровая обработка речевых сигналов: Пер. с англ./ Под ред. М.В. Назарова и Ю.Н. Прохорова. М.: Радио и связь, 1981. -495 с.

65. Речевая информатика: Сб. научн. тр./Под ред. В.В. Зяблова. М.: Наука, 1989.

66. Рылов A.C., Левковская Т.В. Частотно-адаптивный авторегрессионный анализ речевых сигналов.//Анализ и синтез речи. Минск, 1991.-С.42-56.

67. Сердюков В.Д. Опознавание речевых сигналов на фоне мешающих факторов. Тбилиси: Мецниерба, 1987.

68. Система инженерных и научных расчетов Matlab 5.2 в 2-х книгах/Под ред. В.Г. Потемкина. М.: Диалог-миссия, 1999. - т. 1 - 366 с.

69. Система инженерных и научных расчетов Matlab 5.2 в 2-х книгах/Под ред. В.Г. Потемкина. М.: Диалог-миссия, 1999. - т. 2 - 306 с.

70. Сорокин В.Н. Синтез речи. М.: Наука, 1992.

71. Тарасова М.Е., Галицына Н.В. Метод экспертных оценок: Уч. пособие для инж. экон. вузов и фак. специальности АСУ. М., 1974.

72. Фланаган Дж. Анализ, синтез и восприятие речи: Пер. с англ./Под ред. A.A. Пирогова. М.: Связь, 1968. - 396 с.

73. Хорошавин А.И. Шаповалов В.В., Пустовой Ю.Е., Драган М.П. Цифровые процессоры сигналов в аппаратуре технологической связи.//Проблемы иперспективы развития железнодорожного транспорта.: РГУПС, 1999. -С.25-26.

74. Чымбаев А.Ж. Предварительная сегментация и маркировка слитной речи. -М.: ВЦ АН СССР, 1979.

75. Шаповалов В.В. Поиск локальных степеней стационарности речевого сигнала на основе модели линейно-предикатного кодирования.//Материалы 58-й научной конференции профессорско-преподавательского состава РГУПС, 20-22 апреля 1999. С. 67.

76. Экспертные оценки и их применение в энергетике: /Под ред. P.M. Хвастунова М.: Энергоиздат, 1981. - 188 с.

77. Atal B.S. and Hanauer S L., Speech analyses and synthesis by linear prediction of the speech wave J. //Acoustic Society of America. Vol.50., 1971.

78. Benzmuller R., Barry W. Microsegment synthesis economic principles in low-cost solution //Proc. Fourth International Conference of Spoken Language Processing (ICSLP), Philadelphia, 1996.

79. Black A.W., Campbell N. Optimizing selection of units from speech databases for concatenative synthesis. //Proc. Evrospeech"95, vol. 2, 1995. pp. 581 - 584.

80. Black A.W., Campbell N. Prosody and the selection of source units for concatenative synthesis. //Progress in speech synthesis. Berlin: Springer Verlag, 1996 pp. 279-282.

81. Black A.W., Hunt A.J. Unit selection in a concatenative speech synthesis system using a large speech database. In 1С AS SP 96, Atlanta, 1996 - vol. 1 - pp.373 -376.

82. Black A.W., Taylor P. Automatically clustering similar units for unit selection in speech synthesis. //Proc. Evrospeech"97, vol. 2, 1997. pp. 601 - 604.

83. Burg J. A new analysis technique for time series data. //Proc. NATO Advanced Study Institute on Signal Processing, 1968.

84. Campos G.L., Couvea E.V. Speech synthesis using the CELP algorithm. //Proc. Fourth International Conference of Spoken Language Processing (ICSLP), Philadelphia, 1996.

85. Dalsgaard P., Petek В., Andersen O. On the robust automatic segmentation of spontaneous speech. //Proc. Fourth International Conference of Spoken Language Processing (ICSLP), Philadelphia, 1996.

86. Hubener K. Using multi-level segmentation coefficients to improve HMM speech recognition. //Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), Munich, Germany, 1997.

87. Itakura F.I., Saito S. Analysis-synthesis telephony based upon maximum likelihood method. //Proc. Sixth International Congress of Acoustic, 1968.

88. King S., Portele T., Hofer F. Speech synthesis using non-uniform units in the verbmobil project. //Proc. Evrospeech"97, vol. 2, 1997. pp. 569 - 572.

89. Koishida K. CELP coding system based on mel-cepstral analysis //Proc. ICASSP'95, 1995.-pp. 33 -36.

90. Lee S.C. Probabilistic segmentation for segment-based speech recognition.: Requirements for the degree of Master of Engineering in Electrical Engineering and Computer Science at the Massachusetts Institute of Technology. May 1998.

91. Makhoul J. Stable and efficient lattice method for linear predication. IEEE Trans. Acoustics, Speech, and Signal Proc., ASSP-25, №5, 1977.

92. Ohno S., Masamichi F., Hiroya F. Quantitative analysis of the local speech rate and its application to speech synthesis. //Proc. Fourth International Conference of Spoken Language Processing (ICSLP), Philadelphia, 1996.

93. Pellom B. Automatic segmentation of speech recorded in unknown noisy channel characteristics. //Speech Communication. № 25 - 1998. - pp. 97 - 116.

94. Portnoff M.R., Zue V.W., and Oppenheim A.V., Some Considerations in the use of Linear Predication for Speech Analysis. MIT QPR №105, Research Lab of Electronics, 1972.

95. Taylor P.A. A real time speech synthesis system. // Proc. Eurospeech'91 1991. -pp. 341 -344.

96. Suh Youngjoo, Youngjik Lee. Phoneme segmentation of continuous speech using multi-layer perceptron. //Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), Munich, Germany, 1997.

97. Wang X., Zahorian A. Analysis of speech segments using variable spectral/temporal resolution. //Proc. Fourth International Conference of Spoken Language Processing (ICSLP), Philadelphia, 1996.