автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Разработка методов и пакета прикладных программ речевого ввода информации в диспетчерском управлении
Автореферат диссертации по теме "Разработка методов и пакета прикладных программ речевого ввода информации в диспетчерском управлении"
На правах рукописи
КРАИШКИН АНАТОЛИЙ ВИКТОРОВИЧ
РАЗРАБОТКА МЕТОДОВ И ПАКЕТА ПРИКЛАДНЫХ ПРОГРАММ РЕЧЕВОГО ВВОДА ИНФОРМАЦИИ В ДИСПЕТЧЕРСКОМ УПРАВЛЕНИИ
Специальность 05.13.06 — Автоматизация и управление технологическими процессами и производствами (транспорт)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Москва - 2006
ш—---
На правах рукописи
Краишкин Анатолий Викторович
РАЗРАБОТКА МЕТОДОВ И ПАКЕТА ПРИКЛАДНЫХ ПРОГРАММ РЕЧЕВОГО ВВОДА ИНФОРМАЦИИ В ДИСПЕТЧЕРСКОМ УПРАВЛЕНИИ
Специальность 05.13.06 — Автоматизация и управление технологическими процессами и производствами (транспорт)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Москва —
2006
Работа выполнена в Российском государственном открытом техническом университете путей сообщения (РГОТУПС)
Научный руководитель — доктор технических наук, профессор
Горелик Владимир Юдаевич
Официальные оппоненты: доктор физико-математических наук,
профессор Карпухин Владимир Борисович,
кандидат технических наук,
доцент Нагинаев Валерий Николаевич
Ведущая организация — Российский научно-исследовательский
и проектно-конструкторский институт информатизации, автоматизации и связи (ВНИИАС)
Защита диссертации состоится «5" октября 2006 г. часов на заседании диссертационного совета Д 218.009.03 при Российском государственном открытом техническом университете путей сообщения (РГОТУПС) по адресу: 125993, Москва, ул. Часовая, 22/2, ауд. 344
С диссертацией можно ознакомиться в библиотеке РГОТУПС.
Автореферат разослан «5» сентября 2006 г.
Отзывы на автореферат в двух экземплярах, заверенные печатью, просим направлять по адресу диссертационного совета.
Ученый секретарь \
диссертационного совета Д 218.009.03 сОл j ^
доктор технических наук, профессор f^/vi/ A.C. Космодамианский
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Диспетчерское управление находит свое применение не только в железнодорожной отрасли, но и в авиационной, атомной и других отраслях. Везде, где применяется диспетчерское управление, оно показывает свою высокую эффективность.
Современные тенденции развития диспетчерского управления свидетельствуют об увеличении количества выполняемых диспетчером функций в его повседневной работе. Многочисленные попытки создания «автодиспетчера» приводят к выводу о необходимости разработки мер, направленных, во-первых, на частичную автоматизацию часто выполняемых функций, во-вторых, на предоставление диспетчеру дополнительного канала ввода информации. Значительный вклад в разработку методов и моделей решения задач автоматизации управления движением поездов железных дорог внесли российские ученые Абрамов В.М., Баранов Л.А., Беляков И.В., Горелов Г.В., Дмитренко И.Е., Ерофеев Е.В., Жербина А.И., Иванченко В.Н., Козлов П.А., Кравцов Ю.А., Лисенков В.М., Лисицын А.Л., Никифоров Б.Д., Розен-бергЕ.Н., Сапожников В.В., Сидоренко В.Г., Тишкин Е.М., Феофи-лов А.Н., Шалягин Д.В., Шубинский И.Б. и многие другие.
В настоящее время, помимо ручного способа ввода информации все большее распространение приобретает речевой ввод. Это в первую очередь связано с возросшей мощностью компьютеров, которые уже сейчас позволяют распознавать речь в режиме реального времени. Речевой ввод информации особенно актуален при диспетчерском управлении, когда диспетчер подвергается постоянным стрессовым нагрузкам, действуя в условиях дефицита времени. Большой вклад в разработку методов распознавания и обработки речи внесли российские ученые БондаркоЛ.В., Венцов A.B., ВинщокТ.К., Галунов В.И., Горелик А.Л., Загоруйко Н.Г., Златоустова Л.В., Михайлов В.Г., Мясников Л.Л., Назаров М.В., Прохоров Ю.Н., Чистович Л А., Шелухин О.И. и многие другие.
Цель и задачи исследования. Целью диссертационного исследования является разработка методов и пакета прикладных программ речевого ввода информации применительно к диспетчерским системам управления (на примере железнодорожного транспорта). Для реализации поставленной цели решались следующие взаимосвязанные задачи:
• анализ структуры и процесса функционирования диспетчерского управления на ж.д. транспорте; построение модели человеко-машинной системы (ЧМС) диспетчерского управления движением поездов, с целью выяснения областей применения речевого ввода информации;
• оценка эффективности применения речевого ввода по следующим критериям: вероятность ошибочного формирования ответственной команды при применении речевого ввода в качестве завершающего этапа; скорость ввода команд;
• разработка архитектуры системы распознавания речи (СРР) на основе анализа существующих;
• анализ существующих методов распознавания речи, выбор и разработка эффективных методов для решения поставленной задачи;
• разработка принципов формирования словаря и организации грамматики команд;
• разработка программного обеспечения, реализующего модель управления движением поездов с использованием речевого ввода команд управления, в качестве дополнительного канала информации.
Объектом исследования выступает ЧМС диспетчерского управления движением поездов.
Предметом исследования является математическое, алгоритмическое и программное обеспечение поддержки работы систем диспетчерского управления и их функциональных модулей.
Методологической основой исследования явилось использование методов системного анализа, спектрального анализа, распознавания образов, теории вероятностей, теории конечных автоматов, искусственной нейронной сети (ИНС), скрытой марковской модели (СММ), объектно-ориентированного программирования (ООП).
Исследование работоспособности и достоверности разработанных алгоритмов проводилось методом вычислительного эксперимента с помощью созданного комплекса программ на языке программирования С++ общим объемом около 15000 строк (часть исходных кодов включена в приложение).
Научная новизна.
1. Разработана методика обучения ИНС, позволяющая сократить время ее обучения, перейти от минимизации целевой функ-
ции в виде суммы квадратов ошибок обучения к минимизации максимальной ошибки.
2. Определен критерий эффективности использования нейрона в ИНС, позволяющий получать более устойчивые решения.
3. Разработан метод масштабирования при обучении СММ, позволивший упростить вычисление модифицированных прямых и обратных переменных.
Практическая ценность. Разработано программное обеспечение, которое позволяет в режиме диалога производить настойку словаря и грамматики команд, для конкретной системы диспетчерского управления.
Разработана методика обучения ИНС.
Произведена настройка словаря и грамматики команд для применения в работе поездного диспетчера (ДНЦ), которая позволяет ему с помощью речевого ввода выполнять следующие операции:
• управление устройствами железнодорожной автоматики;
• навигацию по станциям участка, с отображением подробной информации по выбранной станции;
• запись диспетчерских приказов в звуковой файл и сохранение их в едином информационном массиве;
• подтверждение выполнения ответственной команды.
Апробация работы. Основные положения и результаты диссертации докладывались, обсуждались и получили одобрение на заседании кафедры «Электроника и защита информации»МИИТ (2006 г.), на заседании кафедры «Вычислительная техника» РГОТУПС (2005, 2006 гг.), в Российском научно-исследовательском и проектно-кон-струкгорском институте информатизации, автоматизации и связи (2006 г.).
Публикации. По материалам диссертации опубликовано пять научных работ. Список приведен в конце автореферата.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы и приложения. Работа содержит 134 страницы машинописного текста, 3 таблицы и 55 рисунков. Список литературы состоит из 103 наименований.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность, определена цель и объект исследования, формулируется научная новизна и практическая ценность работы.
В первой главе проанализированы возможности применения речевого ввода информации применительно к диспетчерским системам управления на транспорте.
На примере железнодорожного транспорта был выполнен функционально-структурный анализ ЧМС диспетчерского управления движением поездов. Ключевым звеном данной системы является ДНЦ. Компонентно-системная структура рассматриваемой ЧМС представлена на рис. 1.
Рис. 1. Компонентно-системная структура ДНЦ
Из инженерной психологии известно, что оптимальный темп деятельности и количество перерабатываемой информации составляют 65—75% возможностей человека, в то время как ДНЦ 80—98% рабочего времени практически без перерыва занят приемом и переработкой информации.
Повысить безопасность движения можно, разработав и осуществив мероприятия, направленные на снижение загруженности, подтверждение выполнения ответственных команд диспетчера и
предотвращение несанкционированного доступа к управлению движением. Перспективным в этом отношении является речевой ввод информации голосом диспетчера в виде определенных команд.
Для снижения загруженности ДНЦ могут использоваться следующие способы применения речевого ввода:
• управление устройствами автоматики;
• навигация по станциям участка, с отображением подробной информации (например, схемы путевого развития станции) по выбранной станции (пример команды — станция Куровская);
• запись диспетчерских приказов в звуковой файл (пример команды — запись «распоряжение» стоп).
Установлено, что скорость речевого ввода команд для систем дискретного распознавания слов не уступает скорости ввода команд с помощью клавиатуры и мыши, а иногда и выше ее.
Пусть рош вероятность ошибочного формирования ответственной команды, при ее подаче существующими средствами. Вероятность ошибочного формирования голосовой команды складывается из двух составляющих, а именно, из вероятности верного распознавания неправильной команды и вероятности неверного распознавания. Верное распознавание означает, что система распознала то слово, которое было произнесено. Команда является правильной, если именно она необходима для решения сложившейся ситуации. Вероятность верного распознавания неправильной команды
Рт -Рь) = 0,9-0,001 - 0,001,
где ръ — вероятность верного распознавания (для средней СРР, как правило, равна 0,9); рбп — вероятность безошибочной подачи команды голосом. При передаче ответственной команды в два этапа, где завершающим этапом является речевое подтверждение, вероятность ошибочного формирования ответственной команды равна
Рош(Рт + Р**) = Рош0,031 = рвш, (1)
где рнв — вероятность неверного распознавания (для средней СРР, как правило, равна 0,03); роа1 — окончательная вероятность ошибочного формирования ответственной команды при использовании речевого ввода в качестве заключительного этапа.
Таким образом, применение речевого ввода для подтверждения ответственной команды, позволит снизить вероятность ее ошибочного формирования более чем на порядок.
Также, анализируя речь человека, можно контролировать его физическое и психологическое состояние. Еще более важная задача — возможность использования устных команд для идентификации личности говорящего перед тем, как допустить его к работе.
Вторая глава содержит аналитический обзор современных СРР. Распознавание речи не является унифицированной системой. СРР можно поделить на две принципиальные различные группы. Первая группа служит для управления машинами с помощью речевых приказов, другая группа применяется для предварительной обработки разговорной речи. В нашем случае речь идет о разработке системы речевого ввода команд, относящейся к первой группе.
Среди фирм производителей СРР можно выделить:
> Dragon Systems Inc основным продуктом является «Dragon NaturallySpeaking» ;
> IBM основным продуктом является «ViaVoice»;
> Philips основным продуктом является «SpeechMagic»;
> Microsoft основным продуктом является «Speech Application SDK»;
> Университет Карнеги — Меллона основным продуктом является «Sphinx4».
К сожалению, на сегодняшней момент не существуют хорошей системы распознавания слитной речи для русского языка, это объясняется не только коммерческими соображениями, но и определенными принципиальными отличиями славянских языков от основных европейских (в частности, высокой тенденцией к фонетической редукции). Системы дискретного распознавания слов, которые являются, как правило, независимыми от языка, обладают низкой точностью и надежностью распознавания. Такие системы, в основном, обладают большой вероятностью неверного распознавания. Помимо всего прочего, данные системы, в основном, не предоставляют возможность определять грамматику команд.
На основе анализа существующих СРР были выявлены следующие этапы процесса распознавания речи.
1. Сегментация речи: Разбиение речи на сегменты.
2. Анализ признаков: Выполнение спектрального и/или временного анализа конкретного сегмента речи.
3. Распознавание сегмента речи: Нахождение наиболее похожей единицы речи, которая представлена данным сегментом.
4. Лексическое декодирование: Определение ограничений на возможные последовательности единиц речи, т.е. система, воспринимает только те слова, которые есть в ее словаре.
5. Синтаксический анализ: Определение ограничений на возможные последовательности слов словаря.
Для применения в диспетчерском управлении СРР должна обладать:
• высокой вероятностью верного распознавания команды и низкой вероятностью неверного распознавания, т.е. в процессе распознавания необходимо использовать совокупность методов с вынесением решения о верности распознавания по мажоритарному принципу;
• грамматикой построения команд;
• специализированным словарем;
• системой протоколирования выполняемых действий.
Среди имеющихся не существует СРР для конкретного применения в диспетчерском управлении, а имеющиеся потребуют обращения к фирмам разработчикам, т.к. они являются «закрытыми».
В третьей главе были проанализированы существующие методы распознавания речи. На основе анализа сделаны следующие выводы:
1. При оцифровке звукового сигнала предпочтительно использовать частоту дискретизации 16 кГц с 2 байтами на каждый отсчет.
2. Длительность сегмента речи для получения устойчивой спектральной оценки составляет от 10 до 20 мс.
3. Эффективными, по критерию сохранения нужной для дальнейшего распознавания информации малым количеством параметров (до 20), является использование следующих методов:
с) кепстральный анализ на основе линейного предсказания с учетом модели восприятия, для описания квазистационарных звуков речи (гласные, часть согласных);
б) вейвлет — анализ, для описания взрывных звуков речи.
4. В качестве способа классификации сегмента речи целесообразным является комплексное использование ИНС (базис фонем русского языка) и бинарного векторного квантования (базисы с 64, 128, 256 векторами).
5. Для распознавания, эффективным по критерию надежности оценки близости произнесенного слова к слову из словаря является использование СММ.
Четвертая глава посвящена разработке СРР для конкретного применения в диспетчерских системах управления на примере железнодорожного транспорта.
После того, как речевой сигнал переведен в цифровую форму, необходимо выделить в потоке поступающих данных начало и конец слова. Для решения данной задачи в разработанной СРР используется адаптивный алгоритм, введенный Шмидтом — Нильсеном Бен-том.
Для работы алгоритма определяются следующие параметры:
■ Длина кадра 240 (15 мс).
■ Коэффициент адаптации ц = 0,003.
■ Минимальный пороговый уровень энергии Ет{п = 0,2.
■ Минимальный пороговый уровень частоты Рт]п = 0,2.
■ Порог х = 1.
Следующим этапом обработки речи является перевод выделенного слова в спектральную область. Для этого, слово равномерно разбивается на сегменты длительностью 12 мс, и для каждого сегмента вычисляются следующие спектральные характеристики:
■ Максимальное изменение распределения энергии в полосе частот (количество частотных полос определяются выбором базисного вейвлета, в нашем случае был выбран вейвлет До-беши 3 порядка);
■ 14 коэффициентов кепстра с учетом модели восприятия.
Для выбора базисного вейвлета использовался следующий
критерий с!-е • , где ря = |хп| :/||х|Р, хл— коэффициенты вейвлет — преобразования. Чем он меньше, тем лучше базисный вейвлет представляет исследуемый сигнал.
После того, как получено спектральное представление слова, выполняется преобразование последовательности спектральных векторов в последовательность кодовых символов. Для этого, предварительно, на этапе обучения должны быть созданы базисы спектральных векторов речи. В качестве базисов были использованы: базис фонем русского языка, базисы, полученные с помощью бинарного векторного квантования с количеством классов 64,128,256.
Классификация спектральных векторов в базисе фонем русского языка производится с помощью ИНС. Для обучения данной ИНС разработана модификация алгоритма обратного распространения ошибки, которая позволяет минимизировать не суммарную ошибку обучения, а максимальную. Решение данной задачи с помощью классического алгоритма обратного распространения ошибки, как правило, является недостижимым, так как ошибка обучения для некоторой совокупности обучающих пар (<входной вектор, выходной вектор>) может быть максимальной. Причину данного явления объясняет уравнение (2). Данное уравнение показывает, что при увеличении разницы между текущим и желаемым значением равным 1(0) величина ошибки постепенно возрастает, но при разнице больше или равной 2/3 величина ошибки начинает резко падать (рис. 2 и рис. 3).
= (2)
где yJ — выходу-го нейрона выходного слоя; желаемое значение у-го нейрона выходного слоя; е] — ошибка для у'-го нейрона.
0,15 0,13 0,11 0,086 0,064 0,043 0,021
°0 0,14 0,29 0,43 0,57 0,71 0,86 1
У
Рис. 2. График величины ошибки при желаемом значении равном 1
11
Рис. 3. График величины ошибки при желаемом значении равном О
Для устранения данного эффекта предлагается способ, который состоит в том, что при желаемом значении равном 1 (0) значение функции величины ошибки при у< 1/3 равно е(1/3,1) (у^ 2/3 равно е(2/3,0).
Данный способ позволил также сократить время обучения И НС (рис. 4 и 5).
В работе предложена модификация методики «jog of weights» (встряхивание весов), заключающаяся в том, что встряхивание весов выполняется только для тех нейронов сети, которые являются «неактивными» более чем на 80—90% обучающих выборок. Нейрон считается «неактивным» для обучающей выборки, если при подаче данной выборки на вход сети выход нейрона больше 0,99 либо меньше 0,01. Таким образом, предложенная модификация определяет целенаправленный характер встряхивания весов нейронов. В результате время амнезии сети при использовании модифицированной методики «jog of weights» уменьшается на 10—15%.
Следующим этапом обработки речевого сигнала является поиск слова, которое наилучшим образом соответствует совокупности последовательностей кодовых символов. Каждое слово представлено четырьмя последовательностями кодовых символов, которые
эвена
Рис. 4. Изменение суммарной ошибки обучения ИНС, классифицирующей 5356 спектральных векторов
по 24 классам
Исходный алгоритм -Мэдифицированный алгоритм
ЭПОХ!
Рис. 5. Изменение максимальной ошибки обучения ИНС, классифицирующей 5356 спектральных
векторов по 24 классам
соответствуют отображению последовательности спектральных векторов в каждом из базисов, полученных на этапе обучения.
Для решения данной задачи в работе используется СММ (рис. 6), которая позволяет оценить вероятность генерирования ею (моделью) имеющейся последовательности кодовых символов.
Разработан метод масштабирования, используемый при обучении СММ. Основной метода является замена прямых и обратных переменных (ос, р() на модифицированные прямые и обратные переменные (а(,р,), которые получаются умножением исходных
переменных на определенный коэффициент зависящий от дискретного времени t = 1,2,...,п (см. 3,4, 5, 6).
Р(о„о2,...,ол)
а/
Р(о1,о2,...,оя) = Р(о1,о2,...,ол)-гл,
(3)
(4)
(5)
(6)
где ДОр о2,...,оп) — вероятность генерирования последовательно-
сти о,, о2,.
.,<? СММ слова.
Достоинством данного метода является уменьшение количества арифметических операций для вычисления модифицированных прямых и обратных переменных и адаптивное изменение масштабирующего множителя.
Исходя из указанных областей применения речевого ввода, приведем примерный словарный запас разрабатываемой системы. Для упрощения, представим данный словарный запас в виде множества категорий, где каждая категория есть совокупность слов.
Словарный запас состоит из следующих категорий:
• Устройства автоматики.
• Цифры: ноль, один, два,..., девять.
• Порядковый номер: первый, второй, и т.п.
• Цвет: зеленый, желтый, красный, синий, белый, мигающий.
• Ткп светофора: входной, выходной, маршрутный, проходной, прикрытия, заградительный, предупредительный, повторительный, локомотивный, маневровый, горочный.
• Положение стрелки: прямое, боковое.
• Станции участка: совокупность наименований станций.
• Запись диспетчерских приказов: запись, стоп.
• Подтверждение ответственной команды: подтверждаю, выполнить.
Общая категория — совокупность слов выполняющих вспомогательные функции: станция, положение, отмена.
Грамматику рассматриваемого словаря можно представить в виде конечного автомата Мили, определяемого следующей совокупностью шести объектов <5, X, У, б, X, л0>.
Множество состояний ^ = — ожидание команды, — выбор станции, 52 — запись приказа, ^ — подтверждение команды,
— конец приказа, ^ — станция выбрана, 56 — управление светофором, — управление стрелкой, ^ — выбор типа светофора, 59 — выбор светофора, £10 — выбор стрелки, 5И — цвет светофора, £[2 —положение стрелки, 513 — установка положения стрелки}.
Множество входных сигналов Л'включает в себя все слова рассматриваемого словаря, а также сигнал синхронизации, который генерируется каждые две-четыре секунды. Множество выходных сигналов У— множество идентификаторов выполняемых системой команд.
Одним из наглядных представлений конечного автомата является ориентированный граф переходов (рис. 7). Для упрощения изложения на рисунке не представлены входные сигналы, которые ведут к переходу от одного состояния к другому.
Рис. 7. Граф переходов конечного автомата грамматики
Пример команды: Станция Озёрная светофор входной первый желтый (s0 —> s, s5 —» s6 —> ig —> iu).
Рассмотрим архитектуру разработанного программного комплекса (рис. 8). Каждый объект данного программного комплекса является COM (Component Object Model) объектом.
Основным достоинством данной архитектуры является возможность построения распределенной вычислительной системы, т.е. модули данного программного комплекса могут располагаться на разных ЭВМ и обмениваться данными по сети (рис. 9).
Listener —
выделение фрагментов речи на фоне шума
о
О
Basis—базис спектральных характеристик речи
\
Сигнал
Analysis —
сегментация
и спектральное
представление
речи
гЛ-V
Phonetics —поиск слова, соответствующего кодовой последовательности
1 и
Execution—
Выполнение команд
V
Source—
считывание данных с внешню устройств
Output -
приемник данны:
■N
Хранилище базисных единиц речи
Neural Net —
Нейронная сеть
Словарный запас и грамматика
Хранилище операций
Рис. 8. Структура объектов программы
Рабочая станция Сервер
Рис. 9. Архитектура распределенной вычислительной системы
Основные количественные показатели программного обеспечения:
1. Количество файлов — 51.
2. Объем исходного кода — 15000 строк (примерно).
3. Объем скомпилированного кода — 1,36 Мб.
4. Количество исполняемых файлов — 17.
/
Минимальные системные требования:
1. Операционная система Microsoft Windows 2000 и выше.
2. Частота процессора от 650 МГц.
3. Объем оперативной памяти от 256 Мб.
4. Объем свободного места на жестком диске от 4 Мб.
При написании программы использовалось средство разработки от компании Microsoft — Microsoft Visual Studio .Net 2003 и язык программирования С++.
Для эксперимента были выбраны три железнодорожные станции: Озёрная, Юная, Пионерская.
Эксперимент состоял из следующих основных этапов:
1. Запись специализированного словаря в звуковой файл.
2. Построение базисов единиц речи.
3. Обучение СММ.
4. Тестирование.
В результате эксперимента было установлено:
1. Точность распознавания составила около 92% (17 команд из 200 были потеряны; ни одна команда не была трансформирована).
2. Для обеспечения времени выполнения команды меньше 1 с необходимо, чтобы количество дуг исходящих из любой вершины орграфа грамматики не превышало 30.
3. Время выполнения команды, состоящей из последовательности пяти слов (например, светофор —» маневровый—» —> один —» желтый —> выполнить), составляет около 7 с.
4. Разработанное программное обеспечение при распознавании команды загружает процессор Intel Pentium М с частотой 795 МГц на 18%.
ЗАКЛЮЧЕНИЕ
1. На примере железнодорожных систем диспетчерского управления, установлены следующие возможные области применения речевого ввода:
• управление объектами автоматики;
• навигация по станциям участка, с отображением подробной информации по выбранной станции;
• запись диспетчерских приказов в звуковой файл;
• подтверждение выполнения ответственной команды.
2. Произведена оценка эффективности применения речевого ввода в диспетчерских системах по критерию вероятности безошибочного формирования ответственной команды и скорости ввода команд. Показано, что при применении речевого ввода в качестве заключительного этапа формирования ответственной команды, вероятность ее ошибочного формирования становиться более чем на порядок ниже.
3. Определены структурные решения разработанной СРР, которая состоит из следующих модулей: модуль считывания звуковых данных с внешних устройств; модуль выделения слов на фоне шума; модуль спектрального анализа речи; модуль, решающий задачи классификации фрагментов речи и преобразующий последовательность спектральных векторов в последовательность кодовых символов; модуль, выполняющий лексический анализ кодовой последовательности и выбирающий слово, которое наилучшим образом соответствует данной последовательности; модуль, выполняющий команды, ассоциированные с последовательностью распознанных слов.
4. На основе анализа существующих методов спектрального представления речи, выбраны следующие методы: вейвлет преобразование и кепстральное преобразование на основе линейного предсказания с учетом модели восприятия.
5. Разработана методика оптимизации обучения ИНС, позволившая сократить время ее обучения, перейти от минимизации целевой функции в виде суммы квадратов ошибок обучения к минимизации максимальной ошибки обучения, обеспечить, априорно, более устойчивое решение, за счет сброса весов тех нейронов, которые «неактивны» на большей части обучающей выборки.
6. Разработан метод масштабирования при обучении СММ, позволивший упростить процедуру вычисления модифицированных прямых и обратных переменных, использующихся в процессе обучения.
7. Разработаны принципы формирования словаря и организации грамматики системы дискретного распознавания команд, позволяющие, с помощью ввода ограничений на последовательность слов, значительно сократить количество недопустимых высказываний и время распознавания команды.
8. Для реализации речевого ввода разработано программное обеспечение, позволяющее с помощью речевых команд осуществлять:
• навигацию по станциям участка;
• запись диспетчерских приказов в звуковой файл;
• управление устройствами автоматики;
• подтверждение выполнения ответственной команды.
Основные положения диссертации опубликованы
в работах:
1.Горелик В.Ю., Краишкин A.B. Дополнительный канал передачи информации в диспетчерской системе. Современные проблемы совершенствования ж.д. транспорта // Межвузовский сборник научных трудов. — М.: РГОТУПС, 2004. — С. 92-94.
2. Краишкин A.B. Общая схема распознавания речи. Современные проблемы совершенствования ж.д. транспорта // Межвузовский сборник научных трудов. — М.: РГОТУПС, 2004. — С. 402-405.
3.Горелик В.Ю., Краишкин A.B. Увеличение надежности работы диспетчера по управлению движением за счет дополнительного канала передачи информации // Наука и техника транспорта, 2005. № 1. — С. 78 -81.
4. Ал ейников И.А., Ал ейникова JI.H., Краишкин A.B. О проблемах решения многопараметрических задач оптимизации. Национальная экономика как социальная система // Сборник научных трудов. - М.: МАКС Пресс, 2006. - С. 7-10.
5. Методика оптимизации обучения искусственной нейронной сети в задачах классификации / В.Ю. Горелик, A.B. Краишкин, Ю.А. Эйгин. Фед. аген. ж. д. трансп. Рос. гос. откр. техн. ун-т путей сообщения. — М., 2006. — 8 с. Библиограф. 3 назв., 4 ил. (Рукопись депонирована в ВИНИТИ 27.07.2006 № 1016-В2006).
КРАИШКИН Анатолий Викторович
РАЗРАБОТКА МЕТОДОВ И ПАКЕТА ПРИКЛАДНЫХ ПРОГРАММ РЕЧЕВОГО ВВОДА ИНФОРМАЦИИ В ДИСПЕТЧЕРСКОМ УПРАВЛЕНИИ
05.13.06 — Автоматизация и управление технологическими процессами и производствами (транспорт)
Тип. зак. Изд. зак. 92 Тираж 100 экз.
Подписано в печать 28.08.06 Гарнитура Ке\*1опС Офсет
Усл. печ. л. 1,5 Формат60x90..
Издательский центр РГОТУПСа, 125993, Москва, Часовая ул., 22/2
Участок оперативной печати РГОТУПСа, 125993, Москва, Часовая ул., 22/2
Оглавление автор диссертации — кандидата технических наук Краишкин, Анатолий Викторович
Введение.
Глава 1. Функционирование диспетчерской системы управления на железнодорожном транспорте и определение возможных путей ее совершенствования.
1.1. Модель человеко-машинной системы управления движением поездов (ДНЦЧМС).
1.2. Надежность профессиональной деятельности в ЧМС.
1.3. Аспекты применения речевого ввода информации в диспетчерском управлении.
1.4. Анализ возможностей речевого ввода информации.
1.5. Выводы.
Глава 2. Анализ систем распознавания речи.
2.1. Историческая справка.
2.2. Классификация систем распознавания речи.
2.3. Общая структура системы распознавания речи.
2.4. Выводы.
Глава 3. Теоретические основы распознавания речи.
3.1. Основные механизмы образования и восприятия речи.
3.2. Цифровое представление речи.
3.3. Выделение речи на фоне шума.
3.4. Сегментация речи.
3.5. Спектральный анализ речи.
3.6. Классификация речевых образцов.
3.7. Лексический анализ.
3.7. Выводы.
Глава 4. Разработка методов распознавания речи для практического применения на транспорте.
4.1. Разработка технических требований к СРР.
4.2. Методы распознавания речи.
4.3. Словарный запас и грамматика системы.
4.4. Архитектура программного комплекса.
4.5. Результаты эксперимента.
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Краишкин, Анатолий Викторович
Диспетчерское управление существует на всех видах транспорта и во многих отраслях промышленного производства. Суть его заключается в том, что оперативное управление ходом производственного процесса, поручается одному работнику - диспетчеру, который имеет оперативную связь со всеми объектами системы, и незамедлительно получает информацию об изменении их состояния [1].
Диспетчерское управление зародилось на железнодорожном транспорте как средство оперативного руководства движением поездов. Считается, что первое диспетчерское распоряжение было отдано главным инженером одной из американских железных дорог Чарльзом Майнотом в 1851 году. Сопровождая экспресс и установив во время стоянки на одной из станций, что встречный поезд значительно запаздывает, он принял управление движением на себя и распоряжением по телеграфу изменил порядок скрещивания этих поездов на участке. В результате этого поезд отправился на соседнюю станцию, где было осуществлено скрещивание.
Диспетчерская система управления движением поездов оказалась очень эффективной, и ее быстро ввели на всех дорогах США. В 1925 г. в США работали 2400 диспетчеров, которые обслуживали около 340 тысяч километров железнодорожных линий.
В Европе диспетчерская система появилась сначала в Англии (1909 г.), затем во Франции (1919 г.) и постепенно распространилась и в других странах, кроме Германии. В ГДР и ФРГ она была введена лишь после второй мировой войны.
В 1914 г. российские инженеры Рогинский и Ландсберг были откомандированы в США для изучения автоблокировки. Они ознакомились там с диспетчерской системой управления движением поездов и дали ей высокую оценку. Ландсберг писал: «Приходится только удивляться, как это мы сами до сих пор не пришли к этому сознанию, имея столько однопутных железных дорог, где диспетчерская система могла бы принести неоценимые услуги, особенно в период усиленной работы».
Первый опыт внедрения диспетчерского управления движением поездов на отечественных железных дорогах был произведен в 1918 - 1919 г., когда американцы оборудовали для Колчака железные дороги Сибири телефонами с избирательным вызовом. Опыт не удался, и дело остановилось. Оборудование после гражданской войны было демонтировано и установлено на линии Москва - Александров Северной железной дороги специально для введения на этом участке диспетчерской связи.
В 1923 г. было выработано "Временное положение о регулировании движения поездов при посредстве диспетчерской системы". В полном объеме диспетчерское руководство движением поездов на этом участке началось с марта 1924 г. Сразу же выявились преимущества диспетчерской системы: средняя техническая скорость возросла на 17%, средняя коммерческая на 22%; в пассажирском движении - соответственно на 10 и 8%. Начиная с 1925 г., диспетчерское руководство вводится сначала на Октябрьской и на Московско-Казанской дорогах, а к 1934 г. действует уже на всей сети железных дорог СССР (за исключением малодеятельных линий).
В это время сложилась сущность советской диспетчерской системы на железнодорожном транспорте: вся оперативная работа по движению поездов на участке централизована и сосредоточена в руках одного ответственного, опытного, обладающего полными правами работника - поездного диспетчера, действующего на основе графика движения поездов, ПТЭ, инструкций, приказов и распоряжений вышестоящих органов. В дальнейшем диспетчерская система распространилась на все уровни управления движением поездов и маневровой работой: станционный, отделенческий, дорожный и сетевой. Произошло также расширение системы по горизонтали: появились диспетчеры локомотивные, вагонораспределители, узловые, энергодиспетчеры и др.
В настоящий момент управление перевозочным процессом реализуется в рамках следующих территориальных объединений [2, 3]:
• сеть железных дорог РФ - сетевой центр управления перевозками (ЦУП);
• железная дорога - единый центр диспетчерского управления (ЕДЦУ) в границах существующих дорог с переходами в перспективе при соответствующем укрупнении железных дорог к региональным центрам управления (РЦДУ);
• опорный центр управления (ОЦ) эксплуатационной работой линейных районов по развозу и сборке местных вагонов, организации погрузки и выгрузки грузов, распределению и использованию маневровых локомотивов, оформлению перевозочных документов на вагоны, поезда и все информационное обеспечение.
Сеть центров управления перевозками представлена на рисунке 1.
Рис. 1. Схема сети центров управления перевозками
Диспетчерское управление находит свое применение не только в железнодорожной отрасли, но и в авиационной, атомной и других отраслях. Везде, где применяется диспетчерское управление, оно показывает свою высокую эффективность [4].
Современные тенденции развития диспетчерского управления свидетельствуют об увеличении количества выполняемых диспетчером функций в его повседневной работе. Многочисленные попытки создания "автодиспетчера"[5] приводят к выводу о необходимости разработки мер направленных, во-первых, на частичную автоматизацию часто выполняемых функций, во-вторых, на предоставление дополнительного канала ввода информации. Значительный вклад в разработку методов и моделей решения задач автоматизации управления движением поездов железных дорог внесли российские ученые Абрамов В.М., Баранов JI.A., Беляков И.В., Горелов Г.В., Дмитренко И.Е., Ерофеев Е.В., Жербина А.И., Иванченко В.Н., Козлов П.А., Кравцов Ю.А., Лисенков В.М., Лисицын А.Л., Никифоров Б.Д., Розенберг Е.Н., Сапожников В.В., Сидоренко В.Г., Тишкин Е.М., Феофилов А.Н., Шалягин Д.В., Шубинский И.Б. и многие другие.
В настоящее время, помимо ручного способа ввода информации в ЭВМ, все большее распространение приобретает речевой ввод информации[6]. Это в первую очередь связано с возросшей мощностью компьютеров, которые уже сейчас позволяют распознавать речь в режиме реального времени. Речевой ввод информации особенно актуален при диспетчерском управлении, когда диспетчер подвергается постоянным стрессовым нагрузкам, действуя в условиях дефицита времени. Большой вклад в разработку методов распознавания и обработки речи внесли российские ученые Бондарко Л.В., Венцов А.В., Винцюк Т.К., Галунов В.И., Горелик А.Л., Загоруйко Н.Г., Златоустова Л.В., Михайлов В.Г., Мясников Л.Л., Назаров М.В., Прохоров Ю.Н., Чистович Л.А., Шелухин О.И. и многие другие.
Цель и задачи исследования. Целью диссертационного исследования является разработка методов и пакета прикладных программ речевого ввода информации применительно к диспетчерским системам управления (на примере железнодорожного транспорта). Для реализации поставленной цели решались следующие взаимосвязанные задачи:
• анализ структуры и процесса функционирования диспетчерского управления на ж.д. транспорте; построение модели человеко-машинной системы (ЧМС) диспетчерского управления движением поездов, с целью выяснения областей применения речевого ввода информации;
• оценка эффективности применения речевого ввода по следующим критериям: вероятность ошибочного формирования ответственной команды при применении речевого ввода в качестве завершающего этапа; скорость ввода команд;
• разработка архитектуры системы распознавания речи (СРР) на основе анализа существующих;
• анализ существующих методов распознавания речи, выбор и разработка эффективных методов для решения поставленной задачи;
• разработка принципов формирования словаря и организации грамматики команд;
• разработка программного обеспечения, реализующего модель управления движением поездов с использованием речевого ввода команд управления, в качестве дополнительного канала информации.
Объектом исследования выступает человеко-машинная система управления движением поездов (далее ЧМС ДНЦ).
Предметом исследования является математическое, алгоритмическое и программное обеспечение поддержки работы систем диспетчерского управления и их функциональных модулей.
Методологической основой исследования явилось использование методов системного анализа, спектрального анализа, распознавания образов, теории вероятностей, теории конечных автоматов, искусственной нейронной сети, скрытой марковской модели, объектно-ориентированного программирования.
Исследование работоспособности и достоверности разработанных алгоритмов проводилось методом вычислительного эксперимента с помощью созданного комплекса программ на языке программирования С++ общим объемом около 15000 строк (часть исходных кодов включена в приложение). Научная новизна.
1. Разработана методика обучения ИНС, позволяющая сократить время ее обучения, перейти от минимизации целевой функции в виде суммы квадратов ошибок обучения к минимизации максимальной ошибки.
2. Определен критерий эффективности использования нейрона в ИНС, позволяющий получать более устойчивые решения.
3. Разработан метод масштабирования при обучении СММ, позволивший упростить вычисление модифицированных прямых и обратных переменных.
Практическая ценность. Разработано программное обеспечение, которое позволяет в режиме диалога производить настойку словаря и грамматики команд, для конкретной системы диспетчерского управления. Разработана методика обучения ИНС.
Произведена настройка словаря и грамматики команд для применения в работе поездного диспетчера (ДНЦ), которая позволяет ему с помощью речевого ввода выполнять следующие операции:
• управление устройствами железнодорожной автоматики;
• навигацию по станциям участка, с отображением подробной информации по выбранной станции;
• запись диспетчерских приказов в звуковой файл и сохранение их в едином информационном массиве;
• подтверждение выполнения ответственной команды.
Апробация работы. Основные положения и результаты диссертации докладывались, обсуждались и получили одобрение на заседании кафедры "Электроника и защита информации" МИИТ (2006 г.), на заседании кафедры «Вычислительная техника» РГОТУПС (2005, 2006 гг.), в Российском научно-исследовательском и проектно-конструкторском институте информатизации, автоматизации и связи (2006 г.).
Публикации. По теме диссертации опубликовано пять печатных работ. Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы и приложения. Работа содержит 134 страницы машинописного текста, 3 таблицы и 55 рисунков. Список литературы состоит из 103 наименований.
Заключение диссертация на тему "Разработка методов и пакета прикладных программ речевого ввода информации в диспетчерском управлении"
Заключение
1. На примере железнодорожных систем диспетчерского управления, установлены следующие возможные области применения речевого ввода:
• управление объектами автоматики;
• навигация по станциям участка, с отображением подробной информации по выбранной станции;
• запись диспетчерских приказов в звуковой файл;
• подтверждение выполнения ответственной команды.
2. Произведена оценка эффективности применения речевого ввода в диспетчерских системах по критерию вероятности безошибочного формирования ответственной команды и скорости ввода команд. Показано, что при применении речевого ввода в качестве заключительного этапа формирования ответственной команды, вероятность ее ошибочного формирования становиться более чем на порядок ниже.
3. Определены структурные решения разработанной СРР, которая состоит из следующих модулей: модуль считывания звуковых данных с внешних устройств; модуль выделения слов на фоне шума; модуль спектрального анализа речи; модуль, решающий задачи классификации фрагментов речи и преобразующий последовательность спектральных векторов в последовательность кодовых символов; модуль, выполняющий лексический анализ кодовой последовательности и выбирающий слово, которое наилучшим образом соответствует данной последовательности; модуль, выполняющий команды, ассоциированные с последовательностью распознанных слов.
4. На основе анализа существующих методов спектрального представления речи, выбраны следующие методы: вейвлет преобразование и кепстральное преобразование на основе линейного предсказания с учетом модели восприятия.
5. Разработана методика оптимизации обучения ИНС, позволившая сократить время ее обучения, перейти от минимизации целевой функции в виде суммы квадратов ошибок обучения к минимизации максимальной ошибки обучения, обеспечить, априорно, более устойчивое решение, за счет сброса весов тех нейронов, которые "неактивны" на большей части обучающей выборки.
6. Разработан метод масштабирования при обучении СММ, позволивший упростить процедуру вычисления модифицированных прямых и обратных переменных, использующихся в процессе обучения.
7. Разработаны принципы формирования словаря и организации грамматики системы дискретного распознавания команд, позволяющие, с помощью ввода ограничений на последовательность слов, значительно сократить количество недопустимых высказываний и время распознавания команды.
8. Для реализации речевого ввода разработано программное обеспечение, позволяющее с помощью речевых команд осуществлять:
• навигацию по станциям участка;
• запись диспетчерских приказов в звуковой файл;
• управление устройствами автоматики;
• подтверждение выполнения ответственной команды.
Библиография Краишкин, Анатолий Викторович, диссертация по теме Автоматизация и управление технологическими процессами и производствами (по отраслям)
1. Кудрявцев В.А. Управление движением на железнодорожном транспорте: Учебное пособие для вузов ж.-д. транспорта. М.: Маршрут, 2003.-200 с.
2. Боровикова М.С. Организация движения на железнодорожном транспорте. М.: Маршрут, 2003. - 368 с.
3. Вдовин А.Н. Центры управления перевозками. //Конференция "Системы безопасности на транспорте" г. Пшибрам, Чешская Республика, 08.04.05 09.04.05.
4. Казаков А.А. Автоматика регулирует движение поездов. М.: Транспорт, 1986. - 119 с.
5. Гавзов Д.В., Дрейман O.K., Кононов В.А., Никитин А.Б. Системы диспетчерской централизации: Учебник для вузов ж.д. трансп. М: Маршрут, 2002. - 407 с.
6. Зубов Г., Смирнова Н. Распознавание речи сегодня и завтра. //Мир связи, 2005. Март.
7. Методы и модели функциональной безопасности технических систем: монография / Е. Н. Розенберг, И. Б. Шубинский. М.: ВНИИАС, 2004 (Тип. ВНИИАС МПС России). -188 с.
8. Надежность систем железнодорожной автоматики, телемеханики и связи : Учеб. пособие для студентов вузов ж.-д. транспорта / В. В. Сапожников, Вл. В. Сапожников, В. И. Шаманов; Под ред. Вл. В. Сапожникова. М.: Маршрут, 2003. - 261 с.
9. Павлов В. В. Проблемы технической кибернетики: "Системы человек-машина: проблемы и синтез" Киев: Высшая школа, 1987. -55 с.
10. Цибулевский И.Е. Человек как звено следящей системы. М.: Наука, 1981.288 с.
11. И. Адаменко А.Н., Ашеров А.Т., Бердников И.Л. Информационно-управляющие человеко-машинные системы: Исследование,проектирование, испытания; Справочник. М.: Машиностроение, 1993.-528 с.
12. Сапожников В.В., Гавзов Д.В., Никитин А.Б. Концентрация и централизация оперативного управления движением поездов. М.: Транспорт, 2002. - 102 с.
13. Кондратьева JI.A., Ромашкова О.Н. Системы регулирования движения на железнодорожном транспорте: Учебник для техникумов и колледжей ж.-д. Транспорта М: Маршрут, 2003. - 432 с.
14. Надежность технических систем: Справочник / Ю.К. Беляев, В.А. Богатырев, В.В. Болотин и др.; Под ред. И.А. Ушакова. М.: Радио и связь, 1985.-608 с.
15. Дружинин Г.В. Надежность автоматизированных производственных систем. М.: Энергоатомиздат, 1986. - 480 с.
16. Ястребенецкий М.А., Иванова Г.М. Надежность автоматизированных систем управления технологическими процессами. М.: Энергоатомиздат, 1989.-264 с.
17. Гнеденко Б. В., Беляев Ю. К., Соловьев А. Д. Математические методы в теории надежности. М.: Наука, 1965. - 524 с.
18. Байхельт Ф., ФранкенП. Надежность и техническое обслуживание: Математический подход. М.: Радио и связь, 1988. - 392 с.
19. Густав О. Джангуидо П. Цифровые системы автоматизации и управления. СПб.: Невский диалект, 2001. - 557 с.
20. Аллахвердов В.М., Богданова С.И. Психология: Учебник. М.: Проспект, 2004. - 752 с.
21. Бодров В.А., Орлов В.Я. Психология и надежность: Человек в системах управления техникой. М.: Институт психологии РАН, 1998.-288 с.
22. Адамчук В.В., Варна Т.П., Воротникова В.В. Эргономика: Учебное пособие для вузов. М.: ЮНИТИ-ДАНА, 1999. - 254 с.
23. Грунтов П.С. Управление эксплуатационной работой и качеством перевозок на железнодорожном транспорте. М.: Транспорт, 1994. -542 с.
24. Цибулевский И.Е. Ошибочные реакции человека-оператора. М.: Сов. Радио, 1979.-3 с.
25. Сушков А. Голос как инструмент управления. //Мир связи, 2005. Март.
26. Левин Е.К., Левин К.Е. Моделирование процесса создания эталонов голосовых команд для систем автоматического распознавания речи //Цифровая обработка сигналов. 2002. №6. - с. 21-23.
27. Amir N. , Ron S. . Towards an Automatic Classification of Emotions in Speech. //ICSLP98: Speaker and Language Recognition, Sydney, 30.11.98-4.12.98,p. 199.
28. Ronzhin A., Lee I., Karpov A., Skormin V. Automatic estimation of humans psychophysiological state by speech, In SPECOM-2004, pp. 382387.
29. В. Г. Михайлов, Л. В. Златоустова. Измерение параметров речи. М.: Радио и связь, 1987. 167 с.
30. Мартынович П.В. Специфика детектора речи для системы верификации диктора по голосу //Цифровая обработка сигналов. -2004. №3.-с. 43-46.
31. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу. М: Радио и Связь, 1981. - 224 с.
32. Рамишвили Г.С. Речевой сигнал и индивидуальность голоса. Тб.: Мецемереба, 1976. - 183 с.
33. Атал Б. Автоматическое опознавание дикторов по голосам. // ТИИЭР, 1976, т. 64, №4, с. 48-66.
34. Розенберг А. Автоматическая верификация диктора: Обзор. // ТИИЭР, 1976, т. 64, №4, с. 66-79.
35. Клэтт Д. X., Барнет Дж. А., Бернстейн М. И. и др. Методы автоматического распознавания речи в 2-х книгах. -М.: Мир, 1983. -716 с.
36. Фланаган Дж. JI. Анализ, синтез и восприятие речи. М.:"Связь", 1968.-392 с.
37. Sebastian Henne. Spracherkennung: vom akustischen Signal zur Sprache. Informatik-Seminare, Fachhochschule Wedel, 2001.
38. Краишкин A.B. Общая схема распознавания речи. Современные проблемы совершенствования ж. д. транспорта. Межвузовский сборник научных трудов. М.:РГОТУПС, 2004. - 431 с.
39. E.G. Schukat-Talamazzini. Automatische Spracherkennung: Grundladen, statistische Modelle and effiziente Algorithmen. Braunschweig/Wiesbaden, 1995, 403 S.
40. Аркадьев А.Г. Браверманн Э.М. Обучение машины распознаванию образов. М.: Наука, 1964. 110 с.
41. Дуда Р. Харт П. Распознавание образов и анализ сцен. -М.: Мир, 1976.-506 с.
42. Сорокин В.Н. Теория речеобразования. М.: Радио и связь, 1985. -312с.
43. Чистович JI.A., Венцов А.В., Гранстрем М.П. Физиология речи. Восприятие речи человеком. JL: Наука, 1976. 388 с.
44. Акустика речи. Медицинская и биологическая акустика. //Сборник трудов XI сессии Российского акустического общества. М. ГЕОС, 2001. Том 3.-230 с.
45. Sachs, М.В. Speech encoding in the auditory nerve. //Hearing Science (p. 263 308). San Diego: College Hill, 1984.
46. Moore B. Introduction to the Psychology of Hearing. London: Academic, 1990.
47. Секунов Н.Ю. Обработка звука на PC. СПб: БХВ-Петербург, 2001. -1248 с.
48. Баранов JI.A. Квантование по уровню и временная дискретизация в цифровых системах управления. М.: Энергоатомиздат, 1990. -303 с.
49. И.А. Липкин. Статистическая радиотехника. Теория информации и кодирования. М.: Вузовская книга, 2002. - 216 с.
50. М. В. Назаров, Ю. Н. Прохоров. Методы цифровой обработки и передачи речевых сигналов. М.:Радио и связь, 1985. 176 с.
51. Рабинер JI.P., Р.Ф. Шафер. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981.-496 с.
52. Гольденберг JI.M., Матюшкин Б.Д., Поляк М.Н. Цифровая обработка сигналов: Справочник. М.: Радио и связь, 1985. - 312 с.
53. Furui, Sadaoki. Digital speech processing, synthesis, and recognition. New York: Marcel Dekker, 2001.
54. Ronald L. Allen, Duncan W.Mills. Signal Analysis. Time, Frequency, Scale and Structure. Hoboken, 2004. - 382 p.
55. Рабинер JI.P. Скрытые Марковские модели и их применение в избранных приложениях при распознавании речи. //Обзор. ТИИЭР, т. 77, №2, февраль, 1989 с.86-120.
56. J.G. Wilpon, L.R. Rabiner. "Application of hidden Markov models to automatic speech endpoint detection". Computer Speech and Language, vol. 2, no. 3/4, pp. 321-341, Sept./Dec. 1987.
57. Ермоленко Т., Шевчук В. Алгоритмы сегментации с применением быстрого вейвлет преобразования. //Труды международной конференции Диалог. Протвино, 2003.
58. Jia-Lin Shen, Jeih-Weih Hung, Lin-Shan Lee. Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments. //ICSLP98: Speaker and Language Recognition, Sydney, 30.11.98 -4.12.98, p. 232.
59. Робинсон Э.А. История развития теории спектрального оценивания. ТИИЭР, т. 70, №9, февраль, 1982. с. 6-32.
60. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: "Мир". 1989.-540 с.
61. Юкио Сато. Обработка сигналов. Первое знакомство. М.:Издательский дом "Додэка-ХХГ, 2002. 176 с.
62. Дж. Д. Маркел, А.Х. Грэй. Линейное предсказание речи. М.: Связь, 1980.-308 с.
63. Э. Оппенгейм. Применение цифровой обработки сигналов. М. :Мир, 1980.-545 с.
64. Бокс ДЖ., Дженкинс Г. Анализ временных рядов прогноз и управление. М., 1974. 560 с.
65. Марпл С. JI. мл. Цифровой спектральный анализ и его приложения. М.: Мир, 1990.-584 с.
66. Hiroshi Matsumoto, Yoshihisa Nakatoh, Yoshinori Furuhata. An Efficient Mel-LPC Analysis Method for Speech Recognition. //ICSLP98: Speaker and Language Recognition, Sydney, 30.11.98 4.12.98, p. 47
67. Чуй Ч. Введение в вейвлеты. М.: Мир, 2001.-412 с.
68. Добеши И. Десять лекций по вейвлетам. Ижевск: НИЦ "Регулярная и хаотическая динамика", 2001. 464 с.
69. Mertins Alfred. Signal Analysis. Wavelets, Filter Banks, Time-Frequency Transforms and Applications. Chichester, 1999. - 310 p.
70. Christopher John Long, Sekharajit Datta. Wavelet Basis Construction for Speech Recognition. //ICSLP98: Speaker and Language Recognition, Sydney,30.11.98-4.12.98,p. 802.
71. Farooq Omar, Datta Sekharjit. Speaker independent phoneme recognition by MLP using wavelet features.// ICSLP2000: Speaker and Language Recognition, Beijing, 16.10.2000 20.10.2000, p. 393-396.
72. Астафьев H.M. Вейвлет-анализ: основы теории и примеры применения. //Успехи физических наук, 1996, т. 166, №11. с. 11451170.
73. Бойков Ф., Старожилова Т. Применение вейвлет-анализа сигнала в системе распознавания речи. //Труды международной конференции Диалог, Протвино, 2003.
74. Coifman R.R., Mladen V.W. Entropy-based algorithms for best basis selection. IEEE Trans. Information Theory, v38, n2, March, 1992, p. 713718.
75. J. Picone, D.P. Prezas, W.T. Hartwell and J.L. LoCicero. Spectrum Estimation using an Analytic Signal Representation. // Signal Processing, vol. 15, no. 2, pp. 169-182, September 1988.
76. Ф. Уоссермен. Нейрокомпыотерная техника: Теория и практика. -М.: Мир, 1992. -236 с.
77. С. Осовский. Нейронные сети для обработки информации. М.: "Финансы и Статистика", 2002. 343 с.
78. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия - Телеком, 2001. - 382 с.
79. Freeman A. James., Skapura М. David. Neural Networks. Algorithms, Applications, and Programming Techniques. New York, 1991,-401 p.
80. Parveen Shahla, Qadeer Abdul, Green Phil. Speaker recognition with recurrent neural networks.// ICSLP2000: Speaker and Language Recognition, Beijing, 16.10.2000-20.10.2000, p. 306-309.
81. Соболь И.М. Точки равномерно заполняющие многомерный куб. — М.: Знание, 1985.-32 с.
82. Алейников И.А., Алейникова JI.H., Краишкин А.В. О проблемах решения многопараметрических задач оптимизации. Национальнаяэкономика как социальная система. //Сборник научных трудов. М.: МАКС Пресс, 2006. - 392 с.
83. Murveit Н., Weintraub М. Speaker-independent connected-speech recognition using hidden Markov models. //Proc. DARPA Speech and Natural Language Workshop. February, 1992.
84. Pye D., Woodland P. Experiments in speaker normalization and adaptation for large vocabulary speech recognition. Proc. ICASSP, April, 1997, Munich.
85. Picone J. Continuous Speech Recognition Using Hidden Markov Models. // IEEE ASSP Magazine, vol. 7, no. 3, pp. 26-41, July 1990.
86. Pfau Т., Ruske G. Creating hidden Markov models for fast speech. //ICSLP98: Speaker and Language Recognition, Sydney, 30.11.98 -4.12.98.
87. Ruxin Chen, Miyuki Tanaka, Duanpei Wu, Lex Olorenshaw, Mariscela Amador. A Four Layer Sharing HMM System For Very Large Vocabulary Isolated Word Recognition. //ICSLP98: Speaker and Language Recognition, Sydney, 30.11.98 4.12.98, p. 583.
88. Kazuyo Tanaka, Hiroaki Kojima. Speech Recognition Based on the Distance Calculation Between Intermediate Phonetic Code Sequences in Symbolic Domain. //ICSLP98: Speaker and Language Recognition, Sydney, 30.11.98 4.12.98, p. 966.
89. МПС. Инструкция по сигнализации на железных дорогах российской федерации. М.: Транспорт, 2000. - 126 с.
90. МПС. Инструкция по движению поездов и маневровой работе на железных дорогах российской федерации. М.: Транспорт, 2002. -317с.
91. Белов В.В. Теория графов. Учебное пособие для втузов. М.:"Высшая школа", 1976.-392 с.
92. Нефедов В.Н., Осипова В.А. Курс дискретной математики. М: МАИ, 1992.-264 с.
93. Мелихов А.Н. Ориентированные графы и конечные автоматы. М.: Наука, 1971.-416 с.
94. Гилл. А. Введение в теорию конечных автоматов. М.: Наука, 1966. -272 с.
95. В.М. Лисенков "Безопасность технических средств в системах управления движением поездов"- М.: Транспорт, 1992. 192 с.
96. Микропроцессорные системы автоведения электроподвижного состава /Л.А.Баранов, Е.В.Ерофеев, В.М.Максимов/ М.: Транспорт, 1990.
97. Каналообразующие устройства железнодорожной телемеханики и связи: Учеб. для вузов ж.-д. трансп. /Г. В. Горелов, А. А. Волков, В. И. Шелухин. М.: Транспорт, 1994. - 238 с.
98. Баранов Л.А., Жербина А.И. Построение на ЭВМ графиков движения поездов метрополитена //Вестник ВНИИЖТ. №7. 1981.
99. Микропроцессорные информационно-управляющие системы автоматизации сортировочных процессов: Учеб. пособие /В. Н. Иванченко, 96 е., Ростов н/Д РИИЖТ 1984.
100. Система интервального регулирования движения поездов с централизованным размещением аппаратуры : Учеб. пособие. / Ю.
101. A. Кравцов, Б. М. Степенский. М.: МИИТ, 1983 (вып. дан. 1984). -88 с.
102. Автоматизация управления торможением поездов / Б. Д. Никифоров,
103. B. И. Головкин, Ю. Г. Кутыев. М.: Транспорт, 1985. - 263 с.
104. Автоматизация управления вагонным парком / Е.М. Тишкин. М. : Интекст, 2000. - 223 с.1. С406 5 \ ЪЧ ^
105. ФЕДЕРАЛЬНОЕ АГЕНТСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА
106. РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ОТКРЫТЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
107. КРАИШКИН Анатолий Викторович
-
Похожие работы
- Разработка адаптивных статистических методов выбора рациональных режимов эксплуатуции магистральных газопроводов для обеспечения максимальной их загрузки
- Построение математического обеспечения систем распознавания речи на основе нелинейных методов сравнения образов
- Исследование параметров телефонной нагрузки и обоснование метода расчета пропускной способности системы персонального радиовызова
- Автоматизация процесса диспетчерского управления объектами добычи газа
- Речевая коммуникация в системах ввода сообщений для автоматизации рабочих мест оперативно-диспетчерского персонала
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность