автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Вероятностные характеристики сообщения устной казахской речи

кандидата технических наук
Бахтиярова, Елена Ажибековна
город
Москва
год
2007
специальность ВАК РФ
05.13.17
Диссертация по информатике, вычислительной технике и управлению на тему «Вероятностные характеристики сообщения устной казахской речи»

Автореферат диссертации по теме "Вероятностные характеристики сообщения устной казахской речи"

На правах рукописи

Бахтиярова Елена Ажибековна

ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ СООБЩЕНИЯ УСТНОЙ КАЗАХСКОЙ РЕЧИ

05 13.17 «Теоретические основы информатики»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

003160238

Москва - 2ии /

003160238

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Московский государственный университет путей сообщения» (МИИТ) на кафедре «Радиотехника и электросвязь»

Научный руководитель Официальные оппоненты

Ведущая организация

доктор технических наук, профессор Горелов Г В доктор технических наук, профессор Кнышев И П кандидат технических наук Жуков Е В

Московский технический университет связи и информатики

Защита диссертации состоится "31" октября 2007 г в " 1300 " часов на заседании диссертационного совета Д218 005 04 в Московском государственном университете путей сообщения (МИИТ) по адресу 127994, г Москва, ул Образцова, д 15, ауд 4518

С диссертацией можно ознакомиться в библиотеке МИИТа.

Автореферат разослан "aej/Ty&AJ 2007 года

Ученый секретарь диссертационного совета Д218 005 04 к т н , доцент

Н А Казанский

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы В нагрузке телекоммуникационных сетей возрастает доля речевого трафика, расширяются сферы применения речевых услуг, что приводит к необходимости увеличения числа и эффективности использования имеющихся каналов

В условиях интенсивного развития телекоммуникационных сетей практически отсутствует информация о вероятностных характеристиках сообщения устной казахской речи, его аналитические модели

Фонетические, морфологические и синтаксические отличия казахского языка сгг русского не могут не привести к неисследованным до настоящего времени отличиям в вероятностных характеристиках сообщения устной казахской речи

Определение характеристик сообщения устной казахской речи и его моделей, их использование для оценивания качества восстановления речи в телекоммуникационных системах, применение результатов в производственной деятельности субъектов с учетом требований Международного союза электросвязи представляются актуальными задачами для телекоммуникационных сетей Республики Казахстан

В настоящее время для увеличения эффективности процесса передачи разработаны и широко используются цифровые системы передачи (ДСП) с преднамеренным введением стохастичности в процесс дискретизации Под стохастическими ЦСП (СЦСП) понимаем ЦСП, на вход восстанавливающих устройств которых поступает стохастический поток отсчетов дискретизированной речи

Цель работы состоит в определении вероятностных характеристик сообщения устной казахской речи, его аналитических моделей и оценивании качества стохастической цифровой передачи сообщения устной казахской речи

Реализуется следующая последовательность решения задач

диссертационной работы

1 Обзор существующих аналитических моделей речевого сообщения, его вероятностных характеристик

2 Экспериментальное определение характеристик сообщения казахской речи, его аналитическое моделирование, сопоставление аналитических моделей сообщения казахской речи с моделями сообщений на других языках

3 Учет специфики сообщения казахской речи при оценке качества стохастической цифровой передачи речи, с использованием критериев отношения мощности речевого сигнала к мощности шумов дискретизации и восстановления, отношения мощности речевого сигнала к мощности шумов квантования по уровню

Исходная основа диссертации В основе диссертации лежат

- фундаментальные работы теории информации Н Винера, В А Котельникова, К Шеннона и др

- теоретические и прикладные исследования по цифровой обработке и передаче непрерывных, в том числе, речевых сообщений Л А Баранова, Дж Беллами, А И Величкина, Г В Вемяна, М Д Бенедиктова, В Н Гордиенко, Г В Горелова, А Г Зюко, И П Кнышева, И А Лозового, А П Мановцева, М В Назарова, Н И Пилипчук, Л Рабинера О Н Ромашковой, П Н Толмачева, А Ф Фомина и др

Методы исследования В работе использованы методы теории вероятностей, математического анализа, теории массового обслуживания

Научная новизна. Степень научной новизны диссертации определяется тем, что в ней впервые решаются вопросы определения характеристик и моделирования сообщения устной речи на казахском языке

Диссертационная работа развивает теорию восстановления речевых сообщений в направлении разработки методики аналитической оценки качества передачи и восстановления сообщений устной казахской речи в стохастических цифровых системах передачи информации, применения

разработанных моделей при анализе и проектировании телекоммуникационных систем реализующих передачу и восстановление дискретизированных речевых сообщений

Практическая ценность результатов диссертации заключена в предоставленной возможности получения аналитическими методами объективных результатов оценки качества устной казахской речи, которые использованы при анализе и проектировании конкретных стохастических цифровых систем, реализующих передачу и восстановление речевых сообщений.

Апробация работы выполнена на заседаниях кафедры радиотехники и электросвязи МИИТа, а также - на конференциях

Четвертая международная научно-практическая конференция «Транспорт Евразии XXI века» Казахстан Алматы 2006 г ,

- Научно-практическая конференция Неделя науки-2006 «Наука транспорту» (неделя науки-2006 МИИТ) Россия Москва 2006 г ,

- 19-я международная школа-семинар «Перспективные системы управления на железнодорожном, промышленном и городском транспорте» Украина Алушта 2006 г ,

- 20-я международная школа-семинар «Перспективные системы управления на железнодорожном, промышленном и городском транспорте» Украина Алушта 2007 г ,

- IV Всероссийская Неделя студенческой науки в РГСУ Россия Москва 2007 г

Результаты работы использованы в НИР:

- «Разработка алгоритма формирования маршрутных таблиц международных узлов коммутации сети ММТС ЗАО «Компания ТрансТелеКом» №200н/06-26/373, МИИТ, 2006 г

Результаты диссертации внедрены и использованы предприятиями Департамента СЦБ, связи и информационных технологий АО «Казахстанская железная дорога», компании «Network integration Telecommunications», СКТБ «Гранит», Институтом ионосферы Министерства образования и науки

Республики Казахстан, в учебном процессе на кафедрах «Радиотехника и электросвязь» Московского государственного университета путей сообщения и «Радиотехника и телекоммуникации» Казахской академии транспорта и коммуникаций, что подтверждено актами

Публикации. Основные результаты диссертации изложены в девяти опубликованных работах, перечень которых представлен в конце автореферата

Структура и объем работы Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 84 наименований и приложения Основная часть диссертации изложена на 105 страницах машинописного текста, содержит 46 рисунков, 33 таблицы

Во введении обоснована актуальность темы диссертационной работы, приводится краткий анализ современного состояния исследуемых вопросов, формулируются цель и задачи исследования, дан алгоритм их решения и анонсированы основные положения диссертации

Первая глава содержит обзор существующих аналитических моделей речевого сообщения, его вероятностных характеристик

В ряде известных работ используется предложенное в работах О Н Ромашковой выражение нормированной спектральной плотности мощности (СПМ) речевого сообщения

где се=1000 Гц и /0 =400 Гц (предложено в работе А И Величкина) для

сообщения устной речи на русском языке (известны значения этих коэффициентов и для речевых сообщений на английском, испанском и

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

0)

ГЧ

вьетнамском языках).

Для уточнения представления о СИМ сообщения устной речи на русском языке в работе проведены экспериментальные исследования с использованием программы Adobe Acini lion, принадлежащей к числу наиболее мощных звуковых редактор о к. Реализация сообщения приставлялась в цифровой форме с использованием формата файла «wav»,

Получены усредненные СЛIM речевого сообщения па русском языке (в полосе 0 - 16000 Гц), телефонного сигнала. (300 - 3400 Гц, рис. 1 [9]), СИМ для полос 88.88 - 3400 Гц, 88,88 - 8888,88 Гц, 280 - 3500 Гц.

Рие.1

Определены значения нормированной CUM Sx(f) (табл.1) и доли мощности в полосах Д/ =1/3 октавы.

Таблица 1

Е ^снтргшьнля Нфртмроватод спектральная плотность £ nPrt Авгйетн определи лил

ПОЛОСЫ •У" -1/3 октавы, Гц IBU - Гц Ш- J4<M Гц eS,RS - i4ild Tu 68,88-amss Гц (1 - I6(№f) Vn

¿Б paiTii ЛБ pai'Tn дБ peri/Tu дб рачТц дБ рэУГц

100 -29.У7 0.001008 оО.ЙО 0,00 Mol ■30,00 O.OOIOOI

125 -31,83 0,000!>j7 ■:ч,*б 0,000652 -UM O.CO0652

¡60 - -29, Ol 0..ПО125& ■29.04 0.001246 •29.04 0,001246

200 -27. OS O.COi9hü -27,11 0,00] Ш 47,) I 0.00 lWi.

250 - -26.51 (МКИ234 46,5-1 (J 01122 1 7 ■26,54 0,002217

3 (5 QjQQlUft ■«.Ol 0,01*51« 46.54 OflOZllfc -20,57 одоияг -26 .£7

390 ОДО-Ш •23.05 OJUMlfS -2J.5S 0,00348 -24,61 0.00346

400 -23,07 0,00-192» ■23.06 0,004940 -24,59 0,003475 44/4 0,003449 •24,62 0.003449

500 -16,55 0,00221 L -20.54 0.1Ю2216 -28.07 0,001559 4Я„ш li,OOI547 ■2«. 10 0,00 ¡547

-33,67 о,оо<мзо -ПМ "J.000431 •35,19 <1.000303 -35,22 ft,C00301 -35.22 0,(M)ll?Ul

«00 41.49 0,011(1063 -4 J,УЙ [i.rKX)fiö3 •J3.50 O.OOOOJ5 -43,5-! 0,00004-1 -43,54 0.О0П044

Продолжение табл. 1

1000 ■42,85 0,000052 -42.К4 0,000051 44,37 О.ООООЭ7 44,-10 0,000036 -44,40 0,00003«

1250 -42,00 0,000063 41,99 0,000063 -43,52 0,000015 43,55 0.000044 •43,55 0,000044

1600 -42,5» 0,000055 -42,57 0,000055 44,10 0,000039 44,13 0,000039 ■44,13 0,0<ХНШ

2000 •45,80 0,000026 -45,79 0,000026 47,31 0,000019 47,35 0,000058 ■47,35 0,000028

2500 ■47,02 0,000020 -47,01 0,000020 48,54 0,000014 -48,57 0,000034 -4,4,57 0,0000 Е 4

3150 ■4бг3б 0,000023 46,35 0,000023 47,87 0.000016 47,91 0,000036 47,91 а.иооогб

4000 - - -52,ЗЯ 0,000006 ■52.38 о,оососб

5000 -62,33 0,000001 -Й2.3Э 0,000001

63 00 0 0 0 0

ВООО 0 0 0 0

Нормированная СИМ телефонного сигнала на русском языке представлена (кривая 1) на рис.2 [1].

0,0»« •--

0,006--|1

-----

О,як - -0.004,1 ------»—

5 0,004.....—!

^ '

^0,0035 -----!—

0,003---

0,0025 ;----(—

о.оог---—

о;оои----

0,001 -

: - —

о

О 200 400 600 800 1000 3200 Е400 1600 ] НОО 2000 2200 2400 2600 2300 Л]00 3200 ЗЯОО

/, Гв . Рис.2

Приходим к уточнению известного результата: максимумы оценок СПМ для всех полос, реализуются на частоте 390 Гц (а не на частоте 400 Гц).

Это приводит к уточнению параметров аппроксимации (1)

нормированной СПМ телефонного сигнала [1]: /'0 =390 Гц, а=492 Гц и

М=0,207. Для иллюстрации существенности уточнения на рис.3 представлены графики СПМ телефонного сигнала на русском языке (кривая 1, [9]), прежняя (кривая 2) и уточненная (кривая 3, [9]) ее аппроксимации.

Определены корреляционные функции и их аппроксимации для телефонного сигнала (формула (3) [I]. табл.2) и сообщения (формула (4), табл.З, сплошная линия на графике рис.4) устной речи на русском языке

|о, при г >0.01 }

[0, при т > 0,0!

0,005

0,00«

0,004

0.0035

= 0,003 1

^О.ООУ

I

■ о.оог

0,0015 0.00]

(4)

А

Г --

1 кривая 1

л! ! 1 кривая 3 1

V

' 1.......

Л !

'л ( КЬивая 2

\

О 200 400 600 803 1000 1200 1400 1600 ЕЛОО 2000 2200 2400 2600 2800 3000 3200 3400

/, ГА

Рис.З

Таблица 2

Значения при значенных т. мс

0,5 1,5 2,0 3,0 4,0 5,0 6,0 7,-й 9,0 10,0 1 20,0

0,29 -0,52 ' 0,096 0,178 -0,246 0,181 -0,073 -0,013 0,051 -о.ого '0,029 [ 0,0004

Таблица 3

Значения ( ^¡ЯЧСНКНХ ;. мс

0,5 2,0 3.0 4,0 5,0 6,0 7,0 8,0 9,0 . 10,0 20,0

0,28 -0.46 1),0Е I 0,137 -0.174 0,1 17 ■0,043 -0,007 0,025 -0.023 0,012 0^001

'■л О

0.8 0.6 0 4 ,0.2

0

"0.4 "0.6 "0.8

1 С 0,0020.0040.1X160.008 0.0! 0.0120.0140.0160.018 0.02 Г,С

Рис.4

Во второй главе впервые определяются СПМ и одномерная плотность распределения вероятностей (ПРВ) сообщения устной казахской речи

В качестве реализации сообщения устной казахской речи использованы записи продолжительностью 1 час, с частотой дискретизации 44100 Гц и разрешением 16 бит (динамический диапазон разбивался на 21б=65536 уровней)

Получены усредненные СПМ речевого сообщения на казахском языке (в полосе 0 - 16000 Гц), телефонного сигнала [8], СПМ для полос 88,88 - 3400 Гц, 88,88 - 8888,88 Гц, 280 - 3500 Гц

Определены значения нормированной СПМ Sx (/) (табл4) и доли

мощности в полосах Д/"* —1/3 октавы

Таблица 4

Центральная частота полосы Af =1/3 оставы, Гц Нормированная спектральная плотность £ {f) "Р" °6Л!|СП| определения

2»«-ЗЯН1Гц 300 - 3400 Гц нам -3400 г» 88,88 — 8888,88 Гц 0-16000 Гц

дБ paVTu дБ раэ/Гц дБ paVTu дБ paVTu ДБ разГц

100 -33 55 0 000441 -33 56 0000441 33 36 0000441

125 - - 27 84 0 001646 27 84 0 001643 27 84 0 001643

160 - - 27 41 0001817 -27 42 0 001813 -27 42 0 001813

200 - - -28 57 0001389 28 58 0 001386 28 58 0 001386

250 - - - -24 29 0 003725 24 30 0003717 24 30 0 003717

300 -21,55 0,007 21,55 0 007 -23,68 0,00429 -23,70 0,00427 -23,70 0,00427

315 -2157 0 006971 21 56 0006975 23 70 0 004263 23 71 0 004254 23 71 0 004254

400 23 91 0 004068 23 90 0004070 26 04 0 002488 -26 05 0 002482 26 05 0 002482

500 29 79 0 001049 -29 79 0 001049 31 93 0000641 31 94 0 000640 -31 94 0 000640

630 32 S3 0 000521 32 83 0 000521 34 97 0 000319 34 98 0 000318 34 98 0 000318

800 -39 27 0000118 39 27 0 000118 •41 40 0 000072 -41 41 0 000072 -41 41 0 000072

1000 -38 53 0 000140 38 S3 0 000140 -4066 0000086 -40 67 0 000086 -40 67 0 000086

1250 -40 18 0 000096 ■40 18 0 000096 -42 32 0 000059 -42 33 0000058 -42 33 0 000058

1600 -46 49 0 000022 -46 49 0 000022 -48 62 0 000014 •48 63 0 000014 -4863 0 000014

2000 -49 31 0000012 -49 31 0 000012 51 43 0 000007 51 46 0,000007 51 46 0000007

2500 50 79 0 000008 50 79 0 000008 52 93 0 000005 52 94 0 000005 52 94 0 000005

3150 -52,74 0 000005 52 74 0 000005 -34,88 0,000003 -54,89 0 000003 54 89 0 000003

4000 - - - - -57 18 0 000002 57 18 0 000002

5000 - - - - •69 86 1 ОЗЕ-07 -69 86 1 03Е-07

6300 - - - - - 0 0 0 0

8000 - - - - - 0 0 0 0

Нормированная СПМ телефонного сигнала на казахском языке

представлена (кривая 2) на рис 2 [1]

Приходим к выводу, что максимумы оценок СПМ сообщения устной казахской речи для всех полос, реализуются на частоте 300 Гц

В главе получены оценки одномерной ПРВ сообщения устной казахской

речи.

Для определения достаточной (для энсперимещального стределения ПРВ) продолжительное и реализации сообщения устной речи на казахском языке использованы результаты развития (при увеличении длины реализации) оценок математического ожидания тх и среднего квадратичсского отклонения ах, а также относительных погрешностей йгп„ 6о„% их определения (табл.5, рис.5 [6])- . '

_ __.__Таблица 5

Оценки математического ожидания 'п, и среднего кнадрятического о i к.'.оненин OTHOCf rítjlbИ ЫС ilOr jH'UnlOCJJt óГТ1fi<Jj,% 111>51 прОДОЛЖЩСЛЬКОСТМ [:t':t.1 ;t]пиип речевого l'lll 11 Ll.4 Цотсчет ii Milu

1. ! 3230000 26460000- 39690000 ■'52920000 66150000 79380000

t 5 10 15 20 25 30

-0,183703 -0,186397 -0,186595 -0,187014 -П, 185699 -0,186483

<4 1926,603 1 809,545 1670,572 1692,23 1571,257 1580,205

6m, -1,49 -0,05 0,06 0,28 -0,42 0

6uL 2 i, 92 14,51 5,72 7,09 -0,57 -0

Рис.5

Значения <j5 и ш, практически стабилизируются при t > 25 мин.

На рис.6 [1] представлена ПРВ W:5(x) сообщения устной казахской речи, динамический диапазон которого (согласно

рекомендации G.712 ITU-T) совмещен с диапазоном

кодера. Рис ,6

В третьей главе впервые решаются вопросы моделирования СПМ и одномерной ПРВ сообщения устной казахской речи.

Определены значения параметров аппроксимации (1) СПМ [9] /0 =300Гц а=427 Гц и М=0,477 (при Рн=300 Гц и Рв=3400 Гц)

Значения нормированной СПМ телефонного сигнала (см рис 2, кривая 2), и ее аппроксимации представлены в табл 6

________Таблица 6

Центральная частота полосы Д/" = 1/3 октавы, Гц Спектральная плотность 5ДУ),дБ(та6л4) Спектральная плотность {])' (аппроксимация)

300 -21,55 -21,55

315 -21 56 -21,75

400 -23,90 -26,48

500 -29 79 31,16

630 -32 83 -34,97

800 -39 27 -38 19

1000 -38 53 -40,79

1250 -40 18 -43 14

1600 -46,49 -45,58

2000 -49 31 -47 68

2500 50,79 -49,72

1150 -52 74 -51 80

Определены корреляционные функции и их аппроксимации для

телефонного сигнала (формула (5) [1], табл 7) и сообщения (формула (6),

табл 8, штриховая линия на графике рис 4) устной речи на казахском языке

( ,2Ы6Г со5(600лт),приг<0,011 , (5)

Г' {о, при т> 0,01 }

( )= И6"6' С05(600ят),приг <0,011 (6)

Г'1 [О, при г >0,01 }

______Таблица 7

Значения Г-(г) при значениях т, мс

0,5 1,5 2,0 3,0 4 0 5,0 60 7,0 8,0 9,0 10,0 20 0

0 499 -0 583 -0,421 0 304 0,084 -0,196 0,044 0 082 -0 059 -0,016 0,038 0 0015

Таблица 8

Значения при значениях т, мс

0 5 ',5 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0

0 466 -0,475 -0,320 0,202 0,048 -0,099 0,019 0 032 -0,0199 -0,005 0,0098 0,0001

Корреляционные связи разделенных интервалом времени сечений сообщения устной речи на казахском языке по мере увеличения этого интервала затухают медленнее по сравнению с сообщением устной речи на русском языке Впервые определена экспериментальная оценка W3km(x) (табл 9) одномерной ПРВ телефонного сигнала казахской речи при совмещении его (согласно рекомендации G 712 ITU-T) с диапазоном кодера.

_ Таблица 9

х/с, <*,\Уд1(х) сЛУд„,<*>

-3,5 0,005 0 0 -

-3 0,011 0 1 1Е-09 - -

-2,5 0,021 0,030 4.32Е-08 -

-2 0,041 0,036 1.639Е-06 0 149 1 370Е-08

-1,5 0,082 0,044 6.218Е-05 0,152 1.853Е-06

0,163 0,064 0 0023593 0,152 2 506Е-04

-0,9 0 186 0,072 0,004882 0,154 6.687Е-04

-0,8 0 214 0,082 0,0101022 0,154 0,0017841

-0,7 0,245 0 095 0 0209043 0,156 0 0047603

-0,6 0 281 0 108 0 0432568 0 157 0 0127014

-0,5 0 322 0,123 0,0895103 0 157 0,0338896

-0,4 0,37 0,175 0,1852217 0,160 0 0904239

-0,3 0,425 0,258 0,3832753 0,167 0,2412682

-0,2 0,499 0,376 0,7931034 0,183 0,6437491

-0,1 0 649 0,803 1 6412677 0,339 1,7176487

0 1277 6,792 6,792 9,166 9,166

0,1 0,649 0,803 1 6412677 0 339 1,7176487

0,2 0 499 0,375 0 7931034 0,183 0 6437491

0,3 0,425 0,258 0 3832753 0,167 0,2412682

0,4 0 37 0 175 0,1852217 0,160 0,0904239

0,5 0 322 0 123 0,0895103 0,157 0,0338896

0,6 0,281 0 108 0,0432568 0,157 0 0127014

0,7 0,245 0,095 0 0209043 0 156 0,0047603

0,8 0,214 0,082 0,0101022 0 154 0 0017841

0,9 0 186 0,071 0,004882 0,154 6 687Е-04

1 0 163 0 064 0,0023593 0,152 2.506Е-04

1,5 0 082 0 044 6 218Е-05 0,152 1.853Е-06

2 0 041 0,036 1.639Е-06 0,149 1.370Е-08

2,5 0 021 0,030 4.32Е-08 - -

3 ООП 0,0009 1.1Е-09 - -

3,5 0 005 0 0 - -

В диссертации использована наиболее хорошо зарекомендовавшая себя

при анализе русскоязычных речевых сообщений аппроксимация О Н Ромашковой

\¥(Х)=4С"Нх! +еЖ] (7)

Ее значения \¥А1(х) (при Я=0,63/ах, Р=19,33/ах, а=1,37/ах) и \УАрус(х) (с уточнениями П Н Толмачева К=3,396/сх, р=102,845/ох, а=7,272/0х) приведены в табл 9

В диссертации определены [2] значения параметров аппроксимации \УАказ(х) ПРВ сообщения устной казахской речи

11=4,583/0« (3=138,79/ах, а=9,814/ах (8)

На рис 7 представлены графики экспериментальных ПРВ \^'Эру1;(х) (табл 9), \Уэт(х) и их аппроксимаций WA1(x), \УАрус(х), \УАказ(х) Очевидна возможность использования при аналитическом определении качества восстановления

речевого сообщения в различных ДСП аппроксимации ^'^„(х), однако более целесообразным представляется непосредственное применение для этой цели

Рис, 7

Б четвертой главе рассмотрены примеры учета специфики речевого сообщения на казахском языке при оценке качества воспроизведения речи в СЦСП.

1.Определение качества воспроизведения речи в CIICU со статистическим уплотнением.

Для анализа качества воспроизведения казахской речи при различных реализациях статистического уплотнения необходимо распределение вероятностей Р(Х) случайной величины X количества подряд отбракованных отсчетоп в рекурренгном потоке на входе интерполирующего фильтра дополнительного комплекта.

В качестве входных данных использованы два файла типа «RAW» (побайтный поток отсчетов И КМ с параметрами, определенными рекомендацией G.711 1TU-T), полученные путем конвертирования реальных аудиозаписей телефонных разговоров двух пар абонентов. С целью определения статистики коллизий, «столкновения отсчетов» основного и

дополнительного комплекта каждый отсчет основно1 о комплекта преобразован к виду «активный/пассивный»

Определена достаточная (для имитационного моделирования) продолжительность реализации речевого сообщения (Ь в отсчетах и I в минутах) с использованием развития оценки вероятности в отбраковки отсчета дополнительного комплекта и относительной погрешности 80,% ее определения (рис 8) [3]

я

0

1 001

о -------

О 5 10 15 20 25 30 35

Продолжительность реализации t, мин

Рис 8

Значение оценки 0 практически стабилизируется (при выполнении условия |60I<2%) при t > 20 мин (рис 8) С запасом выбираем продолжительности L=14 400 000 отсчетов (30 мин) для реализаций речевых сообщений основного и дополнительного комплектов

Результат моделирования - распределение вероятностей Р(Х) случайной величины X количества подряд отбракованных отсчетов в потоке на входе интерполирующего фильтра дополнительного комплекта в условиях фиксированного приоритета представлен в табл 10 [5]

__Таблица 10

Распределение вероятностей р(Х) п ри значениях случайной величины X, отсчет

X 0 1 2 3 4 5 6 7

р(Х) 0,964 0,0041 0,0029 0 0020 0,0016 0,0014 0,0013 0,0015

X 8 9 Ю 11 12 13 14 15

Р(Х) 0,0018 0,0022 0,0027 0,0027 0,0024 0,0017 0,0012 0,0008

X 16 17 18 19 20 21 22 23

Р(Х) 0,0006 0,0005 0,0004 0,00038 0,00034 0,00033 0,00032 0,00028

X 24 25 26 27 28

Р(Х) 0,00025 0,00021 0,00017 0,00014 0,00011

В табл 11 представлена аппроксимация этого распределения (геометрическое распределение) для сообщения казахской речи при полученном в результате моделирования значении 0=0,034 (в условиях фиксированного приоритета) [5]

Таблица 11

Распределение вероятностей р(Х) при значениях случайной величины X, отсчет

X 0 1 2 3 4 Я 6 7

Р(Х) 0 9643 0,0344 0,0012 4.37Е-05 1 56Е-06 5.55Е-08 0 0

Чередующийся приоритет может быть реализован путем чередования

через отсчет речевого сообщения и через цикл Е1

В табл 12 представлены результаты моделирования - распределение вероятностей случайной величины X количества подряд отбракованных отсчетов речевого сообщения основного Р](Х) и дополнительного Рг(Х) комплекта (термины «основной» и «дополнительный» здесь теряют смысл, поскольку оба комплекта находятся в равноценных условиях)

Таблица 12

Распределение вероятностей р(Х) прн значениях случайной величины X, отсчет

X 0 1 2 3 4 5 6 7 8

Р|(Х) 0,473125 0 003934 0 003068 0 002464 0 002149 0 001905 0,001778 0,001718 0 001647

X 9 10 11 12 13 14 15 16

Р.(Х) 0,001561 0001415 0,001172 0 000901 0 000650 0 000474 0 000357 0 001405

X 0 1 2 3 4 5 6 7 8

Р1<Х) 0,473641 0 003940 0 003088 0 002463 0 002180 0 001948 0 001806 0 001708 0 001628

X 9 10 11 12 13 14 15 16

рг(Х) 0 001563 0 001408 0 001166 0,000904 0 000632 0 000467 0,000352 0 001384

В табл 13 представлен результат моделирования чередования

приоритета через цикл передачи Е1

Таблица 13

Распределение вероятностей р(Х) при значениях случайной величины X, отсчет

X 0 1

Р.(Х) 0,373374 0126626

X 0 1

Р,(Х) 0 373404 0 126596

Сравнивая значения, приведенные в табл 10 и табл 12-13 получаем

подтверждение очевидному преимуществу алгоритма с чередующимся приоритетом (вероятность отбраковки отсчета дополнительного комплекта при чередовании приоритета через цикл передачи Е1 равна 0,027, при чередовании через отсчет равна 0,127, а при фиксированном приоритете -0,034)

В табл 14 представлена аппроксимация распределения вероятностей р(Х)

для чередующегося приоритета.

Таблица 14

Распределение вероятностей р(Х) при значениях случайной величины X, отсчет

X 0 1 2 3 4 5 6 7 8

Р,(Х) 0.473125 0.249278 0,131338 0,069199 0,036459 0,019209 0,010121 0,005332 0,002810

X 9 10 11 12 13 14 15 16

р>(Х) 0,001480 0,000780 0,000411 0,000217 0,000114 0,000060 0,000032 0,000017

X 0 1 2 3 4 5 6 7 8

р,(Х) 0 473641 0,249305 0,131224 0,069071 0,036356 0,019136 0,010073 0,005302 0,002791

X 9 10 11 12 13 14 15 16

Р,(Х) 0,001469 0,000773 0,000407 0 000214 0,000113 0,000059 0,000031 0.000016

Таким образом, при аналитическом определении качества восстановления речевого сообщения в СЦСП целесообразно не прибегать к аппроксимациям, используя в расчетных формулах непосредственно экспериментальное распределение вероятностей числа подряд отбракованных отсчетов

Определено отношение мощности речевого сигнала к мощности шумов дискретизации и восстановления ОСШД сообщения устной русской речи (при /о =390 Гц и а =492 Гц).

В случае использования алгоритма с фиксированным приоритетом с использованием исходных данных Р =Р =3400 Гц, Г_ =8000 Гц при

ср 1 ср Д г

использовании распределения р(Х) и его аппроксимации, представленного в [3] получаем оценку ОСШД=29,63 дБ и ОСШД=35,57 дБ соответственно

Таким образом, уточнены результаты П Н Толмачева (ОСШД=30,34 дБ и ОСШД=42,52 дБ соответственно)

Определено отношение мощности речевого сигнала к мощности шумов дискретизации и восстановления ОСШД сообщения устной казахской речи (при /0 =300 Гц и а =427 Гц).

В случае использования алгоритма с фиксированным приоритетом с

использованием исходных данных р =Р =3400 Гц, г =8000 Гц при

«р ч> д

использовании распределения р(Х), представленного в табл 10 получаем ОСШД=34,79 дБ [4] А при использовании распределения р(Х), представленного в табл 11 - ОСШД=48,84 дБ соответственно

В случае использования алгоритма с чередующимся приоритетом для

«Мощения устной казахской речи с использованием данных габл. 12 н табл. 13 подучено значение ОСШД=37,53 дБ ¡ipn чередовании приоритета через цикл передачи Е! и ОСШД=43,86 дБ при чередовании приоритета через отсчет.

Определено отношение сигнал/шум квантования ОСШК в стандартной первичной ЦСП с использованием аппроксимаций распределения вероятностей мгновенного значения речевого сигнала.

На рис.9 представлены зависимости ОСШК от мощности сигнала р для А- и и-характеристик компрессии (согласно рекомендации G.711 ITU-T) при использовании аппроксимаций ПРВ мгновенного значения устной речи на русском WAr(x) и казахском WAk(x) языках (за значение р=0 дБ принята мощность Сигнала, при которой Швпадшйу era динамический диапазон с диапазоном кодера) [2]. Ломаной линией на рисунке приведена норма, рекомендованная ITU-T, д;щ отношения сигнал-шум квантования (G-712).

Рис.9

Определено отношение сигнал/шум квантования в СЦСП с использованием аппроксимаций распределении вероятностей мгновенного значения речевого сигнала.

На рис.10 представлены зависимости ОСШК от мощности сигнала р для значения Л ~ 1/64 [2].

Рис.10

При р=0 дБ для речевого сообщения устной речи на казахском языке получены значения ОСШК=62,68 дБ для стандартной первичной ЦСП и ОСШК=56,66 дБ для ЦСП с введенным синдромом [7].

При согласовании динамического диапазона сигнала с диапазоном кодера оценка ОСШК для сообщений устной речи на казахском языке на 2,5 дБ превышает Значение ОСШК для сообщений устной речи па русском языке. При уменьшении р разница для русской и казахской речи в значениях ОСШК уменьшается и при р=~20 дБ практически равна 0 [7].

2.Определение тчеетт воспроизведения печи в CLfCfl С пакетной KawiVmmiHfH (системах УР-телеФонии).

Влияние на качество восстановления речи н системах с лакетпой коммутацией оказывают потери речевых пикетов в процессе их передачи.

Рассмотрены системы, использующие ные око скоростные кодеки (кодек G.7I I с функцией маскирования потерянных кадров типа «Repeat 1/Silence», определенной Международным союзом электросвязи (МСЭ) в исправлениях

Рекомендации G.U3: ITU -T Recommendation 0.113 Amendment 2 (01/2007).

Получены зависимости оценок ОСИ! воспроизведения (при учете лишь шумов, вызванных потерей пакетов) от длительности пакета tnSK при различных вероятностях отбраковки рп=0,3; рп=0,03 рп=0,01; рп=0,001. Графики зависимостей при рп=0,03 представлены на рис, 11 [I] для речевых сообщений на русском (сплошная линия) и казахском (штриховая линия) языках.

26 24 12 20 IS [6

и

5 14

3

и [I

ш к 6 4 2 0

0 1 2 3 4 5 6 7 в 9 t(l 11 U 13 14 IS 16 17 IS 19 20 Д-'Ш-гелъиОСГЬ ITajiCTF. (ЛЯКн мс

Рис.11

При уменьшении длительности пакета и фиксированном значении вероятности его потери качество воспроизведения речи повышается за счет увеличения корреляционных связей между потерянным и используемым для восстановления фрагментами речи. Например, при рц=0,03 оно увеличивается с «хорошего» (ОСШ=12 дБ) при t„iK=20 мс до «отличного» (ОСШ=20 дБ) при t1MK=0,21 мс (для сообщения на русском языке) и tnss=0,22 мс (для сообщения на казахском языке).

При увеличении и уменьшении длительности пакета и фиксированном значении вероятности различие а оценках качества воспроизведения устной речи на русском и казахском языках стремится к нулю (в первом случае за счет затухания до нуля корреляционных связей между потерянным и используемом

..........[....... 1

----

\ ...... |

V; у-у-

Л 1 / 1

[

1

для восстановления фрагментами речи, а во втором случае за счет нивелирования различий между двумя языками в характере изменения корреляционной функции сообщения при малых значениях аргумента)

Заключение

На основании исследований, представленных в диссертации, получены следующие результаты

1 Оценки усредненного по времени энергетического спектра сообщения устной речи на русском языке для ряда областей его определения, в том числе для стандартной полосы телефонного канала (телефонного сигнала) Уточнение коэффициентов известной аппроксимации энергетического спектра телефонного сигнала

2 Аппроксимация нормированной корреляционной функции сообщения устной речи Аппроксимация нормированной корреляционной функции сообщения и телефонного сигнала устной речи на русском языке

3 Оценки усредненного по времени энергетического спектра сообщения устной речи на казахском языке для ряда областей его определения, в том числе для телефонного сигнала

4 Продолжительность реализации сообщения устной речи на казахском языке, достаточная для экспериментальной оценки плотности распределения вероятностей случайной величины мгновенного значения сообщения устной речи на казахском языке Значение оценок математического ожидания и дисперсии сообщения стабилизируются при I > 25 мин Оценка плотности распределения вероятностей случайной величины мгновенного значения сообщения устной речи на казахском языке при условии согласования его динамического диапазона с диапазоном кодера цифровой системы передачи

5 Первые для речевого сообщения устной речи на казахском языке модели корреляционной функции, усредненного по времени энергетического спектра и одномерной плотности распределения вероятностей

6 Впервые предложенная в качестве аппроксимации корреляционной

функции речевого сообщения устной речи на казахском языке экспоненциально-косинусная функция и соответствующие ей аппроксимации энергетического спектра, использованные ранее для сообщений устной речи на русском, английском, испанском и вьетнамском языках

Определены коэффициенты этой аппроксимации Определены аппроксимации корреляционной функции и энергетического спектра телефонного сигнала на казахском языке

Корреляционные связи разделенных интервалом времени сечений сообщения устной речи на казахском языке по мере увеличения этого интервала затухают медленнее по сравнению с сообщением устной речи на русском языке

7 Выбор в качестве модели одномерной плотности распределения вероятностей речевого сообщения устной речи на казахском языке гиперэкспоненциальной плотности, использованной ранее для сообщений устной речи на русском, английском, испанском и вьетнамском языках Определение коэффициентов этой аппроксимации

8 Для СЦСП со статистическим уплотнением определена продолжительность реализации речевого сообщения устной казахской речи, достаточная для определения статистики коллизий («столкновения» отсчетов сообщения) основного и дополнительного комплекта Значение оценки вероятности отбраковки отсчета стабилизируется при I > 20 мин

9 Для СЦСП со статистическим уплотнением и различными алгоритмами фиксированного и чередующегося приоритетов получены распределения вероятностей занятости канального интервала и распределения вероятностей появления числа подряд отбракованных отсчетов при имитационном моделировании процесса столкновения отсчетов сообщений устной казахской речи

10 Для СЦСП со статистическим уплотнением определено отношение сигнал/шум дискретизации и восстановления (ОСШД) сообщений устной русской и казахской речи Качество восстановления речевого сообщения по критерию ОСШД составило при фиксированном приоритете

29,63 и 34,79 дБ, при чередовании приоритета через цикл передачи El - 30,34 и 37,53 дБ, при чередовании приоритета через отсчет - 42,52 и 43,86 дБ для русской и казахской речи соответственно

И Для стандартной первичной ЦСП и СЦСП со статистическим уплотнением определено отношение сигнал/шум квантования (ОСШК) сообщения устной казахской речи при использовании А- и р-характеристик компрессии При согласовании динамического диапазона сигнала с диапазоном кодера оценка ОСШК для сообщений устной речи на казахском языке на 2,5 дБ превышает значение ОСШК для сообщений устной речи на русском языке При уменьшении мощности сообщения разность оценок ОСШК для русской и казахской речи уменьшается и при мощности -20 дБ практически исчезает

12 Для СЦСП с пакетной коммутацией речи (систем 1Р-телефонии, использующих высокоскоростные кодеки G711 с функцией маскирования потерянных кадров типа «Repeat 1/Silence» определены зависимости оценок ОСШ воспроизведения речевых сообщений на русском и казахском языках от длительности пакета при различных вероятностях его потери

При уменьшении длительности пакета и фиксированном значении рп вероятности его потери качество воспроизведения повышается за счет усиления корреляционных связей между потерянным и используемым для восстановления фрагментами речи Например, при рп=0,03 оно увеличивается с «хорошего» (ОСШ=12 дБ) при tnaK=20 мс до «отличного» (ОСШ=20 дБ) при tnaK=0,21 мс (для сообщения на русском языке) и tnai=0,22 мс (для сообщения на казахском языке)

При увеличении и уменьшении длительности пакета и фиксированном значении рп различие в оценках качества воспроизведения устной речи на русском и казахском языках стремится к нулю (в первом случае за счет затухания до нуля корреляционных связей между потерянным и используемом для восстановления фрагментами речи, а во втором случае за счет нивелирования различий между двумя языками в характере изменения корреляционной функции сообщения при малых значениях аргумента)

Основные положения диссертации опубликованы в работах:

1 Горелов Г В, Бахтиярова Е А Вероятностные характеристики сообщения устной казахской речи//Телекоммуникации -2007, №9 - с 8-10

2 Горелов Г В , Бахтиярова Е А, Карпов А В Вероятностные характеристики речевого трафика // Мир транспорта 2007, №1, с 22-25

3 Горелов Г В , Толмачев П Н , Бахтиярова Е А К оценке качества восстановления речевого сообщения при статистическом уплотнении первичной цифровой системы передачи//ВКСС Connect - 2006 - №2 - с 94-97

4 Горелов Г В , Толмачев П Н , Бахтиярова Е А Качество передачи речи при уплотнении первичной цифровой системы передачи //Материалы четвертой международной научно-практической конференции «Транспорт Евразии XXI века», 4 том, Казахстан - Алматы - 2006, с 8

5 Горелов Г В., Толмачев П Н, Бахтиярова Е А Повышение пропускной способности первичной ЦСП при ее статистическом уплотнении //Материалы четвертой международной научно-практической конференции «Транспорт Евразии XXI века», 4 том, Казахстан - Алматы - 2006, с 5-8

6 Горелов Г В , Толмачев П Н, Бахтиярова Е А Статистические свойства отсчета речевого сигнала русской и казахской речи на входе интерполирующего фильтра цифровой системы передачи //Информационно-управляющие системы на железнодорожном транспорте Украина — Харьков -2006, №4 - с 15

7 Горелов Г В, Толмачев П Н, Бахтиярова Е А Качество воспроизведения речи при статистическом уплотнении //Информационно-управляющие системы на железнодорожном транспорте Украина - Харьков -

2006, №4 - с 14

8 Толмачев П Н , Бахтиярова Е А , Корнева Н В Спектральная плотность мощности речевого сообщения на казахском языке Труды научно-практической конференции Неделя науки - 2006 «Наука - транспорту» М МИИТ,2006 - с II-40

9 Горелов Г В , Бахтиярова Е А , Толмачев П Н , Ширинский Д А К оценке энергетического спектра речевого сообщения //Информационно-управляющие системы на железнодорожном транспорте Украина - Харьков -

2007,№4 -с64-68

Вероятностные характеристики сообщения устной казахской речи

Бахтиярова Елена Ажибековна

05 13 17-Теоретические основы информатики

Подписано к печати ¿2-/. ОЗ, Q11.

Печать офсетная

Тираж 80 экз Заказ № £Г03,

Объем 1,5 п л Формат 60x84/16

ч

Типография МИИТа, 127994, Москва, ул Образцова, 15

Оглавление автор диссертации — кандидата технических наук Бахтиярова, Елена Ажибековна

ОСНОВНЫЕ СОКРАЩЕНИЯ И ОБОЗНАЧЕНИЯ

ВВЕДЕНИЕ

1. АНАЛИТИЧЕСКИЕ МОДЕЛИ РЕЧЕВОГО СООБЩЕНИЯ

1.1. Аналитическое моделирование речевого сообщения

1.2. Характеристики аналитических моделей речевого сообщения

1.3. Спектральная плотность мощности и корреляционная функция речевого сообщения

1.4. Одномерная плотность распределения вероятностей речевого сообщения

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Бахтиярова, Елена Ажибековна

Актуальность темы. В настоящее время в телекоммуникационных сетях возрастает речевой трафик, быстро увеличивается число потребителей речевых услуг, расширяются сферы применения их предоставления, что приводит к необходимости увеличения числа и эффективности использования имеющихся каналов.

В условиях интенсивного развития телекоммуникационных сетей практически отсутствует информация о вероятностных характеристиках сообщения устной казахской речи, аналитические модели этих характеристик.

Известны существенные не только фонетические, но также морфологические и синтаксические отличия казахского языка от русского [57].

Структурно-типологическая характеристика казахского языка, в основном, связана с его принадлежностью к агглютинативным языкам.

Современный казахский алфавит основан на кириллице и включает 42 буквы: 33 русские и 9 казахских, которые отражают специфические звуки казахского языка: Э, 9, ¥, Y, I, F, К, F, Ц, h. В алфавите 15 букв для передачи гласных: а, э, е, ё, и, о, е, у, Y> ы> Ь э> ю> 25 для передачи согласных звуков: б, в, г, г, д, ж, з, й, к, к, л, м, н, ц, п, р, с, т, ф, х, ц, ч, ш, щ, h; 2 знака: ъ (твердый знак), ь (мягкий знак). Буквы в, ф, ц, ч, щ, ь, ъ, ё, э используют только при написании слов иноязычного (в основном русского) происхождения [57,62,63].

В казахском языке ударение большей частью падает на последний слог слова. Согласные звуки в слогах с твёрдыми гласными в казахском языке произносятся твердо, с мягкими гласными произносятся мягко.

При обозначении принадлежности предмета в казахском языке употребляются не только притяжательные местоимения, но и особые притяжательные окончания.

В казахском языке нет предлогов. Значение русских предлогов большей частью передаётся посредством послелогов, а также в форме косвенных падежей.

Числительные и прилагательные в казахском языке в функции определения перед существительными не изменяются ни в числе, ни в падеже.

Категория рода в казахском языке отсутствует. Поэтому одно и то же прилагательное, местоимение или порядковое числительное, в зависимости от смысла предложения, может переводиться на русский язык в мужском, женском или среднем роде.

Именные части речи в казахском языке, в отличие от русского языка, изменяются по лицам.

В казахском языке в отличие от русского вопрос кто? ставится только к существительным, обозначающим человека, а ко всем остальным существительным, в том числе и к одушевленным, ставится вопрос что?.

Причастие в казахском языке, стоя перед определяемым существительным, не изменяется ни в падеже, ни в числе. В русском языке причастие согласуется с определяемым словом в роде, числе и падеже.

В казахском языке имена числительные (количественные, порядковые), употребляясь в предложении перед существительным в функции определения, не изменяются в числе и падеже [57,63].

Фонетические, морфологические и синтаксические отличия казахского языка от русского не могут не привести к не исследованным до настоящего времени отличиям в вероятностных характеристиках сообщения устной казахской речи, их аналитическим моделям, используемым при определении параметров современных телекоммуникационных систем и сетей.

Определение характеристик сообщения устной казахской речи и их моделей, их использование для оценивания качества восстановления речи в телекоммуникационных системах (в том числе и при стохастической цифровой передаче речевого сообщения), применение результатов в производственной деятельности субъектов с учетом требований

Международного союза электросвязи (МСЭ) представляются актуальными задачами для телекоммуникационных сетей Республики Казахстан.

В настоящее время для увеличения эффективности процесса передачи разработаны и широко используются цифровые системы передачи (ЦСП) с преднамеренным введением стохастичности в процесс дискретизации.

Под стохастическими ЦСП (СЦСП) понимаем ЦСП, на вход восстанавливающих устройств которых поступает стохастический поток отсчетов дискретизированной речи [66,77].

Цель работы состоит в определении вероятностных характеристиках сообщения устной казахской речи, их аналитических моделей и разработке методов оценки качества стохастической цифровой передачи сообщения устной казахской речи.

Реализуется следующая последовательность решения задач диссертационной работы:

1. Обзор существующих аналитических моделей речевого сообщения, его вероятностных характеристик.

2. Экспериментальное определение характеристик сообщения казахской речи, его аналитическое моделирование, сопоставление аналитических моделей сообщения казахской речи с моделями сообщений на других языках.

3. Учет специфики сообщения казахской речи при оценке качества примеров реализации стохастической цифровой передачи речи, с использованием критериев отношения мощности речевого сигнала к мощности шумов дискретизации и восстановления, отношения мощности речевого сигнала к мощности шумов квантования по уровню.

Исходная основа диссертации. В основе диссертации лежат:

- фундаментальные работы теории информации Н.Винера, В.А.Котельникова, К.Шеннона и др.

- теоретические и прикладные исследования по цифровой обработке и передаче непрерывных, в том числе речевых сообщений Л.А.Баранова,

Дж.Беллами, А.И.Величкина, Г.В.Вемяна, М.Д.Венедиктова, В.Н.Гордиенко, Г.В.Горелова, А.Г.Зюко, И.П.Кнышева, И.А.Лозового, А.П.Мановцева, М.В.Назарова, Н.И.Пилипчук, Л.Рабинера, О.Н.Ромашковой (Луковой), П.Н.Толмачева, А.Ф.Фомина и др.

- теоретические и прикладные исследования средств и систем передачи информации В.П.Багуц, А.Н.Голубева, Д.В.Дьякова, И.А.Лозового, В.А.Новикова, В.Л.Тюрина, В.П.Яковлева и др.

Методы исследования. В работе использованы методы теории вероятностей, математического анализа, теории массового обслуживания.

Научная новизна. Степень научной новизны диссертации определяется тем, что в ней впервые решаются вопросы моделирования характеристик речевого сообщения устной речи на казахском языке.

Диссертационная работа развивает теорию восстановления речевых сообщений в направлении разработки методики аналитической оценки качества передачи и восстановления сообщений устной казахской речи в стохастических цифровых системах передачи информации, применения разработанных моделей при анализе и проектировании телекоммуникационных систем реализующих передачу и восстановление дискретизированных речевых сообщений.

Практическая ценность результатов диссертации заключена в предоставленной возможности получения аналитическими методами объективных результатов оценки качества устной казахской речи, которые использованы при анализе и проектировании конкретных стохастических цифровых систем, реализующих передачу и восстановление речевых сообщений.

Заключение диссертация на тему "Вероятностные характеристики сообщения устной казахской речи"

5. ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

На основании исследований, представленных в диссертации, получены следующие результаты.

1. Оценки усредненного по времени энергетического спектра сообщения устной речи на русском языке для ряда областей его определения, в том числе для стандартной полосы телефонного канала (телефонного сигнала). Уточнение коэффициентов известной аппроксимации энергетического спектра (на частотах, в пределах стандартной полосы телефонного канала).

2. Аппроксимация нормированной корреляционной функции сообщения устной речи. Аппроксимация нормированной корреляционной функции сообщения и телефонного сигнала устной речи на русском языке.

3. Оценки усредненного по времени энергетического спектра сообщения устной речи на казахском языке для ряда областей его определения, в том числе для телефонного сигнала.

4. Продолжительность реализации сообщения устной речи на казахском языке, достаточная для экспериментальной оценки плотности распределения вероятностей случайной величины мгновенного значения сообщения устной речи на казахском языке. Значение оценок математического ожидания и дисперсии сообщения стабилизируются при t > 25 мин. Оценка плотности распределения вероятностей случайной величины мгновенного значения сообщения устной речи на казахском языке при условии согласования его динамического диапазона с диапазоном кодера цифровой системы передачи.

5. Первые для речевого сообщения устной речи на казахском языке модели корреляционной функции, усредненного по времени энергетического спектра и одномерной плотности распределения вероятностей.

6. Впервые предложено в качестве модели корреляционной функции речевого сообщения устной речи на казахском языке использовать экспоненциально-косинусную корреляционную функцию и соответствующие ей модели энергетического спектра, использованные ранее для сообщений устной речи на русском, английском, испанском и вьетнамском языках.

Определены коэффициенты этой аппроксимации. Определены аппроксимации корреляционной функции и энергетического спектра сообщения устной речи на казахском языке на частотах, в пределах стандартной полосы телефонного канала.

Корреляционные связи разделенных интервалом времени сечений сообщения устной речи на казахском языке по мере увеличения этого интервала затухают медленнее по сравнению с сообщением устной речи на русском языке.

7. Выбор в качестве модели одномерной плотности распределения вероятностей речевого сообщения устной речи на казахском языке гиперэкспоненциальной плотности, использованной ранее для сообщений устной речи на русском, английском, испанском и вьетнамском языках. Определение коэффициентов этой аппроксимации.

8. Для СЦСП со статистическим уплотнением определена продолжительность реализации речевого сообщения устной казахской речи, достаточная для определения статистики коллизий («столкновения» отсчетов сообщения) основного и дополнительного комплекта. Значение оценки вероятности отбраковки отсчета стабилизируется при t > 20 мин.

9. Для СЦСП со статистическим уплотнением и различными алгоритмами фиксированного и чередующегося приоритетов получены распределения вероятностей занятости канального интервала и распределения вероятностей появления числа подряд отбракованных отсчетов при имитационном моделировании процесса столкновения отсчетов сообщений устной казахской речи.

10. Для СЦСП со статистическим уплотнением определено отношение сигнал/шум дискретизации и восстановления (ОСШД) сообщений устной русской и казахской речи. Качество восстановления речевого сообщения по критерию ОСШД составило при фиксированном приоритете 29,63 и 34,79 дБ, при чередовании приоритета через цикл передачи Е1 30,34 и 37,53 дБ, при чередовании приоритета через отсчет 42,52 и 43,86 дБ для русской и казахской речи соответственно.

11. Для стандартной первичной ЦСП и СЦСП со статистическим уплотнением определено отношение сигнал/шум квантования (ОСШК) сообщения устной казахской речи при использовании А- и ц-характеристик компрессии. При согласовании динамического диапазона сигнала с диапазоном кодера оценка ОСШК для сообщений устной речи на казахском языке на 2,5 дБ превышает значение ОСШК для сообщений устной речи на русском языке. При уменьшении мощности сообщения разница для русской и казахской речи в значениях ОСШК уменьшается и при мощности -20 дБ практически исчезает.

12. Для СЦСП с пакетной коммутацией речи (систем 1Р-телефонии), использующих высокоскоростные кодеки G.711 с функцией маскирования потерянных кадров типа «Repeat 1/Silence» определены зависимости оценок ОСШ воспроизведения речевых сообщений на русском и казахском языках от длительности пакета при различных вероятностях его потери.

При уменьшении длительности пакета и фиксированном значении рп вероятности его потери качество воспроизведения повышается за счет усиления корреляционных связей между потерянным и используемым для восстановления фрагментами речи. Например, при рп=0,03 оно увеличивается с «хорошего» (ОСШ=12 дБ) при tnaK=20 мс до «отличного» (ОСШ=20 дБ) при t пак-0,21 мс (для сообщения на русском языке) и tnaK—0,22 мс (для сообщения на казахском языке).

При увеличении и уменьшении длительности пакета и фиксированном значении рп различие в оценках качества воспроизведения устной речи на русском и казахском языках стремится к нулю (в первом случае за счет затухания до нуля корреляционных связей между потерянным и используемом для восстановления фрагментами речи, а во втором случае за счет нивелирования различий между двумя языками в характере изменения корреляционной функции сообщения при малых значениях аргумента).

Библиография Бахтиярова, Елена Ажибековна, диссертация по теме Теоретические основы информатики

1. CCITT Volume V-Sectoin 4 Recommendation P.51. P.85-93.

2. CCITT Volume V Supplement No. 13. -P.267-270.

3. CCITT Contribution Com. XII-N. Study period. Vol. V, Q 1S/XII, Annex 3,4.

4. Gorelov G., Romashkova O. Influence of russian, spanish and Vietnamese speech characteristics on digital information transmission quality. Proceedings of the IEEE Internatonal Symposium on Industrial Electronics. ISIE'96. Warsaw Vol 1. p.311-313.

5. ITU-T Recommendation G.113 Amendment 2 (01/2007): Revised Appendix 1 Provisional planning values for the equipment impairment factor Ie and packet-loss robustness factor Bpl.

6. Transmission performance characteristics of pulse code modulation channels. ITU-T Recommendation G.712. (Previously CCITT Recommendation).

7. Багуц В.П., Тюрин B.JI. Многоканальная телефонная связь на железнодорожном транспорте. М.: Транспорт, 1988. 252 с.

8. Баранов Л.А. Квантование по уровню и временная дискретизация в цифровых системах управления. М.: Энергоатомиздат, 1990. - 304 с.

9. Ю.Беллами Дж. Цифровая телефония. М.: Эко-Трендз, 2004. 640с.

10. П.Берганов И.Р., Гордиенко В.Н., Крухмалев В.В. Проектирование и техническая эксплуатация систем передачи. М.: Радио и связь, 1989. -272 с.

11. Быков С.Ф., Журавлев В.И., Шалимов И.А. Цифровая телефония: Учеб. пособие для вузов. М.: Радио и связь, 2003. - 144 с.

12. Величкин А.И. Передача аналоговых сообщений по цифровым каналам связи. М.: Радио и связь, 1983.-240 с.

13. Величкин А.И. Теория дискретной передачи непрерывных сообщений. М.: Сов.радио, 1970. - 296 с.

14. Вемян Г.В. Передача речи по сетям электросвязи. М.: Радио и связь, 1985.-272 с.

15. Вентцель Е.С. Исследование операций. М.: Сов.радио, 1972. - 552с.

16. Вентцель Е.С. Теория вероятностей. М.: Высшая школа, 1999.576 с.

17. Верзунов М.В. Однополосная модуляция в радиосвязи. М.: Воениздат, 1972. - 296 с.

18. Волков В.М., Лебединский А.К., Павловский А.А., Юркин Ю.В./ Под ред. Волкова В.М. Автоматическая телефонная связь на железнодорожном транспорте М.: Транспорт, 1996.-342 с.

19. Волков В.М., Зорько А.П., Прокофьев В.А. Технологическая телефонная связь на железнодорожном транспорте. М.: Транспорт, 1990. - 294 с.

20. Горелов Г.В. Нерегулярная дискретизация сигналов. М.: Радио и связь, 1982. -256с.

21. Горелов Г.В. Теория передачи сигналов на железнодорожном транспорте. М.: Транспорт, 1999.-415 с.

22. Горелов Г.В. Алгоритм Burst aloha в статистическом уплотнении аудиоинформационных сигналов //'ЛОКСЕТЬ-90. Рига. 1990. с.38-41.

23. Горелов Г.В. Качество воспроизведения речи в стохастических цифровых системах передачи //Автоматика и вычислительная техника. 1993.-N5. с.40-43.

24. Горелов Г.В., Лукова О.Н. Влияние алгоритмов поиска на качество передачи речи по сети с коммутацией пакетов. Обработка сигналов в системах двусторонней телефонной связи. М.-Пушкино.1994 с.136-138.

25. Горелов Г.В., Ромашкова О.Н. Modelling of Speech Information Probability Characteristics for Anflysis of Speech Digital Transmission Quality. TEMPT'96 София, 1996. c.104-111.

26. Горелов Г.В., Ромашкова O.H., Кинтана M. Одномерная плотность распределения вероятностей речевого сообщения на испанском языке //Сб.трудов МИИТа. 1995. - с.65.

27. Горелов Г.В., Ромашкова О.Н., Чан Туан Ань. Свойства энергетического спектра сообщения вьетнамской речи. Обработка сигналов в системах двусторонней телефонной связи, 1995. с.103-105.

28. Горелов Г.В., Ромашкова О.Н., Чан Туан Ань. Плотность распределения вероятностей вьетнамского речевого сообщения //Обработка сигналов в системах двусторонней телефонной связи. МТУСИ. 1995. - с.100 - 102.

29. Горелов Г.В., Ромашкова О.Н., Чан Туан Ань. Качество управления речевым трафиком в телекоммуникационных сетях. М: Радио и связь, 2001. - 112 с.

30. Горелов Г.В., Ромашкова О.Н., Пчелинцев А.В. Аналитическая оценка качества кодеков стандарта G.711 // Телекоммуникации. 2001г. - №5.

31. Горелов Г.В., Кинтана М. Квантование по уровню при статистическом уплотнении цифровой системы передачи. Радиотехника 1992.N3.-c.3-5.

32. Горелов Г.В., Лукова О.Н., Иванов А.В. Устройство статистического уплотнения каналов связи системы передачи с ИКМ //Автоматика, телемеханика и связь 1992. N4. - с. 13-14.

33. Горелов Г.В., Иванов А.В. Оценка величины искажений квантования в условиях статистического уплотнения первичной ЦСП. Исследование и разработка современных радиоэлектронных элементов и устройств. Рига, 1989. с.87.

34. Горелов Г.В., Иванов А.В. Оценка качества передачи речевого сигнала при статистическом уплотнении первичной ЦСП. Исследование иразработка современных радиоэлектронных элементов и устройств. Рига, 1989.-c.88.

35. Горелов Г.В., Иванов А.В. Устройство для передачи и приема информации АС СССР 1520571 Бюлл. 41, 1989.

36. Горелов Г.В., Иванов А.В. Многоканальное устройство с импульсно-кодовой модуляцией и временным уплотнением каналов АС СССР 1561202 Бюлл. 16, 1990.

37. Горелов Г.В., Иванов А.В., Лукова О.Н. Устройство для передачи и приема информации АС СССР 1837348 Бюлл.32, 1993.

38. Горелов Г.В., Казанский И.А., Лукова О.Н. Методика оценки качества пакетной передачи речи в интегральных цифровых сетях. М.: Электросвязь, N9, 1992. - с.31-33.

39. Горелов Г.В., Толмачев П.Н., Бахтиярова Е.А. К оценке качества восстановления речевого сообщения при статистическом уплотнении первичной цифровой системы передачи //ВКСС Connect 2006, №2, с.94-97.

40. Горелов Г.В., Толмачев П.Н., Бахтиярова Е.А. Качество воспроизведения речи при статистическом уплотнении //Информационноуправляющие системы на железнодорожном транспорте. Украина -Харьков.-2006, №4. с. 14.

41. Горелов Г.В., Бахтиярова Е.А., Карпов А.В. Вероятностные характеристики речевого трафика // Мир транспорта 2007, №1, с.22-25.

42. Горелов Г.В., Бахтиярова Е.А. Вероятностные характеристики сообщения устной казахской речи // Телекоммуникации. 2007, №9. - с.8-10.

43. Горелов Г.В., Бахтиярова Е.А., Толмачев П.Н., Ширинский Д.А. К оценке энергетического спектра речевого сообщения //Информационно-управляющие системы на железнодорожном транспорте. Украина -Харьков.-2007, №4. с.64-68.

44. Горелов Г.В., Бахтиярова Е.А. Корреляционные функции речевого сообщения и телефонного сигнала //Информационно-управляющие системы на железнодорожном транспорте. Украина Харьков.-2007, №4. - с.69-70.

45. Горелов Г.В., Кочнов JI.JI., Пчелинцев А.В., Пчелинцева Н.М. К оценке качества полосного вокодера. Обработка сигналов в системах телефонной связи. 1998. с.71-74.

46. Горелов Г.В., Лукова О.Н., Чан Куок Тхинь. Влияние порога задержек на качество передачи в пакетных сетях ARPANET //Обработка сигналов в системах двусторонней телефонной связи. МТУСИ. 1994. -с.139-140.

47. Горелов Г.В., Казанский Н.А., Лукова О.Н. Оценка качества связи в сетях с пакетной передачей речи при воздействии случайных прерываний обслуживания. Автоматика и вычислительная техника. 1993. N1 с.69-71.

48. Горелов Г.В., Казанский Н.А., Лукова О.Н. Оценка качества различных методов восстановления речи в цифровых сетях с коммутацией пакетов речи и данных. Автоматика и вычислительная техника. 1993. N4 -с.77-78.

49. Ефимов А.П. Психофизиология вещания. Монография. М.: МТУСИ, 2004.- 196 с.

50. Ефимов А.П., Рысин Ю.С., Свобода Д.Г. Акустические измерения,оценки, контроль. Учебное пособие. -М.: МТУСИ, 2005. 113 с.

51. Иваний Ю.Б. Анализ качества передачи речевой информации в цифровых сетях связи железнодорожного транспорта Диссертация на соискание ученой степени канд.техн.наук. М.МИИТ.2001.

52. Иллюстрированный самоучитель по Adobe Audition 1.5. Интернет: http://www.book.Adobe Audition 1.5/menu.html

53. Иллюстрированный самоучитель уроки казахского языка «Тшашар». Интернет: http://www.tilashar.kz

54. Каллер М.Я., Фомин А.Ф. Теоретические основы транспортной связи. М.: Транспорт. 1989. - 383 с.

55. Карпов А.В. Сравнение критериев оценки качества пакетной передачи речи методами аналитического и имитационного моделирований. Диссертация на соискание ученой степени канд.техн.наук. М.МИИТ.2007.

56. Кинтана Т.М. Методы определения качества стохастической передачи испанской речи в цифровых сетях интегрального обслуживания. Диссертация на соискание ученой степени канд.техн.наук. М.МИИТ.1995.

57. Коршунов С.Е., Плотник М.А., Котов В.К. Аппаратура линейного тракта системы передачи ИКМ 120Т для организации технологической связи по симметричным кабелям. // АТС. N 2. 1995. - с.2-6.

58. Компьютерный самоучитель казахского языка «КДЗАКД1А-С¥ХБАТ». Компакт диск АО «ПАРАД» г. Алматы, 1998 г.

59. Компьютерный переводчик казахского языка «Тшмаш 1.5». Компакт диск «IZET» г. Алматы, 2002 г.

60. Левин B.JL, Плоткин М.А. Цифровые системы передачи информации. М.: Радио и связь, 1982. - 216 с.

61. Лозовой И.А. Параметры каналов тональной частоты аппаратуры с ИКМ. М.: Радио и связь, 1981. 65с.

62. Лукова О.Н. Анализ качества стохастической цифровой передачи речевой информации (Методика и ее использование при разработке информационных систем). Диссертация на соискание ученой степениканд.техн.наук. М.МИИТ.1994. 149 с.

63. Михайлов В.Г., Златоустова JI.B. Измерение параметров речи /Под ред.М.А.Сапожкова. -М.: Радио и связь, 1987. 168 с.

64. Моторина Е.Г. Качество IP-телефонии при мобильном доступе стандарта IEEE 802.11 RADIO-ETHERNET с использованием излучающего кабеля. Диссертация на соискание ученой степени кандидата технических наук. М. 2006.

65. Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов, М.: Радио и связь, 1985. 176 с.

66. Нейман В.И. Системы и сети передачи данных на железнодорожном транспорте: Учебник для вузов ж.-д. транспорта. М.: Маршрут, 2005. - 470 с.

67. Новоселов О.Н., Фомин А.Ф. Основы теории и расчета информационно-измерительных систем. М.: Машиностроение, 1991. 336 с.

68. Ольховский Ю.Б., Новоселов О.Н., Мановцев А.П.Сжатие данных при телеизмерениях. М.: Сов. радио, 1971. - 304 с.

69. Партика, Д. Adobe Audition 1.5 для Windows. М.: НТ Пресс, 2006.-216 с.

70. Пчелинцев А.В. Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением. Диссертация на соискание ученой степени канд.техн.наук. Москва. 2003.

71. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов М.: Радио и связь -1981,- 496 с.

72. Соболев В.Н. Структурные преобразования речевого сигнала. Учебное пособие. М.: МТУСИ, 2005. - 188 с.

73. Толмачев П.Н. Методы имитационного моделирования в определении качества стохастической цифровой передачи речевой информации. Диссертация на соискание ученой степени канд.техн.наук. М.МИИТ.2006.

74. Толмачев П.Н., Бахтиярова Е.А., Корнева Н.В. Спектральная плотность мощности речевого сообщения на казахском языке. Труды научно-практической конференции Неделя науки 2006 «Наука -транспорту» М.:МИИТ, 2006.- с.И-40.

75. Фомин А.Ф. Помехоустойчивость систем передачи непрерывных сообщений. М.: Сов. радио, 1975. - 352 с.

76. Чан Туан Ань. Разработка и исследование методов оценивания качества пакетной передачи вьетнамской речи. Диссертация на соискание ученой степени канд.техн.наук. М.МИИТ.1995.

77. Чан Куок Тхинь. Разработка и исследование методов оценивания качества передачи вьетнамской речи при статистическом уплотнении стандартной цифровой системы передачи. Диссертация на соискание ученой степени канд.техн.наук. М.,МИИТ, 1995. -101 с.

78. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи /Под ред.О.И.Шелухина. М.: Радио и связь, 2000. - 456 с.

79. Шелухин О.И., Тенякшев A.M., Осин А.В. Моделирование информационных систем М. САЙНС-ПРЕСС, 2005. 368 с.

80. Шелухин О.И. Фрактальные процессы в телекоммуникациях. М.: Эко-Трендз, 2003. 432 с.