Главная » Мануалы

1 ... 11 12 13 14 15 16 17 ... 22

больших уровнях сигнала поддерживать отношение сигнал-шум квантования на уровне 50... 60 дБ, что вполне достаточно для маскировки шума квантования. Наилучшими характеристиками обладает система с почти мгновенным компандированием, которая обеспечивает снижение скорости передачи цифрового потока для одной монофонической программы вещания высшего класса до Fi = 323 кбит/с, при этом коэффициент сжатия :сж= эт/11 = 448/ 323=1,4.

В целях устранения избыточности ЗС, обусловленной корреляционными связями между отсчетами, предпринимались попытки использовать метод дифференциальной импульсно-кодовой модуляции (ДИКМ). Результаты экспериментальных исследований ДИКМ показывают, что достаточно высокое качество воспроизведения ЗС достигается при скорости цифрового потока 256 кбит/с. Однако в некоторых случаях при передаче сигналов, имеющих спектр, богатый высокочастотными составляющими, наблюдаются заметные для слушателя искажения. По этой причине метод ДИКМ не нашел широкого распространения в цифровых системах передачи высококачественного ЗС.

Более высокого качества звучания восстановленного сигнала можно добиться, сочетая ДИКМ и ИКМ с почти мгновенным компандированием. При этом на выходе шочти мгновенного компрессора для нечетких отсчетов вычисляется разность

Д (2 -f 1) = [д; (2/г) + х{2п+ 1)]/2,

где х{п) - величина п-го отсчета сигнала.

Далее четные отсчеты передаются без изменений 10-разрядным кодом, а разность А(2п+1) - 9-разрядным кодом после дополнительного компрессирования, подобного компрессированию четных отсчетов. На приемной стороне нечетные отсчеты х{2п+1) восстанавливаются и вместе с четными отсчетами обрабатываются на цифровом экспандере. В этом случае субъективное качество восприятия такое же, как и сигналов с обычным почти мгновенным компандированием.

В результате применения описанного метода удается на 16 кбит/с понизить скорость цифрового потока по сравнению с ИКМ с почти мгновенным компандированием. Это позволяет в цифровом потоке 320 кбит/с передать не только информацию собственно цифрового ЗС, но и символы помехоустойчивого кода и цикловой синхронизации. Таким образом удовлетворяются требования, предъявляемые единой системой связи, а именно в потоке 320 кбит/с, который занимает пять канальных интервалов системы ИКМ-30, передается вся информация об одной вещательной программе. Подобное нельзя было сделать, используя ИКМ с почти мгновенным компандированием, а тем более ИКМ с мгновенным компандированием.

В последнее время ведутся интенсивные исследования апер-турных методов кодирования, основанных на аппроксимации форм



сигнала кусочно-непрерывными функциями. Возможен апертурный метод кодирования речевых сигналов с использованием сплайн-. функций, позволяющий в 5-6 раз понизить требуемую скорость-. передачи цифрового потока речевого сигнала по сравнению са стандартным цифровым потоком телефонного канала системы. ИКЛ'1-30. При этом критерием качества восстановления служит,-разборчивость речи. Применение апертурных алгоритмов для ко- дирования высококачественных ЗС позволяет получить такие же- -результаты, как и при ДИКМ.

Наибольшую степень сжатия звукового сигнала обеспечивают вокодерные методы. На основе спектрального анализа сигнала * выделяются и кодируются его информационные характеристики по которым может быть синтезирован сигнал, подобный исходному. С помощью вокодерных методов удается выделить информационные характеристики, определяющие смысл речи, но при синтезе речевого сигнала полностью теряется узнаваемость голоса диктора. По этой причине в явном виде вокодерные методы неприемлемы для высококачественного кодирования звуковых сигналов. Более высокого качества воспроизведения достигают с помощью полувокодерных методов и прежде всего при полосном кодировании и кодировании с ортогональным преобразованием.

В общем виде метод полосного кодирования реализуется следующим образом. Исходный аналоговый сигнал ограничивается, по частоте ФЗЧ и преобразуется методом линейной ИКМ в цифровую форму. Затем ИКМ-сигнал разделяется с помощью цифровых фильтров на полосы частот, и далее каждый такой полосный, сигнал подвергается раздельному кодированию. После кодирования полосных сигналов цифровые потоки последних объединяются и передаются по каналу связи. Очевидно, что в полосных системах кодирования общая скорость передачи цифрового потока определяется как сумма скоростей передачи каждого полосного сигнала. Для эффективного снижения суммарной скорости передачи цифрового потока необходимо выбрать метод кодирования полосных сигналов, учитывающий их статические свойства и особенности восприятия.

Предполагается, что если исходный ЗС с помощью гребенки фильтров разделить на частотные диапазоны, соответствующие-критическим полосам слуха, и затем осуществить раздельное кодирование полученных таким образом узкополосных сигналов, то-уже при отношении сигнал-шум около 30 дБ помехи и шумы будут маскироваться полезным сигналом. Отсюда следует, что кодирование сигнала в критических полосах слуха требует всего 5 бит на отсчет при использовании равномерного квантования. Это позволит понизить скорость передачи цифрового потока ЗС до 160 кби11/с. Проблем, возникающих при попытке реализации такой системы, достаточно много. Прежде всего разделение исходного ЗС на полосы, соответствующие критическим полосам слуха, требует использования цифровых фильтров с неравномерным изменением полосы пропускания, аппаратурная реализация которых представ-136 ,



ляет собой достаточно сложную задачу. Следует также заметить, что межполосное просачивание, имеющее место в многополосных системах, существенно влияет на качество восприятия обработанного сигнала и непосредственно зависит от того, в какой мере характеристики цифровых фильтров приближаются к идеальным. Именно по этой причине использование полосных цифровых устройств для передачи ЗС не нашло пока практического применения в звуковом вещании. Тем е менее это направление по своей эффективности следует считать весьма перспективным.

Рассмотрим в общем виде метод кодирования с преобразованием [16, 17]. Пусть А - некоторое линейное ортогональное преобразование, обеспечивающее представление исходной последовательности Хт\\х(т), х(т+1), x{m+N)\\ в виде некоррелированной последовательности Хт=АХт.

Обозначим Y - результат квантования последовательности Ym

и предположим, что Y передается потребителю по каналу связи без шума. На приемной стороне осуществляется обратное преобразование А~ и последующее восстановление значений Xfm=A~Ym. Такая схема обработки сигнала является достаточно общей для всех систем кодирования с преобразованием.

Обычно используют два основных метода кодирования коэффициентов преобразования: пороговый и зональный. При пороговом кодировании устанавливается некоторый заранее заданный уровень, и все коэффициенты преобразования, которые не превышают это значение, отбрасываются, а оставшиеся передаются по каналу связи. Зональный метод кодирования предусматривает разбиение спектра исходного сигнала на зоны, и точность кодирования коэффициента преобразования (спектральных составляющих сигнала) определяется в зависимости от того, в какой зоне спектра они расположены.

Преимущества методов кодирования ЗС с использованием ортогональных преобразований в конечном итоге вытекают из особенностей распределения энергии среди коэффициентов преобразования. Вследствие корреляционных связей между отсчетами ЗС его энергия имеет тенденцию концентрироваться в сравнительно небольшом числе коэффициентов преобразования. Поэтому основной принцип уменьшения скорости передачи информации заключается в избирательном кодировании коэффициентов преобразования.

Максимальный выигрыш достигается при использовании преобразования Карунена - Лоэва (ПКЛ), однако его практическое применение для кодирования реальных ЗС вызывает серьезные затруднения, так как отсутствует быстрый алгоритм вычисления коэффициентов ПКЛ. К тому же матрица преобразования зависит от функции корреляции кодируемого сигнала и ее вычисление требует значительных затрат. Поэтому на практике, как правило, используют субоптимальные преобразования, имеющие быстрые алгоритмы вычисления, например такие, как Уолша - Адамара,



дискретное слент-преобразование, дискретное преобразование: Фурье (ДПФ), дискретное косинусное преобразование (ДКП) и. др. Все перечисленные преобразования являются субоптимальными потому, что коэффициенты этих преобразований декоррелиро-ваны не полностью].

В [18] приведены результаты исследований эффективности. ДПФ и ДКП применительно к реальным речевым сигналам, показывающие, что ДКП практически эквивалентно ПКЛ. Так, выигрыш в отношении сигнал-шум при использовании ПКЛ всего на. 1-2 дБ больше по сравнению с ДКП. В то же время следует заметить, что различие между ДПФ и ПКЛ составляет в среднем 13 дБ. Результаты получены при одинаковой длине кодируемой выборки. Наибольшая эффективность достигается в том случае если помимо устранения имеющейся в ЗС статистической избыточности удается в достаточно полной мере учесть психофизические-свойства слуховой системы человека. Наиболее целесообразным представляется использовать для этих целей класс частотных преобразований, таких как ДПФ и ДКП/[16, 18].

Представление звуковых сигналов в частотной области обладает целым рядом достоинств, поскольку известно, что в начальной стадии процесса восприятия слуховой анализатор человека осуществляет некоторый спектральный анализ. Характерные особенности спектрального отображения ЗС играют важную роль в процессах слухового восприятия и поэтому позволяют наиболее полно учитывать при кодировании коэффициентов преобразования психофизические свойства слуха.

Практическое внедрение методов кодирования сигналов звукового вещания, использующих частотные ортогональные преобразования, до недавнего времени не находило широкого применения вследствие сложности их аппаратурной реализации. Однако совершенствование средств цифровой обработки сигналов, появление быстродействующих микропроцессорных систем привело к тому что сложность реализации перестала быть определяющим фактором при выборе метода кодирования звуковых сигналов. В связи с этим на первый план выступает информационный критерий эффективности, т. е. наиболее важное значение имеет предельна возможное уменьшение скорости передачи цифоового потока. Именно с этой точки зрения использование частотных ортогональных преобразований - наиболее перспективное [17].

4.3. СВОЙСТВА ДИСКРЕТНЫХ ПРЕОБРАЗОВАНИИ - КОСИНУСНОГО И ФУРЬЕ

Дискретное косинусное преобразование действительной последовательности отсчетов Х{п) при п = 0, 1, N-1 определяется соотношением

Xe{k) = il/YN)2c (k) X (n) cos l{2n+l)k n/2N], (4.1)



где коэффициенты

1 при fe = 0

12 при fe= 1, 2,..., n-l.

Обратное ДКП, восстанавливающее исходную последовательность отсчетов по последовательности коэффициентов преобразования, Xc{k) (где k - 0, 1, n-1), задается выражением

x (п) = (Yn)- с (k) X, {k) cos [(2rt -\-\)k n/2N], n = 0, 1, 2,...n- 1.

Прямое и обратное дискретные преобразования Фурье последовательности отсчетов х{п) задаются следующими соотношениями:

Хр{к) = {УЫ)- х{п)ехр{-]2пЬп/Ы), k = 0, 1,..., Л^- 1,

x{n)={yn)-- 2 Хр (k) ехр {i2nbn/n), п = 0, 1,..., n-\.

(4.2)

Так как последовательность отсчетов ЗС является вещественной, то

Xp{k) = X;(n-k), (4.3)

где >[< - символ комплексного сопряжения.

В силу сказанного необходимо вычислять коэффициенты ДПФ с номерами k = 0, 1, n/2. Остальные спектральцые составляющие могут быть найдены из соотношений (4.2).

Между ДКП и ДПФ существует следующая связь. Сформируем из yV-точечной последовательности отсчетов Х{п) 2Л^-точечную последовательность z(n) по следующему правилу:

2( )= n = 0,u...,n,

[x(2N-n-l)!V2,n=N,N+\, ...,2N-\, где 2Л^-точечное ДПФ последовательности

Zp = (к) = (УШ )-1 2 Z (п) ехр (- ] 2 я kn/2 N) =

= {УШ)- ехр (-/ 2 яk/2N) 2 x (п) cos [{2п+ 1) kя/2 N]. (4.5)

Далее определим

Y ik) = c (k) Zp [k) ехр (- / я kl2 N). (4.6)

Из приведенных соотношений видно, что ДКП последовательности х{п) равно ДПФ последовательности, являющейся расши-



рением х{п) посредством ее зеркального отражения. В силу этого, при использовании ДКП в спектр исходного сигнала вносится меньше искажений, чем при Я-точечном ДПФ. Действительно, выделяя участок сигнала длиной в N отсчетов, получаем ограниченную последовательность, значения которой на концах в общеь*} случае отличны от нуля и не совпадают между собой. При использовании ДПФ исходная последовательность х{п) периодически * продолжается, поэтому фактически осуществляется преобразование Фурье сигнала, имеющего разрывы в точках, являющихся кон-цом предыдущего и началом последующего отрезка (рис. 4.1,а). Разрывы сигнала приводят к возникновению в его спектре высокочастотных паразитных составляющих. Несмотря на то, что пр обратном ДПФ можно точно восстановить исходную последовательность отсчетов, возникает необходимость кодирования паразитных составляющих, которые в реальном сигнале отсутствуют. Ошибки, возникающие при их кодировании, распространяются на все другие спектральные составляющие, поэтому необходимо, чтобы преобразование обеспечивало по возможности наименьший уро- вень паразитных составляющих.

Заметим, что в принципе от паразитных составляющих частично можно было бы избавиться, взвесив исходную последовательность отсчетов с помощью временного окна w{n), что обычно применяют в спектральном анализе сигналов методом ДПФ. Однако в этом случае будет восстановлена не исходная, а взвешенная последовательность

s{n) =x{n)w{n)+e{n),

(4.7)

где е{п) - ошибка восстановления взвешенного сигнала, возникающая при кодировании спектральных составляющих.


Рис. 4.1. Зависимости х{п) для N отсчетов (а) и преобразования Фурье последовательности г (я) для 2yV-1 отсчетов (б)



Соответственно при восстановлении отсчетов получим

X (п) =s{n)lw (п) =х{п) + е (n)lw (п). (4.8)

Учитывая, что весовая функция w{n)\ при п = 0, 1, N--1, а на краях интервала, как правило, стремится к нулю, ошибка восстановления e{n)Jw{n) будет велика. Отсюда следует, что использование временного окна при кодировании спектральных составляющих является нецелесообразным.

В то же время использование ДКП обеспечивает значительно меньшие краевые эффекты. Это объясняется тем, что вычисление ДКП фактически сводится к вычислению преобразования Фурье периодически продолженной последовательности z{n) (рис. 4.1,6)> которая имеет лишь разрывы производной. Именно поэтому при использовании ДКП уровень паразитных составляющих существенно ниже, чем при ДПФ.

4.4. ОСНОВНЫЕ ПРИНЦИПЫ КОДИРОВАНИЯ СПЕКТРАЛЬНЫХ СОСТАВЛЯЮЩИХ ЗВУКОВЫХ СИГНАЛОВ

Разработка эффективных методов кодирования реальных звуковых сигналов, представленных в базисе спектральных преобразований, является фундаментальной задачей, решение которой требует всестороннего учета статистических свойств ЗС, а также свойств слухового восприятия и прежде всего такого его феномена, как маскировка сигналов. Слуховой анализатор при обработке информации осуществляет спектральный анализ воспринимаемых сигналов. При этом наряду с присущей ему чрезвычайно острой частотной избирательностью, благодаря которой слух может различать более 600 градаций высоты тона, он обладает еще удивительной способностью объединять спектральные области в частотные группы (или критические полосы) слуха.

Разделение спектра ЗС на частотные группы (критические полосы) и последующая независимая обработка каждого такого полосного сигнала представляют собой важнейшие свойства, характеризующие обработку звукового сигнала в слуховой системе человека. Известно, что если обеспечить отношение сигнал-шум для полосных сигналов около 30 дБ, шумы квантования восстановленного сигнала на слух восприниматься не будут. Поэтому можно предположить, что кодирование ЗС в критических полосах слуха позволяет в наибольшей степени учесть психофизические особенности слухового восприятия ЗС и тем самым обеспечить требуемую эффективность системы кодирования.

Разделение спектра ЗС на зоны, тождественные по ширине критическим полосам слуха, достаточно просто можно осуществить, используя представление ЗС в базисе ДКП. При частоте дискретизации /в и длине кодируемой выборки N разрешающая способность ДКП по частоте составит w = fB/2N.

Таким образом, k-uy коэффициенту ДКП соответствует частота fi - iw, где 1 = 0, 1, N-1. Отсюда легко можно определить



Таблица 4 1 Распределение коэффициентов ДКП по частотным группам

Границы частотных групп, Гц

1000

1170

Номера коэффици-

ентов ДКП, попа-

дающих в частот-

ные группы

номера и число коэффициентов ДКП, попадающих в заданную частотную группу. Так, в 1-ю частотную группу с частотами, принадлежащими интервалу fe[/(/-1), /(/)], попадают коэффициенты ДКП с номерами k[I{I-1), /(/)], где = = ~1 f{l)J2wr, 1=\, 2, 24. Здесь символ ~\хГ обозначает наибольшее целое число, не превышающее х. Заметим, что в диапазоне частот 20... 16 000 Гц слуховая система человека образует 24 критические полосы. Если верхнюю граничную частоту принять равной 24 кГц, то число частотных групп составит 27.

В табл. 4.1 показано распределение коэффициентов ДКП по частотным группам для Я = 256 и /д = 48 кГц.

Максимальная по амплитуде в пределах частотной группы спектральная составляющая маскирует рядом стоящие компоненты спектра, если ее уровень превышает некоторое пороговое значение, которое легко может быть найдено из кривых маскировки. На рис. 4.2 показано изменение кривой порога слышимости тона Ln при его маскировке узкополосным шумом со средней частотой 1 кГц. В данном случае ширина частотной группы составляет 160 Гц, а уровни маскирующего тона шума равны 100, 80, 60, 40 и 20 дБ. Кривые, представленные на рис. 4.2, имеют четко выраженный максимум. Положение этого максимума на оси частот совпадает со средней частотой маскирующего узкополосного шума. Причем в сторону низких частот кривые маскировки убывают достаточно круто, а в области высоких частот эффект маскировки отчетливо проявляется даже при небольших уровнях маскирующего сигнала.

Количественно эффект маскировки может быть сформулирован следующим образом. Если в пределах частотной группы амплитуда максимальной спектральной составляющей в 4 раза превышает рядом стоящие компоненты спектра, то все они будут полностью маскироваться и ошибки при их кодировании на слух вос-


Рис. 4.2. Изменение порога слы-5 X шимости в зависимости от уровня маскирующего сигнала



приниматься не будут. По этой причине эти спектральные составляющие можно в канал связи не передавать. Заметим, что изменение средней частоты маскирующего сигнала приводит к смещению кривой маскировки по оси частот.

На рис. 4.3 показаны кривые порога слышимости тона при его маскировке узкополосным шумом с различной средней частотой, но неизменным значением уровня. Видно, что форма этих кривых мало зависит от положения маскирующего сигнала в диапазоне слышимых частот. Эффект маскировки проявляется во всех частотных группах слуха, однако ширина частотной области, где проявляется этот эффект, на верхних частотах существенно больше размера критической полосы слуха.

При выборе алгоритмов кодирования коэффициентов ДКП, попадающих в частотную группу, необходимо также учитывать зависимость минимально ощущаемых изменений амплитуды спектральных составляющих от уровня звукового давления маскирующего сигнала. На рис. 4.4 показана зависимость минимально ощущаемой амплитудной модуляции т тока с частотой 1 кГц от уровня сигнала L. Из рисунка видно, что при увеличении уровня сигнала коэффициент минимально ощущаемой амплитудной модуляции уменьшается. При увеличении звукового давления слуховой анализатор человека становится более чувствительным к изменениям амплитуды спектральной составляющей. Так, при уровне звукового давления 20 дБ коэффициент минимально ощущаемой амплитудной модуляции составляет 10%, а при уровне 100 дБ он уменьшается до 1%- Иначе говоря, при изменении уровня компонент спектра от 20 до 100 дБ минимально ощущаемые изменения амплитуды спектральных составляющих уменьшаются примерно в 10 раз. Отсюда следует, что слуховой анализатор человека чувствителен к изменениям амплитуды наибольших спектральных составляющих в частотных группах, и поэтому ошибки в их кодировании наиболее заметны на слух. Это еще раз подтверждает целесообразность более точного кодирования максимальных по амплитуде спектральных составляющих в частотных группах.


Рис. 4 3. Кривые маскировки при различной частоте маскирующего сигнала

Рис. 4.4. Зависимость коэффициента минимально ощущаемой амплитудной модуляции тона 1 кГа от уровня сигнала (при частоте модуляции 4 Гц)



Наиболее полно учесть изложенные выше свойства слухового восприятия можно, если осуществить кодирование спектральных составляющих в формате с поблочно плавающей запятой. При этом блок коэффициентов преобразования, соответствующий вы-(борке длины N, предварительно разбивается на зоны (области частот), эквивалентные по ширине критическим полосам звука. Затем в каждой такой выделенной частотной группе определяется максимальный (по абсолютному значению) коэффициент преобразования, и в зависимости от его значения выбирается шаг квантования, который сохраняется постоянным для всех спектральных составляющих, попадающих в данную частотную группу. Очевидно, при таком способе кодирования значение порядка необходимо передавать только 1 раз на всю совокупность коэффициентов преобразования, относящихся к данной частотной группе. Поэтому число разрядов, затрачиваемое на кодирование порядка, незначительное.

После того, как все спектральные составляющие будут представлены IB формате с поблочно плавающей запятой, осуществляется ограничение разрядности мантисс, обеспечивающее требуемое отношение сигнал-шум в каждой частотной группе.

Представим спектральные составляющие следующим образом:

Лй)=Л()2й(*), k = 0,\,2,... N-h (4.9)

A(k) = {- fl, 2 -(4.10)

B(k)~B,r2-\ (4.11)

где A{k) я B{k) - соответственно мантисса и порядок -го коэффициента преобразования; aum я - двоичные разряды мантисс и порядка; М{1) - разрядность мантиссы коэффициентов в /-Й частотной группе; р - разрядность порядка. При таком представлении коэффициентов преобразования шаг квантования определяется значением порядка и равен 2\ Требуемое отношение максимального значения коэффициента преобразования в 1-я частотной группе

1с()1макс=-(2 >--1)2 () (4.12)

к мощности шума квантования е = 2№) ]/12 достигается соответствующим выбором разрядности мантиссы и вычисляется в деци-<белах по формуле

у (1) = 20Ig\Х, {k)UjE = 20Ig (2 ()->)f 12 Ш (l) -h 4,8. (4.13)

Разрядность порядка определяет динамический диапазон D(l) системы кодирования, равный отношению максимального кодируемого коэффициента ДКП к минимальной мощности шума квантования, которая достигается при B{k) =0:

D(/) B=.201g(2W)-i)2(2p-i), 12у(1) + 6(2Р~1). (4.14)



1 ... 11 12 13 14 15 16 17 ... 22

Яндекс.Метрика