Главная » Мануалы

1 ... 12 13 14 15 16 17 18 ... 22

Заметим, что здесь речь идет о динамическом диапазоне кодирования в полосе частот, соответствующей 1-й частотной группе.

Все коэффициенты преобразования, попавшие в 1-ю частотную группу, кодируются с использованием одного значения порядка, который выбирается равным наибольшему числу, удовлетворяющему соотношению

2B(O(2Ai(0-i i)<maxXc(ife), I (1)]. (4.15)

При фиксированном значении порядка В{1) разряды {ahj} /1о'~ мантисс в 1-й частотной группе определяются по правилу

{ w}fir= argmin X,()-2 (-l) °2 fl;-2 --

(4.16)

где йе[/(/-1),

Таким образом, при кодировании коэффициентов преобразования 1-й частотной группы необходимо затратить М(1) разрядов для мантиссы каждого коэффициента ДКП и р разрядов для кодирования порядка.

Скорость передачи цифрового потока при данном алгоритме кодирования может быть вычислена по формуле

v = (Ш) ( 2 {М (I) и (1) - / (/ - 1)]} -f рV (4.17)

где L - число частотных групп.

Из выражения (4.17) видно, что при фиксированной частоте дискретизации скорость цифрового потока зависит в основном от длины выборки N и числа разрядов, выделяемых для мантиссы при кодировании коэффициентов преобразования в частотных группах. Очевидно, с увеличением длины выборки N скорость цифрового потока будет уменьшаться. Однако при этом необходимо учитывать тот факт, что интервал времени спектрального анализа T=\Nlf, определяющий длительность звучания кодируемой выборки сигнала, не должен превышать интервал времени слуховой памяти человека, имеющий величину порядка 20 ...30 мс. Кроме того, увеличение длины выборки N требует больших аппаратных затрат при реализации устройства кодирования ЗС. Поэтому окончательный выбор значения N зависит от конкретных требований, предъявляемых к эффективности кодирования и стоимости аппаратуры.

В описанном алгоритме кодирования особое значение имеет выбор разрядностей М(1) кодирования мантисс. Наиболее простой подход заключается в усечении или округлении разрядов мантисс с таким условием, чтобы обеспечивалось отношение сигнал-шум в каждой частотной группе порядка 30 дБ. В этом случае необходимо выделить не менее пяти разрядов для кодирования мантисс каждого коэффициента преобразования. При этом обеспечивается одинаковая относительная погрешность кодирования коэффициен-



тов во всех частотных группах. Однако такой способ распределения разрядов не учитывает различную чувствительность слуха к, восприятию спектральных составляющих в различных участках диапазона слышимых частот. Поэтому целесообразно распределить общее число разрядов, выделенных для кодирования коэффициен-1 тов преобразования, неравномерно по частотным группам, учиты-j вая тот факт, что усредненные значения дисперсий коэффициентов^ преобразования заметно уменьшаются в области верхних частот. В частности, распределение разрядов можно осуществлять про порционально значению логарифма средних дисперсий коэффициентов преобразования, попадающих в соответствующую частотную группу, т. е. q(k) = const=М{1),

M{l) = ahg,Di (4.18>

при (/-!),/(/)],

где Di - средняя дисперсия коэффициентов ДКП в 1-й частотной группе.

Экспериментальные исследования подтвердили преимуществ неравномерного фиксированного распределения разрядов в блоке преобразования по сравнению с равномерным. Но было также выявлено, что в отдельных случаях эффективность кодирования оказывается несколько меньше, чем при равномерном распределении, По-видимому, это связано с тем, что мгновенный спектр ЗС в ряде случаев существенно отличается от своего среднего значения

Тщательные экспериментальные исследования показали, что наиболее целесообразным оказывается использование адаптивного метода распределения разрядов по частотным группам, в основе которого лежит учет локальных статистических характеристик коэффициентов преобразования кодируемого блока. При этом в первую очередь необходимо учитывать, что искажения спектральных; составляющих на слух воспринимаются тем слабее, чем меньше амплитуда этих составляющих. Иными словами, для малых коэф фициентов преобразования может быть допущена большая ошибка, при квантовании. Этот вывод делается как следствие эффекта маскировки. Поэтому будем выделять число разрядов для коди рования спектральных составляющих в частотных группах про- порционально значению максимального коэффициента преобразо- вания в каждой частотной группе. Очевидно, что при таком спо- собе распределения разрядов получим значительно меньшую сред-J неквадратическую ошибку кодирования и наилучшим образом бу- дем использовать эффект маскировки сигналов в частотных груп- * пах. Число разрядов для (Кодирования мантисс коэффициентов- преобразования, попавших в 1-ю частотную группу, находят из следующего соотношения:

M{l)=alog,(max\Xik)\). (4.19>*

Параметр а в выражении (4.19) выбирают из условия

EM(/)[/(/)-/(/-l)]-.Q, (4.20).;

1=1 i

146 , 1



L-l-


Частотные группы

Рнс. 4 5. Графическая интерпретация адаптивного алгоритма распределения разрядов по частотным группам

где Q - общее число разрядов, выделенное для кодирования блока коэффициентов преобразования.

Таким образом, адаптивное распределение разрядов осуществляется в зависимости от значения максимального коэффициента преобразования в каждой частотной группе. Однако общее число разрядов, выделяемое для кодирования блока коэффициентов преобразования, остается постоянным. На рис. 4.5 показана графическая интерпретация адаптивного алгоритма распределения разрядов по частотным группам, где осуществляется оценка максимальных значений коэффициентов преобразования в каждой частотной группе и затем пропорционально их величине - распределение разрядов для кодирования мантисс.

4.5. ЭФФЕКТИВНОСТЬ АЛГОРИТМОВ КОДИРОВАНИЯ

И ПАРАМЕТРЫ КАЧЕСТВА ЗВУЧАНИЯ ВОССТАНОВЛЕННЫХ

ЗВУКОВЫХ СИГНАЛОВ

Основными параметрами качества звучания являются неравномерность амплитудно-частотной характеристики (АЧХ) и коэффициент гармоник Кг. Для измерения этих параметров предусматривается использование гармонических сигналов с частотами 32, 64, 125, 250, 500, 1000, 3000, 6000, 10 000 и 15000 Гц. Для исследования неравномерности АЧХ и коэффициентов гармоник устройства кодирования ЗС выполняют с помощью комплекса моделирования аппаратуры цифровой обработки звуковых сигналов.

Исходный тестовый сигнал, формируемый генератором, записывают на цифровой магнитофон и далее обрабатывают с помощью программной модели устройства кодирования. Обработанный сигнал снова записывается на цифровой магнитофон и после этого осуществляется измерение параметров испытуемой модели



устройства кодирования. Следует заметить, что оценка параметро качества испытуемого устройства традиционным методом являете достаточно трудоемкой задачей и требует использования большо номенклатуры измерительных устройств. Применение же комплек са моделирования аппаратуры цифровой обработки сигналов поз воляет существенно упростить процедуру оценки параметров каче, ства модели системы кодирования ЗС путем замены аппаратны средств измерения х программными моделями. В данном случа исходный тестовый синусоидальный сигнал формируется програм мным способом в соответствии с выражением

s,(/) = sin(2nM ), (4.21

где А - амплитуда сигнала; / - заданная частота тестового сиг нала fe(0, /д|/2); k - номер отсчета; /д - частота дискретиза ции.

Коэффициент передачи радиовещательного тракта или устрой ства на частоте fo по определению

kF{f) = 20\og,U,JU, (4.22

где f/вых, Ubx - действующие значения синусоидального сигнал с частотой /о соответственно на выходе и входе испытуемого трак та или устройства, причем ?

= Yy I,= V% Д -х (О. (4-23

где Sbx(0 и 5вых(г) соответственно обозначают i-e отсчеты вход ного и выходного сигналов.

Неравномерность АЧХ на частоте f определяется как разност между коэффициентом передачи на частоте / и коэффициенто передачи на частоте fo=1000 Гц.

Коэффициент гармоник

:r = l/ iMo, (4.24

п=2

где Ло - амплитуда основной гармоники выходного сигнала, совпадающая по частоте со входным тестовым сигналом; An - сум ма амплитуд остальных гармоник в полосе частот 20 ...20 ООО Гц Для вычисления коэффициента гармоник программным способом необходимо сначала найти дискретное преобразование Фурь, выходного сигнала

А {k) = iYN)- sb x ( ) ехр (- j .2я kniN) (4.25

при й = 0, 1, -1.

Затем определить по формуле

N-m-\.....2

2 И-Л^о)

Ai, (4.26



где т - максимальный номер спектральной составляющей, расположенной вне полосы пропускания исследуемого устройства.. Применяя равенство Парсеваля, получаем

е Кых(0Р=2лМй)- (4.27)-

Учитывая, что для действительной входной последовательности комплексно-сопряженные отсчеты ДПФ равны, можно преобразовать выражение (4.26) к следующему виду:

2 [вых о

(4.28)

Из (4.28) следует, что для вычисления коэффициента гармоник требуется определить только первые m коэффициентов ДПФ, энергию основной гармоники и энергию всего сигнала.

Изложенный выше метод оценки основных параметров качества испытуемого устройства кодирования ЗС экспериментально сравнивался с традиционными методами измерений. Оказалось, что при использовании цифровых моделей измерительных сигналов достигалась более высокая точность и оперативность получения оценки параметров качества. С помощью разработанного метода были получены значения коэффициента гармоник и неравномерности АЧХ для исследуемой модели системы кодирования при использовании различных алгоритмов обработки коэффициентов ДКП. Неравномерности АЧХ в диапазоне частот 20 ...20 ООО Гц во всех случаях были меньше 0,02 дБ.

На рис. 4.6 показаны зависимости коэффициента гармоник устройства кодирования ЗС от частоты тестового сигнала для двух случаев распределения разрядов по частотным группам: а - неравномерное фиксированное и б - адаптивное. Параметрами представленных зависимостей являются длина блока N=1024 в скорость цифрового потока на выходе устройства кодирования ЗС. Видно, что при фиксированном распределении разрядов требования качества звука не обеспечиваются даже при скорости

И^, fa 6

J г 1 О

T0CT11S15-75

~1 1

Гт 11515-75 /

5г Bit ns Z50 500 10002000mi!f,ri{

it Si- Ш £5Q 550 7000 2 ffOffm0f,ru

Рис. 4.6. Зависимость коэффициента гармоник от частоты при фиксированном (о) и адаптивном (б) распределении разрядов по частотным группам



цифрового потока 1/=166 кбит/с. В то же 1время при использовании адаптивного алгоритма распределения разрядов по частотным группам (рис. 4.6) полученные значения коэффициентов гармоник во всем частотном диапазоне полностью удовлетворяют требованиям ЗС высшего класса качества. Наряду с измерениями необходимым элементом комплексной оценки качества устройства звуко вого вещания является прослушивание звучания испытуемых устройств при их сравнении с эталоном. Целью субъективного прослушивания, выполненного в данном случае, было получение оценки, характеризующей ухудшение качества передачи при использовании различных алгоритмов кодирования коэффициентов ДКП. Учитывая, что международные нормативные технические документы дают лишь самые общие рекомендации по составу музыкальных программ (ОИРТ № 63/1, МЭК № 268-13), конкретный звуковой материал для тестового прослушивания выбирался на основе опыта работы экспертной группы с учетом мнения звукорежиссеров.

Следует заметить, что набор программ прослушивания и формирования тестов - один из наиболее важных факторов, оказывающих влияние на результаты исследований. Чаще всего в качестве звукового материала используют реальный и синтезированный сигналы с заранее известными условиями записи. В рекомендациях МЭК указывается, что звуковой материал должен содержать фрагменты музыкальных сигналов не менее пяти жанров, чтобы можно было продемонстрировать различные аспекты качества звука. Эталонный образец выбирался высококвалифицированными профессиональными экспертами по критерию максимальной естественности звучания.

В итоге было выбрано несколько фрагментов музыкальных отрывков, различных по жанру, составу оркестра и исполнению. Выбранные образцы тестовых музыкальных сигналов приведены в табл. 4.2. Следует заметить, что обычные аналоговые записи, как правило, имеют ограниченный частотный диапазон 30... 15 000 Гц. Поэтому в качестве источника звукового сигнала использова-

Таблица 4.2. Образцы тестовых фрагментов ЗС при субъективной оценке качества звучания

Номер фрагмента

Жанр ЗС

и эталонного СЗВ

Автор и название произведения

Симфонический оркестр

И. Стравинский, Петрушка, Нью-Иорский филармонический оркестр

Глен Гульд. Шесть сонат для фортепьяно

Хор без сопровождения

Русский народный хор Ленинградского радио и телевидения

Скрипка

Мендельсон. Концерт для скрипки с

Джазовый оркестр

оркестром

Сюита для флейты н джаз-пиаио



лись в основном грамзаписи в специальном техническом исполнении, которые обеспечивали полосу частот 20... 20 000 Гц и отношение сигнал-шум не менее 90 дБ.

Экспертам поочередно в случайной последовательности с интервалом 2 с предъявлялись эталонный сигнал и сигнал, обработанный с помощью различных алгоритмов кодирования. Оценка качества звучания проводилась по общему звуковому впечатлению с использованием пятибалльной шкалы ухудшения качества.

Результаты экспертиз приведены в табл. 4.3. Во всех случаях длина выборки составляет 1024 отсчета, а скорость цифрового потока меняется от 100 до 75 кбит/с. Из табл. 4.3 видно, что при адаптивном распределении разрядов для кодирования мантисс коэффициентов ДКП искажения становятся заметными на слух при скорости цифрового потока на выходе кодера 1/=100 кбит/с. Дальнейшее уменьшение точности кодирования коэффициентов преобразования приводит к появлению искажений, и при скорости V=75 кбит/с эксперты отличают эталонный сигнал от обработанного.

Исследованный алгоритм кодирования позволяет достичь сжатия ЗС примерно в 7,5 раза с сохранением студийного качества звучания ценой больших апертурных затрат на его реализацию.

Практический интерес представляют менее эффективные алгоритмы кодирования, допускающие более-менее простую реализацию. В качестве такого компромиссного варианта можно предложить адаптивное кодирование ЗС в базис ДКП малой размерности, например при N=128. Процессор 128-точечного ДКП может быть реализован на жесткой логике, причем современная элементная база обладает достаточным быстродействием для того, чтобы осуществить вычисление ДКП не с помощью быстрого алгоритма, а путем непосредственного умножения на матрицу преобразования. При этом существенно упрощается логическая структура процессора. При непосредственном вычислении ДКП достаточно иметь 20-разрядные арифметические устройства, которые обеспечивают требуемый низкий уровень шумов округления.

Таблица 4.3. Результаты экспертной оценки качества звучания обработанного сигнала при адаптивном распределении разрядов в частотных группах (при yv=128)

Жаир СЗВ

Скорость цифрового

Результат оценки звучания экспертом

потока,

кбит/с

Симфонический

оркестр

Скрипка

Джазовый оркестр



Таблица 4.4. Результаты экспертной оценки качества звучания обработанного сигнала при адаптивном распределении разрядов в частотных группах (при

\Т 100Ч

Л'=128)

Жанр ЗС

Скорость цифрового

Результат оценки

потока.

кбнт/с

Симфонический

оркестр

Скрипка

Джазовый оркестр

В табл. 4.4 представлены результаты экспертиз по субъективной оценке качества звучания ЗС при кодировании с помощью адаптивного алгоритма при длине блока N = 256. В данной серии экспертиз эталонным являлся сигнал звукового вещания высшего класса качества с частотой следования отсчетов 32 кГц и 14-разрядными ИКМ-отсчетами.

Как следует из табл. 4.4, при скорости цифрового потока 150 кбит/с данный метод кодирования обеспечивает требуемое качест- во звучания, причем экспертизы проводились по описанной выше методике.

4.6. КОДИРОВАНИЕ ЗВУКОВЫХ СИГНАЛОВ С НИЗКОЙ СКОРОСТЬЮ БИТОВ

Уменьшение скорости битов цифрового ЗС без ухудшения его качества возможно путем передачи только тех составляющих, которые эффективно воспроизводят исходный сигнал в слуховом аппарате слушателя. Типичная скорость передачи ИКМ сигнала составляет 400 ...700 кбит/с для каждого моноканала. При передаче ЗС в любом канале возникают трудности, для преодоления которых следует уменьшить скорость передачи битов. Вместе с тем для передачи на подвижные объекты и переносную аппаратуру скорость передачи битов должна быть сведена к минимальной, определяемой качеством воспроизводимого сигнала. Для этого нужно устранить части как сигнала, так и пауз, которые не несут в себе информацию, требуемую для верности воспроизведения. Избыточность информации ЗС в структуре сигнала должна равняться 0. Дополнительно следует устранить избыточность ЗС в той его части, которая не воспринимается ухом человека в силу специфики его спектральной и временной восприимчивости.

Обычная широкополосная ИКМ система (16- или 16/14-разрядная) создает широкополосный, почти белый шум квантования, спектральное распределение которого очень отличается от частот-152



но-завис'имой чувствительности уха. При широкополосных методах цифрового сжатия допустимо очень небольшое снижение скорости передачи битое без потерь качества, так как шум компандирова-ния в широкой полосе легко превышает частотно-зависимый порог маскирования уха. Широкополосный ИКМ звуковой сигнал по сути своей не согласуется с частотно-зависимым кодированным каналом уха.

Чтобы согласовать шум квантования с характеристиками уха, предлагаются два метода кодирования различных источников звука: с преобразованием и субполосное. В обоих используют анализ спектра и частотно-зависимое распределение битов, оба имеют скорость передачи 120 кбит/с для моносигнала без слышимых ухудшений качества.

Метод кодирования с преобразованием включает в себя преобразование блока последовательных выборок в частотную область (т. е. преобразование Фурье или косинус-преобразование). Такая стратегия приводит к уменьшению избыточности звукового сигнала и согласованию квантования с порогами восприятия ошибок квантования. Квантованию подвергаются только те амплитуды и фазы, которые соотносятся с эффектами маскирования уха человека.

Метод субполосного кодирования делит широкополосный сигнал соответствующей гребенкой фильтров на субполосные сигналы и на цифровые кадры длиной 2... 8 мс. Находясь в кадре, максимальный уровень каждого субполосного сигнала (коэффициент масштабирования) квантуется и передается. Каждая субполоса квантуется с перераспределением битов, основанным на порогах, маскирования. Метод избегает преобразований типа время - частота-время и поэтому уменьшает степень сложности обработки сигнала в приемнике, а также избегает взвешивания с использованием финитной функции во временной области и оптимизируег распределение не только шума квантования, но и шума ошибок битов в спектре относительно характеристик уха.

Рассмотрим метод субполосного кодирования, при котором используются основные принципы системы субполосного кодирования мультиплексирования с адаптацией характеристик маскирования (MASKAM).

Оптимальная адаптация канала передачи звука к уху человека включает моделирование внутреннего процесса кодирования в ухе, что нелегко реализовать на практике. Поэтому необходимо использовать методы кодирования, которые достижимы технически и учитывают особенности шумовой характеристики уха [24], Такое кодирование может осуществляться в частотной или временной области, быть постоянным или адаптивным и использовать или не использовать память. Оно может считаться действительно оптимальным только тогда, когда спектр результирующего шума согласуется с порогом маскирования уха. Следовательно, частотная зависимость порога маскирования считается соответствующей спектру шума кодирования слухового канала связи. Так, громкие



НЧ-звуки маскируют тихие ВЧ-звуки гораздо сильнее, чем наоборот, а ЗС, уровень которого ниже порога маскирования маскирующего шума, не воспринимается ухом и является иррелевантным. Такой эффект взаимного маскирования особенно очевиден у широкополосных звуковых сигналов с хорошо определенной структурой. Если учитывать взаимное маскирование при кодировании ЗС, то следует учесть, что часть сигнала, лежащая ниже порога маскирования, не должна кодироваться и передаваться.

Ухо можно рассматривать как канал связи по модели, в которой слух расщепляет частотный спектр на субполосы, или так называемые критические полосы. Критические полосы определяются как характеристические части широкополосного спектра звуковых частот, в пределах которого имеют значение специфические пси-хоакустичеокие закономерности, такие как частотная избирательность, порог маскирования и т. д. Если принять, что оптимальное кодирование осуществляется в каждой субполосе с критической шириной, полный спектр зависящего от сигнала шума кодирования будет соответствовать частичным спектрам индивидуальных субполос с критической шириной полосы. Отсюда выводится оптимальная концепция кодирования. Шум кодирования можно оптимально маскировать звуковым сигналом, если сигнал не широкополосный, а узкополосный кодированный, т. е. в каждой субполосе кодирование приспосабливается к шумовой характеристике уха.

Порог между различимым и неразличимым шумами квантования Б субполосе определяется точкой пересечения порога маскирования (НЧ-край) и нижней частоты среза субполосы L Разница между уровнем этого порога и уровнем сигнала может быть названа критическим отношением сигнал-шум ag,i субполосы L Его можно рассчитать (в децибелах) по формуле

age = 2001g(foe ui) + 5, (4.29)

где foi н fui - верхняя и нижняя частоты среза субполосы. Для Qi шагов квантования отношение сигнал-шум

% = 20lg(/i;5<7J. (4.30)

Минимальная разрешающая способность квантования, необходимая для выборки, где шум квантования маскируется, может быть определена прямо из уравнений (4.29) и (4.30) и представлена в виде

lg7iмин = 321g(/oг/f г)-Ы. (4.31)

Минимальная разрешающая способность сигнала субканала (биты на выборку) зависит только от относительной полосы пропускания foi/fui используемого фильтра, и если она уменьшается у высокочастотных субполос, то требуемая разрешающая способность соответствующих субполос уменьшается. Уравнение (4.31) показывает, что скорость передачи битов должна быть уменьшена путем увеличения числа субполос. Однако существует иной путь

il54



1 ... 12 13 14 15 16 17 18 ... 22

Яндекс.Метрика