+7(495)926-7456
+7(495)926-7456
Электронные компоненты  Мануалы 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 [ 49 ] 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70

Таблица 4.4. Результаты экспертной оценки качества звучания обработанного сигнала при адаптивном распределении разрядов в частотных группах (при

\Т 100Ч

Л=128)

Жанр ЗС

Скорость цифрового

Результат оценки

потока.

кбнт/с

Симфонический

оркестр

Рояль

Скрипка

Джазовый оркестр

В табл. 4.4 представлены результаты экспертиз по субъективной оценке качества звучания ЗС при кодировании с помощью адаптивного алгоритма при длине блока N = 256. В данной серии экспертиз эталонным являлся сигнал звукового вещания высшего класса качества с частотой следования отсчетов 32 кГц и 14-разрядными ИКМ-отсчетами.

Как следует из табл. 4.4, при скорости цифрового потока 150 кбит/с данный метод кодирования обеспечивает требуемое качест- во звучания, причем экспертизы проводились по описанной выше методике.

4.6. КОДИРОВАНИЕ ЗВУКОВЫХ СИГНАЛОВ С НИЗКОЙ СКОРОСТЬЮ БИТОВ

Уменьшение скорости битов цифрового ЗС без ухудшения его качества возможно путем передачи только тех составляющих, которые эффективно воспроизводят исходный сигнал в слуховом аппарате слушателя. Типичная скорость передачи ИКМ сигнала составляет 400 ...700 кбит/с для каждого моноканала. При передаче ЗС в любом канале возникают трудности, для преодоления которых следует уменьшить скорость передачи битов. Вместе с тем для передачи на подвижные объекты и переносную аппаратуру скорость передачи битов должна быть сведена к минимальной, определяемой качеством воспроизводимого сигнала. Для этого нужно устранить части как сигнала, так и пауз, которые не несут в себе информацию, требуемую для верности воспроизведения. Избыточность информации ЗС в структуре сигнала должна равняться 0. Дополнительно следует устранить избыточность ЗС в той его части, которая не воспринимается ухом человека в силу специфики его спектральной и временной восприимчивости.

Обычная широкополосная ИКМ система (16- или 16/14-разрядная) создает широкополосный, почти белый шум квантования, спектральное распределение которого очень отличается от частот-152



но-зависимой чувствительности уха. При широкополосных методах цифрового сжатия допустимо очень небольшое снижение скорости передачи битое без потерь качества, так как шум компандирова-ния в широкой полосе легко превышает частотно-зависимый порог маскирования уха. Широкополосный ИКМ звуковой сигнал по сути своей не согласуется с частотно-зависимым кодированным каналом уха.

Чтобы согласовать шум квантования с характеристиками уха, предлагаются два метода кодирования различных источников звука: с преобразованием и субполосное. В обоих используют анализ спектра и частотно-зависимое распределение битов, оба имеют скорость передачи 120 кбит/с для моносигнала без слышимых ухудшений качества.

Метод кодирования с преобразованием включает в себя преобразование блока последовательных выборок в частотную область (т. е. преобразование Фурье или косинус-преобразование). Такая стратегия приводит к уменьшению избыточности звукового сигнала и согласованию квантования с порогами восприятия ошибок квантования. Квантованию подвергаются только те амплитуды и фазы, которые соотносятся с эффектами маскирования уха человека.

Метод субполосного кодирования делит широкополосный сигнал соответствующей гребенкой фильтров на субполосные сигналы и на цифровые кадры длиной 2... 8 мс. Находясь в кадре, максимальный уровень каждого субполосного сигнала (коэффициент масштабирования) квантуется и передается. Каждая субполоса квантуется с перераспределением битов, основанным на порогах, маскирования. Метод избегает преобразований типа время - частота-время и поэтому уменьшает степень сложности обработки сигнала в приемнике, а также избегает взвешивания с использованием финитной функции во временной области и оптимизируег распределение не только шума квантования, но и шума ошибок битов в спектре относительно характеристик уха.

Рассмотрим метод субполосного кодирования, при котором используются основные принципы системы субполосного кодирования мультиплексирования с адаптацией характеристик маскирования (MASKAM).

Оптимальная адаптация канала передачи звука к уху человека включает моделирование внутреннего процесса кодирования в ухе, что нелегко реализовать на практике. Поэтому необходимо использовать методы кодирования, которые достижимы технически и учитывают особенности шумовой характеристики уха [24], Такое кодирование может осуществляться в частотной или временной области, быть постоянным или адаптивным и использовать или не использовать память. Оно может считаться действительно оптимальным только тогда, когда спектр результирующего шума согласуется с порогом маскирования уха. Следовательно, частотная зависимость порога маскирования считается соответствующей спектру шума кодирования слухового канала связи. Так, громкие



НЧ-звуки маскируют тихие ВЧ-звуки гораздо сильнее, чем наоборот, а ЗС, уровень которого ниже порога маскирования маскирующего шума, не воспринимается ухом и является иррелевантным. Такой эффект «взаимного маскирования» особенно очевиден у широкополосных звуковых сигналов с хорошо определенной структурой. Если учитывать взаимное маскирование при кодировании ЗС, то следует учесть, что часть сигнала, лежащая ниже порога маскирования, не должна кодироваться и передаваться.

Ухо можно рассматривать как канал связи по модели, в которой слух расщепляет частотный спектр на субполосы, или так называемые критические полосы. Критические полосы определяются как характеристические части широкополосного спектра звуковых частот, в пределах которого имеют значение специфические пси-хоакустичеокие закономерности, такие как частотная избирательность, порог маскирования и т. д. Если принять, что оптимальное кодирование осуществляется в каждой субполосе с критической шириной, полный спектр зависящего от сигнала шума кодирования будет соответствовать частичным спектрам индивидуальных субполос с критической шириной полосы. Отсюда выводится оптимальная концепция кодирования. Шум кодирования можно оптимально маскировать звуковым сигналом, если сигнал не широкополосный, а узкополосный кодированный, т. е. в каждой субполосе кодирование приспосабливается к шумовой характеристике уха.

Порог между различимым и неразличимым шумами квантования Б субполосе определяется точкой пересечения порога маскирования (НЧ-край) и нижней частоты среза субполосы L Разница между уровнем этого порога и уровнем сигнала может быть названа критическим отношением сигнал-шум ag,i субполосы L Его можно рассчитать (в децибелах) по формуле

age = 2001g(foe ui) + 5, (4.29)

где foi н fui - верхняя и нижняя частоты среза субполосы. Для Qi шагов квантования отношение сигнал-шум

% = 20lg(/i;5<7J. (4.30)

Минимальная разрешающая способность квантования, необходимая для выборки, где шум квантования маскируется, может быть определена прямо из уравнений (4.29) и (4.30) и представлена в виде

lg7iмин = 321g(/oг/f„г)-Ы. (4.31)

Минимальная разрешающая способность сигнала субканала (биты на выборку) зависит только от относительной полосы пропускания foi/fui используемого фильтра, и если она уменьшается у высокочастотных субполос, то требуемая разрешающая способность соответствующих субполос уменьшается. Уравнение (4.31) показывает, что скорость передачи битов должна быть уменьшена путем увеличения числа субполос. Однако существует иной путь

il54



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 [ 49 ] 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70