улучшение перцепционной характеристики дублирования полосы спектра и связанных способов кодирования высокочастотного восстановления путем адаптивного добавления минимального уровня шума и ограничения подстановки шумов

Классы МПК:H03M13/01 основные предположения теории кодирования; границы кодирования; способы оценки вероятности ошибки; модели каналов связи; моделирование или проверка кодов
H03M13/37 способы декодирования или устройства, не предназначенные для конкретного вида кодирования, отнесенного к подгруппам  13/03
Автор(ы):, , ,
Патентообладатель(и):КОУДИНГ ТЕКНОЛОДЖИЗ СВИДН АБ (SE)
Приоритеты:
подача заявки:
2000-01-26
публикация патента:

Изобретение относится к системам кодирования и декодирования. Достигаемый технический результат - добавление и управление уровнями шумов в процессе высокочастотного восстановления в декодере. Способ для усовершенствования систем кодирования исходного сигнала включает этапы оценки минимального уровня шума исходного сигнала, причем минимальный уровень шума является мерой различия между спектральной огибающей, определяемой точками локальных минимумов спектрального представления исходного сигнала, и другой спектральной огибающей, определяемой точками локальных максимумов спектрального представления исходного сигнала, и мультиплексирования кодированного сигнала и минимального уровня шума для получения выходного сигнала кодера. 4 c. и 12 з.п. ф-лы, 9 ил.
Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9

Формула изобретения

1. Способ для усовершенствования системы кодирования исходного сигнала, причем упомянутая система кодирования исходного сигнала обеспечивает формирование кодированного сигнала путем кодирования исходного сигнала, включающий этапы оценки (803) минимального уровня шума исходного сигнала, причем минимальный уровень шума является мерой различия между спектральной огибающей, определяемой точками локальных минимумов спектрального представления исходного сигнала, и другой спектральной огибающей, определяемой точками локальных максимумов спектрального представления исходного сигнала, и мультиплексирования (805) кодированного сигнала и минимального уровня шума для получения выходного сигнала кодера.

2. Способ по п.1, в котором этап оценки включает подэтапы обеспечения точно структурированного спектрального представления исходного сигнала с использованием разрешения, которое достаточно для различения формант или отдельных синусоид в спектральном представлении, причем точно структурированное спектральное представление имеет точки локальных минимумов и точки локальных максимумов, применения действия отслеживания к точно структурированному спектральному представлению для интерполяции по точкам локальных минимумов для получения спектральной огибающей, применения действия отслеживания к точно структурированному спектральному представлению для интерполяции по точкам локальных максимумов для получения другой спектральной огибающей, формирования разности между упомянутой спектральной огибающей и другой спектральной огибающей для получения меры различия и сглаживания меры различия для получения значений минимального уровня шума.

3. Способ по п.1, в котором этап оценки дополнительно включает подэтапы отображения минимального уровня шума на множество частотных диапазонов для получения минимального уровня шума для каждого из множества частотных диапазонов.

4. Способ по п.2, в котором упомянутый минимальный уровень шума представляют с использованием линейного кодирования с предсказанием (ЛКП) или другого полиномиального представления.

5. Способ по п.2, в котором упомянутую меру различия дополнительно сглаживают во времени.

6. Способ по п.2, дополнительно включающий этапы обеспечения дополнительного точно структурированного спектрального представления исходного сигнала с использованием разрешения, которое ниже, чем разрешение, использованное на этапе обеспечения точно структурированного спектрального представления, выполнения этапов применения действия отслеживания минимумов, применения действия отслеживания максимумов и формирования разности для получения дополнительной меры различия, и выбора между дополнительной мерой различия и значениями минимального уровня шума для получения максимальной оценки минимального уровня шума.

7. Способ по любому из пп.1-6, в котором спектральную огибающую высокочастотного диапазона исходного сигнала оценивают и дополнительно мультиплексируют в выходной сигнал кодера для использования в способе декодирования с использованием способа высокочастотного восстановления.

8. Устройство для усовершенствования системы кодирования исходного сигнала, причем упомянутая система кодирования исходного сигнала обеспечивает формирование кодированного сигнала путем кодирования исходного сигнала, содержащее средство (803) для оценки минимального уровня шума исходного сигнала, причем минимальный уровень шума является мерой различия между спектральной огибающей, определяемой точками локальных минимумов спектрального представления исходного сигнала, и другой спектральной огибающей, определяемой точками локальных максимумов спектрального представления исходного сигнала, и мультиплексор (805) для мультиплексирования кодированного сигнала и минимального уровня шума для получения выходного сигнала кодера.

9. Способ для усовершенствования системы декодирования исходного сигнала, причем упомянутая система декодирования исходного сигнала обеспечивает формирование декодированного сигнала путем декодирования кодированного сигнала, полученного путем кодирования исходного сигнала, при этом декодированный сигнал используется для высокочастотного восстановления для получения высокочастотного восстановленного сигнала, включающий этапы демультиплексирования (901) входного сигнала, включающего кодированный сигнал и минимальный уровень шума исходного сигнала, причем минимальный уровень шума является мерой различия между спектральной огибающей, определяемой точками локальных минимумов спектрального представления исходного сигнала, и спектральной огибающей, определяемой точками локальных максимумов спектрального представления исходного сигнала, получения (902) представления спектральной огибающей исходного сигнала, формирования спектра сигнала случайного шума в соответствии с представлением спектральной огибающей исходного сигнала для получения сигнала случайного шума со сформированным спектром, регулировки (906) сигнала случайного шума со сформированным спектром в соответствии с минимальным уровнем шума для получения отрегулированного сигнала случайного шума со сформированным спектром, и добавления (911) отрегулированного сигнала случайного шума со сформированным спектром к высокочастотному восстановленному сигналу.

10. Способ по п.9, в котором представление спектральной огибающей включает меру энергии для энергии высокочастотного восстановленного сигнала и минимального уровня шума, причем способ дополнительно включает этап регулировки высокочастотного восстановленного сигнала таким образом, что суммарная энергия высокочастотного сигнала и отрегулированного сигнала случайного шума со сформированным спектром соответствует мере энергии представления спектральной огибающей.

11. Способ по п.9, в котором этап регулировки сигнала случайного шума со сформированным спектром включает этап сглаживания уровня сигнала случайного шума со сформированным спектром по времени и/или частоте.

12. Способ по п.9, в котором спектральную огибающую высокочастотного восстановленного сигнала регулируют с использованием ограничения коэффициентов усиления регулирования огибающей.

13. Способ по п.9, в котором спектральную огибающую высокочастотного восстановления сигнала регулируют с использованием интерполяции.

14. Способ по п.9, в котором спектральную огибающую высокочастотного восстановленного сигнала регулируют с использованием сглаживания коэффициентов усиления регулирования огибающей.

15. Способ по п.9, в котором при высокочастотном восстановлении формируют сигнал, который является суммой различных высокочастотных восстановленных сигналов, получаемых из различных низкочастотных диапазонов частот, при этом способ дополнительно включает этап анализа упомянутого низкочастотного диапазона и обеспечения управляющих данных для суммирования, при котором суммируют различные высокочастотные восстановленные сигналы.

16. Устройство для усовершенствования системы декодирования исходного сигнала, причем упомянутая система декодирования исходного сигнала обеспечивает формирование декодированного сигнала путем декодирования кодированного сигнала, полученного путем кодирования исходного сигнала, при этом декодированный сигнал используется для высокочастотного восстановления для получения высокочастотного восстановленного сигнала, содержащий демультиплекстор для демультиплексирования входного сигнала, включающего кодированный сигнал и минимальный уровень шума исходного сигнала, причем минимальный уровень шума является мерой различия между спектральной огибающей, определяемой точками локальных минимумов спектрального представления исходного сигнала, и спектральной огибающей, определяемой точками локальных максимумов спектрального представления исходного сигнала, блок декодирования данных огибающей для получения представления спектральной огибающей исходного сигнала, блок формирования спектра сигнала случайного шума в соответствии с представлением спектральной огибающей исходного сигнала для получения сигнала случайного шума со сформированным спектром, блок регулировки для регулировки сигнала случайного шума со сформированным спектром в соответствии с минимальным уровнем шума для получения отрегулированного сигнала случайного шума со сформированным спектром и блок добавления отрегулированного сигнала случайного шума со сформированным спектром к высокочастотному восстановленному сигналу.

Описание изобретения к патенту

Настоящее изобретение касается систем кодирования исходного сигнала, использующих высокочастотное восстановление (ВЧВ) типа дублирования полосы спектра, ДПС [WO 98/57436] или связанные способы. Это улучшает эффективность как высококачественных способов ДПС, так и низкокачественных способов копирования [патент США №5127054]. Оно применимо к системам кодирования речи и к системам кодирования настоящих аудиосигналов. Кроме того, изобретение можно полезно использовать с кодеками (кодерами/декодерами) настоящих аудиосигналов с высокочастотным восстановлением или без него для снижения слышимого эффекта выключения частотных полос, обычно возникающего при условиях низкой скорости передачи данных в битах за счет применения адаптивного добавления минимального уровня шума.

Предшествующий уровень техники

Присутствие стохастических компонентов сигнала является важной особенностью многих музыкальных инструментов, а также человеческого голоса. Воспроизведение этих шумовых компонентов, которые обычно смешаны с другими компонентами сигнала, является решающим для естественного звучания воспринимаемого сигнала. В случае высокочастотного восстановления, при известных условиях, обязательным является добавление шума к восстанавливаемой высокочастотной полосе для обеспечения шумовых составляющих, подобных оригиналу. Эта потребность обусловлена тем, что большинство гармонических звуков, например, от язычковых или смычковых музыкальных инструментов, имеют более высокий относительный уровень шумов в области высоких частот по сравнению с низкочастотной областью. Кроме того, гармонические звуки иногда возникают вместе с высокочастотным шумом, результатом чего является сигнал, не имеющий подобия между уровнями шумов в высокочастотном диапазоне и низкочастотном диапазоне. В любом случае, частотные преобразования, то есть высококачественное ДПС, а также любой низкокачественный процесс копирования иногда испытывают недостаток шума в воспроизведенном высокочастотном диапазоне. Кроме того, процесс восстановления высокочастотного диапазона обычно включает в себя некоторый вид регулирования огибающей, где требуется избежать нежелательной подстановки шума для гармоник. Таким образом, необходимо иметь возможность добавлять и управлять уровнями шумов в процессе высокочастотного восстановления в декодере.

При условиях низкой скорости передачи в битах кодеки настоящих аудиосигналов обычно демонстрируют резкое отключение частотных полос. Это выполняется на покадровой основе, приводя к провалам в спектре, которые могут появляться произвольным образом по всему кодированному диапазону частот. Это может вызывать появление слышимых искажений. Данная проблема может быть решена адаптивным добавлением минимального уровня шума.

Некоторые известные системы кодирования аудиосигналов включают в себя средства для повторного формирования шумовых компонентов в декодере. Это позволяет кодеру опускать шумовые компоненты в процессе кодирования, повышая его эффективность. Однако, чтобы такие способы были успешными, шум, исключенный в процессе кодирования кодером, не должен содержать другие компоненты сигнала. Это сложное решение, основанное на схеме кодирования шума, приводит к относительно низкой скважности сигнала, поскольку большинство шумовых компонентов обычно смешивается, по времени и/или частоте, с другими компонентами сигнала. Кроме того, никакими средствами невозможно решить проблему недостаточного содержания шума в восстановленных высокочастотных диапазонах.

Сущность изобретения.

Настоящее изобретение направлено на решение проблемы недостаточного содержания шума в восстановленном высокочастотном диапазоне и провалов в спектре, обусловленных выключением частотных полос при низкой скорости передачи в битах, путем адаптивного добавления минимального уровня шума. Оно также предотвращает нежелательную подстановку шума для гармоник. Это выполняют посредством оценки минимального уровня шума в кодере и адаптивного добавления минимального уровня шума и ограничения нежелательной подстановки шума в декодере.

Способ адаптивного добавления минимального уровня шума и ограничения подстановки шума включает этапы оценки в кодере минимального уровня шума исходного сигнала с использованием повторителей минимумов и максимумов для спектрального представления исходного сигнала; отображения в кодере минимального уровня шума на разные частотные полосы или его представление с использованием ЛКП (линейного кодирования с предсказанием) или любого другого полиномиального представления; сглаживания в кодере или декодере минимального уровня шума по времени и/или частоте; формирования в декодере случайного шума в соответствии с представлением спектральной огибающей исходного сигнала, и регулирования шума в соответствии с минимальным уровнем шума, оцененным в кодере; сглаживания в декодере уровня шума по времени и/или частоте; добавления минимального уровня шума к высокочастотному восстановленному сигналу, либо в восстановленной высокочастотной полосе, либо в отключенных частотных полосах; регулирования в декодере спектральной огибающей высокочастотного восстановленного сигнала с использованием ограничения коэффициентов усиления регулирования огибающей; использования в декодере интерполяции принятой спектральной огибающей для повышенной разрешающей способности по частоте и, таким образом, улучшенной характеристики ограничителя; применения в декодере сглаживания для коэффициентов усиления регулирования огибающей; генерирования в декодере высокочастотного восстановленного сигнала, который представляет собой сумму отдельных высокочастотных восстановленных сигналов, получаемых из различных низкочастотных диапазонов частот, и анализа низкочастотного диапазона для получения управляющих данных для суммирования.

Краткое описание чертежей.

Настоящее изобретение описано ниже на примерах, не ограничивающих сущности и объема изобретения, со ссылками на чертежи, на которых представлено следующее:

фиг.1 - повторители минимумов и максимумов, применяемые к спектру с высоким и средним разрешением, и распределение минимального уровня шума по частотным полосам в соответствии с настоящим изобретением;

фиг.2 - минимальный уровень шума со сглаживанием по времени и частоте в соответствии с настоящим изобретением;

фиг.3 - спектр первоначального входного сигнала;

фиг.4 - спектр выходного сигнала процедуры ДПС без адаптивного добавления минимального уровня шума;

фиг.5 - спектр выходного сигнала с использованием ДПС и с адаптивным добавлением минимального уровня шума в соответствии с настоящим изобретением;

фиг.6 - коэффициенты усиления для блока фильтров регулирования спектральной огибающей в соответствии с настоящим изобретением;

фиг.7 - сглаживание коэффициентов усиления в блоке фильтров регулирования спектральной огибающей в соответствии с настоящим изобретением;

фиг.8 - возможная реализация настоящего изобретения в системе кодирования исходного сигнала на стороне кодера;

фиг.9 - возможная реализация настоящего изобретения в системе кодирования исходного сигнала на стороне декодера.

Описание предпочтительных вариантов осуществления изобретения.

Описанные ниже варианты осуществления изобретения поясняют принципы настоящего изобретения, предназначенного для усовершенствования систем высокочастотного восстановления. Понятно, что специалистам в данной области техники будут очевидны модификации и видоизменения описанных здесь устройств и деталей. Следовательно, они ограничены только объемом формулы изобретения, а не конкретными деталями, представленными здесь в качестве описания и пояснения вариантов осуществления изобретения.

Оценка минимального уровня шума.

При анализе спектра аудиосигнала с достаточной разрешающей способностью по частоте ясно видны форманты, отдельные синусоидальные составляющие и т.д., и в дальнейшем это называется точно структурированной спектральной огибающей. Однако, если используется низкое разрешение, точные детали наблюдать невозможно и это в дальнейшем называется грубо структурированной спектральной огибающей. Минимальным уровнем шума, хотя по определению это не обязательно шум, в настоящем изобретении называется отношение между грубо структурированной спектральной огибающей, интерполированной по точкам локальных минимумов в спектре с высоким разрешением, и грубо структурированной спектральной огибающей, интерполированной по точкам локальных максимумов в спектре с высоким разрешением. Это измерение получают путем вычисления БПФ (быстрого преобразования Фурье) с высоким разрешением для сегмента сигнала, и применения повторителей минимумов и максимумов (см. фиг.1). Затем вычисляют минимальный уровень шума как разность между повторителем максимумов и повторителем минимумов. При соответствующем сглаживании этого сигнала по времени и частоте получают меру минимального уровня шума. Функция повторителя максимумов и функция повторителя минимумов могут быть описаны в соответствии с уравнением (1) и уравнением (2),

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

где Т - коэффициент затухания, a X(k) - логарифмическое абсолютное значение спектра на линии k. Эта пара вычисляется для двух различных размеров БПФ, одного с высоким разрешением, а второго со средним разрешением, для получения хорошей оценки при наличии колебаний (vibratos) и квазистационарных звуков. Для повторителей максимумов и минимумов, применяемых к БПФ с высоким разрешением, осуществляется низкочастотная фильтрация для отбрасывания экстремальных значений. После получения двух оценок минимального уровня шума выбирается наибольшая. В одном из вариантов осуществления настоящего изобретения значения минимального уровня шума отображаются на множество частотных полос, однако также можно использовать другие отображения, например, многочлены подбора эмпирической кривой или коэффициенты ЛКП. Следует подчеркнуть, что при определении содержания шума в аудиосигнале можно использовать несколько различных подходов. Однако, как описано выше, задачей данного изобретения является оценка разности между локальными минимумами и максимумами в спектре с высоким разрешением, хотя это не обязательно должно быть точным измерением истинного уровня шумов. Другие возможные способы представляют собой линейное предсказание, автокорреляцию и т.д., они обычно используются в алгоритмах принятия жесткого решения о наличии шума или отсутствия шума (D. Schultz. Improving Audio Codecs by Noise Substitution. JAES, vol. 44, №7/8, 1996). Несмотря на то, что в этих способах стремятся измерять величину истинного шума в сигнале, они применимы для измерения минимального уровня шума, как определено в настоящем изобретении, хотя и не дают в равной степени хороших результатов, как в описанном выше способе. Также можно использовать метод анализа через синтез, то есть при наличии декодера в кодере, и оценивая таким образом корректное значение требуемой величины адаптивного шума.

Адаптивное добавление минимального уровня шума.

Для применения адаптивного минимального уровня шума необходимо иметь представление спектральной огибающей сигнала. Это может быть линейными значениями ИКМ (импульсно-кодовой модуляции) для реализации с помощью блоков фильтров или представлением ЛКП.Минимальный уровень шума формируется в соответствии с этой огибающей перед его регулированием до корректных уровней, в соответствии со значениями, принимаемыми декодером. Также можно регулировать уровни с дополнительным смещением, задаваемым в декодере.

В одном из вариантов осуществления декодера по настоящему изобретению принятые минимальные уровни шума сравниваются с верхним пределом, задаваемым в декодере, отображаются на различные каналы блока фильтров и затем сглаживаются низкочастотной фильтрацией как по времени, так и по частоте (см. фиг.2). Скопированный сигнал высокочастотного диапазона регулируется для получения корректного общего уровня сигнала после добавления к сигналу минимального уровня шума. Коэффициенты регулирования и энергии минимального уровня шума рассчитываются согласно уравнению(3) и уравнению(4),

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

где k указывает линию частоты, 1 - индекс времени для каждой выборки поддиапазона, sfb_nrg улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032 - представление огибающей, a nfулучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032 - минимальный уровень шума. Если шум сформирован с энергией "Уровень шума улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032", а амплитуда высокочастотного диапазона отрегулирована с помощью коэффициента "Коэффициент регулирования улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032", добавленный минимальный уровень шума и высокочастотная полоса будут иметь энергию в соответствии с выражением sfb_nrgулучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032. Пример результата вычислений алгоритма показан на фиг.3-5. Фиг.3 изображает спектр исходного сигнала, содержащего явно выраженную структуру форманты в низкочастотной полосе, но намного менее явную в высокочастотной полосе. Его обработка путем ДПС без адаптивного добавления минимального уровня шума дает результат, соответствующий фиг.4. Из нее очевидно, что хотя структура форманты скопированной высокочастотной полосы корректна, минимальный уровень шума слишком низок. Минимальный уровень шума, оцененный и применяемый согласно изобретению, дает результат, представленный на фиг.5, где показан минимальный уровень шума, наложенный на скопированную высокочастотную полосу. Польза адаптивного добавления минимального уровня шума здесь вполне очевидна как визуально, так и акустически.

Адаптация коэффициентов усиления преобразования.

Процесс идеального дублирования, с использованием множества коэффициентов преобразования, приводит к генерации большого количества гармонических составляющих, обеспечивая плотность распределения гармоник, подобную плотности распределения для оригинала. Ниже описан способ выбора соответствующих коэффициентов усиления для различных гармоник. Положим, что входной сигнал представляет собой гармонический ряд

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

Преобразование с коэффициентом преобразования 2 дает

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

Ясно, что каждая вторая гармоника в преобразуемом сигнале отсутствует. Для увеличения плотности гармоник к высокочастотной полосе добавляются гармоники преобразований более высоких порядков, М=3,5 и т.д. Для повышения эффективности использования большинства кратных гармоник важно соответствующим образом регулировать их уровни, чтобы избежать доминирования одной гармоники над другими в диапазоне частот наложения гармоник. Проблема, которая возникает при осуществлении этого способа, состоит в том, каким образом учитывать различия в уровнях сигналов между исходными диапазонами гармоник. Эти разности также имеют тенденцию изменяться в разных программных материалах, что затрудняет использование постоянных коэффициентов усиления для различных гармоник. Ниже поясняется способ регулирования уровня гармоник, который учитывает спектральное распределение в низкочастотном диапазоне. Результаты преобразований подаются через регуляторы усиления, складываются и посылаются на блок фильтров регулирования огибающей. Также в этот блок фильтров посылается сигнал низкочастотного диапазона, разрешающий его спектральный анализ. В настоящем изобретении оцениваются мощности сигналов исходных диапазонов, соответствующих различным коэффициентам преобразования, и в соответствии с этим регулируются коэффициенты усиления гармоник. Более сложное решение заключается в оценке наклона спектра низкочастотного диапазона и его компенсации до блока фильтров, используя простые реализации фильтров, например, задерживающие (shelving) фильтры. Важно отметить, что эта процедура не влияет на функциональные возможности сглаживания блока фильтров и что низкочастотный диапазон, анализируемый блоком фильтров, точно также не синтезируется заново.

Ограничение подстановки шума.

Согласно вышеупомянутому (уравнения 5 и 6), скопированный высокочастотный диапазон может содержать провалы в спектре. Алгоритм регулирования огибающей стремится сделать спектральную огибающую восстановленной высокочастотной полосы подобной огибающей оригинала. Предположим, что исходный сигнал имеет высокую энергию внутри частотной полосы, и что преобразованный сигнал имеет провал в спектре внутри этой частотной полосы. Это означает, что если для коэффициентов усиления допустимо принимать произвольные значения, то для этой частотной полосы будет применяться очень высокий коэффициент усиления и шум или другие нежелательные компоненты сигнала будут регулироваться на такую же энергию, как энергия оригинала. Это определяется как нежелательная подстановка шума. Допустим, что

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

являются масштабными коэффициентами исходного сигнала в данный момент времени, а

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

представляют соответствующие масштабные коэффициенты преобразуемого сигнала, где каждый элемент двух векторов представляет энергию поддиапазона, нормализованную по времени и частоте. Требуемые коэффициенты усиления для блока фильтров регулирования спектральной огибающей получены как

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

Исходя из полученного G, можно просто определить частотные полосы с нежелательной подстановкой шума, поскольку они демонстрируют значительно более высокие коэффициенты усиления, чем другие. Таким образом, легко избежать нежелательной подстановки шума, применяя к коэффициентам усиления ограничитель, то есть позволяя им свободно изменяться до определенного предела, gmax. Используя ограничитель шума, получают коэффициенты усиления

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

Однако это выражение показывает только основной принцип ограничителей шума. Поскольку спектральная огибающая преобразована и исходный сигнал может значительно отличиться и по уровню, и по наклону, невозможно использовать постоянные значения для gmax. Вместо этого рассчитывают средний коэффициент усиления, определяемый как

улучшение перцепционной характеристики дублирования полосы   спектра и связанных способов кодирования высокочастотного   восстановления путем адаптивного добавления минимального   уровня шума и ограничения подстановки шумов, патент № 2226032

а для коэффициентов усиления допустимо превышение этих значений на некоторую величину. Для учета широкополосных изменений уровня, два вектора P1 и P2 также можно делить на различные подвекторы и соответствующим образом их обрабатывать. Таким образом, получена очень эффективная схема ограничения шума, не создающая помех и не ограничивающая функциональные возможности регулирования уровня сигналов поддиапазонов, содержащих полезную информацию.

Интерполяция.

Обычно в кодерах аудиосигналов поддиапазона группируют каналы анализирующего блока фильтров при формировании масштабных коэффициентов. Масштабные коэффициенты представляют оценку спектральной плотности внутри полосы частот, содержащей сгруппированные каналы анализирующего блока фильтров. Для получения самой низкой возможной скорости передачи информации в битах желательно минимизировать количество передаваемых масштабных коэффициентов, что подразумевает использование по возможности больших групп каналов фильтров. Обычно это выполняют, группируя частотные полосы в соответствии с масштабом Барка (Bark-scale), таким образом используя логарифмическую разрешающую способность по частоте органов слуха человека. Это можно обеспечить в блоке фильтров регулирования огибающей ДПС-декодера, группируя каналы идентично группированию, используемому при вычислении масштабных коэффициентов в кодере. Однако блок фильтров регулирования все еще может функционировать на основании каналов блока фильтров, интерполируя значения полученных масштабных коэффициентов. Самый простой способ интерполяции состоит в том, чтобы назначать каждому каналу блока фильтров в группе, используемой для вычисления масштабных коэффициентов, значение масштабного коэффициента. Преобразуемый сигнал также анализируется, и рассчитывается масштабный коэффициент на канал блока фильтров. Эти масштабные коэффициенты и интерполируемые коэффициенты, представляющие первоначальную спектральную огибающую, используются для вычисления коэффициентов усиления согласно вышеупомянутому способу. У этой схемы интерполяции частотной области имеются два главных преимущества. Преобразуемый сигнал обычно имеет более редкий спектр, чем оригинал. Таким образом, спектральное сглаживание является выгодным и делается более эффективным, когда оно действует на узких частотных полосах, по сравнению с широкими полосами. Другими словами, сформированные гармоники можно лучше изолировать и управлять ими с помощью блока фильтров регулирования огибающей. Кроме того, характеристика ограничителя шума улучшается, поскольку провалы в спектре можно лучше оценивать и контролировать с более высокой разрешающей способностью по частоте.

Сглаживание.

После получения соответствующих коэффициентов усиления предпочтительно применяется сглаживание по времени и частоте, чтобы избежать наложения спектра и переходного процесса в виде затухающих колебаний при регулировке блока фильтров, а также пульсации коэффициентов усиления. На фиг.6 изображены коэффициенты усиления, подлежащие перемножению с соответствующими выборками поддиапазонов. На чертеже показаны два блока с высоким разрешением, сопровождаемые тремя блоками с низким разрешением и одним блоком с высоким разрешением. Также показано снижение разрешающей способности по частоте на верхних частотах. Резкость контуров, иллюстрируемая на фиг.6, устранена в случае фиг.7 фильтрованием коэффициентов усиления как по времени, так и по частоте, например, с использованием взвешенного скользящего среднего значения. Однако важно сохранять переходную структуру для коротких блоков по времени, чтобы не снижать переходную характеристику в копируемом частотном диапазоне. Точно так же важно не выполнять избыточное фильтрование коэффициентов усиления для блоков с высоким разрешением, чтобы сохранить формантную структуру копируемого частотного диапазона. На фиг.7 фильтрация намеренно преувеличена для лучшей наглядности.

Практические реализации.

Настоящее изобретение можно реализовать на аппаратных микросхемах и в программах цифровой записи и воспроизведения аудиосигнала, для различных видов систем, для хранения или передачи сигналов, аналоговых или цифровых, с использованием различных кодеков. На фиг.8 и фиг.9 показана возможная реализация настоящего изобретения. Здесь высокочастотное восстановление выполнено посредством дублирования полосы спектра (ДПС). На фиг.8 показан кодер. Аналоговый входной сигнал подается на аналого-цифровой преобразователь 801 и на произвольный кодер 802 аудиосигнала, а также в блок 803 оценки минимального уровня шума и блок 804 выделения огибающей. Кодированная информация мультиплексируется (805) в последовательный битовый поток и передается или запоминается. На фиг.9 показана типовая реализация декодера. Последовательный битовый поток демультиплексируется (901), и данные огибающей декодируются (902) для получения спектральной огибающей высокочастотного диапазона и минимального уровня шума. Демультиплексированный исходный кодированный сигнал декодируется с использованием произвольного декодера 903 аудиосигнала и дополнительно дискретизируется (904). В блоке 905 применяется ДПС-преобразование. В этом блоке усиливаются различные гармоники с использованием информации обратной связи с анализирующего блока фильтров 908, согласно настоящему изобретению. Данные минимального уровня шума посылаются в блок 906 добавления адаптивного минимального уровня шума, где вырабатывается минимальный уровень шума. Спектральные данные огибающей интерполируются (907), коэффициенты усиления ограничиваются (909) и сглаживаются (910), в соответствии с настоящим изобретением. Восстановленный высокочастотный диапазон регулируется (911) и добавляется адаптивный шум. В заключение сигнал повторно синтезируется (912) и добавляется к задержанному (913) низкочастотному диапазону. Цифровой выходной сигнал преобразуется обратно в аналоговую форму сигнала (914).

Класс H03M13/01 основные предположения теории кодирования; границы кодирования; способы оценки вероятности ошибки; модели каналов связи; моделирование или проверка кодов

устройство моделирования канала связи -  патент 2319301 (10.03.2008)
способ моделирования канала связи -  патент 2254675 (20.06.2005)
устройство и способ нормализации величин показателей в компонентном декодере в системе подвижной связи -  патент 2226033 (20.03.2004)

Класс H03M13/37 способы декодирования или устройства, не предназначенные для конкретного вида кодирования, отнесенного к подгруппам  13/03

Наверх