низведение параметров последовательности битов sbr
Классы МПК: | G10L19/00 Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи G10L21/02 усиление речи, например подавление шума, нейтрализация эхо-сигнала |
Автор(ы): | ЧОЭРЛИНГ Кристофер (SE), ТЕЗИНГ Робин (DE) |
Патентообладатель(и): | ДОЛБИ ИНТЕРНЕШНЛ АБ (NL) |
Приоритеты: |
подача заявки:
2010-12-14 публикация патента:
27.08.2014 |
Изобретение относится к средствам декодирования и/или транскодирования звука. Технический результат заключается в уменьшении сложности процесса уменьшения числа каналов при сохранении релевантной высокочастотной информации о каналах. Объединяют первый и второй исходные наборы параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Первый и второй исходные наборы включают первое и второе разбиения полосы частот соответственно, которые отличны друг от друга. Первый исходный набор включает первый набор энергозависимых значений, связанных с полосами частот первого разбиения полосы частот. Второй исходный набор включает второй набор энергозависимых значений, связанных с полосами частот второго разбиения полосы частот. Конечный набор включает конечный набор энергозависимых значений, связанных с элементарной полосой частот. Способ включает этапы разделения первого и второго разбиений полосы частот в объединенную координатную сетку, включающую элементарную полосу частот; назначение первого значения первого набора энергозависимых значений в элементарную полосу частот; назначение второго значения второго набора энергозависимых значений в элементарную полосу частот; и объединение первого и второго значений для получения конечного энергозависимого значения элементарной полосы частот. 9 н. и 23 з.п. ф-лы, 9 ил.
Формула изобретения
1. Способ объединения первого (201, 512) и второго (202, 522) исходных наборов параметров репликации полосы спектра, далее именуемых как параметры SBR, в конечный набор (206, 532) параметров SBR, в котором:
- первый (201, 512) и второй (202, 522) исходные наборы включают первое (513, 514) и второе (523, 524, 525) разбиения полосы частот соответственно, которые отличны друг от друга;
- первый исходный набор (201, 512) включает первый набор энергозависимых значений (515, 516, 517), связанных с полосами частот (511) первого разбиения полосы частот (513, 514);
- второй исходный набор (202, 522) включает второй набор энергозависимых значений (526, 527, 528, 529), связанных с полосами частот второго разбиения полосы частот (523, 524, 525);
и
- конечный набор (206, 532) включает конечный набор энергозависимых значений, связанных с элементарной полосой частот (543);
включающий:
- разделение первого (513, 514) и второго (523, 524, 525) разбиений полосы частот на объединенную координатную сетку (541, 542), включающую элементарную полосу частот (543);
- назначение элементарной полосе (543) частот первого значения (517) первого набора энергозависимых значений (515, 516, 517);
- назначение элементарной полосе частот (543) второго значения (529) второго набора энергозависимых значений;
- объединение первого (517) и второго (519) значений для получения конечного энергозависимого значения (533) элементарной полосы частот (543).
2. Способ по п.1, отличающийся тем, что:
- первое значение (517) соответствует энергозависимому значению, связанному с полосой частот (511) первого разбиения полосы частот (513, 514), которая включает элементарную полосу частот (543); и
- второе значение (529) соответствует энергозависимому значению, связанному с полосой частот второго разбиения полосы частот (523, 524, 525), которая включает элементарную полосу частот (543).
3. Способ по п.2, отличающийся тем, что:
- объединенная координатная сетка (541, 542) с набором квадратурных зеркальных фильтров, именуемым далее набором QMF, используемая для определения параметров SBR; и
- элементарная полоса частот (543) является поддиапазоном QMF.
4. Способ по п.3, отличающийся тем, что дополнительно включает:
- нормирование конечного энергозависимого значения (543) с помощью числа используемых исходных наборов.
5. Способ по п.4, в котором конечный набор (206, 532) включает набор конечных энергозависимых значений (533), отличающийся тем, что дополнительно включает:
- повторение этапов назначения и этапов объединения для всех элементарных полос частот (543) объединенной координатной сетки (541, 542), получая таким образом набор конечных энергозависимых значений (533).
6. Способ по п.5, в котором конечный набор (206, 532) включает конечное разбиение полосы частот с помощью предварительно назначенной полосы частот; и отличающийся тем, что дополнительно включает:
- усреднение набора конечных энергозависимых значений (533), связанных с элементарными полосами частот (543), включенного в конечную полосу частот; и
- назначение усредненного значения в качестве конечного энергозависимого значения конечной полосы частот.
7. Способ по п.6, отличающийся тем, что:
- энергозависимые значения являются энергиями коэффициента масштабирования, а полосы частот являются полосами коэффициента масштабирования; и/или
- энергозависимые значения являются полосами коэффициента масштабирования собственных шумов, а полосы частот являются полосами коэффициента масштабирования уровня собственных шумов.
8. Способ по п.7, отличающийся тем, что:
- первый исходный набор (201, 512) связан с первым низкочастотным сигналом первого исходного канала;
- второй исходный набор (202, 522) связан со вторым низкочастотным сигналом второго исходного канала; и
- конечный набор (206, 532) связан с конечным сигналом нижнего диапазона конечного канала, полученным из уменьшения числа каналов временной области первого и второго сигналов нижнего диапазона.
9. Способ по п.8, отличающийся тем, что:
- конечное энергозависимое значение (533) связано с конечным временным интервалом конечного сигнала нижнего диапазона;
- первый набор энергозависимых значений (515, 516, 517) связан с первым временным интервалом первого сигнала нижнего диапазона, в котором первый временной интервал перекрывает конечный временной интервал; и
- при этом этап объединения включает: масштабирование первого значения (517) в соответствии с отношением, представленным длиной перекрытия первого временного интервала и конечного временного интервала, а также длиной конечного временного интервала; и объединение масштабированного первого (517) и второго значений (529).
10. Способ по п.9, в котором:
- первый исходный набор (201, 512) включает третье разбиение полосы частот;
- первый исходный набор (201, 512) включает третий набор энергозависимых значений, связанных с полосами частот третьего разбиения полосы частот;
- третий набор энергозависимых значений связан с третьим временным интервалом первого сигнала нижнего диапазона, в котором третий временной интервал перекрывает конечный временной интервал;
отличающийся тем, что дополнительно включает:
- разделение третьего разбиения полосы частот на объединенную координатную сетку (541, 542), включающую элементарную полосу частот (543);
- назначение элементарной полосе частот (543) третьего значения третьего набора энергозависимых значений; и
где включен этап объединения:
- масштабирование третьего значения в соответствии с отношением, представленным длиной перекрытия третьего временного интервала и конечного временного интервала и длиной конечного временного интервала; и
- объединение масштабированного первого значения (517), второго значения (529) и масштабированного третьего значения.
11. Способ по п.8, отличающийся тем, что дополнительно включает:
- масштабирование первого набора энергозависимых значений (515, 516, 517) с помощью первого коэффициента уменьшения числа каналов; и
- масштабирование второго набора энергозависимых значений (526, 527, 528, 529) с помощью второго коэффициента уменьшения числа каналов;
при этом первый и второй коэффициенты уменьшения числа каналов связаны с первым и вторым исходными каналами соответственно.
12. Способ по п.11, отличающийся тем, что до этапов масштабирования выполняют:
- взвешивание первого и второго коэффициентов уменьшения числа каналов с помощью коэффициента компенсации энергии; в котором коэффициент компенсации энергии связан с взаимодействием первого и второго низкочастотных сигналов в течение временного низведения.
13. Способ по п.12, отличающийся тем, что:
- коэффициент компенсации энергии связан с отношением энергии конечного низкочастотного сигнала к объединенной энергии первого и второго низкочастотных сигналов.
14. Способ по п.13, отличающийся тем, что:
- выполняют объединение N исходных каналов, где N 2, для получения M конечных каналов, где M<N и M 1;
- коэффициент компенсации энергии fcomp дан с помощью:
- xin[chin][n] - сигнал нижнего диапазона временной области в исходном канале chin, cchin - коэффициент уменьшения числа каналов для исходного канала chin,
- xdmx[chout][n] - сигнал нижнего диапазона временной области конечного канала chout, а n - выборочный указатель импульсного сигнала в цикле сигналов временной области.
15. Способ по п.14, в котором:
- первый исходный набор (201, 512) включает первую начальную частоту (551);
- второй исходный набор (202, 522) включает вторую начальную частоту (552);
- первая (551) и вторая (552) начальные частоты различаются и связаны с нижними границами первого (513, 514) и второго (523, 524, 525) разбиений полосы частот соответственно; и
отличающийся тем, что дополнительно включает:
- сравнение первой (551) и второй (552) начальных частот;
- выбор более высокой или более низкой из первой (551) и второй (552) начальных частот в качестве начальной частоты (553) конечного набора.
16. Способ по п.15, отличающийся тем, что:
- первый исходный набор (201, 512) включает первый заголовок элемента SBR, включая первую начальную частоту(551);
- второй исходный набор (202, 522) включает второй заголовок элемента SBR, включая вторую начальную частоту (552);
в котором способ далее включает:
- выбор заголовка элемента SBR конечного набора (206, 532) на основе первого или второго заголовка элемента SBR в соответствии с выбранной начальной частотой (553) конечного набора (206, 532).
17. Способ по п.16, отличающийся тем, что:
- если конечный набор (206, 532) является элементом канальной пары и исходные наборы (201, 512, 202, 522) включают, по меньшей мере, один элемент канальной пары, то заголовок элемента SBR конечного набора (206, 532) выбирается из одного из исходных наборов (201, 512, 202, 522), который включает элемент канальной пары;
- если конечный набор (206, 532) является элементом канальной пары и ни один из исходных наборов (201, 512, 202, 522) не включает элемент канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, выбирается в качестве основы для заголовка элемента SBR конечного набора;
- если конечный набор (206, 532) представляет собой одиночный элемент канальной пары и, по меньшей мере, один из исходных наборов (201, 512, 202, 522) включает одиночный элемент канальной пары, то заголовок элемента SBR конечного набора (206, 532) выбирается как заголовок элемента SBR одного из исходных наборов, который включает одиночный элемент канальной пары; и/или
- если конечный набор (206, 532) является одиночным элементом канальной пары и все исходные наборы (201, 512, 202, 522) являются элементами канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, может использоваться в качестве основы для заголовка элемента SBR конечного набора (206, 532).
18. Способ по любому из предшествующих пунктов, в котором:
- первый исходный набор (201) включает показатель первой динамической огибающей; где показатель первой динамической огибающей идентифицирует первую динамическую огибающую (414) с первым пределом начального времени (417);
- второй исходный набор (202) включает показатель второй динамической огибающей; где показатель второй динамической огибающей идентифицирует вторую динамическую огибающую (423) со вторым пределом начального времени (426);
- конечный набор (206) включает множество конечных огибающих, при этом каждая из них имеет предел начального времени;
- первая динамическая огибающая (414), вторая динамическая огибающая (423) и множество конечных огибающих могут быть связаны с одним или несколькими временными интервалами первого звукового сигнала, второго звукового сигнала и конечного сигнала соответственно;
отличающийся тем, что дополнительно включает:
- выбор более раннего первого (426) или второго (417) предела начального времени;
- определение в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему (426) из первого (417) и второго (426) пределов начального времени; и
- установку показателя конечной динамической огибающей для ее идентификации.
19. Способ объединения первого (201, 512) и второго (202, 522) исходных наборов параметров SBR в конечный набор (206, 532) параметров SBR, в котором
- первый исходный набор (201, 512) включает первую начальную частоту (551);
- второй исходный набор (202, 522) включает вторую начальную частоту (552);
- первая (551) и вторая (552) начальные частоты отличаются и связаны с более низкими пределами полосы частот первого и второго сигналов верхнего диапазона, связанного с первым (201, 512) и вторым (202, 522) исходными наборами параметров SBR соответственно; и
при этом включающий:
- сравнение первой (551) и второй (552) начальных частот;
- выбор более высокой или более низкой из первой (551) и второй (552) начальных частот в качестве начальной частоты (553) конечного набора (206, 532).
20. Способ по п.19, в котором:
- первый исходный набор (201, 512) может включать первый заголовок элемента SBR, включая первую начальную частоту (551);
- второй исходный набор (202, 522) может включать второй заголовок элемента SBR, включая вторую начальную частоту (552);
отличающийся тем, что дополнительно включает:
- выбор заголовка элемента SBR конечного набора (206, 532) на основе первого или второго заголовка элемента SBR в соответствии с выбранной начальной частотой (553) конечного набора (206, 532).
21. Способ объединения первого (201, 512) и второго (202, 522) исходных наборов параметров SBR в конечный набор (206, 532) параметров SBR, в котором:
- первый исходный набор (201, 512) связан с первым сигналом нижнего диапазона первого исходного канала и включает первый набор энергий коэффициента масштабирования (515, 516, 517);
- второй исходный набор (202, 522) связан со вторым сигналом нижнего диапазона второго исходного канала и включает второй набор энергий коэффициента масштабирования (526, 527, 528, 529);
- конечный набор (206, 532) связан с конечным сигналом нижнего диапазона конечного канала, полученным из уменьшения числа каналов временной области первого и второго сигналов нижнего диапазона; и
- конечный набор (206, 532) включает конечный набор энергий коэффициента масштабирования (533);
и при этом включающий:
- взвешивание первого и второго коэффициентов уменьшения числа каналов с помощью коэффициента компенсации энергии; где первый коэффициент уменьшения числа каналов связан с первым исходным каналом; где второй коэффициент уменьшения числа каналов связан со вторым исходным каналом; и где коэффициент компенсации энергии связан с взаимодействием первого и второго сигналов нижнего диапазона во время уменьшения числа каналов временной области;
- масштабирование первого набора энергий коэффициента масштабирования (515, 516, 517), используя первый коэффициент уменьшения числа каналов;
- масштабирование второго набора энергий коэффициента масштабирования (526, 527, 528, 529), используя второй коэффициент уменьшения числа каналов; и
- определение конечного набора энергий коэффициента масштабирования (533) из масштабированных первого (515, 516, 517) и второго (526, 527, 528, 529) наборов энергий коэффициента масштабирования.
22. Способ по п.21, отличающийся тем, что коэффициент компенсации энергии связан с отношением энергии конечного низкочастотного сигнала к объединенной энергии первого и второго низкочастотных сигналов.
23. Способ объединения первого (201) и второго (202) исходных наборов параметров SBR в конечный набор (206) параметров SBR, в котором:
- первый исходный набор (201) включает показатель первой динамической огибающей; где показатель первой динамической огибающей идентифицирует первую динамическую огибающую (414) с первым пределом начального времени (417);
- второй исходный набор (202) включает показатель второй динамической огибающей; где показатель второй динамической огибающей идентифицирует вторую динамическую огибающую (423) со вторым пределом начального времени (426);
- конечный набор включает множество конечных огибающих, при этом каждая из них имеет предел начального времени;
- первая динамическая огибающая (414), вторая динамическая огибающая (423) и множество конечных огибающих могут быть связаны с одним или несколькими временными интервалами первого звукового сигнала, второго звукового сигнала и конечного сигнала соответственно;
и при этом включающий:
- выбор более раннего первого (417) или второго (426) предела начального времени;
- определение в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему (426) из первого (417) и второго (426) пределов начального времени; и
- установку показателя конечной динамической огибающей для ее идентификации.
24. Способ по п.23, отличающийся тем, что включает этап определения в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени (426) ближе всех к самому раннему из первого (417) и второго (426) пределов начального времени, но не позже более раннего первого или второго предела начального времени.
25. Способ по п.24, отличающийся тем, что каждый исходный набор параметров SBR соответствует параметрам SBR, связанным с каналом последовательности битов HE-AAC.
26. Способ объединения N исходных наборов (201, 202, 203, 204, 205) параметров SBR в М конечных наборов (208, 209) параметров SBR, при этом
- N больше 2;
- M меньше N; включающий:
- объединение пары (201, 202) исходных наборов для получения промежуточного набора (206); и
- объединение промежуточного набора (206) с исходным (204) или другим промежуточным набором для получения конечного набора (208),
отличающийся тем, что этапы объединения выполняют в соответствии со способом по любому из пп.1-25.
27. Способ по п.26, отличающийся тем, что исходные наборы, соответствующие исходным каналам более высокой звуковой релевантности, объединяются менее часто, чем исходные наборы, соответствующие исходным каналам более низкой звуковой релевантности.
28. Блок объединения параметров SBR (112), сконфигурированный для обеспечения M конечных наборов (208, 209) параметров SBR от N исходных наборов (201, 202, 203, 204, 205) параметров SBR, где N>M 1, блок объединения параметров SBR, включающий процессор, сконфигурированный для выполнения любого этапа способа по пп.1-27.
29. Декодер звукового канала, сконфигурированный для декодирования последовательности битов НЕ-ААС, включающей N звуковых каналов, и включающий:
- декодер ААС, сконфигурированный для приема последовательности битов НЕ-ААС и для обеспечения отдельной последовательности битов SBR;
- декодер SBR, сконфигурированный для обеспечения N исходных наборов параметров SBR, соответствующих числу N звуковых каналов из последовательности битов SBR; и
- блок объединения SBR (112), сконфигурированный для обеспечения М конечных наборов параметров SBR от N исходных наборов параметров SBR, где N>M 1.
30. Декодер звукового канала по п.29, в котором декодер AAC сконфигурирован для обеспечения N звуковых сигналов нижнего диапазона временной области, соответствующих числу N звуковых каналов; и в котором декодер звукового канала далее включает:
- блок уменьшения каналов временной области, сконфигурированный для обеспечения звуковых сигналов нижнего диапазона временной области из числа N звуковых сигналов нижнего диапазона временной области; и
- блок SBR, сконфигурированный для формирования звуковых сигналов верхнего диапазона из числа М звуковых сигналов нижнего диапазона и конечных наборов М параметров SBR;
отличающийся тем, что декодер звукового сигнала сконфигурирован для обеспечения М звуковых сигналов, содержащих М звуковых сигналов нижнего диапазона и М звуковых сигналов верхнего диапазона соответственно.
31. Звуковой транскодер, сконфигурированный для обеспечения последовательности битов НЕ-AAC, включающей М звуковых сигналов из последовательности битов НЕ-ААС, включающей N звуковых каналов, где N>M 1, и включающий:
- блок объединения параметров SBR (112) по п.28.
32. Электронное устройство, сконфигурированное для выдачи М звуковых сигналов, соответствующих числу М каналов из последовательности битов НЕ-ААС, включающей N звуковых каналов, где N>M 1, и включающее:
- средства передачи звука, сконфигурированные для выполнения акустической передачи М звуковых сигналов;
- приемник, сконфигурированный для приема последовательности битов НЕ-ААС; и
- звуковой декодер, сконфигурированный для получения М звуковых сигналов из последовательности битов НЕ-ААС по любому из пп.29-30.
Описание изобретения к патенту
ОБЛАСТЬ ТЕХНИКИ
Настоящий документ относится к декодированию и/или транскодированию звука. В частности, настоящий документ относится к схеме для эффективного декодирования числа М звуковых каналов из последовательности битов, содержащей большее число N звуковых каналов.
УРОВЕНЬ ТЕХНИКИ
Декодер звука, соответствующий стандарту высокоэффективного перспективного звукового кодирования (High-Efficiency Advanced Audio Coding, HE-AAC), в основном предназначен для декодирования и вывода числа N каналов звуковых данных, которые должны быть воспроизведены отдельными динамиками, установленными на заранее определенных позициях. Обычно последовательность битов, закодированная с помощью HE-AAC, включает данные, относящиеся к числу N сигналов низкочастотного диапазона, соответствующему числу N звуковых сигналов, а также закодированные параметры SBR (Spectral Band Replication, воспроизведение полосы спектра) для восстановления числа N сигналов высокочастотного диапазона, соответствующих сигналам низкочастотного диапазона.
При определенных обстоятельствах может потребоваться, чтобы декодер HE-AAC снизил число выходных каналов до значения М (М меньше N), сохраняя при этом звуковые события из всех N каналов. Один пример использования такого уменьшения каналов представляет собой мобильное устройство, которое может воспроизводить число N каналов при подключении к многоканальной системе домашнего кинотеатра, но которое ограничено встроенным моно- или стереовыходом при автономном использовании.
Возможный способ получения числа M выходов или конечных каналов из выхода N или исходных каналов заключается в уменьшении числа каналов временной области декодированного сигнала N-каналов. В таких системах закодированная последовательность битов, представляющая число N каналов, сначала декодируется в N выходных звуковых сигналов временной области, которые затем принудительно уменьшаются во временной области до M звуковых сигналов, соответствующих числу M каналов. Недостатком такого подхода является величина вычислительных ресурсов и ресурсов памяти, необходимых для первого декодирования всех N звуковых сигналов, соответствующих числу N каналов, и затем уменьшение N декодированных звуковых сигналов в M уменьшенных звуковых сигналов.
Технический стандарт ETSI (TS) 126 402 (3GPP TS 26.402) в разделе 6 описывает способ, называемый «Уменьшение каналов стереопараметра в монопараметр SBR». Этот документ включен в настоящую заявку посредством ссылки. Технический стандарт ETSI описывает процесс соединения параметров SBR для извлечения моноканала SBR из пары каналов SBR. Указанный способ, однако, ограничен принудительным уменьшением стереосигнала в моносигнал, где каналы представлены в виде элемента канальной пары (CPE).
На основании вышеизложенного необходимо иметь схему низкой сложности, предназначенную для уменьшения числа каналов из произвольного числа каналов N в произвольное число каналов M. В частности, необходимо иметь схему уменьшения числа каналов для параметров SBR, связанных с N каналами, в параметры SBR, связанные с М каналами, в которых схема уменьшения числа каналов сохраняет релевантную высокочастотную информацию о различных каналах.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
В настоящем документе описываются способы и системы, которые обеспечивают эффективный способ снижения выходных или конечных каналов в декодере HE-AAC, в то же время предохраняя звуковые события от всех входов или исходных каналов. Способы и системы обеспечивают уменьшение числа каналов от произвольного числа каналов N в произвольное число каналов М, где M меньше N. Способы и системы могут быть реализованы при сниженной вычислительной сложности в сравнении с уменьшением каналов во временной области. Следует отметить, что описанные способы и системы применимы к любым многоканальным декодерам, использующим SBR для высокочастотного восстановления. В частности, описанные способы и системы не ограничены закодированными последовательностями битов HE-AAC. К тому же, следует отметить, что следующие аспекты описаны для соединения первого и второго исходных каналов в конечный канал. Эти термины следует понимать как «минимум первый», «минимум второй» и «минимум конечный» каналы и, следовательно, применяются для соединения произвольного числа N исходных каналов в произвольное число М конечных каналов.
В соответствии с этим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Исходный набор параметров SBR может соответствовать параметрам SBR, связанным со звуковыми каналами последовательности битов HE-AAC. Исходный и/или конечный наборы параметров SBR могут соответствовать параметрам SBR цикла звукового сигнала отдельного звукового канала. В этом качестве первый исходный набор может соответствовать первому звуковому сигналу первого звукового канала, второй исходный набор может соответствовать второму звуковому сигналу второго звукового канала, а конечный набор может соответствовать конечному звуковому сигналу конечного канала. Исходный и/или конечный наборы параметров SBR могут содержать информацию, которая используется для формирования высокочастотной составляющей соответствующего звукового сигнала из низкочастотной составляющей соответствующего звукового сигнала. В частности, набор параметров SBR может содержать информацию относительно огибающей спектра высокочастотной составляющей в пределах предварительно назначенного временного интервала цикла соответствующего звукового сигнала. Спектральная информация, содержащаяся в таком временном интервале, обычно называется «огибающая».
Первый и второй исходные наборы, и, в частности, огибающие первого и второго исходных наборов, могут включать первое и второе разбиения полосы частот соответственно. Эти первое и второе разбиения полосы частот могут отличаться друг от друга. Первый исходный набор может включать первый набор энергозависимых значений, связанных с полосами частот первого разбиения полосы частот; а второй исходный набор может включать второй набор энергозависимых значений, связанных с полосами частот второго разбиения полосы частот. Конечный набор может включать конечный набор энергозависимых значений, связанных с элементарной полосой частот.
Такие энергозависимые значения могут быть энергиями коэффициента масштабирования, а полосы частот могут быть полосами коэффициента масштабирования. В ином случае или в дополнение, энергозависимые значения могут быть энергиями коэффициента масштабирования уровня собственных шумов, а полосы частот могут быть полосами коэффициента масштабирования уровня собственных шумов.
Этот способ может включать этап разделения первого и второго разбиений полосы частот на объединенной координатной сетке, включающей элементарную полосу частот. Первое и второе разбиения полосы частот могут перекрывать частотный диапазон высокочастотной составляющей соответствующего звукового сигнала. Этот частотный диапазон может быть разделен на объединенную координатную сетку частот. Объединенная координатная сетка может быть связана с набором квадратурных зеркальных фильтров (набор QMF), который применяется для определения параметров SBR. В частности, набор QMF может применяться на стадии анализа для определения спектральной сегментации высокочастотной составляющей соответствующего звукового сигнала в поддиапазоны QMF. Такой поддиапазон QMF может являться элементарной полосой частот объединенной координатной сетки частот.
Следует отметить, что первое разбиение полосы частот может перекрывать другой частотный диапазон, а не второе разбиение полосы частот. В частности, начальная частота первого разбиения полосы частот, то есть нижняя граница первого разбиения полосы частот, может отличаться от начальной частоты второго разбиения полосы частот, то есть нижней границы второго разбиения полосы частот. Обычно объединенная координатная сетка частот покрывает перекрывающийся диапазон первого и второго разбиений полосы частот. В частности, полосы частот или одна или несколько частей полосы частот, которые находятся ниже самой высокой из начальных частот, не могут рассматриваться.
Способ может включать назначение первого значения первого набора энергозависимых значений в элементарную полосу частот; и/или назначение второго значения второго набора энергозависимых значений в элементарную полосу частот. Первый этап назначения может быть выполнен таким образом, что первое значение соответствует энергозависимому значению, связанному с полосой частот первого разбиения полосы частот, которая включает элементарную полосу частот. Второй этап назначения может быть выполнен таким образом, что второе значение соответствует энергозависимому значению, связанному с полосой частот второго разбиения полосы частот, которая включает элементарную полосу частот.
Способ может включать этап суммирования, например добавления и/или масштабирования, первого и второго значений для получения конечного энергозависимого значения для элементарной полосы частот. К тому же, конечное энергозависимое значение может быть нормировано с помощью числа используемых исходных наборов. Например, конечное энергозависимое значение может быть поделено на число используемых исходных наборов с целью определения среднего значения используемых энергозависимых значений исходных наборов.
Вышеописанный способ был указан для отдельной элементарной полосы частот. Способ может включать дополнительный этап повторения этапов назначения и этап суммирования всех элементарных полос частот объединенной координатной сетки, и для получения таким образом набора конечных энергозависимых значений конечного набора.
Конечный набор может включать конечное разбиение полосы частот с помощью предварительно назначенной конечной полосы частот. Обычно такая конечная полоса частот имеет одно соответствующее конечное энергозависимое значение. Для определения этого соответствующего конечного энергозависимого значения способ может включать этап усреднения набора конечных энергозависимых значений, связанных с элементарными полосами частот, которые содержатся в конечной полосе частот. Усредненное значение может быть назначено как конечное энергозависимое значение конечной полосы частот.
Первый исходный набор может быть связан с первым сигналом первого исходного канала; и/или второй исходный набор может быть связан со вторым сигналом второго исходного канала; и/или конечный набор может быть связан с конечным сигналом конечного канала. Обычно исходные наборы и конечные наборы связаны с определенным временным интервалом соответствующего сигнала. Такие временные интервалы могут определяться с помощью так называемых огибающих.
В частности, конечное энергозависимое значение конечного набора может быть связано с конечным временным интервалом конечного сигнала; и/или первый набор энергозависимых значений первого исходного набора может быть связан с первым временным интервалом первого сигнала, в котором первый временной интервал может перекрывать конечный временной интервал. В этих случаях вышеупомянутый этап суммирования может включать этап масштабирования первого значения первого набора энергозависимых значений в соответствии с отношением, представленным длиной перекрытия первого временного интервала и конечного временного интервала, а также длиной конечного временного интервала. Вследствие этого масштабированные первое и второе значения могут суммироваться, например добавляться для получения конечного энергозависимого значения.
К тому же первый исходный набор может включать третье разбиение полосы частот; и/или первый исходный набор может включать третий набор энергозависимых значений, связанных с полосами частот третьего разбиения полосы частот; и/или третий набор энергозависимых значений может быть связан с третьим временным интервалом первого сигнала нижнего диапазона, в котором третий временной интервал может перекрывать конечный временной интервал. Следует отметить, что третье разбиение полосы частот может соответствовать, в частности может быть равно, первому разбиению полосы частот. В таких случаях способ может далее включать этап разделения третьего разбиения полосы частот на объединенную координатную сетку, включающую элементарную полосу частот; и/или назначение элементарной полосе частот третьего значения третьего набора энергозависимых значений. В этих случаях вышеупомянутый этап суммирования может включать этап масштабирования третьего значения в соответствии с отношением, представленным длиной перекрытия третьего временного интервала и конечного временного интервала, а также длиной конечного временного интервала. Вследствие этого масштабированные первое, второе и третье значения могут суммироваться, например добавляться для получения конечного энергозависимого значения.
В соответствии с этим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Первый исходный набор может быть связан с первым сигналом нижнего диапазона первого исходного канала и может включать первый набор энергии коэффициента масштабирования. Второй исходный набор может быть связан со вторым сигналом нижнего диапазона второго исходного канала и может включать второй набор энергий коэффициента масштабирования. Конечный набор может быть связан с конечным сигналом нижнего диапазона конечного канала, полученным из уменьшения числа каналов временной области первого и второго сигналов нижнего диапазона. Кроме того, конечный набор может включать конечный набор энергий коэффициента масштабирования.
Способ может включать этап взвешивания первого и второго коэффициентов уменьшения числа каналов, выполняемый с помощью коэффициента компенсации энергии; где первый коэффициент уменьшения числа каналов может быть связан с первым исходным каналом; где второй коэффициент уменьшения числа каналов может быть связан со вторым исходным каналом; и где коэффициент компенсации энергии может быть связан с взаимодействием первого и второго сигналов нижнего диапазона во время уменьшения числа каналов временной области. Такое взаимодействие может включать ослабление и/или усиление первого и второго сигналов нижнего диапазона, которые могут быть обусловлены синфазным или противофазным режимом первого и второго сигналов нижнего диапазона. В частности, коэффициент компенсации энергии может быть связан с отношением энергии конечного сигнала нижнего диапазона и энергии первого и второго сигналов нижнего диапазона или суммарной энергии первого и второго сигналов нижнего диапазона.
Например, в случае, когда объединены N исходных каналов, то при N 2 для получения М конечных каналов с M<N и M 1 коэффициент компенсации энергии может быть представлен с помощью:
где - сигнал нижнего диапазона временной области в исходном канале , - коэффициент уменьшения числа каналов для исходного канала , - сигнал нижнего диапазона временной области конечного канала , а - выборочный указатель импульсного сигнала в цикле сигналов временной области. Следует отметить, что может быть определен на основе подмножества импульсных сигналов в цикле сигналов временной области. В таком качестве вышеприведенные суммы могут быть вычислены по всему подмножеству выборок, например, с помощью каждой выборки P-th цикла, при P как целое, то есть
Далее способ может включать этапы масштабирования первого набора энергий коэффициента масштабирования с помощью первого весового коэффициента уменьшения числа каналов; и/или масштабирование второго набора энергий с помощью второго весового коэффициента уменьшения числа каналов. Конечный набор энергий коэффициента масштабирования может быть определен из масштабированного первого и второго наборов энергий коэффициента масштабирования. В частности, конечный набор энергий коэффициента масштабирования может быть определен в соответствии с любым способом, описанным в данном документе.
В соответствии с другим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Первый исходный набор может включать первую начальную частоту. Второй исходный набор может включать вторую начальную частоту. Первая и вторая начальные частоты могут отличаться и могут быть связаны с более низкими пределами полосы частот первого и второго сигналов верхнего диапазона, связанного с первым и вторым исходными наборами параметров SBR соответственно. В частности, первая и вторая начальные частоты могут быть связаны с более низкими пределами первого и второго разбиений полосы частот.
Способ может включать этап сравнения первой и второй начальных частот; и/или этап выбора более высокой или более низкой первой и второй начальной частоты в качестве начальной частоты конечного набора. В общих чертах начальная частота конечного набора может быть выбрана на основе уровня начальных частот используемых исходных наборов, например первого и второго исходных наборов.
Выбор начальной частоты может применяться для определения заголовка элемента SBR конечного набора. Первый исходный набор может включать первый заголовок элемента SBR, включая первую начальную частоту. Второй исходный набор может включать второй заголовок элемента SBR, включая вторую начальную частоту. В этом случае способ может включать этап выбора заголовка элемента SBR конечного набора на основе первого или второго заголовка элемента SBR в соответствии с выбранной начальной частотой конечного набора. В частности, заголовок элемента SBR, включающий более высокую или более низкую начальную частоту, может быть выбран в качестве основы для определения заголовка элемента SBR конечного набора.
В дальнейшем выбор начальной частоты может быть ограничен до исходных наборов с помощью особых свойств, например выбор начальной частоты может исключительно или предпочтительно включать определенные исходные каналы. В частности, выбор начальной частоты может давать привилегии исходным наборам исходных каналов, которые представляют связь друг с другом, которая похожа на требуемую связь конечных наборов конечных каналов.
Например, если конечный набор представляет собой элемент канальной пары и, по меньшей мере, один из исходных наборов включает элемент канальной пары, то заголовок элемента SBR конечного набора может быть выбран из одного из исходных наборов, который включает элемент канальной пары. Если конечный набор является элементом канальной пары, и ни один из исходных наборов не включает элемент канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, может быть выбран в качестве основы для заголовка элемента SBR конечного набора. Если конечный набор представляет собой одиночный элемент канальной пары и, по меньшей мере, один из исходных наборов включает одиночный элемент канальной пары, то заголовок элемента SBR конечного набора может быть выбран как заголовок элемента SBR одного из исходных наборов, который включает одиночный элемент канальной пары. Если конечный набор является одиночным элементом канальной пары, и все исходные наборы являются элементами канальной пары, то заголовок элемента SBR исходного набора, включающий самую верхнюю или самую нижнюю начальную частоту, может использоваться в качестве основы для заголовка элемента SBR конечного набора.
В соответствии с другим аспектом описывается способ для объединения первого и второго исходных наборов параметров воспроизведения полосы спектра SBR в конечный набор параметров SBR. Первый исходный набор может включать показатель первой динамической огибающей; при этом показатель первой динамической огибающей идентифицирует первую динамическую огибающую с первым пределом начального времени. Второй исходный набор может включать показатель второй динамической огибающей; при этом показатель второй динамической огибающей идентифицирует вторую динамическую огибающую со вторым пределом начального времени. Конечный набор может включать множество конечных огибающих, при этом каждая из них имеет предел начального времени.
Как указано выше, огибающие, а именно первая динамическая огибающая, вторая динамическая огибающая и множество конечных огибающих, могут быть связаны с одним или несколькими временными интервалами соответствующего звукового сигнала, а именно первого звукового сигнала, второго звукового сигнала и конечного сигнала соответственно. В частности, огибающие могут быть связаны с одним или несколькими временными интервалами в пределах цикла соответствующего звукового сигнала. Показатель динамической огибающей может использоваться для идентификации огибающей, которая включает информацию об акустическом переходном процессе.
Способ может включать этап выбора одного более раннего первого или второго предела начального времени; и/или этап определения в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему из первого и второго пределов начального времени; и/или этап установки показателя конечной динамической огибающей для ее идентификации. В варианте воплощения изобретения способ может включать этап определения в качестве конечной динамической огибающей из множества конечных огибающих, для которых предел начального времени ближе всех к самому раннему из первого и второго пределов начального времени, но не позже более раннего первого или второго предела начального времени. В соответствии с другим аспектом описывается способ для объединения N исходных наборов параметров воспроизведения полосы спектра (SBR) в M конечных наборов параметров SBR. N может быть больше 2, а M может быть меньше N. Способ может включать этап объединения пары исходных наборов для получения промежуточного набора; и/или этап объединения промежуточного набора с исходным или другим промежуточным набором для получения конечного набора. По существу, способ может включать следующие этапы объединения и посредством этого обеспечить иерархический способ объединения N исходных наборов параметров SBR в M конечных наборов параметров SBR. Этапы объединения могут быть выполнены в соответствии с любыми способами и аспектами, описанными в данном документе. В варианте воплощения изобретения исходные наборы, соответствующие исходным каналам более высокой звуковой релевантности, объединяются менее часто, чем исходные наборы, соответствующие исходным каналам более низкой звуковой релевантности.
Согласно следующему аспекту описывается системная программа. Эта системная программа может быть приспособлена для ее выполнения на процессоре и для выполнения любого этапа способа, описанного в этом документе при выполнении на вычислительном устройстве.
Согласно следующему аспекту описывается носитель данных. Этот носитель данных может включать системную программу для ее выполнения на процессоре и для выполнения любого этапа способа, описанного в этом документе при выполнении на вычислительном устройстве.
Согласно еще одному аспекту описывается компьютерная программа. Компьютерная программа может включать выполняемые команды для выполнения любого этапа способа, описанного в этом документе при выполнении на компьютере.
Согласно еще одному аспекту описывается блок объединения параметров SBR. Блок объединения SBR может быть сконфигурирован для обеспечения M конечных наборов параметров SBR от N исходных наборов параметров SBR, где N>M 1. Блок объединения параметров SBR может включать процессор, сконфигурированный для выполнения любых аспектов и этапов способов, описанных в этом документе.
Согласно следующему аспекту описывается декодер звукового канала, сконфигурированный для декодирования последовательности битов HE-AAC N звуковых каналов. Декодер звукового канала может включать декодер ААС, сконфигурированный для приема последовательности битов HE-AAC и для обеспечения отдельной последовательности битов SBR; и/или декодер SBR, сконфигурированный для обеспечения N исходных наборов параметров SBR, соответствующих числу N звуковых каналов из последовательности битов SBR; и/или блок объединения параметров SBR, как описано выше, сконфигурированный для обеспечения числа М конечных наборов параметров SBR из N исходных наборов параметров SBR, где N>M 1.
Декодер ААС может быть сконфигурирован для обеспечения N звуковых сигналов нижнего диапазона временной области, соответствующих числу N звуковых каналов. Звуковой декодер может включать блок уменьшения числа каналов временной области, сконфигурированный для обеспечения звуковых сигналов нижнего диапазона временной области М из числа N звуковых сигналов нижнего диапазона временной области; и/или блок SBR, сконфигурированный для формирования M звуковых сигналов верхнего диапазона из числа М звуковых сигналов нижнего диапазона и конечных наборов М параметров SBR. Таким образом, звуковой декодер может быть сконфигурирован для обеспечения М звуковых сигналов, содержащих М звуковых сигналов нижнего диапазона и М звуковых сигналов верхнего диапазона соответственно.
Согласно следующему аспекту описывается звуковой транскодер, сконфигурированный для обеспечения последовательности битов HE-AAC, включающей М звуковых сигналов из последовательности битов HE-AAC, включающей N звуковых каналов, где N>M 1. Звуковой транскодер может включать блок объединения параметров SBR, как описано выше.
Согласно следующему аспекту описывается электронное устройство, сконфигурированное для передачи М звуковых сигналов, соответствующих числу М каналов из последовательности битов HE-AAC, включающей N звуковых каналов, где N>M 1. Электронное устройство может быть, например, медиаплеером, декодером каналов кабельного телевидения или смартфоном. Электронное устройство может включать средства передачи звука, сконфигурированные для выполнения акустической передачи М звуковых сигналов; и/или приемник, сконфигурированный для приема последовательности битов HE-AAC; и/или звуковой декодер, сконфигурированный для получения М звуковых сигналов из последовательности битов HE-AAC в соответствии с любым аспектом, приведенным в данном документе.
Следует отметить, что варианты воплощения изобретения и аспекты, описанные в этом документе, могут произвольно объединяться. В частности, следует отметить, что аспекты и характеристики, описанные применительно к системе, также применимы в контексте соответствующего способа и наоборот. К тому же следует отметить, что раскрытие настоящего документа также охватывает другие комбинации формулы изобретения помимо тех, которые явным образом даны с помощью обратных ссылок в зависимых пунктах формулы изобретения, т. е. пункты формулы изобретения и их технические характеристики могут быть объединены в любом порядке и в любом формировании.
КРАТКОЕ ОПИСАНИЕ чертежей
Настоящее изобретение описывается с помощью наглядных примеров, не ограничивающих объем и сущность запатентованного изобретения, с учетом прилагаемых чертежей, на которых:
Фигура 1 иллюстрирует пример блок-схемы системы уменьшения числа каналов для N-канальной последовательности битов HE-AAC в звуковой стереосигнал;
Фигура 2 иллюстрирует пример блок-схемы блока объединения параметров SBR, включающего пять входных каналов и два выходных канала.
Фигура 3 иллюстрирует пример блок-схемы блока объединения параметров SBR, включающего два входных канала и один выходной канал.
Фигура 4 иллюстрирует пример объединения временных пределов огибающей, выполняемых блоком объединения параметров SBR, изображенным на фигуре 3;
Фигуры 5A, B, C и D иллюстрируют пример процесса определения энергий коэффициента масштабирования конечного канала из двух исходных каналов; и
Фигура 6 иллюстрирует пример схемы взвешивания исходных каналов с помощью коэффициентов уменьшения числа каналов.
ПОДРОБНОЕ ОПИСАНИЕ
Декодер HE-AAC можно разделить на основной декодер AAC, который декодирует нижний диапазон декодированного звукового сигнала, и алгоритм воспроизведения полосы спектра (SBR), который восстанавливает верхний диапазон звукового сигнала с помощью декодированного сигнала нижнего диапазона и параметрической информации, передаваемой в последовательности битов. Обычно алгоритм SBR требует больше вычислительных ресурсов, чем основной декодер AAC. Это обусловлено наличием блоков фильтров, используемых на стадиях анализа и синтеза восстановления высокой частоты, т. е. воспроизведения полосы спектра. К примеру, в типовом варианте воплощения изобретения вычислительные ресурсы, требуемые для ААС-декодирования, составляют примерно 1/3, тогда как вычислительные ресурсы, требуемые для декодирования параметров SBR и для восстановления высокой частоты, составляют примерно 2/3 от общих вычислительных ресурсов, необходимых для декодирования последовательности битов HE-AAC.
Декодер может принимать последовательность битов HE-AAC, которая представляет собой N-канальный звуковой сигнал. Однако, вследствие различных причин, например ограничений устройства передачи звука, декодеру может потребоваться выходной сигнал, который включает только М звуковых сигналов (при M меньше N). В альтернативном сценарии использования транскодер может принимать входную последовательность битов HE-AAC, представляющую N-канальный звуковой сигнал, и может обеспечить выходную последовательность битов HE-AAC, представляющую М-канальный звуковой сигнал.
Принимая во внимание высокую вычислительную сложность восстановления высокочастотной составляющей или верхнего диапазона звукового сигнала с помощью параметров SBR, может оказаться полезным уменьшение числа каналов от N до M в закодированной области перед дополнительным декодированием низведенной последовательности битов и формированием М высокочастотных звуковых сигналов, соответствующих числу М каналов. Ниже описывается способ, позволяющий эффективное объединение параметров SBR N входных или исходных каналов в параметры SBR M выходных или конечных каналов. Объединение параметров SBR выполняется таким образом, что информация относительно определенных звуковых событий сохраняется.
Предлагаемый способ может включать этап декодирования параметров SBR для N входных каналов, обеспечивая таким образом N наборов параметров SBR, соответствующих числу N исходных каналов. Затем выполняется этап объединения параметров SBR для получения М наборов параметров SBR, соответствующих М конечных каналов. Для обеспечения выходных сигналов М каналов способ может включать этап декодирования ААС-кодированного низкочастотного сигнала для всех N входных каналов с последующим уменьшением числа каналов временной области с целью получения М выходных каналов. Кроме того, восстановление полосы спектра для М каналов можно выполнить с помощью уменьшенного числа М каналов, полученного из ААС-кодированного низкочастотного сигнала, и соответствующего новому набору параметров SBR, полученному в вышеописанном этапе объединения SBR.
На фигуре 1 приведен пример декодера HE-AAC 100, обеспечивающего два выходных звуковых сигнала 107, 108, которые соответствуют двум выходным или конечным каналам из входной последовательности битов HE-AAC 101, представляющей N звуковых каналов. Декодер ААС 110 выполняет декодирование битов HE-AAC 101 в N звуковых каналов 103, включающих низкочастотные составляющие N звуковых каналов, именуемых также низкочастотными сигналами 103. N низкочастотных звуковых сигналов 103 снижается до двух низкочастотных звуковых сигналов 106 в блоке уменьшения каналов временной области 113. Затем декодер ААС обеспечивает последовательность битов SBR 102, включая параметры SBR для N звуковых каналов. Последовательность битов SBR 102 декодируется в декодере SBR 111 для получения N наборов параметров SBR 104, один набор параметров SBR 104 для каждого из N звуковых каналов. Извлечение и декодирование параметров может выполняться в соответствии со стандартом ISO/IEC 14496-3, подразделы 4.4.2.8 и 4.5.2.8, которые включены в настоящую заявку посредством ссылки. N наборов параметров SBR 104 объединяются в два набора параметров SBR 105 в блоке объединения параметров SBR 112. В итоге репликация полосы спектра или восстановление высокой частоты двух выходных звуковых сигналов 107, 108 выполняется в блоке SBR 114. Блок SBR 114 формирует высокочастотные компоненты двух звуковых сигналов с помощью низкочастотных звуковых сигналов 106 и наборов объединенных параметров SBR 105 и обеспечивает в качестве выхода два звуковых сигнала 107, 108, которые включают соответствующие низко- и высокочастотную составляющие.
Фигура 2 иллюстрирует блок-схему блока объединения параметров SBR 112. Изображенный блок объединения параметров SBR 112 имеет иерархическую структуру для объединения пяти наборов параметров SBR 201, 202, 203, 204, 205 на входе в два набора параметров SBR 208, 209 на выходе. Блок объединения параметров SBR 112 включает блоки объединения параметров SBR «два в один» 210, 211, 212, 213, которые объединяют два набора параметров SBR 201, 202 на входе в один набор параметров SBR 206 на выходе. Блоки объединения параметров SBR «два в один» 210, 211, 212, 213 называются «элементарными блоками объединения». С помощью иерархически организованных элементарных блоков объединения 210 можно обеспечить гибкий и адаптивный блок объединения параметров SBR 112, который способен объединять произвольное число N наборов параметров SBR 201 на входе в произвольное число М наборов параметров SBR 208 на выходе. Путем добавления или удаления элементарных блоков объединения 210 общий блок объединения параметров SBR 112 может быть приспособлен в изменяющееся число N входных каналов и/или изменяющееся число М выходных каналов.
Фигура 2 иллюстрирует пример блока объединения параметров SBR 112, который объединяет параметры SBR входного сигнала 5.1 в параметры SBR выходного стереосигнала. Сигнал 5.1 включает пять полнодиапазонных каналов, называемых левый (L), правый (R), «окружающий» левый (LS), «окружающий» правый (RS) и центральный (C) каналы, а также канал низкочастотных эффектов (LFE). На приведенном примере канал LFE не рассматривается. Обычно содержание такого канала LFE сохраняется только в том случае, если канал LFE также доступен в качестве одного из выходных каналов.
В проиллюстрированном варианте воплощения изобретения набор параметров SBR 201, соответствующий каналу C, объединяется в первом элементарном блоке объединения 210 с набором параметров SBR 202 канала LS, и во втором элементарном блоке объединения 211 с набором параметров SBR 203 канала RS. Он получает два набора объединенных параметров SBR 206 и 207 соответственно. Эти наборы объединенных параметров SBR 206, 207 могут именоваться промежуточными наборами параметров SBR. Затем набор объединенных параметров SBR 206 объединяется с набором параметров SBR 204 канала L в элементарном блоке объединения 212, чтобы получить набор объединенных параметров SBR 208, соответствующий левому каналу (L´) выходного стереосигнала. Набор объединенных параметров SBR 207 объединяется с набором параметров SBR 205 канала R в элементарном блоке объединения 213, чтобы получить набор объединенных параметров SBR 209, соответствующий левому каналу (R´) выходного стереосигнала.
Проиллюстрированная иерархическая схема объединения является единственной возможностью для объединения множества наборов параметров SBR на входе. Эти наборы параметров SBR могут также объединяться в другом порядке. Однако следует отметить, что обычно каждый этап объединения в элементарном блоке объединения 210 приводит к размыванию информации, содержащейся в наборах параметров SBR. Затем может оказаться предпочтительным преобразовать каналы с более высоким акустическим значением или более высокой акустической релевантностью в меньшее количество этапов объединения, чем каналы с меньшим акустическим значением или акустической релевантностью. Например, каналы L и R могут быть представлены меньшим количеством этапов объединения, чем канал C. В качестве дополнительного примера в случае звуковой дорожки к фильму, в котором канал С передает диалоги, имеющие более высокое акустическое значение, канал С может быть представлен меньшим числом этапов объединения, чем каналы L и R.
В альтернативном варианте воплощения изобретения блок объединения параметров SBR 112 может быть реализован в качестве общей матрицы, которая напрямую объединяет N наборов параметров SBR 201 на входе в M наборов параметров SBR 208 на выходе.
Далее описывается объединение двух наборов параметров SBR 201, 202 в элементарном блоке объединения 210 в один набор объединенных параметров SBR 206. Описываемые способы и системы можно обобщить, рассматривая не менее чем два набора параметров SBR на входе.
На фигуре 3 представлен пример блок-схемы элементарного блока объединения 210. Элементарный блок объединения 210 обеспечивает набор объединенных параметров SBR 206, именуемый также конечным набором, из двух наборов параметров SBR 201, 202, именуемых также исходными наборами. Обычно иллюстрированный элементарный блок объединения 210 выполняет объединение параметров SBR на поцикловой основе, то есть параметры SBR цикла входных сигналов, относящихся к соответствующим входным каналам, объединяются, чтобы обеспечить параметры SBR соответствующего цикла выходного сигнала выходного канала. В дальнейшем, для упрощения иллюстрации, набор параметров SBR 201,202, 206 относится к наборам параметров SBR цикла.
Например, цикл входного сигнала может включать набор огибающих, охватывающих номинальную длину 2048 импульсов при частоте выборки выходного сигнала. Если, к примеру, блок фильтров QMF имеет разрешение по частоте 64 поддиапазона, длина цикла 2048 будет соответствовать 32 выборкам поддиапазона QMF в каждом из них. Кроме того, может быть введен дополнительный блок, например, «временной интервал», который объединяет выборки поддиапазона со степенью детализации в две выборки поддиапазона. Другими словами, цикл может включать 32 выборки поддиапазона QMF (на каждый поддиапазон QMF), соответствующие 16 временным интервалам.
Проиллюстрированный элементарный блок объединения 210 включает блок определения временного предела огибающей 301, который определяет временные пределы огибающих конечного набора 206 по временным пределам огибающих двух исходных наборов 201, 202. Более подробно блок определения временного предела огибающей 301 описан на фигуре 4. Затем в блоке определения энергий коэффициента масштабирования 302 энергии коэффициента масштабирования конечного набора 206 определяются из энергий коэффициента масштабирования исходных наборов 201, 202. Подробное описание блока определения энергий коэффициента масштабирования 302 приведено на фигурах 5A, 5B, 5C и 5D.
В дополнение к объединению параметров временного предела огибающей и энергий коэффициента масштабирования блок объединения параметров SBR 112 или элементарный блок объединения 210 могут выполнять объединение дополнительных параметров SBR. Параметр SBR «Inverse filtering levels» (Уровни обратной фильтрации) может быть объединен в соответствии со стандартом ETSI TS 126 402, раздел 6.1, который включен в настоящую заявку посредством ссылки. Параметр SBR «additional harmonics» (дополнительные гармоники) может быть объединен в соответствии со стандартом ETSI TS 126 402, раздел 6.2, который включен в настоящую заявку посредством ссылки.
Кроме того, может потребоваться параметр SBR "frequency resolution per envelope" (частотное разрешение на огибающую). В этот параметр входит параметр "bs_freq_res", который представляет собой двоичный переключатель, предназначенный для выбора одной из двух таблиц частот. Значение bs_freq_res==0 выбирает таблицу низкого разрешения, а bs_freq_res==1 - таблицу высокого разрешения. Обычно эти таблицы извлекаются из таблицы задающей частоты с помощью выбора подмножества полос частот. Частотное разрешение таблицы задающей частоты определяется с помощью параметра bs_freq_scale. Значение bs_freq_scale==0 является наиболее точным разрешением с одним поддиапазоном QMF на полосу частот. Более высокие значения параметра bs_freq_scale приводят к более грубым разрешениям 8-12 полос частот на октаву. Подробную информацию об этом параметре можно найти в стандарте ISO/IEC 14496-3, подраздел 4.6.18.3.2, который включен в настоящую заявку посредством ссылки. Обычно параметр bs_freq_scale включается в заголовок элемента SBR. Объединение заголовков элементов SBR обсуждается ниже. Для объединенного канала параметр bs_freq_res может быть установлен в 1, указывая этим, что следует использовать таблицы с высокой разрешающей способностью.
Параметры «SBR element headers» (Заголовки элементов SBR) могут объединяться согласно следующему процессу:
1) Могут быть определены начальная и конечная частоты всех элементов исходных каналов. При наличии блока объединения параметров SBR 112 возможными исходными каналами являются каналы 201, 202, 203, 204, 205.
2) Заголовок элемента исходного канала с наибольшей начальной частотой выбирается в качестве заголовка элемента того конечного канала, который является его частью. При использовании элемента конечного канала 208 рассматриваются заголовки элементов исходных каналов 201, 202 и 204. При использовании элемента конечного канала 209 рассматриваются заголовки элементов исходных каналов 201, 203 и 205. Следует отметить, что в альтернативных вариантах воплощения изобретения может оказаться полезным выбор заголовка элемента исходного канала с наименьшей начальной частотой в качестве заголовка элемента того конечного канала, который является его частью.
3) В дальнейшем выбор заголовка конечного канала может быть ограничен для соответствия типа элемента канала элементу конечного канала. Если элементом конечного канала является CPE (элемент канальной пары), то заголовок исходного CPE с наибольшей начальной частотой, которая является частью соединения, выбирается в качестве заголовка элемента конечного канала. В случае если исходный CPE отсутствует, выбирается заголовок исходного SCE (элемент одиночного канала) с наибольшей начальной частотой, и с его помощью создается заголовок CPE для элемента конечного канала. Если элементом конечного канала является SCE, то в качестве заголовка элемента конечного канала выбирается заголовок исходного SCE с наибольшей начальной частотой, который является частью соединения. В случае если исходный SCE отсутствует, выбирается заголовок исходного CPE с наибольшей начальной частотой, и с его помощью создается заголовок SCE для элемента конечного канала.
Следует отметить, что обычно начальная и конечная частоты первого и второго исходных наборов 201, 202 различаются. Обычно начальная и конечная частоты определяются в заголовке элемента SBR соответствующих исходных наборов 201, 202. Начальная частота звукового канала, называемая также переходной частотой, определяет максимальную частоту низкочастотной составляющей и/или минимальную частоту высокочастотной составляющей. При объединении определенного числа звуковых каналов следует предусмотреть, чтобы объединенная высокочастотная составляющая не пересекалась с низкочастотной составляющей. Причиной этого является тот факт, что декодированная с помощью ААС низкочастотная составляющая обычно содержит более достоверную акустическую информацию, чем декодированная с помощью SBR высокочастотная составляющая. Поэтому необходимо избегать вмешательства низкочастотной составляющей в высокочастотную составляющую, извлеченную из объединенных параметров SBR. Это можно обеспечить с помощью выбора начальной частоты конечного набора 206 или конечного канала, которая является максимальной начальной частотой исходных наборов 201, 202, входящих в конечный набор 206. В частности, вышеописанный риск помех между объединенными низкочастотной и высокочастотной составляющими можно предотвратить с помощью выбора заголовка элемента SBR конечного набора, как описано выше.
Далее описывается объединение параметров SBR, которые относятся к временным пределам. Следует отметить, что даже если следующее описание относится к объединению временных пределов огибающих, его можно также применять и к временным пределам огибающих шума. Кроме того, дана ссылка на стандарт ETSI TS 126 402, раздел 6.4, который включен в настоящую заявку посредством ссылки, и в котором описывается схема для объединения временных пределов огибающих шума.
HE-AAC позволяет определить до пяти огибающих в одном цикле. Эти огибающие определяют огибающую спектра высокочастотной составляющей кодированного звукового сигнала в определенном временном интервале цикла. Временные пределы различных огибающих могут быть определены по временной оси в соответствии с установленной временной сеткой. Обычно длина цикла, например, 24 мс, подразделяется на ряд временных квантов (например, 16 временных квантов), каждый из которых определяет возможный временной предел для огибающей. Временные пределы огибающих исходных наборов 201, 202 могут объединяться в соответствии со стандартом ETSI TS 126 402, раздел 6.3, который включен в настоящую заявку посредством ссылки.
На фигуре 4 проиллюстрированы огибающие спектра, определенные двумя исходными наборами 201, 202. Огибающие спектра показаны в виде ячеек на диаграмме время/частота, где время t 401 представляет длину цикла, а частота f 402 представляет частоты высокочастотной составляющей соответствующего звукового сигнала. Исходный набор 201 на приведенном примере определяет четыре огибающие 411, 412, 413, 414 с промежуточными временными пределами 415, 416, 417. Исходный набор 202 на приведенном примере определяет четыре огибающие 421, 422, 423, 424 с промежуточными временными пределами 425, 426, 427. Промежуточные временные пределы представляют собой начальные временные пределы для следующей огибающей и конечные временные пределы для предыдущей огибающей. В дополнение на фигуре 4 показан начальный временной предел 403 первой огибающей и конечный временной предел 404 последней огибающей.
Блок определения временного предела огибающей 301 способен обеспечить временную структуру, то есть начальные и конечные временные пределы огибающих конечного набора 206 из временной структуры огибающих 411, 412, 413, 414, 421, 422, 423, 424 исходных наборов 201, 202. Для этого временная структура, то есть начальные и конечные временные пределы исходных наборов 201, 202, перекрывается, как изображено на фигуре 4. В результате такого перекрытия огибающих двух исходных наборов 201, 202 получается временная структура, включающая семь временных интервалов для конечного набора 206, где эти временные интервалы определяются временными пределами [403, 425], [425, 415], [415, 416], [416, 426], [426, 417], [417, 427] и [427, 404]. Эти временные интервалы можно понимать как временные интервалы соответствующих огибающих конечного набора 206. Если полученные временные интервалы конечного набора 206 не превышают максимального количества допустимых огибающих, полученные временные пределы могут поддерживаться. Максимальное количество допустимых огибающих может задаваться основной схемой кодирования. При использовании HE-AAC максимальное количество допустимых огибающих на цикл ограничено до пяти.
Однако если количество допустимых временных интервалов превышено, то определенное количество временных интервалов конечного набора 206 следует объединить. Это можно выполнить путем объединения всех временных квантов, меньших чем два временных кванта с напрямую предшествующим или продолжающим временным интервалом. Это достигается с помощью запуска от начала временной оси 401, отображенной начальным временным пределом 403, и удалением всех конечных временных пределов, которые распложены ближе 2 от соответствующего начального временного предела. На приведенном примере конечный временной предел 426 может быть удален, тем самым создавая новый временной интервал с временными пределами [416, 417]. Если после такой операции количество временных интервалов превышает максимально допустимое количество огибающих (например, пять), то количество временных интервалов можно уменьшить. Это достигается с помощью запуска от начала временной оси 401, отображенной начальным временным пределом 404, и поиска в направлении временной оси 401, указываемой с помощью ссылочной позиции 403, временного интервала, меньшего 4 временных интервалов, и удаления начального временного предела этого временного кванта. Этот поиск может продолжаться до тех пор, пока не будет достигнуто то количество временных интервалов, которое соответствует максимальному числу допустимых огибающих. В приведенном примере будет удален начальный временной предел 417, тем самым создавая новый временной интервал с временными пределами [416, 427].
Используя вышеописанный процесс объединения временных интервалов, можно обеспечить, что количество временных интервалов конечного набора 206 не превышает максимальное количество допустимых огибающих. В примере, приведенном выше, количество временных квантов составляет 16, а максимальное количество допустимых огибающих - 5. Средний временной интервал огибающих конечного набора 206 не должен быть меньше чем 16/5=3,2 временных кванта, что может быть получено путем объединения временных интервалов с помощью постепенно возрастающего порога (как описано выше). В общем можно сформулировать, что средняя длина временных интервалов должна быть равной, по меньшей мере, отношению количества временных квантов на цикл к максимальному количеству допустимых огибающих.
В качестве выхода блока определения временного предела огибающей 301 могут быть получены временные интервалы, определяемые временными пределами 403, 425, 415, 416, 427, 404 огибающих спектра конечного набора 206. Число временных пределов было снижено таким образом, что количество временных интервалов не превышает максимально допустимого числа огибающих спектра.
Вышеописанный процесс определения временных интервалов огибающих конечного набора 206 может быть обобщен до произвольного числа исходных наборов 201. В этом случае все временные пределы исходных наборов 201 могут перекрываться, как показано на фигуре 4 и описано выше. Используя последующий процесс объединения временных интервалов, можно определить предварительно назначенное число временных интервалов огибающих конечного набора 206.
Следует отметить, что огибающая цикла может быть обозначена как переходная огибающая спектра, отображая таким образом наличие перехода в звуковом сигнале в определенном временном интервале в пределах цикла. Обычно число переходных огибающих спектра в цикле и в канале ограничено одним. Переходная огибающая спектра обычно обозначается индексом , указывая число огибающих спектра. Если максимальное число допустимых огибающих спектра равно 5, индекс может, например, принимать любое из значений от 0 до 4. Индекс переходной огибающей исходных наборов может быть объединен следующим образом:
i. Для каждого исходного набора 201, 202 он определяется, если индекс переходной огибающей текущего цикла отображает, что переход существует, то есть .
ii. Для каждого начальный временной предел такой огибающей определен.
iii. Если в различных исходных наборах 201, 202 переходы присутствуют и, следовательно, было определено несколько начальных временных пределов, то может быть выбран наименьший начальный временной предел (т. е. самый ранний).
iv. В конечном наборе 206 идентифицируется тот временной предел, который находится ближе всех к начальному временному пределу, определенному на этапах i-i.
v. В качестве переходной огибающей объединенного канала выбирается временной интервал или огибающая конечного набора 206, для которого начальный временной предел соответствует пределу, идентифицированному на этапе iv.
Если в примере, изображенном на фигуре 4, допускается, что исходный набор 201 включает переходную огибающую 414, а исходный набор 202 включает переходную огибающую 423, то этап iii выбирает начальный временной предел 426. Затем на этапе iv определяется тот начальный временной предел 416 конечного набора 206, который находится ближе всех к начальному временному пределу 426, и временной интервал [416, 427] отмечается как переходная огибающая с помощью индекса переходной огибающей в 2. Применяя вышеописанный способ, переход стремится к перемещению в более ранние из возможных временных интервалов. Это может иметь психоакустические преимущества при выборе более позднего начального временного интервала, благодаря, например, эффектам временного маскирования более раннего перехода. Более того, вышеописанный способ обычно гарантирует, что переходная огибающая конечного набора 206 охватывает множество временных квантов переходных огибающих 414, 423 исходных наборов 201, 203. Однако следует отметить, что в качестве дальнейшего или альтернативного ограничения переходная огибающая конечного набора 206 может быть выбрана таким образом, что ее начальный временной предел появляется не позднее, чем любой из начальных временных пределов переходных огибающих 414, 423 исходных наборов 201, 202.
Вышеописанный процесс определения индекса переходной огибающей конечного набора 206 из одного или нескольких индексов переходной огибающей исходных наборов 201, 202 может быть обобщен в произвольное число индексов произвольного числа исходных наборов. С этой целью этапы ii, iii, iv и v выполняются для произвольного числа индексов переходной огибающей.
Далее описывается объединение огибающих спектра двух исходных наборов 201, 202 в блоке определения энергий коэффициента масштабирования 302. Огибающая спектра включает один или несколько полос коэффициентов масштабирования и коэффициент масштабирования для каждой полосы коэффициентов масштабирования. Другими словами, огибающая спектра определяет спектральное распределение энергии высокочастотного сигнала соответствующего канала в пределах временного интервала огибающей спектра.
Как сказано выше, временные интервалы огибающих спектра конечного набора 206 были определены в блоке определения временного предела огибающей 301. Блок определения энергий коэффициента масштабирования 302 способен определять полосы коэффициента масштабирования и соответствующие коэффициенты масштабирования огибающих спектра конечного набора 206 из огибающих спектра исходных наборов 201, 202.
На фигуре 5 представлен основной принцип объединения энергий коэффициента масштабирования, находящихся в огибающих спектра двух исходных наборов 201, 202. В блоке определения временного предела огибающей 301 определяются временные пределы 403, 425 огибающей 532 конечного набора 206. Эта огибающая 532 перекрывает временной интервал 503, определенный с помощью соответствующих временных пределов 403, 425. Временной интервал 503 прикладывается к огибающим спектра исходных наборов 201, 202, определяя таким образом огибающие спектра исходных наборов 201, 202, которые входят в огибающую спектра 532 конечного набора. На изображенном примере можно видеть, что огибающая спектра 411 исходного набора 201 попадает во временной интервал 503 и, следовательно, входит в огибающую спектра 532 конечного набора 206. К тому же можно видеть, что огибающая спектра 421 исходного набора 202 попадает во временной интервал 503 и, следовательно, входит в огибающую спектра 532 конечного набора 206.
Следует, в общем, отметить, что одна или несколько огибающих спектра 411 исходного набора 201 может попасть во временной интервал 503 огибающей спектра 532 конечного набора 206. Следовательно, несколько огибающих спектра 411 исходного набора 201 может попасть в огибающую спектра 532 конечного набора 206. Этот аспект множества участвующих огибающих спектра будет описан на последнем этапе. Для упрощения иллюстрации объединение двух огибающих спектра исходных наборов 201, 202 будет описано на первом этапе. Эти огибающие спектра называются первой исходной огибающей 512 и второй исходной огибающей 522 и связаны с огибающими спектра 411, 421 исходных наборов 201, 202 соответственно. В варианте воплощения изобретения первая и вторая исходные огибающие 512, 522 могут соответствовать огибающим спектра 411, 421 исходных наборов 201, 202 соответственно.
К тому же следует отметить, что начальные частоты используемых исходных огибающих 411, 421 могут отличаться друг от друга. Как указано выше, начальная частота конечного набора 206 обычно выбирается так, чтобы она была наибольшей начальной частотой используемых исходных наборов 201, 202. В варианте воплощения изобретения начальная частота конечного набора 206 может быть выбрана такой, чтобы она была наибольшей начальной частотой используемых исходных наборов 201, 202, 204, которые входят в последний конечный набор 208 блока объединения параметров SBR 112 (как указано выше в контексте объединения заголовка элемента SBR). В результате не весь частотный диапазон огибающих спектра 411, 421 исходных наборов 201, 202 может входить в огибающую спектра 532 конечного набора 206, которая также называется конечной огибающей 532. Это изображено на фигуре 5B, на которой показаны огибающие спектра 411, 421 исходных наборов 201, 202. На приведенном примере огибающая спектра 411 имеет начальную частоту 551, которая ниже начальной частоты 552 огибающей спектра 421. Если в качестве начальной частоты 553 конечной огибающей 532 выбирается более высокая начальная частота 552, то огибающая спектра 411 может быть усечена. Это обусловлено тем фактом, что полосы коэффициентов масштабирования в диапазоне частот между более низкой начальной частотой 551 и более высокой начальной частотой 552 обычно не попадают в конечную огибающую 532. По существу, «усечение» огибающей спектра 411 может быть достигнуто с помощью игнорирования частотного диапазона между более низкой начальной частотой 551 и более высокой начальной частотой 552 во время объединения.
В общем можно сказать, что исходные огибающие 512, 522, попадающие в конечную огибающую 532, могут быть усечены таким образом, что их частотный диапазон будет соответствовать частотному диапазону конечной огибающей 532. В частности, могут быть усечены полосы частот или одна или несколько частей частотных диапазонов, лежащих ниже начальной частоты и выше конечной частоты конечной огибающей 532. Далее допускается, что участие исходных огибающих 512, 522 было усечено, как отмечено выше, таким образом, что их начальные и/или конечные частоты соответствуют их начальным и/или конечным частотам конечной огибающей 532.
Обычно разбиение полосы коэффициента масштабирования первой исходной огибающей 512 не соответствует разбиению полосы коэффициента масштабирования второй исходной огибающей 522. Другими словами, полосы частот с постоянной энергией, то есть полосы частот с постоянными энергиями коэффициента масштабирования, для разных исходных огибающих 512, 522 являются разными. Это показано на фигуре 5A, где граничные частоты 513, 514 первой исходной огибающей 512 отличаются от граничных частот 523, 524, 525 второй исходной огибающей 522. В дополнение, количество полос коэффициента масштабирования в первой исходной огибающей 512 (три на приведенном примере) может отличаться от количества полос коэффициента масштабирования во второй исходной огибающей 512 (четыре на приведенном примере). К тому же исходные огибающие 512, 522 в зависимости от частот могут включать различные уровни энергий. Блок определения энергий коэффициента масштабирования 302 способен определять конечную огибающую 532 из используемых исходных огибающих 512, 522, при этом конечная огибающая 532 включает одну или несколько полос коэффициента масштабирования и соответствующие энергии коэффициента масштабирования.
Далее описывается объединение энергий коэффициента масштабирования, соответствующих полосам коэффициента масштабирования исходных огибающих 512, 522. Основная идея заключается в том, чтобы обеспечить объединенную координатную сетку частот между множеством исходных огибающих 512, 522 и конечной огибающей 532. Такая объединенная координатная сетка частот может быть создана с помощью поддиапазонов QMF (квадратурный зеркальный фильтр) блоков фильтров анализа/синтеза, используемых в кодеках, работающих на основе SBR. С помощью объединенной координатной сетки, например, поддиапазонов QMF, добавляются коэффициенты масштабирования используемых исходных огибающих, которые соответствуют тому же поддиапазону QMF, обеспечивая накопленную энергию коэффициента масштабирования соответствующего поддиапазона QMF конечной огибающей. В итоге накопленная энергия коэффициента масштабирования может быть разделена на количество используемых исходных огибающих с целью обеспечения среднего коэффициента масштабирования в качестве энергии коэффициента масштабирования соответствующего поддиапазона QMF конечной огибающей.
Этот процесс объединения энергий коэффициента масштабирования изображен на фигурах 5C и 5D. Фигура 5C показывает множество энергий коэффициента масштабирования 515, 516 и 517, связанных с исходной огибающей 512, так же как и энергии коэффициента масштабирования 526, 527, 528 и 529, связанные с исходной огибающей 522. Для каждой исходной огибающей 512, 522, которые микшируются в конечную огибающую, выполняются следующие этапы. Эти этапы приведены для определенной полосы коэффициента масштабирования 511. В частности, приведены этапы для определенного поддиапазона QMF 541 в полосе коэффициента масштабирования 511. Эти этапы должны быть выполнены для всех поддиапазонов QMF 541, которые лежат в пределах частотного диапазона конечной огибающей 532.
На первом этапе энергия коэффициента масштабирования 517 каждой полосы коэффициента масштабирования 511 может быть масштабирована с помощью соответствующего компенсированного энергией коэффициента уменьшения числа каналов для канала, соответствующего исходному набору 201. Определение компенсированного энергией коэффициента уменьшения числа каналов описано ниже.
Как указано выше, каждая исходная полоса коэффициента масштабирования 511 разбита на поддиапазоны QMF 541, то есть полосы коэффициента масштабирования 511 разбиты в объединенную координатную сетку. Каждому поддиапазону QMF 541 полосы коэффициента масштабирования 511 назначена энергия коэффициента масштабирования 517 соответствующей полосы коэффициента масштабирования 511. Другими словами, поддиапазону QMF 541 назначена энергия коэффициента масштабирования 517 полосы коэффициента масштабирования 511, в пределах которой он лежит. Представление полос коэффициента масштабирования 511 и соответствующих энергий коэффициента масштабирования 517 на сетке поддиапазонов QMF 541 далее называется «представление QMF».
На следующем этапе исходное представление QMF добавляется к конечному представлению QMF конечного канала. В примере, изображенном на фигуре 5C, энергия коэффициента масштабирования 517 поддиапазона QMF 541 исходного набора 201 добавляется к энергии коэффициента масштабирования 533 соответствующего поддиапазона QMF 543 конечной огибающей 532.
Аналогичным образом энергия коэффициента масштабирования 529 поддиапазона QMF 542 исходного набора 202 добавляется к энергии коэффициента масштабирования 533 соответствующего поддиапазона QMF 543 конечной огибающей 532. В итоге накопленная энергия коэффициента масштабирования 533 может быть разделена на число используемых исходных наборов 201, 202 для получения усредненной энергии коэффициента масштабирования 533.
Следует отметить, что в результате удаления начального/конечного временных пределов во время определения временных пределов огибающей в блоке 301 может случиться, что временной интервал 503 конечной огибающей 532 охватывает несколько огибающих первого и/или второго исходного набора 201, 202. Этот аспект многократных используемых огибающих 411 исходного набора 201 уже был отражен выше. Далее описывается, как эти многократные исходные огибающие могут быть рассмотрены в блоке определения энергий коэффициента масштабирования 302. Основная идея заключается в использовании исходной огибающей исходного набора 201 в соответствии с ее частичным использованием. Исходная огибающая исходного набора может перекрывать только частично с временным интервалом конечной огибающей. Другими словами, временной интервал конечной огибающей может перекрывать несколько огибающих исходного набора с тем, чтобы каждая огибающая исходного набора покрывала только часть времени временного интервала конечной огибающей. Такое частичное использование может быть принято во внимание с помощью масштабирования энергий коэффициента масштабирования используемых огибающих исходного набора в соответствии с частью времени, в которое они входят во временной интервал конечной огибающей. Если временная ось подразделяется на временные кванты, масштабирование энергий коэффициента масштабирования может быть выполнено в соответствии с отношением перекрывающихся временных интервалов, то есть перекрывающихся временных интервалов соответствующих исходной и конечной огибающих, к числу временных интервалов, включенных во временной интервал конечной огибающей.
Частичное использование может быть показано на фигуре 4. Временной интервал [416, 427] конечного набора 206 включает исходные огибающие 413, 414 первого исходного набора 201 и исходные огибающие 422, 423 второго исходного набора 202. В этих случаях все исходные огибающие 413, 414, 422, 423 первого и второго исходных наборов 201 и 202, которые используют конечную огибающую 531 конечного набора 206, должны быть рассмотрены для объединения энергий коэффициента масштабирования. Энергии коэффициента масштабирования в пределах полос коэффициентов масштабирования различных исходных огибающих 413, 414, 422, 423 должны использоваться частично в соответствии с отношением, данным с помощью числа перекрывающихся временных квантов используемой огибающей 413, 414, 422, 423 и временного интервала [416, 427] конечной огибающей, а также количества временных квантов [416, 427] конечной огибающей. Этот аспект включения частичного использования исходных огибающих 413, 414, 422, 423 для конечной огибающей может быть использован в процессе объединения энергий коэффициента масштабирования, описанном выше. В частности, масштабированные энергии коэффициента масштабирования используемых исходных огибающих 413, 414, 422, 423 могут быть добавлены для определения накопленной энергии коэффициента масштабирования 533 поддиапазона QMF конечной огибающей 532.
В результате описанного выше процесса получаются конечные полосы коэффициента масштабирования для конечной огибающей 532. В зависимости от числа используемых исходных огибающих 512, числа полос коэффициента масштабирования 511, включенных в исходные огибающие 512, и позиции пределов частоты 513 между полосами коэффициента масштабирования 511 число полос коэффициента масштабирования для конечной огибающей 532 может быть относительно высоким. Полезно уменьшить число полос коэффициента масштабирования в конечной огибающей 532, например, из-за ограничений основной схемы кодирования и/или из-за предварительного разбиения или структуры полосы коэффициента масштабирования.
Например, если конечный набор 206 использует заголовок элемента SBR одного из исходных наборов 201, 202, то может быть использована структура полосы коэффициента масштабирования соответствующего исходного набора 201, 202. Как было описано в контексте способа объединения заголовков элементов SBR множества исходных наборов, заголовок элемента SBR конечного набора может соответствовать или основываться на заголовке элемента SBR одного из исходных наборов. В дополнение к назначению начальной и/или конечной частот огибающих спектра, включенных в соответствующий набор параметров SBR, заголовок элемента SBR может также определять структуру полосы коэффициента масштабирования огибающих спектра. Эта структура полосы коэффициента масштабирования может быть использована для конечной огибающей, определенной в процессе объединения энергии коэффициента масштабирования, описанном выше. Далее описывается способ, при помощи которого структура полосы коэффициента масштабирования, полученная из процесса объединения, которая также называется первой структурой полосы коэффициента масштабирования, может быть преобразована в структуру полосы коэффициента масштабирования, назначенную предварительно, например, структуру, данную заголовком элемента SBR конечного набора 206, который называется второй структурой полосы коэффициента масштабирования.
Для преобразования из первой структуры полосы коэффициента масштабирования во вторую можно использовать процесс, приведенный со ссылкой на фигура 5D. Этот процесс приведен для определенной полосы коэффициента масштабирования второй структуры полосы коэффициента масштабирования и должен быть выполнен для всех полос коэффициента масштабирования второй структуры полосы коэффициента масштабирования. Процесс основан на координатной сетке частот, например поддиапазонах QMF 543.
На первом этапе суммируются энергии коэффициента масштабирования 533 всех поддиапазонов QMF 543 в полосе коэффициента масштабирования второй структуры полосы коэффициента масштабирования. Как уже указано выше, конечное разбиение полосы коэффициента масштабирования, то есть вторая структура полосы коэффициента масштабирования, может быть определена с помощью заголовка элемента SBR, который был выбран во время объединения заголовков элемента SBR.
Сумма энергий поддиапазона QMF, вычисленных на первом этапе, делится на количество суммированных поддиапазонов QMF. Другими словами, определяется усредненная энергия коэффициента масштабирования 534 полосы коэффициента масштабирования второй структуры полосы коэффициента масштабирования. Результатом является конечная энергия коэффициента масштабирования 534 соответствующей полосы коэффициента масштабирования. Этот процесс повторяется для остальных полос коэффициента масштабирования второй структуры полосы коэффициента масштабирования.
Подводя итог вышесказанного, выше был описан процесс определения энергий коэффициента масштабирования в конечной структуре полосы коэффициента масштабирования конечной огибающей 532. Используя вышеописанный процесс объединения всех конечных огибающих 532 конечного набора 206, может быть получен полный набор объединенных энергий коэффициента масштабирования огибающих конечного набора 206. Описанный процесс может быть обобщен в произвольное число исходных наборов 201. В этих случаях произвольное число исходных огибающих может входить в конечную огибающую 532. Используемые исходные огибающие разбиваются с помощью объединенной координатной сетки частот, например, поддиапазонов QMF, и исходные энергии коэффициента масштабирования соответствующих поддиапазонов QMF суммируются с целью определения конечной энергии коэффициента масштабирования соответствующего поддиапазона QMF. Конечная энергия коэффициента масштабирования может быть нормирована с помощью числа используемых исходных наборов. Если исходная огибающая исходного набора используется только частично, энергии коэффициента масштабирования могут быть масштабированы в соответствии с способом, описанным выше. К тому же энергии коэффициента масштабирования могут быть взвешены с помощью компенсированных энергией коэффициентов уменьшения числа каналов. В итоге определенные энергии коэффициента масштабирования и структура полосы коэффициента масштабирования могут быть преобразованы в структуру полосы коэффициента масштабирования, назначенную предварительно.
Следует отметить, что исходные наборы 201, 202 могут определять уровни собственных шумов. Эти уровни собственных шумов различных исходных каналов могут быть объединены способом, аналогичным объединению энергий коэффициента масштабирования. В этих случаях энергии коэффициента масштабирования соответствуют уровням собственных шумов, а временные пределы огибающих соответствуют пределам собственных шумов. Однако следует отметить, что количество временных интервалов для шума обычно ниже числа огибающих. В варианте воплощения изобретения с помощью начального, конечного и промежуточного пределов могут быть определены только два временных интервала шума. В пределах этих временных интервалов шума могут быть назначены один или несколько уровней собственных шумов и соответствующая структура частотного диапазона (или структура полосы коэффициента масштабирования собственных шумов). Начальный, конечный и промежуточный пределы множества исходных наборов 201 могут быть объединены с помощью процесса, приведенного на фигуре 4. Один или несколько уровней собственных шумов множества исходных наборов 201 могут быть объединены с помощью процесса, приведенного на фигурах 5A-5D.
Однако следует отметить, что обычно уровни собственных шумов с помощью компенсированных энергией коэффициентов уменьшения числа каналов не масштабируются. Тем не менее, используемые исходные и/или конечные уровни собственных шумов могут масштабироваться с целью тонкой настройки субъективного качества звука объединенных звуковых каналов.
В контексте способа объединения энергий коэффициента масштабирования было указано, что в исходные каналы полезно добавлять коэффициенты уменьшения числа каналов. Обычно эти коэффициенты уменьшения числа каналов применяются для низкочастотных сигналов, чтобы обеспечить защиту от искажения сигналов для уменьшенных каналов. На фигуре 6 показано применение коэффициентов уменьшения числа каналов до низкочастотных сигналов соответствующих звуковых каналов. Можно видеть, что С-канал взвешен или масштабирован с помощью коэффициента уменьшения числа каналов c0, R- и L-каналы взвешены с помощью коэффициента уменьшения числа каналов c1, а LS- и RS-каналы взвешены с помощью коэффициента уменьшения числа каналов c2 . В контексте уменьшения числа каналов с пяти до двух коэффициенты уменьшения числа каналов могут быть назначены следующим образом: , , , где . Значения этих коэффициентов соответствуют рекомендации Международного союза телекоммуникаций (ITU) для уменьшения числа каналов сигнала канала 5.1. Кроме того, эти коэффициенты могут быть использованы в случае, когда уменьшается меньше пяти каналов (например, только левый, правый и центральный каналы).
Аналогично низкочастотному сигналу, полезно взвесить с помощью коэффициентов уменьшения числа каналов энергии коэффициента масштабирования исходных каналов или исходных наборов 201, 202. Большое значение имеет поддержка отношения между низкочастотной и высокочастотной составляющими звукового сигнала. В частности, важно поддерживать отношение энергии низкочастотной составляющей и высокочастотной составляющей. В этом смысле на фигуре 6 показано одноэтапное уменьшение числа каналов с пяти до двух. Коэффициенты уменьшения числа каналов применяются непосредственно к входным каналам. В варианте воплощения изобретения может использоваться иерархическое уменьшение числа каналов, как показано на фигуре 2, в соответствии с чем коэффициенты уменьшения числа каналов применяются непосредственно к входным каналам 202, 203, 204, 205.
Тем не менее, следует отметить, что исходные каналы во временной области могут быть синфазными или находиться в противофазе, чтобы низведенный конечный сигнал во временной области мог быть усилен или ослаблен в зависимости от соотношения фаз. Для учета этого эффекта при объединении энергий коэффициента масштабирования вышеуказанные коэффициенты уменьшения числа каналов могут быть умножены на коэффициент компенсации энергии, который учитывает синфазный и/или противофазный режим звуковых сигналов используемых исходных каналов. В частности, коэффициент компенсации энергии учитывает ослабление или усиление низведенного низкочастотного звукового сигнала, перемещаемого относительно используемых низкочастотных звуковых сигналов. Для заданного цикла звукового сигнала коэффициент компенсации энергии может быть рассчитан в соответствии с уравнением, приведенным ниже:
где - коэффициент компенсации энергии для коэффициентов уменьшения числа каналов, - низкочастотный сигнал временной области в исходном канале (channel in), - коэффициент уменьшения числа каналов (например, на фигуре 6) для канала , - низкочастотный сигнал временной области в конечном канале (channel out), а - выборочный указатель выборок в цикле. Уравнение вычисляет энергию доступных выборок одного цикла. В частности, уравнение определяет отношение между энергией конечных каналов и энергией исходных каналов, где исходные каналы взвешены с помощью соответствующих коэффициентов уменьшения числа каналов. Во многих случаях оценка энергии со сниженной точностью, например с использованием только части доступных выборок, может быть важна для определения соответствующего коэффициента компенсации энергии.
С помощью коэффициента компенсации энергии можно поддерживать энергетический баланс между низкочастотной и высокочастотной составляющими звуковых сигналов различных звуковых каналов. Это может быть достигнуто с помощью учета положительного и/или отрицательного вноса сигналов исходных каналов в низведенный сигнал низведенного канала. Следует отметить, что в низведенных системах, которые обеспечивают М выходных каналов из N входных каналов, можно использовать один коэффициент компенсации энергии для всей системы. С другой стороны или в дополнение может быть назначено несколько коэффициентов компенсации энергии. К примеру, для каждого из М низведенных выходных каналов может быть определен особый коэффициент компенсации энергии. Это может быть выполнено с помощью учета только входных каналов, которые вносятся в соответствующий выходной канал. В следующем примере особый коэффициент компенсации энергии может быть определен для каждого элементарного блока объединения 210.
Коэффициенты уменьшения каналов , которые были использованы для низведения временной области выхода декодера AAC, например c0, c1 и c2, назначенные выше, могут быть умножены на коэффициент компенсации энергии для получения компенсированных энергией коэффициентов уменьшения числа каналов. Перед объединением энергий коэффициента масштабирования исходных наборов 201, 202 энергии коэффициента масштабирования 517 могут быть взвешены или масштабированы с помощью соответствующего компенсированного энергией коэффициента уменьшения числа каналов, как описано выше. Учитывая, что коэффициенты уменьшения числа каналов были назначены для сигналов временной области, энергии коэффициента масштабирования 517 должны быть масштабированы с помощью коэффициента уменьшения числа каналов, возведенного в квадрат, то есть соответствующего исходного канала. Поэтому следует помнить, что вычисление может быть важным. Обычно это должно быть более эффективным, когда извлечение корня для определения может быть опущено.
Обычно коэффициенты уменьшения числа каналов масштабируются или нормируются, как указано выше, чтобы они составляли в сумме постоянное значение, например один. При масштабировании к значению один диапазон масштабированных коэффициентов уменьшения числа каналов ограничивается до [0.01; 1]. Однако, учитывая, что коэффициенты уменьшения числа каналов используются для определения относительного взвешивания различных исходных каналов, для нормирования может быть использовано другое постоянное значение. Следовательно, вышеуказанные предельные значения могут быть увеличены или уменьшены в соответствии с постоянным значением нормализации при условии, что поддерживается относительный показатель между коэффициентами уменьшения числа каналов.
Следует отметить, что в альтернативном варианте воплощения изобретения компенсация энергии может быть приложена к низкочастотному низведенному сигналу. Это обусловлено тем фактом, что коэффициент компенсации энергии применяется для поддержки баланса между сигналами высокого и низкого диапазонов. Этот баланс может также поддерживаться с помощью применения инверсии коэффициента компенсации энергии на стадии низведения сигнала. В таком варианте воплощения изобретения коэффициенты уменьшения числа каналов, используемые для энергий коэффициента масштабирования, могут оставаться неизменными, т. е. они могут быть ограничены любой компенсацией низведения.
В настоящем документе описываются способы и системы для низведения параметров SBR. Описываемые способы и системы позволяют реализовать общий процесс для формирования параметров SBR для M каналов из параметров SBR N каналов, где M<N. В частности, способы и системы позволяют объединение параметров SBR каналов с различными начальными и конечными частотами. К тому же способы и системы позволяют объединение параметров SBR каналов с различным разбиением полосы коэффициента масштабирования. Кроме того, описывается схема для точного объединения информации переходной огибающей. К тому же описывается иерархический процесс объединения, который обеспечивает возможность адаптивно управлять конфигурациями многих каналов. В дополнение, описывается схема адаптивной компенсации энергии, которая ослабляет или усиливает энергии SBR с целью согласования энергии восстановленного высокочастотного сигнала с энергией низкочастотного сигнала низведенного сигнала. С помощью такой схемы компенсации синфазный и/или противофазный режим различных звуковых сигналов на стадии низведения во временной области может быть компенсирован напрямую в кодированной области.
Способы и системы для уменьшения числа каналов, описанные в данном документе, могут быть реализованы программно, микропрограммно или аппаратно. Некоторые компоненты, например, могут быть реализованы в качестве программного обеспечения, работающего на цифровом процессоре сигналов или микропроцессоре. Другие компоненты могут, например, быть реализованы аппаратно или в виде специализированных интегральных схем. Сигналы, встречающиеся в описываемых способах и системах, могут храниться на носителях, таких как память с произвольной выборкой или средства оптического хранения информации. Они могут передаваться по сетям, таким как радиосети, спутниковые сети, беспроводные или проводные сети, например Интернет. К типовым устройствам, использующим способы и системы, описанные в данном документе, относятся портативные электронные устройства или другая бытовая аппаратура, используемая для хранения и/или передачи звуковых сигналов. Способы и системы могут также быть использованы на компьютерных системах, например Интернет веб-серверах, которые хранят и передают звуковые сигналы, например музыку, для закачки.
Класс G10L19/00 Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи
Класс G10L21/02 усиление речи, например подавление шума, нейтрализация эхо-сигнала