синтезатор аудиосигнала и кодирующее устройство аудиосигнала

Классы МПК:	G10L21/02 усиление речи, например подавление шума, нейтрализация эхо-сигнала
Автор(ы):	ГРИЛЛ Бернхард (DE), КРАЕМЕР Ульрих (DE), НУЕНДОРФ Макс (DE), РЕТТЕЛБАХ Николаус (DE), НАГЕЛЬ Фредерик (DE), ДИШ Саша (DE), ВАБНИК Стефан (DE)
Патентообладатель(и):	Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. (DE)
Приоритеты:	подача заявки: 2009-06-19 публикация патента: 27.08.2013

Заявленное изобретение относится к области синтезаторов аудиосигнала, кодирующих устройств аудиосигнала и потоков данных, содержащих закодированный аудиосигнал. Технический результат - создание синтезатора, который эффективно выполняет преобразование сигнала и позволяет обеспечить улучшенное качество. Для этого синтезатор аудиосигнала производит сигнал аудиосинтеза, имеющий первый диапазон частот и второй синтезируемый диапазон частот, полученный из первого диапазона частот, и включает в себя: генератор участка диапазона, спектральный конвертер, первичный процессор сигнала и объединитель. Генератор участка диапазона выполняет, по крайней мере, два различных алгоритма внесения исправлений, причем каждый алгоритм внесения исправлений производит первичный сигнал, имеющий компоненты сигнала во втором синтезируемом диапазоне частот, на основе использования аудиосигнала, имеющего компоненты сигнала в первом диапазоне частот. Генератор участка диапазона приспособлен для выбора одного из двух различных алгоритмов внесения исправлений в зависимости от информации контроля о первой временной части сигнала, и второго алгоритма внесения исправлений в зависимости от информации контроля о второй временной части сигнала, отличающейся от первой части, и получить первичный сигнал для первой и второй временных частей. Спектральный конвертер преобразовывает первичный сигнал в первичное представление спектра сигнала. Первичный процессор сигнала формирует соответствующее первичное представление спектра сигнала в зависимости от параметров восстановления спектральной области спектрального диапазона. Объединитель комбинирует аудиосигнал, имеющий компоненты сигнала в первой группе, или сигнал, полученный из аудиосигнала с соответствующим первичным представлением спектра сигнала или с последующим сигналом, полученным из соответствующего первичного представления спектра сигнала, для получения сигнала аудиосинтеза. 6 н. и 8 з.п ф-лы, 7 ил.

синтезатор аудиосигнала и кодирующее устройство аудиосигнала, патент № 2491658

Формула изобретения

1. Синтезатор аудиосигнала, предназначенный для того, чтобы сформировать сигнал (145) аудиосинтеза, имеющий первый диапазон частот и второй синтезируемый диапазон частот (202), полученный из первого диапазона частот (201), включающий генератор участка диапазона (110) для выполнения, по крайней мере, двух различных алгоритмов внесения исправлений, причем каждый алгоритм внесения исправлений производит первичный сигнал (115), имеющий компоненты сигнала во втором синтезируемом диапазоне частот (202), использование аудиосигнала (105), имеющего компоненты сигнала в первом диапазоне частот (201), причем генератор участка диапазона (110) используется для выбора, по крайней мере, одного из двух различных алгоритмов внесения исправлений в зависимости от информации контроля (112) для первой по времени части сигнала и другого алгоритма внесения исправлений в зависимости от информации контроля (112) для второй по времени части сигнала, отличной от первой части, для получения первичного сигнала (115) для первой и второй частей сигнала вне спектральной области; спектральный конвертер (120) для того, чтобы преобразовать первичный сигнал (115) для первой и второй частей сигнала вне спектральной области в спектральную область для получения спектрального представления первичного сигнала (125) для первой и второй по времени частей сигнала; первичный процессор сигнала (130) для выработки первичного спектрального представления сигнала (125) для первой и второй по времени частей сигнала в зависимости от параметров восстановления спектральной области спектрального диапазона (132) и получения соответствующего первичного спектрального представления сигнала (135) для первой и второй временных частей; и сумматор (140) для объединения аудиосигнала (105), имеющего компоненты сигнала в первом диапазоне (201), или сигнала, полученного из аудиосигнала (105), с соответствующим первичным спектральным представлением сигнала (135) или с последующим сигналом, полученным из соответствующего первичного спектрального представления сигнала (135), для получения сигнала (145) аудиосинтеза.

2. Синтезатор аудиосигнала по п.1, в котором используются, по крайней мере, два алгоритма внесения исправлений, отличающихся друг от друга тем, что компонент аудиосигнала (105) из первого диапазона частот (201) преобразовывается к целевой частоте во втором диапазоне частот (202), а целевая частота в обоих алгоритмах внесения исправлений различна.

3. Синтезатор аудиосигнала по п.1, в котором генератор участка диапазона (110) приспособлен для работы во временном интервале для обоих алгоритмов внесения исправлений, или в котором генератор участка диапазона содержит конвертер для преобразования сигнала временного интервала в спектральное представление, конвертер для преобразования сигнала в спектральном представлении во временной интервал и выходной интерфейс временного интервала, причем генератор участка диапазона (110) применяется для работы в спектральной области по крайней мере в одном алгоритме внесения исправлений.

4. Синтезатор аудиосигнала по п.1, в которых генератор участка диапазона (110) приспособлен для формирования первичного сигнала (115), включающего последующие компоненты сигнала из первого диапазона частот (201) с частотой дискретизации, большей, чем частотой дискретизации аудиосигнала (105), поступающего на генератор участка диапазона (110), причем спектральный конвертер используется для преобразования компонент сигнала из второго диапазона частот (202) и последующих компонент сигнала из первого диапазона частот (201) в первичное представление спектра сигнала (125).

5. Синтезатор аудиосигнала по п.1, содержащий дополнительный спектральный конвертер (370), дополнительный объединитель (124), дополнительный спектральный конвертер (370) используется для преобразования аудиосигнала (105), имеющего компоненты сигнала в первом диапазоне частот (201), в первичное спектральное представление сигнала (123), и дополнительный сумматор (124), необходимый для объединения первичного спектрального представления сигнала (125) и первичного спектрального представления сигнала (123) для получения объединенного первичного спектрального представления сигнала (126), причем первичный процессор сигнала (130) приспособлен для обработки объединенного первичного спектрального представления сигнала (126).

6. Синтезатор аудиосигнала по п.1, где сумматор (140) приспособлен для использования в качестве сигнала, полученного из аудиосигнала (105) последующего первичного спектрального представления сигнала (123).

7. Синтезатор аудиосигнала по п.1, где аудиосигнал (105) и контрольная информация (112) закодированы в потоке данных, включающий дополнительный восстановитель формата, необходимый для получения контрольной информации (112) из потока данных.

8. Синтезатор аудиосигнала по п.1, где аудиосигнал и параметр восстановления диапазона (132) закодированы в потоке данных, и причем первичный процессор сигнала (130) приспособлен для получения параметра восстановления диапазона (132) из потока данных.

9. Кодирующее устройство аудиосигнала для получения из аудиосигнала (305) потока данных (345), содержащего компоненты аудиосигнала (305) в первом диапазоне частот (201), информации управления (112) и параметры восстановления диапазона (132), включающее частотный избирательный фильтр (310) для формирования компонент аудиосигнала (305) в первом диапазоне частот (201); генератор для получения параметра восстановления диапазона (132) из компонентов аудиосигнала (305) во втором диапазоне частот (202); генератор контрольной информации (340) для получения информацию о контроле (112), на основании которой определяется наилучший алгоритм внесения исправлений из двух различных алгоритмов внесения исправлений, причем каждый алгоритм внесения исправлений формирует первичный сигнал (115), имеющий компоненты сигнала во втором копируемом диапазоне частот (202), полученные с использованием компонентов аудиосигнала (305) из первого диапазона частот (201), где генератор контрольной информации (340) приспособлен для определения наилучшего алгоритма внесения исправлений путем сравнения аудиосигнала (305) с исправленными аудиосигналами (347) для первого и второго алгоритмов внесения исправлений, причем исправленные различными способами аудиосигналы (347) получены из различных первичных сигналов (344), связанных с первым и вторым алгоритмами внесения исправлений в первичный сигнал в блоке восстановления спектрального диапазона (346), в соответствии с параметрами восстановления диапазона (132).

10. Кодирующее устройство аудиосигнала по п.9, содержащее средства анализа (307) аудиосигнала (305), обеспечивающие получение параметра аудиосигнала, средства анализа (307) предназначены для идентификации негармонических компонент части сигнала, имеющих признаки голоса, или гармонического компонента сигнала, занимающего большую часть времени сигнала.

11. Способ формирования синтезированного аудиосигнала (145), имеющего первый диапазон частот и второй скопированный диапазон (202), полученный из первого диапазона (201), включающий выполнение по крайней мере двух различных алгоритмов внесения исправлений, причем каждый алгоритм внесения исправлений производит первичный сигнал (115), имеющий компоненты сигнала во втором копируемом диапазоне частот (202), использующий аудиосигнал (105), имеющий компоненты сигнала в первом диапазоне частот (201), и причем внесение исправлений выполнено таким образом, что, по крайней мере, один из двух различных алгоритмов внесения исправлений выбран в зависимости от контрольной информации (112) для первой временной части сигнала, и второй алгоритм внесения исправлений выбран в зависимости от контрольной информации (112) для второй временной части сигнала, отличающейся от первой части, чтобы получить первичный сигнал (115) для первой и второй временной части вне спектральной области; преобразование первичного сигнала (115) для первой и второй временных частей вне спектральной области в спектральную область для получения первичного представления спектра сигнала (125) для первой и второй временных частей; обработку первичного представления спектра сигнала (125) для первой и второй временных частей в зависимости от параметров восстановления спектральной области спектрального диапазона (132), для получения соответствующего представления спектра сигнала (135) для первой и второй временных частей; комбинирование аудиосигнала (105), имеющего компоненты сигнала в первом диапазоне (201), или сигнала, полученного из аудиосигнала (105) с соответствующим представлением спектра сигнала (135) или с последующим сигналом, полученным из соответствующего первичного представления спектра сигнала (135), чтобы получить синтезированный аудиосигнал (145).

12. Способ для формирования потока данных (345), включающего компоненты аудиосигнала (305) в первом диапазоне частот (201), управляющую информацию (112) и параметры восстановления диапазона (132), включающие частоту селективного фильтрования аудиосигнала (305) для получения компонент аудиосигнала (305) в первом диапазоне частот (201); параметры восстановления спектрального диапазона (132) из компонентов аудиосигнала (305) во втором диапазоне частот (202); контрольную информацию (112) идентификации наилучшего из двух различных алгоритмов внесения исправлений, причем каждый алгоритм внесения исправлений производит первичный сигнал (115), имеющий компоненты сигнала во втором копируемом диапазоне частот (202) на основе использования компонентов аудиосигнала (305) из первого диапазона частот (201), где наилучший алгоритм внесения исправлений определяется путем сравнения аудиосигнала (305) с исправленными аудиосигналами (347) для первого и второго алгоритмов внесения исправлений, причем исправленные различными способами аудиосигналы (347) получены из различных первичных сигналов (344), связанных с первым и вторым алгоритмами внесения исправлений в первичный сигнал в блоке восстановления спектрального диапазона (346), в соответствии с параметрами восстановления диапазона (132).

13. Носитель информации, содержащий компьютерную программу, запускаемую на процессоре, для реализации способа по п.11.

14. Носитель информации, содержащий компьютерную программу, запускаемую на процессоре, для реализации способа по п.12.

Описание изобретения к патенту

Изобретение относится к области синтезаторов звукового (аудио) сигнала, кодирующих устройств звукового сигнала и потоков данных, содержащих закодированный звуковой сигнал.

Кодирование сигналов природного происхождения и кодирование речи - два основных класса кодировок для звуковых сигналов. Кодирование звуковых сигналов природного происхождения обычно используется для музыки или сигналов произвольного вида, требует использования средних скоростей передачи битов и обычно подразумевает использование широких полос пропускания звуковых частот. Кодирование речи ограничено главным образом требованиями к воспроизведению речи и может использовать очень низкую скорость передачи битов. Передача речи в широком диапазоне частот обеспечивает главным образом субъективное повышение качества по сравнению с узким диапазоном частот. Увеличение полосы пропускания улучшает не только естественность речи, но также ее понимание и четкость. Таким образом, широкополосная кодировка речи - важная задача для разработки телефонных систем следующих поколений. Более того, из-за значительного развития мультимедийной области, передачей музыки и других неречевых сигналов с высоким качеством через телефонные системы, а также, например, необходимостью хранения и передачи сигналов через радио/телевизионные или другие системы радиопередачи, широкополосная кодировка речи является весьма желательным требованием.

Чтобы существенно уменьшить скорость передачи битов, исходное кодирование может быть выполнено с использованием звуковых кодировщиков с узкополосным восприятием. Эти кодировщики звуковых сигналов природного происхождения используют бесполезность части сигнала при его восприятии и статистическую избыточность в сигнале. В случае, если применение вышеупомянутых принципов оказывается недостаточным для преодоления ограничений в скорости передачи данных, скорость передачи может уменьшиться. Часто применяется сокращение числа звуковых потоков в сигнале, что приводит к случайным периодически слышимым искажениям, а также использование объединенного кодирования и совмещения стерео области или параметрическое кодирование двух или больше каналов. Злоупотребление такими методами приводит к раздражающему искажению восприятия. Для того, чтобы улучшить качество кодировки, используются методы расширения полосы частот, такие как восстановление диапазона спектра (ВДС). На этих методах основана кодировка, позволяющая эффективно сформировать высокочастотную область спектра в высокочастотной реконструкции сигнала (ВРС).

В процессе воспроизведения высокочастотных сигналов может, например, произойти определенное изменение низкочастотных сигналов, и преобразованные сигналы затем включаются в высокочастотные сигналы. Этот процесс также известен как внесение исправлений в сигнал, при этом могут использоваться различные способы преобразования. Звуковой стандарт MPEG-4 использует только один алгоритм внесения исправлений для всех звуковых сигналов. Следовательно, такой подход является недостаточно гибким, чтобы его можно было использовать для внесения исправлений в сигналы различных типов или кодирование схем.

С одной стороны, стандарт MPEG-4 использует сложный процесс представления высокочастотной части спектра, в которой применяются многие основные параметры ВДС. Эти основные параметры ВДС-данные по огибающей спектра, данные по уровню шума, который будет добавлен к восстановленной части спектра, информации о способе обратной фильтрации, чтобы приблизить тональность восстановленной высокочастотной части спектра к тональности высокочастотной части исходного сигнала, и дополнительные данные для восстановленной части диапазона, например, данные по недостающей гармонике и т.д. Доказано, что эта часто используемая процедура представления спектра, обеспечивающаяся внесением последовательных исправлений в соответствующие частотные области спектров сигналов в пределах диапазона группы фильтров, эффективна, обеспечивает высокое качество и позволяет достичь приемлемых требований по производительности процесса, объемов и конфигураций памяти, и требований по питанию.

С другой стороны, внесение исправлений начинается в той же самой группе фильтров, поскольку дальнейшая обработка исправленного сигнала применяется таким образом, чтобы было строгое соответствие между операцией внесения исправлений и последующей обработкой результата этой операции. Поэтому при таком комбинированном подходе становится проблематичным выполнение нескольких алгоритмов внесения исправлений.

WO 98/57436 предлагает способы перемещения, используемые в восстановлении частотной полосы спектра, которые объединены с регулированием огибающей спектра.

В WO 02/052545 принята классификация сигналов на две группы: они могут быть «периодической последовательностью импульсов» либо «непериодической последовательностью импульсов», и на основании этой классификации предложен адаптивный переключаемый преобразователь. Переключаемый преобразователь параллельно (одновременно) выполняет два алгоритма внесения исправлений и устройство совмещает оба исправленных сигнала в соответствии с принятой классификацией («периодическая последовательность импульсов», «непериодическая последовательность импульсов»). Фактическое переключение между преобразователями или смешивание сигналов выполнены в настройке огибающей спектра группы фильтров в зависимости от данных контроля и вида огибающей. Кроме того, для сигналов «периодическая последовательность импульсов», сигнал основного диапазона преобразовывается в диапазон группы фильтров, выполняется операция перевода частоты и регулирование огибающей сигнала, полученного в результате перевода частоты. В этом заключается совмещение внесения исправлений и процедуры дальнейшей обработки.

Для сигналов типа «непериодическая последовательность импульсов» осуществляется преобразование частотной области (преобразование 40) и результат преобразования частотной области затем преобразовывается в диапазон группы фильтров, в котором выполняется регулирование огибающей. Таким образом, обеспечиваются выполнение и гибкость этой процедуры, которая имеет, в качестве одной из возможных альтернатив, совмещение процедур внесения исправлений и дальнейшей обработки. Другая альтернатива заключается в возможности преобразования частотной области, которая выполняется за пределами группы фильтров и заключается в регулировании огибающей, но такой подход проблематичен по отношению к возможностям его реализации и гибкости.

Задача предложенного изобретения состоит в том, чтобы создать синтезатор, который эффективно выполняет преобразование сигнала и позволяет обеспечить улучшенное качество.

Эта задача достигнута при помощи синтезатора в соответствии с п.1, кодирующего устройства по п.9, метода формирования синтезированного аудиосигнала по п.13, а также методу создания потока данных по п.14 формулы.

Настоящее изобретение основано на идее, заключающейся в том, что, с одной стороны, операция внесения исправлений в обрабатываемый сигнал и, с другой стороны, дальнейшая обработка результата операции внесения исправлений должны выполняться в полностью независимых областях. Это обеспечивает гибкость и, с одной стороны, позволяет оптимизировать различные алгоритмы внесения исправлений в пределах генератора внесения исправлений и, с другой стороны, всегда использовать тот же самый результат формирования огибающей независимо от основного алгоритма внесения 3 исправлений. Поэтому создание любого исправленного сигнала за пределами спектральной области, в которой производится регулирование огибающей, позволяет гибко применять различные алгоритмы внесения исправлений к различным частям сигнала, полностью независимо от последующей процедуры ВДС. Проектировщик не должен заботиться о специфических особенностях алгоритмов внесения исправлений, прибывающих из регулирования конверта, или не должен заботиться о специфических особенностях алгоритмов внесения исправлений для определенного регулирования огибающей. Вместо этого различные участки восстановленного спектрального диапазона могут быть созданы независимо друг от друга. То есть, с одной стороны, осуществляется операция внесения исправлений и, с другой стороны, производится дальнейшая обработка результата внесения исправлений.

Это означает, что при полном восстановлении спектрального диапазона, алгоритм внесения исправлений выполняется отдельно. Следовательно, алгоритм допускает внесение исправлений при одновременном осуществлении операции ВДС. Эти процедуры могут оптимизироваться независимо друг от друга и, поэтому гибки относительно последующих алгоритмов (внесения исправлений и других), могут применяться просто, без необходимости изменения любого из параметров дальнейшей обработки результата внесения исправлений, выполненного в спектральной области, без внесения каких-либо дополнительных исправлений.

Настоящее изобретение обеспечивает улучшенное качество, так как оно позволяет легко использовать различные алгоритмы внесения исправлений для различных частей сигнала таким образом, чтобы каждая составная часть основного сигнала была преобразована в соответствии с алгоритмом внесения исправлений, который будет применен к этой части сигнала наилучшим образом. Кроме того, при таком подходе также может использоваться прямой, эффективный и высококачественный инструмент регулирования огибающей, который работает в диапазоне группы фильтров, известен и уже используется во многих приложениях, таких как MPEG-4, ОН-ААС. За счет разделения алгоритмов внесения исправлений и дальнейшей обработки, известные способы дальнейшей обработки результата внесения исправлений могут применяться со всеми доступными алгоритмами внесения исправлений. При этом никакие алгоритмы внесения исправлений не применяются в диапазоне группы фильтров, в котором выполняется последующая обработка результата внесения исправлений. Однако произвольное внесение исправлений может выполняться диапазоне группы фильтров, а также в других диапазонах.

Кроме того, эта особенность допускает возможность масштабирования. Например, для сигналов низкого уровня могут использоваться алгоритмы исправления, которые требуют меньшего количества ресурсов, а для сигналов высокого уровня, используются алгоритмы исправления, которые требуют больших ресурсов, что позволяет получить лучшее качество звука.

Возможен альтернативный подход, в котором алгоритмы внесения исправлений остаются прежними, а сложная последующая обработка результата внесения исправлений может быть использована для других задач.

Для сигналов низкого уровня, например, может быть применено пониженное разрешение частоты при регулировании огибающей спектра. В то же время для сигналов высокого уровня будет использовано более высокое разрешение частоты, обеспечивающее лучшее качество, но при этом потребуется увеличение ресурсов памяти, процессора и, конечно, расхода мощности мобильного устройства. Все это может быть сделано без привлечения других аналогичных методов, так как алгоритм внесения исправлений не зависит от метода спектрального регулирования огибающей спектра и наоборот. Вместо этого разделение обрабатываемого сигнала на отдельные части и обработка разделенных исходных данных путем преобразования в спектральное представление при помощи группы фильтров, оказались оптимальными решениями.

В соответствии с первой отличительной особенностью изобретения, звуковой синтезатор сигнала производит сигнал аудиосинтеза, имеющий первый диапазон частот и второй синтезируемый диапазон частот, полученный из первого диапазона частот. Звуковой синтезатор сигнала содержит генератор участка диапазона, спектральный конвертер, первичный процессор сигнала и сумматор. Генератор участка диапазона выполняет по крайней мере два различных алгоритма внесения исправлений, причем каждый алгоритм внесения исправлений использует звуковой сигнал, имеющий компоненты в первом диапазоне частот, и производит первичный сигнал, имеющий компоненты сигнала в области второго синтезируемого диапазона частот. Генератор участка диапазона используется для выбора по крайней мере одного из двух различных алгоритмов внесения исправлений в зависимости от информации контроля для части сигнала, поступающей на первом этапе, и второго (из двух различных) алгоритма внесения исправлений в зависимости от информации контроля для части сигнала поступающей на втором этапе, отличающейся от информации на первом этапе. Затем формируется первичный сигнал для первой и второй частей сигнала. Спектральный конвертер преобразовывает первичный сигнал в первичное спектральное представление сигнала. Первичный процессор сигнала обрабатывает первичное спектральное представление сигнала в зависимости от спектральных параметров представления участка диапазона, чтобы получить соответствующее спектральное представление первичного сигнала. Сумматор формирует звуковой сигнал, имеющий компоненты сигнала из первого диапазона или сигнала, полученного из звукового сигнала с соответствующим первичным спектральным представлением сигнала либо с последующим сигналом, полученным из соответствующего первичного спектрального представления сигнала, для создания сигнала аудиосинтеза.

Возможны другие варианты исполнения, когда звуковой синтезатор сигнала формируется таким образом, чтобы использовались по крайней мере два отличающихся от друг друга алгоритма внесения исправлений, в которых спектральные компоненты звукового сигнала, находящиеся в первом диапазоне частот, заменялись целевой частотой из второго диапазона частот, а целевая частота отличалась от частоты обоих алгоритмов внесения исправлений. Генератор участка диапазона может быть в дальнейшем приспособлен для работы во временном интервале обоих алгоритмов внесения исправлений.

В соответствии со второй отличительной особенностью настоящего изобретения, звуковое кодирующее устройство сигнала на основе аудиосигнала формирует поток данных, включающий компоненты звукового сигнала из первого диапазона частот, управляют информацией и параметрами представления спектрального диапазона. Кодирующее устройство звукового сигнала использует частотный избирательный фильтр, генератор и генератор контроля информации. Частотный избирательный фильтра выделяет компоненты звукового сигнала из первого диапазона частот. Генератор производит параметры отклика диапазона спектра на основе компонентов звукового сигнала из второго диапазона частот. Генератор контроля информации вырабатывает информацию контроля, идентификатор информации контроля, соответствующий алгоритм внесения исправлений на основе первого или второго различных алгоритмов внесения исправлений. Каждый алгоритм внесения исправлений использует компоненты звукового сигнала из первого диапазона частот и производит первичный сигнал, имеющий компоненты сигнала во втором восстанавливаемом диапазоне частот.

В соответствии с еще одной отличительной особенностью настоящего изобретения, поток битов звукового сигнала передается по линии передачи, связанной с компьютером и содержит кодируемое звуковое сообщение из первого диапазона частот, информацию контроля и параметры представления спектрального диапазона.

Поэтому настоящее изобретение имеет отношение к методам переключения между различными алгоритмами внесения исправлений при восстановлении спектрального диапазона, причем используемый алгоритм внесения исправлений зависит от состояния кодирующего устройства и результата, полученного в кодирующем устройстве, а также от состояния кодировщика, в зависимости от информации, переданной в потоке данных. На основе использования восстановления диапазона спектра (ВДС) восстановление высокочастотных участков спектрального диапазона может быть проведено, например, путем копирования низкочастотных участков спектрального диапазона сигнала через набор КОФ-фильтров (КОФ-квадратурный отражательный фильтр) на высокочастотные участки спектра. Это копирование также известно как внесение исправлений, и, согласно вариантам исполнения настоящего изобретения, это внесение исправлений может быть заменено или дополнено альтернативными методами, которые выполнены во временной области. Примеры для альтернативных алгоритмов внесения исправлений:

(1) Использование увеличения частоты дискретизации (например, отражение спектра);

(2) Фазовый вокодер;

(3) Нелинейное искажение;

(4) Отражение спектра через КОФ-диапазоны путем изменения порядка КОФ-групп;

(5) Управляемая модель (в частности, для речи);

(6) Модуляция

Альтернативные алгоритмы внесения исправлений могут также быть выполнены в пределах кодирующего устройства. Это позволяет получить параметры представления спектрального диапазона, которые используются, например, инструментами ВДС для шумоподобного заполнения, обратной фильтрации, восполнения недостающих гармоник и т.д. В зависимости от варианта исполнения, алгоритм внесения исправлений в пределах генератора внесения исправлений заменен имеющимися инструментами для представления спектрального диапазона.

Конкретный выбор для алгоритма внесения исправлений зависит от имеющегося звукового сигнала. Например, фазовый вокодер сильно изменяет индивидуальные особенности речевых сигналов, и поэтому фазовый вокодер не обеспечивает подходящий алгоритм внесения исправлений, например, для речи или подобных речи сигналов. Следовательно, в зависимости от типа звукового сигнала, генератор участка диапазона выбирает алгоритм внесения исправлений из нескольких вариантов для того чтобы восстановить высокочастотные участки диапазона. Например, генератор участка диапазона может выбрать один из вариантов: обычный инструмент ВДС (копирование диапазонов КОФ) или фазовый вокодер или использовать любые другие алгоритмы внесения исправлений.

В отличие от обычного ВДС-алгоритма (например осуществленного в MPEG-4) настоящее изобретение можно использовать в качестве генератора внесения исправлений для того, чтобы воспроизвести высокочастотный сигнал. Генератор внесения исправлений может работать не только в частотном, но также и во временном интервале и средствах, исправляющих алгоритмы, например: отражение и/или осуществление выборки и/или фазовый вокодер и/или нелинейное искажение. Проводится восстановление спектрального диапазона в частотном или во временном интервале зависит от конкретного сигнала (то есть производится адаптация к сигналу), различные виды которых ниже будут рассмотрены подробно.

Восстановление спектрального диапазона опирается на тот факт, что во многих целях достаточно передать звуковой сигнал только в пределах основного диапазона частот и произвести компоненты сигнала в верхнем диапазоне частот в кодировщике. Получающийся звуковой сигнал будет иметь высокое качество восприятия, так как для речи и музыки например, высокочастотные компоненты спектра часто имеют корреляцию относительно низкочастотных компонентов в основном диапазоне частот. Поэтому, при использовании подходящего алгоритма внесения исправлений, который воспроизводит недостающие высокочастотные компоненты, можно получить звуковой сигнал с высоким качеством восприятия. В то же самое время параметр, который влияет на восстановление верхних участков диапазона, приводит к существенному уменьшению скорости передачи битов при кодировке аудиосигнала, потому что только звуковое сообщение в пределах основного диапазона частот сжимается при кодировке и передается на декодировку. Поскольку остающиеся частотные компоненты спектра только управляют информацией, а параметры представления спектрального диапазона переданы, которые управляют декодером в процессе производства оценки исходного высокочастотного сигнала. Так, строго говоря, этот процесс использует три аспекта: (i) параметрическая оценка высокочастотного участка диапазона (вычисление параметра ВДС), (ii) генерация первичных исправлений (фактическое внесение исправлений) и (iii) условия для дальнейшей обработки (например, регулирование уровня шума).

Основной диапазон частот может быть определен так называемой пересекающейся частотой, которая определяет порог в пределах диапазона частот, до которого выполнено кодирование звукового сигнала. Основной кодер кодирует звуковое сообщение в пределах основного диапазона частот, ограниченного пересекающейся частотой. Начинаясь с пересекающейся частоты, компоненты сигнала будут воспроизведены в спектральном диапазоне. При использовании обычных методов для воспроизведения спектрального диапазона часто случается, что некоторые сигналы включают нежелательные искажения в пересекающейся частоте основной кодировки.

При использовании образца на основе настоящего изобретения можно задать такой алгоритм внесения исправлений, который избегает этих искажений или, по крайней мере, корректирует искажения таким образом, что они не имеют эффекта ухудшения качества восприятия. Например, при использовании отражения в алгоритме внесения исправлений во временном интервале восстановление спектрального диапазона выполнено так же как при расширении полосы пропускания (РПП) в пределах AMR-ВБ+(с использованием соответствующего адаптивного многоскоростного широкополосного кодера-декодера). Кроме того, допускается возможность изменения алгоритма внесения исправлений в зависимости от сигнала так, что для речи и для музыки, например, могут использоваться различные способы расширения полосы пропускания. Но также и для сигнала, который не может быть точно идентифицирован как музыка или речь (то есть смешанный сигнал) алгоритм внесения исправлений может быть изменен в пределах коротких промежутков времени. То есть, в любом заданном промежутке времени может использоваться для внесения исправлений наиболее подходящий алгоритм внесения исправлений. Предпочтительно алгоритм исправления определять кодирующим устройством, которое может, например, сравнить для каждого обработанного блока входных данных результаты внесения исправлений с оригинальным (исходным) звуковым сигналом. Это значительно улучшает качество восприятия получающегося звукового сигнала, произведенного звуковым синтезатором сигнала.

Дальнейшие преимущества настоящего изобретения получаются вследствие отделения генератора внесения исправлений от процессора первичного сигнала, который может включать стандартные инструменты ВДС. Это разделение позволяет использовать обычные инструменты ВДС, которые могут включать обратное фильтрование, добавление уровня шума или недостающей гармоники или пр. Поэтому, стандартные ВДС -инструменты также могут использоваться, в то время как процедура внесения исправлений становится более гибкой. Кроме того, так как стандартные ВДС-инструменты используются в частотной области, отделяя генератор исправлений от ВДС-инструментов, допускается вычисление внесения исправлений в частотной или во временной области.

Краткое описание чертежей

Существующее изобретение будет теперь описано посредством иллюстрированных примеров. Отличительные особенности изобретения будут лучше оценены и легче восприниматься в дальнейшем детальном описании, которое нужно рассматривать с использованием сопровождающих рисунков, в которых:

Фиг.1 показывает блок-схему звуковой обработки сигнала, реализующую настоящее изобретение;

Фиг.2 показывает блок-схему для генератора участка диапазона согласно изобретению;

Фиг.3 показывает блок-схему для сумматора, работающего во временном

интервале;

Фиг, 4a к 4d иллюстрируют схематично примеры для различных алгоритмов внесения исправлений;

Фиг.5a и 5b иллюстрируют фазовый вокодер и внесение исправлений методом копирования;

Фиг.6a к 6d показывают блок-схемы для обработки закодированного звукового потока и выполнения модуляции импульсами РСМ;

Фиг.7a к 7c показывают блок-схемы для звукового кодирующего устройства согласно изобретению.

Детальное описание изобретения

Примеры реализации изобретения, описанные ниже, являются просто иллюстрациями для объяснения принципа настоящего изобретения для того, чтобы улучшить преобразование спектрального диапазона, например, для использования в звуковом декодере. Подразумевается, что модификации и изменения решений, описанных здесь, будут очевидны для других специалистов. Представлена суть изобретения, чтобы не ограничиваться определенными деталями, представленными посредством описания и объяснениями об их воплощении.

Фиг.1 показывает звуковой синтезатор сигнала, используемый для воспроизведения сигнала аудиосинтеза 105, имеющего первый диапазон частот и второй скопированный диапазон частот, полученный из первого диапазона. Звуковой синтезатор сигнала включает генератор участка диапазона 110, позволяющий выполнение, по крайней мере, двух различных алгоритмов внесения исправлений, причем каждый алгоритм внесения исправлений производит первичный сигнал 115, имеющий компоненты сигнала во втором копируемом диапазоне частот, использующем звуковой сигнал 105, имеющий компоненты сигнала в первом диапазоне частот. Генератор участка диапазона 110 позволяет выбрать, по крайней мере, один из двух различных алгоритмов внесения исправлений в первую по времени часть сигнала в зависимости от информации контроля 112 и второй алгоритм (из двух различных) внесения исправлений в зависимости от информации контроля 112 для второй части сигнала, отличающейся от первой. Генератор участка диапазона формирует первичный сигнал 115 для первой и второй частей исходного сигнала. Затем звуковой синтезатор сигнала включает спектральный конвертер 120 для преобразования первичного сигнала 115 в первичное спектральное представление 125, включающее компоненты из первой и второй подгрупп, и так далее. Далее звуковой синтезатор сигнала включает первичный процессор сигнала 130 для обработки первичного спектрального представления 125 в зависимости от параметров участка диапазона спектра 132, чтобы получить соответствующее первичное представление спектра сигнала 135. Синтезатор звукового сигнала далее включает сумматор 140. Сумматор объединяет звуковой сигнал 105, имеющий компоненты сигнала из первого диапазона или сигнала, полученного из звукового сигнала 105 с соответствующим первичным представлением спектра сигнала 135 или с последующим сигналом, полученным из соответствующего первичного представления спектра сигнала 135, чтобы получить сигнал аудиосинтеза 145.

В дальнейших вариантах использования сумматор 140 может использовать сигнал, полученный из звукового сигнала 105 для представления первичного спектра сигнала 125. Сигнал, используемый сумматором, и полученный из звукового сигнала, может также быть звуковым сигналом, обработанным конвертером времени / спектральным конвертером, может быть получен в результате анализа группой фильтров, либо низкочастотным сигналом, произведенным генератором участка диапазона, работающим во временном интервале или в спектральной области, либо звуковым сигналом с задержкой по времени, либо звуковым сигналом, обработанным операцией увеличения частоты дискретизации таким образом, чтобы у сигналов, которые будут объединены, была одинаковая основная частота дискретизации.

В еще одном воплощении синтезатор звукового сигнала затем включает анализатор для того, чтобы проанализировать характеристики звукового сигнала 105, имеющего компоненты сигнала в первом диапазоне частот 201 и предоставляет контрольную информацию 112, по результатам которой выбирается первый или второй алгоритмы внесения исправлений.

В дальнейших возможных воплощениях анализатор приспособлен, чтобы запускать негармонический алгоритм исправления для части сигнала, имеющей признаки речи или гармонического алгоритма исправления для оставшейся части звукового сигнала 105.

Во всех дальнейших воплощениях изобретения звуковой сигнал 105 закодирован вместе с метаданными в потоке данных, причем генератор участка диапазона 110 приспособлен для получения контрольной информации 112 из метаданных в потоке данных.

В других вариантах использования преобразователь спектра 120 включает анализ группой фильтров, или, по крайней мере, два различных алгоритма внесения исправлений, могут также включать алгоритм фазового вокодера, либо алгоритм внесения исправлений с увеличением частоты дискретизации, либо нелинейный алгоритм корректировки искажений, либо алгоритм копирования.

Во всех же дальнейших воплощениях первичный процессор сигнала 130 приспособлен для выполнения согласования энергий участков диапазона, либо обратной фильтрации диапазонов спектра, либо добавление уровня шума к диапазону спектра, либо добавление недостающей гармоники к диапазону.

Фиг.2 показывает блок-схему, показывающую подробно генератор участка диапазона 110, включая контроллер, который получает контрольную информацию 112, и звуковой сигнал 105, и средства исправления 113. Контроллер 111 приспособлен для выбора алгоритма для участка диапазона на основе информации контроля 112. Генератор участка диапазона 110 включает первый инструмент внесения исправлений 11 За и выполнение первого алгоритма 1, второй инструмент внесения исправлений 113b и выполнение второго алгоритма внесения исправлений 2, и так далее. Вообще, генератор участка 110 включает столько средств исправления 113, сколько доступно алгоритмов внесения исправлений. Например, генератор внесения исправлений 110 может включить два, три, четыре или больше средств внесения исправлений 113. После того, как контроллер 111 получает информацию контроля 112, выбирается одно из средств внесения исправлений 113, контроллер 111 посылает звуковой сигнал 105 на средство внесения исправлений 113, которое выполняет алгоритм внесения исправлений и производит первичный сигнал 115, включающий компоненты сигнала в копируемых диапазонах частот 202, 203.

Фиг.3 показывает блок-схему, показывающую подробно сумматор (объединитель) 140, причем объединитель 140 включает группу фильтров синтеза 141, устройство задержки 143 и сумматор 147. Соответствующий первичный сигнал 135 введен в группу фильтров синтеза 141, который производит из соответствующего первичного сигнала 135 (например, в спектральном представлении) соответствующий первичный сигнал в пределах временного интервала 135t (первичный сигнал временной области). Аудиосигнал основного диапазона 105 вводится в устройство задержки 143, которое используется для задержки диапазона основного сигнала 105 на определенный промежуток времени, и после задержки диапазона основного сигнала выводится 105d. Задержанный аудиосигнал основного диапазона 105d и скорректированный во временном интервале первичный сигнал 135t объединяются в сумматоре 147, формируя сигнал аудиосинтеза 145, который выводится из объединителя 140. Величина задержки в устройстве задержки 143 зависит от алгоритма обработки синтезатора звукового сигнала, при условии, что временной интервал будет соответствовать первичному сигналу 135t будет соответствовать времени задержки сигнала основного диапазона 105d (синхронизация).

Фиг.4а к 4d показывают различные алгоритмы внесения исправлений, используемые в генераторе участка 110, и средства внесения исправлений 113. Как объяснено выше, алгоритм внесения исправлений производит исправленный сигнал в копируемом диапазоне частот. В воплощениях как показано в фиг.4, первый диапазон частот 201 продолжается до частоты отсечки fmax, в которой начинается второй диапазон частот 202 (или второй копируемый диапазон частот), продолжающийся до удвоенной частоты отсечки 2*fmax. Выше этой частоты начинается третий диапазон частот 203 (или третий копируемый диапазон частот). Первый диапазон частот 201 может включать вышеупомянутый основной диапазон частот.

На фиг.4 показаны в качестве примера четыре алгоритма внесения исправлений. Первый алгоритм внесения исправлений в фиг.4а включает отражение или осуществление выборки, второй алгоритм внесения исправлений включает копирование или модуляцию и показан в фиг.4b, третий алгоритм внесения исправлений, включающий фазовый вокодер, показан на фиг.4 с, и четвертый алгоритм внесения исправлений, обрабатывающий искажение, показан на Фиг.4d.

Отражение, как показано в фиг.4а, выполнено таким образом, чтобы исправленный сигнал во втором диапазоне частот 202 был получен путем отражения первого диапазона частот 201 относительно частоты отсечки fmax. Исправленный сигнал в третьем диапазоне частот 203, в свою очередь, получен отражением сигнала второго диапазона частот 202. Так как сигнал во втором диапазоне частот 202 уже был зеркально отраженным сигналом, сигнал в третьем диапазоне частот 203 может быть просто получен перемещением звукового сигнал 105 из первого диапазона частот 201 в третий диапазон частот 203.

Второй алгоритм внесения исправлений как показано в фиг.4 осуществляет копирование (или модуляцию) сигнала. В этом варианте исполнения сигнал во втором диапазоне частот 202 получен перемещением (копированием) сигнала первого диапазона частот 201 во второй диапазон частот 202. Точно так же также сигнал в третьем диапазоне частот 203 получен перемещением сигнал из первого диапазона частот 201 в третий диапазон частот 203.

Фиг.4 с показывает вариант исполнения с использованием фазового вокодера в качестве алгоритма внесения исправлений. Исправленный сигнал произведен последовательным рядом шагов (этапов), причем на первом шаге производятся компоненты сигнала до удвоенной частоты (максимальная частота 2*fmax), на втором шаге производятся компоненты сигнала до утроенной частоты (максимальная частота 3*fmax) и так далее. Фазовый вокодер увеличивает частоты сигналов с множителем n(n=2,3,4, синтезатор аудиосигнала и кодирующее устройство аудиосигнала, патент № 2491658 ) приведение к распространению типовых ценностей по частотному диапазону n-времен основного диапазона частот (первый диапазон частот 201).

Алгоритм внесения исправлений, использующий искажение (например, с использованием квадратичного сигнала), показан в Фиг.4d. Искажения могут быть получены многими способами. Простой путь заключается в возведении в квадрат уровня сигнала, что приводит к появлению более высоких частот. Другая возможность искажения может быть получена ограничением (например, обрезая сигнал выше определенного уровня). В этом случае также появятся высокочастотные компоненты. Практически любой способ искажения, известный в обычных методах, может здесь использоваться.

На фиг.5а более подробно показан алгоритм внесения исправлений фазовым вокодером. Первый диапазон частот 201 как и прежде заканчивается максимальной частотой fmax (частота отсечки), от которой начинается второй диапазон частот 202, который заканчивается, например, удвоенной максимальной частотой 2*fmax. После второго диапазона частот 202, начинается третий диапазон частот 203, который, например, может закончиться утроенной максимальной частотой 3*finax.

Для более ясно представления на фиг.5а показан спектр (уровень Р как функция частоты f) с восемью линиями частоты 105а, 105b, синтезатор аудиосигнала и кодирующее устройство аудиосигнала, патент № 2491658 , 105-ый для звукового сигнала 105. От этих восьми линий 105а, , 105-ый фазовый вокодер производит новый сигнал, перемещая линии в соответствии с показанными стрелками. Изменение частоты соответствует вышеупомянутому умножению. В частности, первая линия 105а перемещена к второй линии 105b, вторая линия перемещена к четвертой линии, и так далее, до восьмой 105-ой линии, которая перемещена к 16-ой линии (последняя линия во второй частотной области 202). Это соответствует умножению два. Чтобы образовались линии с утроенной максимальной частотой, 3*fmax, все частоты линий могут быть умножены на три, то есть первая линия 105а перемещена к третьей линии 105с, вторая линия 105b перемещена к шестой линии, и так далее, до восьмой 105-ой линии, которая перемещается к 24-ой линии (последняя линия в третьем диапазоне частот 203). Очевидно, что этим фазовым вокодером, линии не являются больше равноудаленными, но они простираются до более высоких частот.

Фиг.5b более подробно показывает внесение исправлений методом копирования. Снова показан уровень Р как функция частоты f, причем восемь линий находятся в первом диапазоне частот 201, которые копируются во второй диапазон частот 202, а также в третий диапазон частот 203. Это копирование предполагает только, что первая линия 105а в первом диапазоне частот 201 становится также первой линией во втором диапазоне частот 202 и в третьем диапазоне частот 203.

Следовательно, первые линии каждого из копируемых диапазонов частот 202 и 203 скопированы с той же самой линии в первом диапазоне частот 201. По аналогии это применяется также к другим линиям. Следовательно, скопирован весь диапазон частот.

Различные алгоритмы внесения исправлений как показано в фиг.4 и 5 могут использоваться избирательно, либо в пределах временного интервала либо в частотной области, и имеют различные преимущества или недостатки, которые могут применяться для различных случаев.

Например, на фиг.4а показано отражение частотной области. Во временном интервале отражение может быть выполнено, увеличивая частоту дискретизации в целое число раз, что можно осуществить, вставляя дополнительные выборки между каждой парой существующих выборок. Эти дополнительные выборки не получены из звукового сигнала, но введены системой и, например, близки к нулю или равны нулю. В самом простом случае, если только одна дополнительная выборка введена между двумя существующими выборками, достигается удвоение числа выборок, предполагая удвоение нормы осуществления выборки. Если введены более чем одна дополнительные выборки (например, равноудаленным способом), то типовая норма соответственно увеличится, и, следовательно, частотный спектр также увеличивается. Вообще, число дополнительных выборок между каждым двумя существующими может быть любым числом n(n=2, 3, 4 синтезатор аудиосигнала и кодирующее устройство аудиосигнала, патент № 2491658 ) с увеличением типовой нормы в n+1 раз. Вставка дополнительных выборок приводит к отражению частотного спектра на частоте Найквиста, которая определяет самую высокую представленную частоту при данной частоте дискретизации. Область частоты основного диапазона спектра (спектра в первом диапазоне частот), таким образом, отражается при этой процедуре непосредственно в следующий диапазон частот. При желании, это отражение может быть объединено с возможной низкочастотной фильтрацией и/Или формированием спектра.

Преимущества этого алгоритма внесения исправлений могут быть получены в итоге следующим образом. Используя этот метод, временная структура сигнала лучше сохранена, чем при использовании подобных методов в частотной области. Кроме того, спектральное отражение частотных линий близких к частоте Найквиста отображается линиями, которые также являются близкими к частоте Найквиста. Это - преимущество, потому что после отражения спектральных областей относительно частоты отражения (то есть частоты Найквиста исходного звукового сигнала 105) они оказываются подобными во многих отношениях. Это относится, например, к свойствам спектральной плоскостности, собственных тонов, количества или отчетливости частотных точек, и т.д. Этим методом спектр продолжен до следующего диапазона частот более легким способом чем, например, при использовании методов копирования. В методах копирования частотные области заканчиваются близко друг к другу и составляются из совершенно различных областей исходного спектра, что приводит к появлению совсем других особенностей. При копировании: первая линия становится снова первым линией в копируемом диапазоне, тогда как в отражении последняя линия становится первой в копируемом диапазоне.

Это более мягкое продолжение спектра может в свою очередь уменьшить искажения восприятия, которые вызваны разрывностью характеристик восстановленного спектра, произведенного другими алгоритмами внесения исправлений.

Наконец, есть сигналы, которые включают большое число гармоники, например, в низкочастотной области (первый диапазон частот 201). Эти гармоники представляются в виде ограниченных пиков в спектре. В верхней части спектра может быть, однако, очень немного гармонических составляющих или, другими словами, число гармоник в верхней части спектра уменьшено. Используя простое копирование спектра, можно получить копируемый сигнал, в котором более низкая часть спектра с большим числом гармоник скопирована непосредственно в верхнюю частотную область, где было только немного гармоник в исходном сигнале. В результате верхний диапазон частот исходного и копируемого сигнала сильно отличаются по числу гармоник, что является нежелательным и должно корректироваться.

Алгоритм внесения исправлений методом отражения может также быть применен в частотной области (например, в КОФ-области), когда порядок расположения диапазонов частот преобразуется таким образом, что упорядочение происходит в обратном порядке. Кроме того, для выборки поддиапазонов, комплексно сопряженное значение должно быть сформировано таким образом, чтобы мнимая часть каждой выборки изменила свой знак. Это приводит к инверсии спектра в пределах поддиапазона.

Этот алгоритм внесения исправлений имеет высокую гибкость относительно границ участка диапазона, так как отражение спектра необязательно должно быть сделано по частоте Найквиста, и может быть выполнено по любой границе поддиапазона.

Пересечение границ соседних КОФ-диапазонов на краях участков диапазона возможно не произойдет, что, однако, в каких- то случаях может быть недопустимо.

В методе расширения или использования фазового вокодера (см. фиг.4с или 5а) частотная структура диапазона равномерно расширяется в высокочастотную область, потому что спектр основного диапазона 201 многократно обрабатывается одним или несколькими вокодерами фазы, а также потому что спектральные компоненты в основного диапазона 201 объединены с дополнительно произведенными спектральными компонентами.

Этот алгоритм внесения исправлений предпочтителен, если основной диапазон 201 уже сильно ограничен в полосе пропускания, например, при использовании очень низкой скорости передачи битов. Следовательно, реконструкция верхних компонентов частоты начинается уже на относительно низкой частоте. Типичная частота отсечки в этом случае, менее 5 кГц (или даже меньше чем 4 кГц). В этой области человеческое ухо очень чувствительно к искажениям из-за неправильно помещенной гармоники. Это может привести к эффекту "неестественных" тонов. Кроме того, спектрально близко расположенные тоны (со спектральным расстоянием приблизительно от 30 Гц до 300 Гц) воспринимаются как грубые тоны. Гармоническое продолжение частотной структуры основного диапазона 201 избегает этих неправильных и неприятных ощущений при воспроизведении.

В третьем алгоритме внесения исправлений методом копирования (см. фиг.4с или 5b) спектральные подобласти качественно копируются в более высокочастотную область или в частотную область, которая будет копироваться. Также копирование полагается на наблюдение, которое справедливо для всех методов внесения исправлений, что спектральные свойства более высокочастотных составляющих сигналов подобны во многих отношениях свойствам сигналов на основных частотах диапазона. Есть только очень небольшие различия одного поддиапазона от другого. Кроме того, человеческое ухо обычно не очень чувствительно в высокой частоте (обычно начиная приблизительно с 5 кГц), особенно по отношению к неточной спектральной передаче. Фактически это ключевая идея общего представления диапазона сигнала. Копирование диапазона по частям имеет преимущество, которое легко и быстро осуществляется.

У этого алгоритма внесения исправлений имеется высокая гибкость относительно границ участка диапазона, так как копирование спектра может быть выполнено относительно любой границы поддиапазона.

Наконец, алгоритм внесения исправлений методом искажения (см. фиг.4d) позволяет получить гармоники путем обрезания, ограничения, возведения в квадрат и т.д. Если, например, передаваемый сигнал имеет очень тонкую структуру спектра (например, после применения вышеупомянутого алгоритма внесения исправлений фазовым вокодером), возможно, что к передаваемому спектру может быть произвольно добавлен искаженный сигнал, чтобы избежать нежелательных пропусков спектральных компонент.

Фиг.6а к 6d показывают различные варианты применения для синтезатора звукового сигнала на основе звукового декодера.

В варианте использования, показанном в фиг.6а, закодированный звуковой поток 345 введен в битовый поток полезного сигнала восстановителем формата 350, который отделяет с одной стороны закодированный звуковой сигнал 355 и с другой стороны дополнительную информацию 375. Закодированный звуковой сигнал 355 введен в, например, основной декодер ААС 360, который производит расшифрованный звуковой сигнал 105 в первом диапазоне частот 201. Диапазон звукового сигнала 105 введен в анализ в группу 32 КОФ-фильтров 370, включающую, например, 32 диапазона частот и которая производит звуковой сигнал 105₃₂ в частотной области. Предпочтительно, чтобы генератор участка диапазона производил только высокочастотную часть диапазона в качестве первичного сигнала и не производил низкочастотную часть диапазона. Как альтернативный вариант, алгоритм внесения исправлений в блоке 110 может производить низкочастотную часть диапазона и также предпочтительно, чтобы через фильтр высоких частот передавался входной сигнал в блок 130а.

Аудиосигнал 105₃₂ частотной области введен в генератор участка диапазона 110, который в этом воплощении производит участок диапазона в пределах частотной области (КОФ-область). Спектральное представление получающегося первичного сигнала 125 вводится в блок SBR 130а, который может, например, произвести уровень шума, восстановить недостающую гармонику или выполнить обратное фильтрование.

С другой стороны, дополнительная информация 375 введена в анализатор потока битов 380, который анализирует дополнительную информацию, выдает необходимую информацию 385 и вводит ее, например, в декодировщик Хаффмана и устройство деквантования 390, которое, например, извлекает контрольную информацию 112 и параметры восстановления спектрального диапазона 132. Информация контроля 112 введена в блок SBR, параметры восстановления спектрального диапазона 132 введены в блок SBR 130а, а также в регулятор огибающей 130b. Регулятор огибающей 130b необходим для корректировки огибающей произведенного диапазона участка спектра. В результате регулятор огибающей 130b производит соответствующий первичный сигнал 135 и вводит его в КОФ-группу синтеза 140, которая комбинирует первичный сигнал 135 со звуковым сигналом в частотной области 105₃₂ . КОФ-группа синтеза может, например, включать 64 диапазона частот и производить комбинирование обоих сигналов (соответствующего первичного сигнала 135 и сигнала 105₃₂ аудио частотной области) сигнал 145 аудиосинтеза (например, результат выборок КИМ, КИМ=кодовая импульсная модуляция).

Кроме того, фиг.6а показывает блок SBR 130а, который может осуществить известные методы восстановления диапазона, которые будут использоваться для спектральных данных КОФ с выводом на генератор участка диапазона 110. Алгоритм внесения исправлений, используемый в частотной области как показано в фиг.6а, может, например, использовать простое отражение или копирование спектральных данных в пределах частотной области (см. фиг.4а и фиг.4b).

Эта общая структура согласуется, таким образом, с обычными декодерами, известными в предшествующих решениях, но воплощение настоящего изобретения заменяет обычный генератор участка диапазона генератором участка диапазона 110, предназначенный для выполнения различных подходящих алгоритмов внесения исправлений, чтобы улучшить качество восприятия звукового сигнала. Кроме того, воплощения могут также использовать алгоритм внесения исправлений в пределах временного интервала и не обязательно внесения исправлений в области частоты как показано в фиг.6а.

Фиг.6b показывает воплощения существующего изобретения, в котором генератор внесения исправлений 110 может использовать алгоритм внесения исправлений в пределах частоты так же как в пределах временного интервала.

Декодер как показано в фиг.6b снова включает битовый поток полезного сигнала восстановителя формата 350, основной декодер ААС 360, анализатор потока двоичных сигналов 380, и декодировщик Хаффмана и устройство деквантования 390. Поэтому, в воплощении как показано в фиг.6b, закодированный звуковой поток 345 снова введен в битовый поток полезного сигнала восстановителя формата 350, который с одной стороны производит закодированный звуковой сигнал 355 и отделяет от него дополнительную информацию 375, который впоследствии обрабатывается анализатором потока двоичных сигналов 380, чтобы выделить информацию о различиях 385, которые введены в декодировщик Хаффмана и устройство деквантования 390. С другой стороны, закодированный звуковой сигнал 355 вводится в основной декодер ААС 360.

Воплощения изобретения теперь отличают эти два случая: генератор участка 110 управляет любым в пределах частотной области (пунктирные линии сигнала) или в пределах временного интервала (следующие пунктирные линии сигнала).

Если генератор участка диапазона работает во временном интервале, результат работы основного декодера ААС 360 вводится в генератор участка диапазона 110 (пунктирная линия для звукового сигнала 105), и затем передается для анализа группой фильтров 370. Результат анализа группой фильтров 370 является первичным представлением спектра сигнала 125, который передается в блок SBR 130а (который является частью регулятора первичного сигнала 130), а также для синтеза в группу КОФ 140.

Если, с другой стороны алгоритм внесения исправлений использует частотную область (как показано в фиг.6а), продукция основного декодера ААС 360 вводится в КОФ-группу 360 для анализа (пунктирная линия для звукового сигнала 105), который, в свою очередь, производит сигнал 105₃₂ частотной аудио области и передает звуковой сигнал 105₃₂ на генератор участка диапазона 110 и КОФ группу 140 для синтеза (пунктиры). Генератор участка диапазона 110 снова производит первичное представление сигнала 125 и передает этот сигнал на блок SBR 130а.

Следовательно, воплощение, либо выполняет первый способ обработки, по пунктирным линиям (внесение исправлений в частотной области) или второй способ обработки, по штриховым линиям (внесение исправлений во временном интервале), а сплошные линии между другими функциональными элементами используются в обоих способах обработки.

Предпочтительно, чтобы способ обработки по времени генератора участка диапазона (пунктирные линии) происходил так, чтобы результат работы генератора участка диапазона включал и низкочастотный и высокочастотный диапазоны. То есть, сигнал выхода генератора участка диапазона - широкополосный сигнал, состоящий из низкочастотного и высокочастотного поддиапазонов. Сигнал низкочастотного поддиапазона вводится в блок 140, а высокочастотного поддиапазона вводится в блок 130а. Разделение поддиапазонов может быть выполнено в блоке анализа 370, но также может быть выполнены альтернативным путем. Кроме того, сигнал с декодера ААС может подаваться непосредственно в блок 370 так, чтобы низкочастотный поддиапазон генератора участка диапазона не использовался вообще, а уникальная низкочастотная часть использовалась в объединителе 140.

В частотной области, предпочтителен способ обработки (пунктиры) при котором генератор участка диапазона только производит высокочастотный поддиапазон, и уникальная низкочастотная часть используется непосредственно для заблокирования 370 и загрузки в банк синтеза 140. Альтернативный способ, когда генератор участка диапазона может произвести сигнал во всей полосе пропускания и загрузить низкочастотный участок диапазона в блок 140.

По-прежнему декодировщик Хаффмана и устройство деквантования 390 производят параметр восстановления спектрального диапазона 132 и контрольную информацию 112, которые вводятся в генератор участка диапазона 110. Кроме того, параметры восстановления спектрального диапазона 132 передаются на регулятор огибающей 130b, а также блок SBR 130а. С выхода регулятора огибающей 130b поступает соответствующий первичный сигнал 135, который объединен в сумматоре 140 (группа синтеза КОФ) с сигналом 105₃₂ аудиодиапазона (для внесения исправлений в частотной области) или с первичным сигналом представления спектра 125 (для внесения исправлений во временном интервале), чтобы произвести сигнал 145 аудиосинтеза, который снова может включить результат выборки КИМ.

Также в этом воплощении генератор участка диапазона 110 использует один из алгоритмов внесения исправлений (как, например, показанный в фиг.4а к 4d), чтобы произвести звуковой сигнал во втором диапазоне частот 202 или третьем диапазоне частот 203 при использовании сигнала основного диапазона из первого диапазона частот 201. Только выборки звукового сигнала в пределах первого диапазона частот 201 закодированы в кодах выходного потока 345, и недостающие выборки произведены с использованием метода восстановления диапазона.

Фиг.6с показывает воплощение для алгоритма внесения исправлений в пределах временного интервала. По сравнению с фиг.6а воплощение, показанное на фиг.6с, отличается расположением генератора участка диапазона 110 и группа анализа КОФ 120. Все остальные компоненты системы декодирования остаются такими же, показано на фиг.6а, и поэтому повторное описание здесь опущено.

Генератор участка диапазона 110 получает звуковой сигнал 105 от основного декодера ААС 360 и теперь выполняет внесение исправлений в пределах временного интервала, чтобы произвести первичный сигнал 115, который введен в спектральный конвертер 120 (например, группа анализа КОФ, включает 64 группы). Один из многих вариантов состоит в том, что алгоритм внесения исправлений во временном интервале выполняется генератором участка диапазона 110, создающем первичный сигнал 115, использующий удвоенную частоту дискретизации, если генератор участка диапазона 110 выполняет внесение исправлений, вводя дополнительные выборки между существующими выборками (которые, например, имеют близкие к нулю значения). Результат работы спектрального конвертера 120 является первичным представлением спектрального сигнала 125, подающимся в регулятор огибающей 130, который снова включает блок SBR 130а с одной стороны и регулятор огибающей 130b с другой стороны. Что касается воплощений, показанных ранее, в них результат работы регулятор огибающей выдает соответствующий первичный сигнал 135, который объединяется со звуковым сигналом в частотной области 105f в сумматоре 140. Затем, при необходимости, снова включается группа КОФ 64 для синтеза диапазонов частот.

Следовательно, главное отличие состоит в том, например, что отражение выполнено во временном интервале, и высокочастотные участки уже восстановлены до того, как сигнал 115 подается на анализ на 64 фильтра диапазона из группы фильтров 120 при условии, что сигнал уже включает удвоенное количество выборок (при двойной скорости ВДС). После этой операции внесения исправлений может использоваться обычный инструмент ВДС, который может снова включить обратное фильтрование, добавление уровня шума или добавление недостающей гармоники. Хотя реконструкция высокочастотной области происходит во временном интервале, анализ/синтез выполнен в области КОФ так, чтобы мог использоваться алгоритм обработки ВДС.

В воплощении фиг.6с генератор участка диапазона предпочтительно производит сигнал во всем диапазоне, включая низкочастотный и высокочастотный участки диапазона (первичный сигнал). В альтернативном варианте, генератор участка диапазона производит только высокочастотный участок диапазона, например, полученный фильтрованием высоких частот, а вход группа КОФ 120 подключен непосредственно к выходу основного декодера ААС 105.

В дальнейшем воплощении генератор участка диапазона 110 включает входной интерфейс временного интервала и/или выходной интерфейс временного интервала (интерфейс временного интервала). В пределах этого блока может выполняться обработка в любой области, например, в области КОФ или частотной области, в областях DFT, FFT, DCT, DST или любых других частотных областях. Тогда, входной интерфейс временного интервала связан с преобразователем времени/частоты или обычным преобразователем из временного интервала в спектральное представление. Затем формируется спектральное представление с использованием по крайней мере двух различных алгоритмов внесения исправлений, работающих в частотной области. В альтернативном варианте, первый алгоритм внесения исправлений работает в частотной области, а второй алгоритм внесения исправлений работает во временной области. Исправленные данные частотной области преобразуются обратно в представление временного интервала, которое затем вводится в блок 120 через выходной интерфейс временного интервала. В варианте использования, в котором сигнал на линии 115 включает не весь диапазон, а только низкочастотную область, предпочтительно выполнять фильтрование в спектральной области до того, как спектральный сигнал преобразовывается обратно во временной интервал.

Предпочтительно, чтобы спектральное разрешение в блоке 110 было выше, чем спектральное разрешение, полученное блоком 120. В одном воплощении спектральное разрешение в блоке 110 по крайней мере в два раза выше, чем в блоке 120.

Ограничивая алгоритм внесения исправлений в отдельном функциональном блоке, который реализован в этом воплощении, можно применять произвольные методы восстановления спектра, полностью независимые от выбора методов ВДС. В альтернативном выполнении также можно получить высокочастотный участок диапазона, обработкой во временном интервале, параллельном входному сигнала декодера ААС в группу фильтров анализа с 32 поддиапазонами. Основной диапазон и исправленные сигналы будут объединены только после анализа КОФ.

Фиг.6d показывает такое воплощение, где внесение исправлений выполнено в пределах временного интервала. Аналогичное воплощение, показанное на фиг.6с, в отличие от воплощения на фиг.6а, включает генератор участка диапазона 110, а также группу фильтров анализа. В частности основной декодер ААС 360, битовый поток полезного сигнала восстановителя формата 350, анализатор потока двоичных сигналов 380, декодировщик Хаффмана и устройство деквантования 390 являются такими же, как в воплощении на фиг.6а, и снова здесь опущено повторное описание.

В воплощении на фиг.6d звуковой сигнал 105, произведенный декодером 360, и звуковой сигнал 105 на входе в генератор участка диапазона 110, такие же, как при анализе 32 поддиапазонов в группе КОФ 370. Анализ 32 поддиапазонов в банке КОФ 370 (дальше конвертер 370) производит следующее спектральное представление первичного сигнала 123. Генератор участка диапазона 110 снова выполняет внесение исправлений в пределах временного интервала и подает входящий первичный сигнал 115 в спектральный конвертер 120, который снова может включить анализ группой фильтров КОФ 64 поддиапазонов. Спектральный конвертер 120 производит первичное представление спектра сигнала 125, которое в этом воплощении включает компоненты частоты из первого диапазона частот 201 и скопированные диапазоны частот во втором или третьем диапазоне частот 202, 203. Кроме того, это воплощение содержит сумматор 124, приспособленный, чтобы с его выхода подать сигнал на фильтры анализа 32 поддиапазонов 370 и первичное спектральное представление сигнала 125 и получить объединенное первичное спектральное представление сигнала 126. В качестве сумматора 124 может использоваться объединитель 124, формируемый таким образом, чтобы вычесть компоненты основного диапазона (компоненты первого диапазона частот 201) из первичного спектрального представления сигнала 125.

Следовательно, сумматор 124 может выполняться таким образом, чтобы на его выходе формировался инвертированный сигнал или, альтернативно, сумматор может включать дополнительный инвертор, чтобы инвертировать сигнал с выхода группы фильтров 32 поддиапазонов 370.

После этого точного вычитания компонентов частоты в основном частотном диапазоне 201, сигнал снова вводится в блок восстановления диапазона спектра 130а, который, в свою очередь, направляет получающийся сигнал на регулятор огибающей 130b. Регулятор огибающей 130b снова производит соответствующий первичный сигнал 135, который складывается в объединителе 140 с результатом анализа из группы фильтров 32 поддиапазонов 370, так, что объединитель 140 складывает исправленные частотные компоненты (во втором и третьем диапазоне частот 202 и 203, например) с компонентами основного диапазона, произведенными группой фильтров 32 поддиапазонов 370. Т.о., объединитель 140 может запустить синтез в банке фильтров КОФ 64 поддиапазонов, приводящих к синтезу аудиосигнала, например, с помощью выборок КИМ.

В воплощении фиг.6d генератор участка диапазона предпочтительно производит сигнал во всем диапазоне, включающий низкочастотный и высокочастотный диапазоны (предварительный сигнал). Альтернативно, генератор участка диапазона производит только высокочастотный диапазон, например, полученный высокочастотной фильтрацией, подающийся в блок 120, и группа КОФ 370 подключается непосредственно к выходу ААС, как показано на фиг.6d. Кроме того, блок вычитания 124 не требуется, и выход блока 120 подается непосредственно в блок 130а, так как этот сигнал включает только высокочастотный диапазон. В дополнение к сказанному, блок 370 не нуждается в выводе на блок вычитания 124.

В дальнейшем воплощении генератор участка диапазона 110 включает входной интерфейс временного интервала и/или выходной интерфейс временного интервала (интерфейс временного интервала). В пределах этого блока может выполняться обработка в любой области, например, в области КОФ или частотной области, в областях DFT, FFT, DCT, DST или любых других частотных областях. Тогда, входной интерфейс временного интервала связан с преобразователем времени/частоты или обычным преобразователем из временного интервала в спектральное представление. Затем формируется спектральное представление с использованием, по крайней мере, двух различных алгоритмов внесения исправлений, работающих в частотной области. В альтернативном варианте, первый алгоритм внесения исправлений работает в частотной области, а второй алгоритм внесения исправлений работает во временной области. Исправленные данные частотной области преобразуются обратно в представление временного интервала, которое затем вводится в блок 120 через выходной интерфейс временного интервала. В варианте использования, в котором сигнал на линии 115 включает не весь диапазон, а только низкочастотную область, предпочтительно выполнять фильтрование в спектральной области до того, как спектральный сигнал преобразовывается обратно во временной интервал.

Рисунки от 6а до 6d показывают структуру декодера и особенно включение генератора участка диапазона 110 в пределы структуры декодера. Чтобы декодер и особенно генератор участка диапазона 110 был в состоянии произвести или копировать более высокие компоненты частоты, кодирующее устройство должно передать дополнительную информацию декодеру. Дополнительная информация 112 с одной стороны дает информацию контроля, которая может, например, использоваться для выбора алгоритма внесения исправлений и, кроме того, для получения параметра восстановления диапазона 132, чтобы воспользоваться методами восстановления спектрального диапазона 130а.

Дальнейшие воплощения включают также метод формирования сигнала аудиосинтеза 145, имеющего первый диапазон частот и второй копируемый диапазон частот 202 полученный из первого диапазона частот 201. Метод включает выполнение, по крайней мере, двух различных алгоритмов внесения исправлений, преобразовывая первичный сигнал 115 в первичный сигнал спектрального представления 125, и затем преобразовывая первичный сигнал спектрального представления 125.

Каждый алгоритм внесения исправлений производит первичный сигнал 115, имеющий компоненты сигнала во втором копируемом диапазоне частот 202 с использованием звукового сигнала 105, имеющего компоненты сигнала в первом диапазоне частот 201. Внесение исправлений выполнено таким образом, чтобы, по крайней мере, один из двух различных алгоритмов внесения исправлений был выбран в зависимости от информации контроля 112 в течение первого отрезка времени, а другой алгоритм внесения исправлений выбирается в зависимости от информации контроля 112 в течение второго отрезка времени, если она отличается от информации контроля в течение первого отрезка времени, чтобы получить первичный сигнал 115 для первого и второго отрезка времени. Обработка первичного представление спектра сигнала 125 выполнена в зависимости от спектральных параметров восстановления спектрального диапазона 132, чтобы получить соответствующее спектральное представление первичного сигнала 135. Наконец, метод включает объединение звукового сигнала 105, имеющего компоненты сигнала в первом диапазоне 201 или сигнала, полученного из звукового сигнала 105 с соответствующим спектральным представлением первичного сигнала 135 или с дальнейшим сигналом, полученным из соответствующего спектрального представления первичного сигнала 135, чтобы получить сигнал аудиосинтеза 145. фиг.7a, 7b и 7c включает воплощения кодирующего устройства.

Фиг.7а показывает кодирующее устройство, преобразующее звуковой сигнал 305, чтобы получить закодированный звуковой сигнал 345, который в свою очередь вводится в декодеры, как показано в фиг.6а к 6d. Кодирующее устройство как показано в фиг.7а включает, низкочастотный фильтр 310 (или селективный фильтр основной частоты), и высокочастотный фильтр 320, в который вводится звуковой сигнал 305. Низкочастотный фильтр 310, отделяет компоненты звукового сигнала в пределах первого диапазона частот 201, а высокочастотный фильтр 320 отделяет остающиеся частотных компонент, например, компоненты частоты во втором диапазоне частот 202 и других диапазонах частот. Поэтому низкочастотный фильтр 310 производит фильтрованный сигнал 315 низкой частоты, а высокочастотный фильтр 320 выделяет высокие частоты звукового сигнала 325. Фильтрованный звуковой сигнал 315 низкой частоты вводится в звуковое кодирующее устройство 330, которое может, например, включать кодирующее устройство ААС.

Кроме того, фильтрованный звуковой сигнал 315 низкой частоты вводится в генератор информационного контроля 340, который предназначен для получения информации контроля 112, на основе которой может быть выбран наилучший алгоритм внесения исправлений, который непосредственно выбирается генератором участка диапазона 110. Фильтрованный звуковой сигнал 325 высокой частоты вводится в генератор данных спектрального диапазона 328. Генератор выдает параметры диапазона 132, которые в селектор участка диапазона.

Кодирующее устройство фиг.7a включает, кроме того, восстановитель формата 343, который получает кодируемое звуковое сообщение от звукового кодирующего устройства 330, параметры восстановления диапазона 132 от генератора данных восстановления диапазона 328, и информацию контроля 112 от генератора контроля информации 340.

Параметры спектрального диапазона 132 могут зависеть от метода внесения исправлений, то есть для различных алгоритмов внесения исправлений параметры диапазона могут не отличаться, и, возможно, нет необходимости определять параметр ВДС 132 для всех алгоритмов внесения исправлений (фиг.7c показывает воплощение, где необходимо вычислять только один набор параметров ВДС 132). Поэтому генератор диапазона 328 может выдавать различные параметры диапазона 132 для различных алгоритмов внесения исправлений, и, таким образом, параметры диапазона 132 могут включать первичные параметры ВДС 132a, соответствующие первому алгоритму внесения исправлений, вторичные параметры ВДС 132b, соответствующие второму алгоритму внесения исправлений, третьи параметры ВДС 132c, соответствующие третьему алгоритму внесения исправлений и так далее.

Фиг.7b показывает более подробно воплощение для генератора контроля информации 340. Генератор контроля информации 340 получает фильтрованный сигнал 315 низкой частоты и параметры ВДС 132. Фильтрованный сигнал 315 низкой частоты может быть введен в первый блок внесения исправлений 342а, во второй блок внесения исправлений 342b, и другие блоки внесения исправлений (не показаны). Число блоков внесения исправлений 342 может, например, согласовываться с числом алгоритмов внесения исправлений, которые могут быть выполнены генератором участка диапазона 110 в декодере. Результат работы блоков внесения исправлений 342 включает первый исправленный звуковой сигнал 344а для первого блока внесения исправлений 342а, второй исправленный звуковой сигнал 344b для второго блока участка диапазона 342b и так далее. Исправленный аудиосигнал 344 включает первичные компоненты из второго диапазона частот 202 и вводится в блок средств восстановления диапазона 346. Снова количество средств в блоке восстановления диапазона 346, может быть, например, равно числу алгоритмов внесения исправлений или к числу блоков внесения исправлений 342. Параметры восстановления диапазона 132 также введены в блоки средств восстановления диапазона 346 (блок средств ВДС) так, чтобы первый блок средств ВДС 346а получил первичные параметры ВДС 132а и первый исправленный сигнал 344а. Второй блок инструментов ВДС 346b получает вторичные параметры SBR 132b и второй исправленный звуковой сигнал 344b. Средства восстановления диапазона блока 346, производят копируемый звуковой сигнал 347, включающий более высокочастотные компоненты в пределах вторых и/или третьих диапазонов частот 202 и 203 на основе параметров восстановления 132.

Наконец, генератор контроля информации 340 включает блоки сравнения, приспособленные, чтобы сравнить исходный звуковой сигнал 305 и, что особенно важно, более высокочастотные компоненты звукового сигнала 305 с копируемым звуковым сигналом 347. Как и прежде, сравнение может быть выполнено для каждого алгоритма внесения исправлений так, чтобы первый блок сравнения 348а сравнил звуковой сигнал 305 с первым копируемым звуковым сигналом 347а, произведенным первым блоком средств ВДС 346а. Точно так же второй блок сравнения 348b сравнивает звуковой сигнал

305 со вторым копируемым звуковым сигналом 347b от второго блока средств ВДС 346b.

Блоки сравнения 348 определяют отклонение копируемого аудиосигнала 347 на высоких частотах от исходного звукового сигнала 305 так, чтобы, наконец, блок оценки 349 мог сравнить отклонение между исходным звуковым сигналом 305 и копируемым аудиосигналом 347 при использовании различных алгоритмов внесения исправлений и определить из этого наилучший алгоритм внесения исправлений либо более или менее подходящие алгоритмы внесения исправлений. Информация контроля 112 включает информацию, которая позволяет идентифицировать один из наилучших алгоритмов внесения исправлений. Информация контроля 112 может, например, присвоить идентификационный номер наилучшему алгоритму внесения исправлений, который может быть определен на основе наименьшего отклонения между исходным звуковым сигналом 305 и копируемым звуковым сигналом 347. Альтернативно, информация контроля 112 может обеспечить большое количество алгоритмов внесения исправлений или создать нумерованный список алгоритмов внесения исправлений, которые приводят к достаточному соответствию между звуковым сигналом 305 и исправленным звуковым сигналом 347. Оценка может, например, быть выполнена относительно качества восприятия так, чтобы копируемый звуковой сигнал 347, в идеальном случае, был неотличим (или близок к этому) от исходного звукового сигнала 305 для человека.

Фиг.7с показывает следующий вариант воплощения для кодирующего устройства, в котором, как и прежде, вводится звуковой сигнал 305, но где произвольные метаданные 306 также введены в кодирующее устройство. Исходный звуковой сигнал 305 снова вводится в низкочастотный фильтр 310 и высокочастотный фильтр 320. Выход низкочастотного фильтра 310 поступает на вход звукового кодирующего устройства 330, а выход высокочастотного фильтра 320 поступает в генератор ВДС данных 328.

Кроме того, кодирующее устройство содержит блок обработки Мета- данных 309 и/или блок анализа 307 (или средства анализа), выход которого соединен с генератором контроля информации 340. Блок обработки метаданных 309 анализирует метаданные 306 в соответствии с подходящим алгоритмом внесения исправлений. Блок анализа 307 может, например, определить характеристики и скорость переходного процесса «периодическая последовательность импульсов»- «непериодическая последовательность импульсов» в пределах звукового сигнала 305. На основе результата работы блока обработки метаданных 309 и/или продукции средства анализа 307, генератор контроля информации 340 может, как и прежде, определить наилучший алгоритм внесения исправлений или создать нумерованный список алгоритмов внесения исправлений и кодирует эту информацию в пределах информации контроля 112. Восстановитель формата 343 снова объединяет информацию контроля 112, параметры восстановления диапазона 132 и закодированный звуковой сигнал 355 в пределах закодированного звукового потока 345.

Средство для того, чтобы проанализировать 307 определяет, например, параметр звукового сигнала и может быть использовано для идентификации негармонических компонент сигнала, часть которых имеет признаки речи, а большая часть времени содержит гармоническую компоненту сигнала. Если звуковой сигнал 305 - обычная речь, составляющая голоса велика, тогда как для смеси голоса и, например, музыки составляющая голоса ниже. Вычисление параметра ВДС 132 и наилучшего алгоритма внесения исправлений может быть выполнено в зависимости от этого параметра. Еще одно воплощение представляет метод для потока данных 345, включающего компоненты звукового сигнала 305 в первом диапазоне частот 201, информацию контроля 112 и параметры восстановления диапазона 132. Метод использует селективную фильтрацию частоты звукового сигнала 305 для создания компонент звукового сигнала 305 в первом диапазоне частот 201. Затем метод создает параметры восстановления диапазона 132 для компонентов звукового сигнала 305 во втором диапазоне частот 202. Наконец, метод вырабатывает информацию контроля 112 для определения наилучшего из двух различных алгоритмов внесения исправлений: первого или второго алгоритма внесения исправлений, причем каждый алгоритм внесения исправлений производит первичный сигнал 115, имеющий компоненты сигнала во втором копируемом диапазоне частот 202 с использованием компонентов звукового сигнала 305 в первом диапазоне частот 201.

Несмотря на то, что некоторые воплощения, показанные на фигурах от 6а до 6d, были представлены так, что комбинирование низкочастотного и высокочастотного диапазонов выполнено в частотной области, необходимо отметить, что комбинирование может также быть осуществлено во временном интервале. Для этого может использоваться выходной сигнал декодера во временном интервале (на выходе необходимо создать задержку для того, чтобы скомпенсировать задержку при обработке, возникшей при исправлении и комбинировании), и высокочастотный диапазон, настроенный на диапазон группы фильтров, преобразованный во временной интервал как сигнал, имеющий высокочастотный и не имеющий низкочастотный диапазон. В воплощении фиг.6 этот сигнал включал бы в себя только самые высокочастотные 32 диапазоны, и преобразовал бы этот сигнал во временном интервале в высокочастотный сигнал. Тогда оба сигнала могут быть объединены во временном интервале с использованием дополнительных выборок, чтобы получить например, выборки КИМ в качестве выходного сигнала для цифро/аналогового преобразования и подачи его на громкоговоритель.

Хотя некоторые аспекты были описаны в контексте аппаратной части, ясно, что эти аспекты также представляют и описание соответствующего метода, в котором блок или устройство соответствуют шагу метода или особенности шага метода. Аналогично, аспекты, описанные в контексте шага метода также, представляют описание соответствующего блока, элемента или особенности соответствующей аппаратной части.

Полученное в соответствии с изобретением закодированное звуковое сообщение или поток битов информации могут быть сохранены на цифровом носителе данных или могут быть переданы по беспроводным средствам передачи или по проводным средствам передачи, таким как Интернет.

В зависимости от конкретных требований к варианту использования изобретения, они могут быть достигнуты с использованием аппаратных средств или программного обеспечения. Изобретение может быть реализовано с использованием цифровых носителей данных, например дискет, DVD, компакт-дисков, ROM, FROM, EPROM, EEPROM или FLASH памяти, и сохранением с помощью электронных средств управляющих сигналов в удобной форме, которые совмещаются (или могут совмещаться) с компьютерной программной системой для выполнения соответствующего метода. Некоторые воплощения согласно изобретению используют носители информации, имеющие, с помощью электронных средств, управляющие сигналы в удобной форме, которые способны к совмещению с компьютерной программной системой, так, что методы, описанные здесь, могут быть выполнены. Вообще, воплощения настоящего изобретения могут быть осуществлены в виде компьютерной программы в программных кодах. Программные коды могут работать с любым из методов, когда компьютерная программа запускается на компьютере. Код программы может, например, быть сохранен в воспринимаемой компьютером форме. Другие воплощения используют компьютерную программу для того, чтобы выполнить один из методов, описанных здесь, сохраненный в воспринимаемой компьютером форме. Другими словами, воплощение метода изобретения может быть в виде компьютерной программы, имеющей программный код для того, чтобы выполнить один из методов, описанных здесь, когда компьютерная программа запускается на компьютере. Следующее воплощение методов изобретения - носитель информации (или цифровой носитель данных, или воспринимаемая компьютером среда) включающий компьютерную программу для выполнения одного из методов, описанных здесь. Следующее воплощение изобретательного метода - поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из методов, описанных здесь. Поток данных или последовательность сигналов могут, например, формироваться таким образом, чтобы их можно было передавать через линии передачи данных, например через Интернет. Следующее воплощение включает средство обработки, например компьютер, или программируемое логическое устройство, созданное или приспособленное, чтобы выполнить один из методов, описанных здесь. Дальнейшее воплощение включает компьютер с установленной на нем компьютерной программой для выполнения одного из методов, описанных здесь. В некоторых воплощениях программируемое логическое устройство (например, поля программируемой логической матрицы) может использоваться для выполнения некоторых или всех функциональных возможностей методов, описанных здесь. В некоторых воплощениях поля программируемой логической матрицы могут обрабатываться с микропроцессором для выполнения одного из методов, описанных здесь. Вообще, методы предпочтительно выполнять блоком аппаратных средств.

Вышеупомянутые описанные варианты использования просто иллюстрируют принципы настоящего изобретения. Подразумевается, что модификации и изменения методов и блоков, описанных здесь, будут очевидны для других специалистов. При таком подходе возможность использования будет ограничена только сферой предстоящих применений патента, а не определенными деталями, представленными здесь посредством описания и объяснениями воплощений.

Класс G10L21/02 усиление речи, например подавление шума, нейтрализация эхо-сигнала

устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы - патент 2527735 (10.09.2014)
низведение параметров последовательности битов sbr - патент 2526745 (27.08.2014)

аудио кодер и декодер, увеличивающий полосу частот - патент 2523035 (20.07.2014)
способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала - патент 2520420 (27.06.2014)
устройство подавления акустического эха и фронтальное устройство конференцсвязи - патент 2520359 (20.06.2014)
усовершенствованное гармоническое преобразование на основе блока поддиапазонов - патент 2518682 (10.06.2014)
устройство и способ генерирования сигнала с расширенной полосой пропускания - патент 2512090 (10.04.2014)
устройства и способы для обработки аудио сигнала с целью повышения разборчивости речи, используя функцию выделения нужных характеристик - патент 2507608 (20.02.2014)
устройство и способ формирования синтезированного аудиосигнала и кодирования аудиосигнала - патент 2501097 (10.12.2013)
устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи - патент 2498422 (10.11.2013)