способ и устройство для обработки звукового сигнала
Классы МПК: | H04S5/00 Псевдостереосистемы, например в которых сигналы дополнительного канала извлекаются из монофонических сигналов с помощью вращения (сдвига) фазы, временной задержки или реверберации |
Автор(ы): | ОХ Хиен-О (KR), ДЗУНГ Йанг Вон (KR) |
Патентообладатель(и): | ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) |
Приоритеты: |
подача заявки:
2008-12-31 публикация патента:
20.12.2011 |
Изобретение относится к устройству и способу обработки звукового сигнала, а именно, предназначено для обработки звукового сигнала, принятого с цифрового носителя, и широкополосного сигнала. Способ обработки звукового сигнала включает в себя прием смешанного сигнала, включающего в себя, по меньшей мере, один сигнал объекта, и информации об объекте, извлеченной при формировании смешанного сигнала, прием информации о сведении для управления сигналом объекта, формирование одной из информации о смешивании и многоканальной информации с использованием информации об объекте и информации о сведении в соответствии с режимом вывода, и если формируется информация о смешивании, формирование выходного сигнала путем применения информации о смешивании к смешанному сигналу, где смешанный сигнал и выходной сигнал соответствуют монофоническому сигналу, и где многоканальная информация соответствует информации для разложения смешанного сигнала на множество канальных сигналов. Технический результат - предотвратить искажение качества звука в случае регулировки усиления вокала или музыкального сопровождения со значительной длительностью. 3 н. и 12 з.п. ф-лы, 12 ил.
Формула изобретения
1. Способ обработки звукового сигнала, содержащий этапы, на которых:
принимают смешанный сигнал, включающий в себя по меньшей мере один сигнал объекта, и информацию об объекте, извлеченную при формировании смешанного сигнала;
принимают информацию о сведении для управления сигналом объекта;
формируют одну из информации о смешивании и многоканальной информации с использованием информации об объекте и информации о сведении в соответствии с режимом вывода и
формируют выходной сигнал путем применения информации о смешивании к смешанному сигналу, если сформирована информация о смешивании,
причем смешанный сигнал и выходной сигнал соответствуют монофоническому сигналу, и
многоканальная информация соответствует информации для разложения смешанного сигнала на множество канальных сигналов.
2. Способ по п.1, в котором смешанный сигнал и выходной сигнал соответствуют сигналу во временной области.
3. Способ по п.1, в котором этап, на котором формируют выходной сигнал, содержит этапы, на которых
формируют сигнал поддиапазона путем разложения смешанного сигнала;
обрабатывают сигнал поддиапазона с использованием информации о смешивании и
формируют выходной сигнал путем синтезирования сигнала поддиапазона.
4. Способ по п.1, в котором выходной сигнал включает в себя сигнал, сформированный путем декорреляции смешанного сигнала.
5. Способ по п.1, дополнительно содержащий этап, на котором формируют множество канальных сигналов путем разложения смешанного сигнала, используя многоканальную информацию, если формируется многоканальная информация.
6. Способ по п.1, в котором режим вывода определяется в соответствии с числом каналов динамика, и в котором число каналов динамика основано на одной из информации об устройстве и информации о сведении.
7. Способ по п.1, в котором информация о сведении формируется на основе, по меньшей мере, одной из информации о положении объекта, информации об усилении объекта и информации о конфигурации воспроизведения.
8. Устройство для обработки звукового сигнала, содержащее:
демультиплексор, принимающий смешанный сигнал временной области, включающий в себя, по меньшей мере, один сигнал объекта, и информацию об объекте, извлеченную при формировании смешанного сигнала;
модуль формирования информации, формирующий одну из информации о смешивании и многоканальной информации, используя информацию об объекте и информацию о сведении для управления сигналом объекта в соответствии с режимом вывода; и
модуль смешивания, формирующий выходной сигнал путем применения информации о смешивании к смешанному сигналу, если сформирована информация о смешивании,
причем смешанный сигнал и выходной сигнал соответствуют монофоническому сигналу, и
многоканальная информация соответствует информации для разложения смешанного сигнала на множество канальных сигналов.
9. Устройство по п.8, в котором смешанный сигнал и выходной сигнал соответствуют сигналу во временной области.
10. Устройство по п.8, в котором модуль смешивания содержит:
модуль разложения на поддиапазоны, формирующий сигнал поддиапазона путем разложения смешанного сигнала;
модуль обработки М2М, обрабатывающий сигнал поддиапазона с использованием информации о смешивании; и
модуль синтезирования поддиапазонов, формирующий выходной сигнал путем синтезирования сигнала поддиапазона.
11. Устройство по п.8, в котором выходной сигнал включает в себя сигнал, сформированный путем декорреляции смешанного сигнала.
12. Устройство по п.8, дополнительно содержащее многоканальный декодер, формирующий множество канальных сигналов путем разложения смешанного сигнала, используя многоканальную информацию, если сформирована многоканальная информация.
13. Устройство по п.8, в котором режим вывода определяется в соответствии с числом каналов динамика, и в котором число каналов динамика основано на одной из информации об устройстве и информации о сведении.
14. Устройство по п.8, в котором информация о сведении формируется на основе, по меньшей мере, одной из информации о положении объекта, информации об усилении объекта и информации о конфигурации воспроизведения.
15. Машиночитаемый носитель записи, содержащий сохраненную на нем программу, предоставленную для выполнения способа обработки звукового сигнала, содержащего:
прием смешанного сигнала временной области, включающего в себя, по меньшей мере, один сигнал объекта, и информации об объекте, извлеченной при формировании смешанного сигнала;
прием информации о сведении для управления сигналом объекта;
формирование одной из информации о смешивании и многоканальной информации с использованием информации об объекте и информации о сведении в соответствии с режимом вывода и
формирование выходного сигнала путем применения информации о смешивании к смешанному сигналу, если сформирована информация о смешивании,
причем смешанный сигнал и выходной сигнал соответствуют монофоническому сигналу, и
многоканальная информация соответствует информации для разложения смешанного сигнала на множество канальных сигналов.
Описание изобретения к патенту
ОБЛАСТЬ ТЕХНИКИ
Изобретение относится к устройству для обработки звукового сигнала и способу обработки. Хотя настоящее изобретение подходит для широкой области применений, оно особенно подходит для обработки звукового сигнала, принятого с цифрового носителя, широковещательного сигнала и т.п.
УРОВЕНЬ ТЕХНИКИ
Как правило, в процессе для смешивания (понижающего микширования), т.е. преобразования с уменьшением числа каналов множества объектов в монофонический или стереофонический сигнал, параметры соответственно извлекаются из сигналов объектов. Эти параметры используются для декодера. Панорамирование и усиление каждого из объектов является управляемым с помощью выбора пользователя.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
ТЕХНИЧЕСКАЯ ПРОБЛЕМА
Однако, чтобы управлять каждым сигналом объекта, каждый источник, содержащийся в смешанном сигнале, должен располагаться или панорамироваться подходящим образом.
Кроме того, чтобы обеспечить обратную совместимость в соответствии с канально-ориентированной схемой декодирования, параметр объекта следует преобразовать в многоканальный параметр для разложения.
ТЕХНИЧЕСКОЕ РЕШЕНИЕ
Соответственно, настоящее изобретение направлено на устройство для обработки звукового сигнала и на способ для этого, которые практически устраняют одну или несколько проблем из-за ограничений и недостатков предшествующего уровня техники.
Задача настоящего изобретения - предоставить устройство для обработки звукового сигнала и способ для этого, с помощью которых монофонический сигнал, стереофонический сигнал и многоканальный сигнал могут выводиться путем управления усилением и панорамированием объекта.
Другая задача настоящего изобретения - предоставить устройство для обработки звукового сигнала и способ для этого, с помощью которых монофонический сигнал и стереофонический сигнал могут выводиться из смешанного сигнала без выполнения сложной схемы в многоканальном декодере.
Дополнительная задача настоящего изобретения - предоставить устройство для обработки звукового сигнала и способ для этого, с помощью которых можно предотвратить искажение качества звука в случае регулирования усиления вокала или музыкального сопровождения со значительной длительностью.
ПОЛЕЗНЫЕ РЕЗУЛЬТАТЫ
Соответственно, настоящее изобретение предоставляет следующие результаты или преимущества.
Во-первых, настоящее изобретение способно управлять усилением и панорамированием объекта без ограничения.
Во-вторых, настоящее изобретение способно управлять усилением и панорамированием объекта на основе пользовательского выбора.
В-третьих, если режим вывода является монофоническим или стереофоническим, то настоящее изобретение формирует выходной сигнал без выполнения сложной схемы в многоканальном декодере, посредством этого облегчая реализацию и снижая сложность.
В-четвертых, если для такого устройства в виде мобильного устройства предоставляются один или два динамика, то настоящее изобретение способно управлять усилением и панорамированием объекта для смешанного сигнала без кодека, соответствующего многоканальному декодеру.
В-пятых, если либо вокал, либо музыкальное сопровождение полностью заглушается, то настоящее изобретение способно предотвратить искажение качества звука в соответствии с регулировкой усиления.
В-шестых, если существует по меньшей мере два независимых объекта (стереофонический канал или несколько вокальных сигналов), например вокал и т.п., то настоящее изобретение способно предотвратить искажение качества звука в соответствии с регулировкой усиления.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Прилагаемые чертежи, которые включаются для обеспечения дополнительного понимания изобретения и включаются в состав и составляют часть этого описания, иллюстрируют варианты осуществления изобретения и вместе с описанием служат для объяснения принципов изобретения.
На чертежах:
фиг.1 - блок-схема устройства для обработки звукового сигнала в соответствии с вариантом осуществления настоящего изобретения для формирования монофонического/стереофонического сигнала;
фиг.2 - подробная блок-схема для первого примера модуля смешивания, показанного на фиг.1;
фиг.3 - подробная блок-схема для второго примера модуля смешивания, показанного на фиг.1;
фиг.4 - блок-схема устройства для обработки звукового сигнала в соответствии с одним вариантом осуществления настоящего изобретения для формирования бинаурального сигнала;
фиг.5 - подробная блок-схема модуля смешивания, показанного на фиг.4;
фиг.6 - блок-схема устройства для обработки звукового сигнала в соответствии с другим вариантом осуществления настоящего изобретения для формирования бинаурального сигнала;
фиг.7 - блок-схема устройства для обработки звукового сигнала в соответствии с одним вариантом осуществления настоящего изобретения для управления независимым объектом;
фиг.8 - блок-схема устройства для обработки звукового сигнала в соответствии с другим вариантом осуществления настоящего изобретения для управления независимым объектом;
фиг.9 - блок-схема устройства для обработки звукового сигнала в соответствии с первым вариантом осуществления настоящего изобретения для обработки улучшенного объекта;
фиг.10 - блок-схема устройства для обработки звукового сигнала в соответствии со вторым вариантом осуществления настоящего изобретения для обработки улучшенного объекта; и
фиг.11 и фиг.12 - блок-схемы устройства для обработки звукового сигнала в соответствии с третьим вариантом осуществления настоящего изобретения для обработки улучшенного объекта.
ЛУЧШИЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Дополнительные признаки и преимущества изобретения будут изложены в описании, которое следует, и частично будут очевидны из описания или могут быть изучены при осуществлении изобретения на практике. Задачи и другие преимущества изобретения будут реализованы и достигнуты посредством конструкции, подробно показанной в его письменном описании и формуле изобретения, а также в прилагаемых чертежах.
Для достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения, которая реализуется и в общих чертах описывается, способ обработки звукового сигнала в соответствии с настоящим изобретением включает в себя прием смешанного сигнала, включающего по меньшей мере один сигнал объекта и информацию об объекте, извлеченные при формировании смешанного сигнала, прием информации о сведении для управления сигналом объекта, формирование одной из информации о смешивании и многоканальной информации с использованием информации об объекте и информации о сведении в соответствии с режимом вывода, и если формируется информация о смешивании, формирование выходного сигнала путем применения информации о смешивании к смешанному сигналу, где смешанный сигнал и выходной сигнал соответствуют монофоническому сигналу, и где многоканальная информация соответствует информации для разложения (преобразования с увеличением числа каналов) смешанного сигнала на множество канальных сигналов.
В соответствии с настоящим изобретением смешанный сигнал и выходной сигнал соответствуют сигналу во временной области.
В соответствии с настоящим изобретением формирование выходного сигнала включает в себя формирование сигнала поддиапазона путем разложения смешанного сигнала, обработку сигнала поддиапазона с использованием информации о смешивании и формирование выходного сигнала путем синтезирования сигнала поддиапазона.
В соответствии с настоящим изобретением выходной сигнал включает в себя сигнал, сформированный путем декорреляции смешанного сигнала.
В соответствии с настоящим изобретением способ дополнительно включает в себя формирование множества индивидуальных сигналов путем разложения смешанного сигнала, используя многоканальную информацию, если формируется многоканальная информация.
В соответствии с настоящим изобретением режим вывода определяется в соответствии с числом каналов динамика, и число каналов динамика основано на одной из информации об устройстве и информации о сведении.
В соответствии с настоящим изобретением информация о сведении формируется на основе по меньшей мере одной из информации о положении объекта, информации об усилении объекта и информации о конфигурации воспроизведения.
Для дальнейшего достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения устройство для обработки звукового сигнала включает в себя демультиплексор, принимающий смешанный сигнал, включающий по меньшей мере один сигнал объекта и информацию об объекте, извлеченные при формировании смешанного сигнала, модуль формирования информации, формирующий одну из информации о смешивании и многоканальной информации, используя информацию об объекте и информацию о сведении для управления сигналом объекта в соответствии с режимом вывода, и модуль смешивания, формирующий выходной сигнал путем применения информации о смешивании к смешанному сигналу, если формируется информация о смешивании, где смешанный сигнал и выходной сигнал соответствуют монофоническому сигналу, и где многоканальная информация соответствует информации для разложения смешанного сигнала на множество канальных сигналов.
В соответствии с настоящим изобретением модуль смешивания включает в себя модуль разложения на поддиапазоны, формирующий сигнал поддиапазона путем разложения смешанного сигнала, модуль обработки M2M, обрабатывающий сигнал поддиапазона с использованием информации о смешивании, и модуль синтезирования поддиапазонов, формирующий выходной сигнал путем синтезирования сигнала поддиапазона.
Для дальнейшего достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения способ обработки звукового сигнала в соответствии с настоящим изобретением включает в себя прием смешанного сигнала, включающего по меньшей мере один сигнал объекта и информацию об объекте, извлеченные при формировании смешанного сигнала, прием информации о сведении для управления сигналом объекта, формирование одной из информации о смешивании и многоканальной информации с использованием информации об объекте и информации о сведении в соответствии с режимом вывода, и если формируется информация о смешивании, формирование выходного сигнала путем применения информации о смешивании к смешанному сигналу, где смешанный сигнал соответствует монофоническому сигналу, где выходной сигнал соответствует стереофоническому сигналу, сформированному путем применения декоррелятора к смешанному сигналу, и где многоканальная информация соответствует информации для разложения смешанного сигнала в многоканальный сигнал.
В соответствии с настоящим изобретением смешанный сигнал и выходной сигнал соответствуют сигналу во временной области.
В соответствии с настоящим изобретением формирование выходного сигнала включает в себя формирование сигнала поддиапазона путем разложения смешанного сигнала, формирование двух сигналов поддиапазонов путем обработки сигнала поддиапазона с использованием информации о смешивании и формирование выходного сигнала путем синтезирования двух сигналов поддиапазонов соответственно.
В соответствии с настоящим изобретением формирование двух сигналов поддиапазонов включает в себя формирование декоррелированного сигнала путем декорреляции сигнала поддиапазона и формирование двух сигналов поддиапазонов путем обработки декоррелированного сигнала и сигнала поддиапазона с использованием информации о смешивании.
В соответствии с настоящим изобретением информация о смешивании включает в себя бинауральный параметр, и выходной сигнал соответствует бинауральному сигналу.
В соответствии с настоящим изобретением способ дополнительно включает в себя формирование множества индивидуальных сигналов путем разложения смешанного сигнала с использованием многоканальной информации, если формируется многоканальная информация.
В соответствии с настоящим изобретением режим вывода определяется в соответствии с числом каналов динамика, и число каналов динамика основано на одной из информации об устройстве и информации о сведении.
Для дальнейшего достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения устройство для обработки звукового сигнала включает в себя демультиплексор, принимающий смешанный сигнал, включающий по меньшей мере один сигнал объекта, смешанный сигнал временной области и информацию об объекте, извлеченные при формировании смешанного сигнала, модуль формирования информации, формирующий одну из информации о смешивании и многоканальной информации, используя информацию о сведении для управления сигналом объекта и информацию об объекте в соответствии с режимом вывода, и модуль смешивания, формирующий выходной сигнал путем применения информации о смешивании к смешанному сигналу, если формируется информация о смешивании, где смешанный сигнал соответствует монофоническому сигналу, где выходной сигнал соответствует стереофоническому сигналу, сформированному путем применения декоррелятора к смешанному сигналу, и где многоканальная информация соответствует информации для разложения смешанного сигнала на множество канальных сигналов.
Для дальнейшего достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения способ обработки звукового сигнала в соответствии с настоящим изобретением включает в себя прием смешанного сигнала, включающего по меньшей мере один сигнал объекта и информацию об объекте, извлеченные при формировании смешанного сигнала, прием информации о сведении, включающей информацию выбора режима, причем информация о сведении предназначена для управления сигналом объекта, игнорирование смешанного сигнала или извлечение фонового объекта и по меньшей мере одного независимого объекта из смешанного сигнала на основе информации выбора режима, и если игнорируется смешанный сигнал, формирование многоканальной информации с использованием информации об объекте и информации о сведении, где смешанный сигнал соответствует монофоническому сигналу, и где информация выбора режима включает в себя информацию, указывающую один из режимов, включающих в себя нормальный режим, режим для управления фоновым объектом и режим для управления по меньшей мере одним независимым объектом.
В соответствии с настоящим изобретением способ дополнительно включает в себя прием информации об улучшенном объекте, где по меньшей мере один независимый объект извлекается из смешанного сигнала с использованием информации об улучшенном объекте.
В соответствии с настоящим изобретением информация об улучшенном объекте соответствует разностному сигналу.
В соответствии с настоящим изобретением по меньшей мере один независимый объект соответствует основанному на объекте сигналу, а фоновый объект соответствует монофоническому сигналу.
В соответствии с настоящим изобретением стереофонический выходной сигнал формируется, если режим выбора режимов соответствует нормальному режиму. И фоновый объект, и по меньшей мере один независимый объект извлекаются, если режим выбора режимов соответствует одному из режима для управления фоновым объектом и режима для управления по меньшей мере одним независимым объектом.
В соответствии с настоящим изобретением способ дополнительно включает в себя формирование по меньшей мере одной из первой многоканальной информации для управления фоновым объектом и второй многоканальной информации для управления по меньшей мере одним независимым объектом, если фоновый объект и по меньшей мере один независимый объект извлекаются из смешанного сигнала.
Для дальнейшего достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения устройство для обработки звукового сигнала включает в себя демультиплексор, принимающий смешанный сигнал, включающий по меньшей мере один сигнал объекта и информацию об объекте, извлеченные при формировании смешанного сигнала, транскодер объекта, игнорирующий смешанный сигнал или извлекающий фоновый объект и по меньшей мере один независимый объект из смешанного сигнала на основе информации выбора режима, включенной в информацию о сведении для управления сигналом объекта, и многоканальный декодер, формирующий многоканальную информацию с использованием информации об объекте и информации о сведении, где смешанный сигнал соответствует монофоническому сигналу, если игнорируется смешанный сигнал, где выходной сигнал соответствует стереофоническому сигналу, сформированному путем применения декоррелятора к смешанному сигналу, и где информация выбора режима включает в себя информацию, указывающую один из режимов, включающих в себя нормальный режим, режим для управления фоновым объектом и режим для управления по меньшей мере одним независимым объектом.
Для дальнейшего достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения способ обработки звукового сигнала в соответствии с настоящим изобретением включает в себя прием смешанного сигнала, включающего по меньшей мере один сигнал объекта и информацию об объекте, извлеченные при формировании смешанного сигнала, прием информации о сведении, включающей информацию выбора режима, причем информация о сведении предназначена для управления сигналом объекта, и формирование стереофонического выходного сигнала с использованием смешанного сигнала или извлечение фонового объекта и по меньшей мере одного независимого объекта из смешанного сигнала на основе информации выбора режима, где смешанный сигнал соответствует монофоническому сигналу, где стереофонический выходной сигнал соответствует сигналу временной области, включающему сигнал, сформированный путем декорреляции смешанного сигнала, и где информация выбора режима включает в себя информацию, указывающую один из режимов, включающих в себя нормальный режим, режим для управления фоновым объектом и режим для управления по меньшей мере одним независимым объектом.
В соответствии с настоящим изобретением способ дополнительно включает в себя прием информации об улучшенном объекте, где по меньшей мере один независимый объект извлекается из смешанного сигнала с использованием информации об улучшенном объекте.
В соответствии с настоящим изобретением информация об улучшенном объекте соответствует разностному сигналу.
В соответствии с настоящим изобретением по меньшей мере один независимый объект соответствует основанному на объекте сигналу, а фоновый объект соответствует монофоническому сигналу.
В соответствии с настоящим изобретением стереофонический выходной сигнал формируется, если режим выбора режимов соответствует нормальному режиму. И фоновый объект, и по меньшей мере один независимый объект извлекаются, если режим выбора режимов соответствует одному из режима для управления фоновым объектом и режима для управления по меньшей мере одним независимым объектом.
В соответствии с настоящим изобретением способ дополнительно включает в себя формирование по меньшей мере одной из первой многоканальной информации для управления фоновым объектом и второй многоканальной информации для управления по меньшей мере одним независимым объектом, если фоновый объект и по меньшей мере один независимый объект извлекаются из смешанного сигнала.
Для дальнейшего достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения устройство для обработки звукового сигнала включает в себя демультиплексор, принимающий смешанный сигнал, включающий по меньшей мере один сигнал объекта и информацию об объекте, извлеченные при формировании смешанного сигнала, и транскодер объекта, формирующий стереофонический выходной сигнал с использованием смешанного сигнала или извлекающий фоновый объект и по меньшей мере один независимый объект из смешанного сигнала на основе информации выбора режима, включенной в информацию о сведении для управления сигналом объекта, где смешанный сигнал соответствует монофоническому сигналу, где стереофонический выходной сигнал соответствует сигналу временной области, включающему сигнал, сформированный путем декорреляции смешанного сигнала, и где информация выбора режима включает в себя информацию, указывающую один из режимов, включающих в себя нормальный режим, режим для управления фоновым объектом и режим для управления по меньшей мере одним независимым объектом.
Нужно понимать, что как предшествующее общее описание, так и последующее подробное описание являются типовыми и поясняющими и имеют целью обеспечить дополнительное объяснение заявленного изобретения.
ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Сейчас будет сделана подробная ссылка на предпочтительные варианты осуществления настоящего изобретения, примеры которых иллюстрируются на прилагаемых чертежах. Во-первых, терминология в настоящем изобретении может толковаться как нижеследующие отсылки. А терминология, не раскрытая в этом описании изобретения, может толковаться как нижеследующие значения и понятия, соответствующие технической идее настоящего изобретения.
В частности, "информация" в этом раскрытии изобретения является терминологией, которая обычно включает в себя значения, параметры, коэффициенты, элементы и т.п., и ее смысл иногда можно истолковать иначе, но этим настоящее изобретение не ограничивается.
Объект обладает идеей, включающей как основанный на объекте сигнал, так и основанный на канале сигнал. Иногда объект может включать в себя только основанный на объекте сигнал.
Если принимается монофонический смешанный сигнал, то настоящее изобретение намеревается описать различные процессы для обработки монофонического смешанного сигнала. Прежде всего, способ формирования монофонического/стереофонического сигнала или множества канальных сигналов из монофонического смешанного сигнала, при необходимости, будет объясняться со ссылкой на фиг.1-3. Во-вторых, способ формирования бинаурального сигнала из монофонического смешанного сигнала (или стереофонического смешанного сигнала) будет объясняться со ссылкой на фиг.4-6. В-третьих, различные варианты осуществления для способа управления сигналом независимого объекта (или монофоническим фоновым сигналом), содержащимся в монофоническом смешанном сигнале, объясняются со ссылкой на фиг.7-12.
1. Формирование монофонического/стереофонического сигнала
Фиг.1 - блок-схема устройства для обработки звукового сигнала в соответствии с вариантом осуществления настоящего изобретения для формирования монофонического/стереофонического сигнала.
Ссылаясь на фиг.1, устройство 100 для обработки звукового сигнала в соответствии с вариантом осуществления настоящего изобретения включает в себя демультиплексор 110, модуль 120 формирования информации и модуль 130 смешивания. Устройство 100 обработки звукового сигнала дополнительно может включать в себя многоканальный декодер 140.
Демультиплексор 110 принимает информацию об объекте (OI) посредством потока двоичных сигналов. Информация об объекте (OI) является информацией об объектах, содержащихся в смешанном сигнале, и может включать в себя информацию об уровне объекта, информацию о взаимосвязи объектов и т.п. Информация об объекте (OI) может содержать параметр объекта (OP), который является параметром, указывающим характеристику объекта.
Поток двоичных сигналов дополнительно содержит смешанный сигнал (DMX). Демультиплексор 110 дополнительно способен извлекать смешанный сигнал (DMX) из этого потока двоичных сигналов. Смешанный сигнал (DMX) является сигналом, сформированным в результате смешивания по меньшей мере одного сигнала объекта, и может соответствовать сигналу во временной области. Смешанный сигнал (DMX) может быть монофоническим сигналом или стереофоническим сигналом. В данном варианте осуществления смешанный сигнал (DMX) для примера является монофоническим сигналом.
Модуль 120 формирования информации принимает информацию об объекте (OI) от демультиплексора 110. Модуль 120 формирования информации принимает информацию о сведении (MXI) из интерфейса пользователя. Модуль 120 формирования информации принимает информацию о режиме вывода (OM) из интерфейса или устройства пользователя. Модуль 120 формирования информации дополнительно способен принимать параметр HRTF (функция моделирования восприятия звука) из HRTF DB.
В этом случае информация о сведении (MXI) является информацией, сформированной на основе информации о положении объекта, информации об усилении объекта, информации о конфигурации воспроизведения и т.п. Информация о положении объекта является информацией, введенной для пользователя, чтобы управлять положением или панорамированием каждого объекта. Информация об усилении объекта является информацией, введенной для пользователя, чтобы управлять усилением каждого объекта. В частности, информация о положении объекта или информация об усилении объекта могут быть информацией, выбранной из заданных режимов. В этом случае заданный режим является значением для предварительной установки определенного усиления или положения объекта с течением времени. Информация о заданном режиме может быть значением, принятым от другого устройства, или значением, сохраненным в устройстве. Между тем выбор одного из по меньшей мере одного или нескольких заданных режимов (например, неиспользуемый заданный режим, заданный режим 1, заданный режим 2 и т.д.) может определяться вводом пользователя.
Информация о конфигурации воспроизведения является информацией, содержащей количество динамиков, положение динамика, информацию об окружении (виртуальное положение динамика) и т.п. Информация о конфигурации воспроизведения может вводиться пользователем, может заранее сохраняться или может приниматься от другого устройства.
Информация о режиме вывода (OM) является информацией о режиме вывода. Например, информация о режиме вывода (OM) может включать в себя информацию, указывающую, сколько сигналов используется для вывода. Эта информация, указывающая, сколько сигналов используется для вывода, может соответствовать одному из монофонического режима вывода, стереофонического режима вывода, многоканального режима вывода и т.п. Между тем информация о режиме вывода (OM) может быть тождественна количеству динамиков в информации о сведении (MXI). Если информация о режиме вывода (OM) заранее сохраняется, то она основывается на информации об устройстве. Если информация о режиме вывода (OM) вводится пользователем, то она основывается на введенной пользователем информации. В этом случае введенная пользователем информация может включаться в информацию о сведении (MXI).
Модуль 120 формирования информации формирует одну из информации о смешивании (DPI) и многоканальной информации (MI), используя информацию об объекте (OI) и информацию о сведении (MXI) в соответствии с режимом вывода. В этом случае режим вывода основывается на объясненной выше информации о режиме вывода (OM). Если режим вывода является монофоническим выводом или стереофоническим сигналом, то модуль 120 формирования информации формирует информацию о смешивании (DPI). Если режим вывода является многоканальным выводом, то модуль 120 формирования информации формирует многоканальную информацию (MI). В этом случае информация о смешивании (DPI) является информацией для обработки смешанного сигнала (DMX), подробности которой будут объясняться позже. Многоканальная информация (MI) является информацией для разложения смешанного сигнала (DMX) и может включать в себя информацию об уровне канала, информацию о взаимосвязи каналов и т.п.
Если режим вывода является монофоническим выводом или стереофоническим выводом, то формируется только информация о смешивании (DPI). Причина в том, что модуль 130 смешивания способен формировать монофонический сигнал временной области или стереофонический сигнал временной области. Между тем, если режим вывода является многоканальным выводом, то формируется многоканальная информация (MI). Причина в том, что многоканальный декодер 140 может формировать многоканальный сигнал, если входной сигнал является монофоническим сигналом.
Модуль 130 смешивания формирует монофонический выходной сигнал или стереофонический выходной сигнал, используя информацию о смешивании (DPI) и монофонический смешанный сигнал (DMX). В этом случае информация о смешивании (DPI) является информацией для обработки смешанного сигнала (DMX) и предназначена для управления усилениями и/или панорамированиями объектов, содержащихся в смешанном сигнале.
Между тем монофонический выходной сигнал или стереофонический выходной сигнал соответствует сигналу временной области и может включать в себя сигнал PCM. В случае монофонического выходного сигнала подробная конфигурация модуля 130 смешивания будет объясняться со ссылкой на фиг.2. В случае стереофонического выходного сигнала подробная конфигурация модуля 130 смешивания будет объясняться со ссылкой на фиг.3.
Кроме того, информация о смешивании (DPI) может включать в себя бинауральный параметр. В этом случае бинауральный параметр является параметром для объемного эффекта и может быть информацией, сформированной модулем 120 формирования информации с использованием информации об объекте (OI), информации о сведении (MXI) и параметра HRTF. Если информация о смешивании (DPI) включает в себя бинауральный параметр, то модуль 130 смешивания способен выводить бинауральный сигнал. Вариант осуществления для формирования бинаурального сигнала будет подробно объясняться позже со ссылкой на фиг.4-6.
Если принимается стереофонический смешанный сигнал вместо монофонического смешанного сигнала [не показано на чертеже], то обработка для изменения перекрестных помех выполняется только у смешанного сигнала вместо формирования выходного сигнала временной области. Обработанный смешанный сигнал может снова обрабатываться многоканальным декодером 140. К тому же настоящее изобретение не ограничивается этой обработкой.
Если режим вывода является многоканальным режимом вывода, то многоканальный декодер 140 формирует многоканальный сигнал путем разложения смешанного сигнала (DMX), используя многоканальную информацию. Многоканальный декодер 140 может быть реализован в соответствии со стандартом MPEG Surround (IS)/IEC 23003-1, которым настоящее изобретение не ограничивается.
Фиг.2 - подробная блок-схема для первого примера модуля смешивания, показанного на фиг.1, который является вариантом осуществления для формирования монофонического выходного сигнала.
Фиг.3 - подробная блок-схема для второго примера модуля смешивания, показанного на фиг.1, который является примером для формирования стереофонического выходного сигнала.
Ссылаясь на фиг.2, модуль 130А смешивания включает в себя модуль 132А разложения на поддиапазоны, модуль 134А обработки M2M и модуль 136А синтезирования поддиапазонов. Модуль 130А смешивания формирует монофонический выходной сигнал из монофонического смешанного сигнала.
Модуль 132А разложения на поддиапазоны формирует сигнал поддиапазона путем разложения монофонического смешанного сигнала (DMX). Модуль 132А разложения на поддиапазоны реализуется с помощью гребенки гибридных фильтров, и сигнал поддиапазона может соответствовать сигналу в гибридной области QMF. Модуль 134А обработки M2M обрабатывает сигнал поддиапазона с использованием информации о смешивании (DPI). В этом случае M2M является аббревиатурой монофонического-в-монофонический. Модуль 134А обработки M2M способен использовать декоррелятор для обработки сигнала поддиапазона. Модуль 136А синтезирования поддиапазонов формирует монофонический выходной сигнал временной области путем синтезирования обработанного сигнала поддиапазона. Кроме того, модуль 136А синтезирования поддиапазонов может быть реализован с помощью гребенки гибридных фильтров.
Ссылаясь на фиг.3, модуль 130В смешивания включает в себя модуль 132В разложения на поддиапазоны, модуль 134В обработки M2S, первый модуль 136В синтезирования поддиапазонов и второй модуль 138В синтезирования поддиапазонов. Модуль 130В смешивания принимает монофонический смешанный сигнал, а затем формирует стереофонический выходной сигнал.
Как и упомянутый выше модуль 132А разложения на поддиапазоны, показанный на фиг.2, модуль 132В разложения на поддиапазоны формирует сигнал поддиапазона путем разложения монофонического смешанного сигнала (DMX). Также модуль 132В разложения на поддиапазоны может быть реализован с помощью гребенки гибридных фильтров.
Модуль 134В обработки M2S формирует два сигнала поддиапазонов (первый сигнал поддиапазона и второй сигнал поддиапазона) путем обработки сигнала поддиапазона с использованием информации о смешивании (DPI) и декоррелятора 135В. В этом случае M2S является аббревиатурой монофонического-в-стереофонический. Если используется декоррелятор 135В, то он способен увеличить стереофонический эффект путем снижения взаимосвязи между правым и левым каналами.
Между тем декоррелятор 135В задает сигнал поддиапазона, введенный из модуля 132В разложения на поддиапазоны, как первый сигнал поддиапазона, а затем может вывести сигнал, сформированный путем декорреляции первого сигнала поддиапазона, в качестве второго сигнала поддиапазона, чем настоящее изобретение не ограничивается.
Первый модуль 136В синтезирования поддиапазонов синтезирует первый сигнал поддиапазона, а второй модуль 138В синтезирования поддиапазонов синтезирует второй сигнал поддиапазона, при помощи чего формируется стереофонический выходной сигнал временной области.
Таким образом, если вводится монофонический смешанный сигнал, то вариант осуществления вывода монофонического/стереофонического выходного сигнала посредством модуля смешивания объясняется в вышеприведенном описании. В нижеследующем описании объясняется случай формирования бинаурального сигнала.
2. Формирование бинаурального сигнала
Фиг.4 - блок-схема устройства для обработки звукового сигнала в соответствии с одним вариантом осуществления настоящего изобретения для формирования бинаурального сигнала. Фиг.5 - подробная блок-схема модуля смешивания, показанного на фиг.4. Фиг.6 - блок-схема устройства для обработки звукового сигнала в соответствии с другим вариантом осуществления настоящего изобретения для формирования бинаурального сигнала.
Со ссылкой на фиг.4 и фиг.5 объясняется один вариант осуществления для формирования бинаурального сигнала. Со ссылкой на фиг.6 объясняется другой вариант осуществления для формирования бинаурального сигнала.
Ссылаясь на фиг.4, устройство 200 обработки звукового сигнала включает в себя демультиплексор 210, модуль 220 формирования информации и модуль 230 смешивания. В этом случае, как и вышеупомянутый демультиплексор 110, описанный со ссылкой на фиг.1, демультиплексор 210 извлекает информацию об объекте (OI) из потока двоичных сигналов и дополнительно способен извлечь смешанный сигнал (DMX) из потока двоичных сигналов. В этом случае смешанный сигнал может быть монофоническим сигналом или стереофоническим сигналом.
Модуль 220 формирования информации формирует информацию о смешивании, содержащую бинауральный параметр, с использованием информации об объекте (OI), информации о сведении (MXI) и информации HRTF. В этом случае информация HRTF может быть информацией, извлеченной из HRTF DB. И бинауральный параметр является параметром для привнесения виртуального объемного эффекта.
Модуль 230 смешивания выводит бинауральный сигнал с использованием информации о смешивании (DPI), которая включает в себя бинауральный параметр. Подробная конфигурация модуля 230 смешивания объясняется со ссылкой на фиг.5.
Ссылаясь на фиг.5, модуль 230А смешивания включает в себя модуль 232А разложения на поддиапазоны, модуль 234А бинауральной обработки и модуль 236А синтезирования поддиапазонов. Модуль 232А разложения на поддиапазоны формирует один или два сигнала поддиапазонов путем разложения смешанного сигнала. Модуль 234А бинауральной обработки обрабатывает один или два сигнала поддиапазонов, используя информацию о смешивании (DPI), содержащую бинауральный параметр. Модуль 236А синтезирования поддиапазонов формирует бинауральный выходной сигнал временной области путем синтезирования одного или двух сигналов поддиапазонов.
Ссылаясь на фиг.6, устройство 300 обработки звукового сигнала включает в себя демультиплексор 310 и модуль 320 формирования информации. Устройство 300 обработки звукового сигнала дополнительно может включать в себя многоканальный декодер 330.
Демультиплексор 310 извлекает информацию об объекте (OI) из потока двоичных сигналов и дополнительно способен извлечь смешанный сигнал (DMX) из потока двоичных сигналов. Модуль 320 формирования информации формирует многоканальную информацию (MI) с использованием информации об объекте (OI) и информации о сведении (MXI). В этом случае многоканальная информация (MI) является информацией для разложения смешанного сигнала (DMX) и включает в себя такой пространственный параметр, как информация об уровне канала и информация о взаимосвязи каналов. Модуль 320 формирования информации формирует бинауральный параметр с использованием параметра HRTF, извлеченного из HRTF DB. Бинауральный параметр является параметром для привнесения объемного эффекта и может включать в себя сам параметр HRTF. Бинауральный параметр является стационарным значением и может обладать динамической характеристикой.
Если смешанный сигнал является монофоническим сигналом, то многоканальная информация (MI) дополнительно может включать в себя информацию об усилении (ADG). В этом случае информация об усилении (ADG) является параметром для регулирования усиления смешанного сигнала и используется в управлении усилением для определенного объекта. В случае бинаурального выходного сигнала для объекта необходима повышающая дискретизация или понижающая дискретизация. Предпочтительно использовать информацию об усилении (ADG). Если многоканальный декодер 330 придерживается стандарта MPS Surround и многоканальную информацию (MI) нужно сконфигурировать в соответствии с синтаксисом MPEG Surround, то можно использовать информацию об усилении (ADG) путем задания "bsArbitraryDownmix=1".
Если смешанный сигнал является стереофоническим сигналом, то устройство 300 обработки звукового сигнала дополнительно может включать в себя модуль смешивания (не показан на чертеже) для повторного панорамирования правого и левого каналов стереофонического смешанного сигнала. Еще в бинауральном воспроизведении могут формироваться перекрестные элементы правого и левого каналов путем выбора параметра HRTF. Поэтому работа модуля смешивания (не показан на чертеже) не является необходимой. Если смешанный сигнал является стереофоническим и многоканальная информация (MI) придерживается стандарта MPS Surround, то предпочтительно установить режим конфигурации 5-2-5. И он [сигнал] предпочтительно выводится путем игнорирования только переднего левого канала и переднего правого канала. Кроме того, бинауральный параметр может передаваться таким образом, что тракты от правого и левого передних каналов к правому и левому выходам (итого четыре набора параметров) имеют допустимые значения, в то время как остальные значения равны нулю.
Многоканальный декодер 330 формирует бинауральный выходной сигнал из смешанного сигнала, используя многоканальную информацию (MI) и бинауральный параметр. В частности, многоканальный декодер 330 способен формировать бинауральный выходной сигнал путем применения сочетания пространственного параметра, включенного в многоканальную информацию, и бинаурального параметра к смешанному сигналу.
В вышеприведенном описании объясняются варианты осуществления для формирования бинаурального выходного сигнала. Как и в первом варианте осуществления, если бинауральный выходной сигнал формируется непосредственно с помощью модуля смешивания, то не нужно выполнять сложную схему в многоканальном декодере. Следовательно, можно снизить сложность. Как и во втором варианте осуществления, если используется многоканальный декодер, то можно использовать функцию многоканального декодера.
3. Управление независимым объектом (режим караоке/режим без инструментального сопровождения)
В нижеследующем описании объясняется методика для управления независимым объектом или фоновым объектом при приеме монофонического смешанного сигнала.
Фиг.7 - блок-схема устройства для обработки звукового сигнала в соответствии с одним вариантом осуществления настоящего изобретения для управления независимым объектом, а фиг.8 - блок-схема устройства для обработки звукового сигнала в соответствии с другим вариантом осуществления настоящего изобретения для управления независимым объектом.
Ссылаясь на фиг.7, многоканальный декодер 410 в устройстве 400 кодирования звукового сигнала принимает множество индивидуальных сигналов, а затем формирует монофонический смешанный сигнал (DMXm) и многоканальный поток двоичных сигналов. В этом случае множество индивидуальных сигналов является многоканальными фоновыми объектами (MBO).
Например, многоканальный фоновый объект (MBO) может включать в себя множество сигналов инструментов, формирующих музыкальное сопровождение. Кроме того, невозможно узнать, сколько исходных сигналов включается (например, сигналов инструментов). И они являются неуправляемыми по исходному сигналу. Хотя фоновый объект может смешиваться в стереофонический канал, настоящее изобретение намеревается описать фоновый объект, смешанный только в монофонический сигнал.
Кодер 420 объекта формирует монофонический смешанный сигнал (DMX) путем смешивания монофонического фонового объекта (DMXm) и по меньшей мере одного сигнала объекта (objN), а также формирует двоичный поток информации об объекте. В этом случае по меньшей мере один сигнал объекта (или основанный на объекте сигнал) является независимым объектом и может называться объектом переднего плана (FGO). Например, если фоновый объект является сопровождением, то независимый объект (FGO) может соответствовать сигналу ведущего вокала. Конечно, если имеется два независимых объекта, это может соответствовать вокальному сигналу певца 1 и вокальному сигналу певца 2 соответственно. И кодер 420 объекта дополнительно способен формировать разностную информацию.
Кодер 420 объекта способен формировать разность в процессе смешивания монофонического фонового объекта (DMXm) и сигнала объекта (objN) (то есть независимого объекта). Эта разность используется для декодера, чтобы извлекать независимый объект (или фоновый объект) из смешанного сигнала.
Транскодер 510 объекта в устройстве 500 декодирования звукового сигнала извлекает по меньшей мере один независимый объект или фоновый объект из смешанного сигнала (DMX), используя информацию об улучшенном объекте (например, разность) в соответствии с информацией выбора режима (MSI), включенной в информацию о сведении (MXI).
Информация выбора режима (MSI) включает в себя информацию, указывающую, выбирается ли режим для управления фоновым объектом и по меньшей мере одним независимым объектом. Кроме того, информация выбора режима (MSI) может включать в себя информацию, указывающую, какому из режимов, включающих нормальный режим, режим для управления фоновым объектом и режим для управления по меньшей мере одним независимым объектом, соответствует установленный режим. Например, если фоновый объект является музыкальным сопровождением, то режим для управления фоновым объектом может соответствовать режиму "без инструментального сопровождения" (или сольному режиму). Например, если независимый объект является вокалом, то режим для управления по меньшей мере одним независимым объектом может соответствовать режиму караоке. Другими словами, информация выбора режима может быть информацией, указывающей, выбирается ли один из нормального режима, режима "без инструментального сопровождения" и режима караоке. Кроме того, в случае режима "без инструментального сопровождения" или караоке дополнительно может включаться информация о регулировке усиления. Таким образом, если информацией выбора режима (MSI) является режим "без инструментального сопровождения" или караоке, то по меньшей мере один независимый объект или фоновый объект извлекается из смешанного сигнала (DMX). В случае нормального режима смешанный сигнал может подвергаться обходу.
Если извлекается независимый объект, то транскодер 510 объекта формирует сведенный монофонический смешанный сигнал путем сведения по меньшей мере одного независимого объекта и фонового объекта с использованием информации об объекте (OI), информации о сведении (MI) и т.п. В этом случае информация об объекте (OI) является информацией, извлеченной из двоичного потока информации об объекте, и может быть тождественна объясненной в предшествующем описании. И информация о сведении (MXI) может быть информацией для регулирования усиления и/или панорамирования объекта.
Между тем транскодер 510 объекта формирует многоканальную информацию (MI) с использованием многоканального потока двоичных сигналов и/или двоичного потока информации об объекте. Многоканальная информация (MI) может предоставляться для управления фоновым объектом или по меньшей мере одним независимым объектом. В этом случае многоканальная информация может включать в себя по меньшей мере одну из первой многоканальной информации для управления фоновым объектом и второй многоканальной информации для управления по меньшей мере одним независимым объектом.
И многоканальный декодер 520 формирует выходной сигнал из монофонического смешанного сигнала, сведенного с использованием многоканальной информации (MI) или пропущенного монофонического смешанного сигнала.
Фиг.8 - схема другого варианта осуществления для формирования независимого объекта.
Ссылаясь на фиг.8, модуль 600 обработки звукового сигнала принимает монофонический смешанный сигнал (DMX). Устройство 600 обработки звукового сигнала включает в себя модуль 610 смешивания, многоканальный декодер 620, модуль 630 OTN и модуль 640 воспроизведения.
Устройство 600 обработки звукового сигнала определяет, вводить ли смешанный сигнал в модуль 630 OTN, в соответствии с информацией выбора режима (MSI). В этом случае информация выбора режима может быть тождественна упомянутой выше информации выбора режима, описанной со ссылкой на фиг.7.
Если в соответствии с информацией выбора режима текущий режим является режимом для управления фоновым объектом (MBO) или по меньшей мере одним независимым объектом (FGO), то смешанный сигнал разрешается ввести в модуль 630 OTN. Если текущий режим является нормальным режимом в соответствии с информацией выбора режима, то смешанный сигнал обходит модуль 630 OTN, но вводится в модуль 610 смешивания или многоканальный декодер 620 в соответствии с режимом вывода. В этом случае режим вывода идентичен информации о режиме вывода (OM), описанной со ссылкой на фиг.1, и может включать в себя количество выходных динамиков.
Если режим вывода является монофоническим/стереофоническим/бинауральным режимом вывода, то смешанный сигнал обрабатывается модулем 610 смешивания. В этом случае модуль 610 смешивания может быть элементом, играющим такую же роль, как и упомянутый выше модуль 130/130A/130B смешивания, описанный со ссылкой на фиг.1/фиг.2/фиг.3.
Если режим вывода является многоканальным режимом, то многоканальный декодер 620 формирует многоканальный выходной сигнал из монофонического смешанного сигнала (DMX). Также многоканальный декодер 620 может быть элементом, играющим такую же роль, как и упомянутый выше многоканальный декодер 140, описанный со ссылкой на фиг.1.
Между тем, если монофонический смешанный сигнал вводится в модуль 630 OTN в соответствии с информацией выбора режима (MSI), то модуль 630 OTN извлекает монофонический фоновый объект (MBO) и по меньшей мере один сигнал независимого объекта (FGO) из смешанного сигнала. В этом случае OTN является аббревиатурой "один-в-n". Если существует один сигнал независимого объекта, то модуль OTN может иметь конструкцию OTT (один-в-два). Если существует два сигнала независимых объектов, то модуль OTN может иметь конструкцию OTT (один-в-три). Если существует (N-1) сигналов независимых объектов, то модуль OTN может иметь конструкцию OTN.
Модуль 630 OTN способен использовать информацию об объекте (OI) и информацию об улучшенном объекте (EOI). В этом случае информация об улучшенном объекте (EOI) может быть разностным сигналом, сформированным в процессе смешивания фонового объекта и независимого объекта.
И модуль 640 воспроизведения формирует выходной индивидуальный сигнал путем воспроизведения фоновой информации (MBO) и независимого объекта (FGO) с использованием информации о сведении (MXI). В этом случае информация о сведении (MXI) включает в себя информацию для управления фоновым объектом и/или информацию для управления независимым объектом. Между тем многоканальная информация (MI) может формироваться на основе информации об объекте (OI) и информации о сведении (MXI). В этом случае выходной индивидуальный сигнал вводится в многоканальный декодер (не показан на чертеже) и может затем смешиваться на основе многоканальной информации.
Фиг.9 - блок-схема устройства для обработки звукового сигнала в соответствии с первым вариантом осуществления настоящего изобретения для обработки улучшенного объекта, фиг.10 - блок-схема устройства для обработки звукового сигнала в соответствии со вторым вариантом осуществления настоящего изобретения для обработки улучшенного объекта, и фиг.11 и фиг.12 - блок-схемы устройства для обработки звукового сигнала в соответствии с третьим вариантом осуществления настоящего изобретения для обработки улучшенного объекта.
Первый вариант осуществления относится к монофоническому смешанному сигналу и монофоническому объекту. Второй вариант осуществления относится к монофоническому смешанному сигналу и стереофоническому объекту. И третий вариант осуществления относится к случаю, охватывающему оба случая из первого и второго вариантов осуществления.
Ссылаясь на фиг.9, кодер 710 информации об улучшенном объекте в устройстве 700А кодирования звукового сигнала формирует информацию об улучшенном объекте (EOP_x1) из сведенного звукового сигнала, который является монофоническим сигналом, и сигнала объекта (obj_x1). В этом случае, поскольку один сигнал формируется с использованием двух сигналов, кодер 710 информации об улучшенном объекте может быть реализован в виде кодирующего модуля OTT (один-в-два). В этом случае информация об улучшенном объекте (EOP_x1) может быть разностным сигналом. И кодер 710 информации об улучшенном объекте формирует информацию об объекте (OP_x1), соответствующую модулю OTT.
Декодер 810 информации об улучшенном объекте в устройстве 800А декодирования звукового сигнала формирует выходной сигнал (obj_x1'), соответствующий дополнительным данным повторного сведения, используя информацию об улучшенном объекте (EOP_x1) и сведенный звуковой сигнал.
Ссылаясь на фиг.10, устройство 700В кодирования звукового сигнала включает в себя кодер 710В информации о первом улучшенном объекте и кодер 720В информации о втором улучшенном объекте. И устройство 800В декодирования звукового сигнала включает в себя декодер 820В информации о первом улучшенном объекте и декодер 810В информации о втором улучшенном объекте.
Кодер 710В информации о первом улучшенном объекте формирует объединенный объект и информацию о первом улучшенном объекте (EOP_L1) путем объединения двух сигналов объектов (obj_x1, obj_x2). В этом случае два сигнала объектов могут включать в себя стереофонический сигнал объекта, то есть сигнал левого канала объекта и сигнал правого канала объекта. В процессе формирования объединенного объекта формируется информация о первом объекте (OP_L1).
Кодер 720В информации о втором улучшенном объекте формирует информацию о втором улучшенном объекте (EOP_L0) и информацию о втором объекте (OP_L0) с использованием сведенного звукового сигнала, который является монофоническим сигналом, и объединенного объекта.
Таким образом, итоговый сигнал формируется посредством двух вышеприведенных этапов. Так как каждый из кодеров 710В и 720В информации о первом и втором улучшенном объекте формирует один сигнал из двух сигналов, то он может быть реализован в виде модуля OTT (один-в-два).
Устройство 800В декодирования звукового сигнала выполняет процесс обратно процессу в устройстве 700В кодирования звукового сигнала.
В частности, декодер 810В информации о втором улучшенном объекте формирует объединенный объект, используя информацию о втором улучшенном объекте (EOP_L0) и сведенный звуковой сигнал. В этом случае можно дополнительно извлечь звуковой сигнал.
И декодер 820В информации о первом улучшенном объекте формирует два объекта (obj_x1', obj_x2'), которые являются дополнительными данными повторного сведения, из объединенного объекта с использованием информации о первом улучшенном объекте (EOP_L1).
Фиг.11 и фиг.12 показывают объединенную конструкцию первого и второго вариантов осуществления. Ссылаясь на фиг.11, если улучшенный объект переходит в монофонический или стереофонический в соответствии с наличием или отсутствием работы древовидной структуры 5-1-5 или 5-2-5 многоканального кодера 705С, то смешанный сигнал переходит в монофонический сигнал или стереофонический сигнал.
Ссылаясь на фиг.11 и фиг.12, если улучшенный объект является монофоническим сигналом, то кодер 710С информации о первом улучшенном объекте и декодер 820С информации о первом улучшенном объекте не работают. Функции элементов идентичны таковым с такими же названиями, описанным касательно фиг.10.
Между тем, если смешанный сигнал является монофоническим, кодер 720С информации о втором улучшенном объекте и декодер 810С информации о втором улучшенном объекте предпочтительно работают как кодер OTT и декодер OTT соответственно. Если смешанный сигнал является стереофоническим, кодер 720С информации о втором улучшенном объекте и декодер 810С информации о втором улучшенном объекте могут работать как кодер TTT и декодер TTT соответственно.
В соответствии с настоящим изобретением, описанный выше способ обработки звукового сигнала может быть реализован на программно записанном носителе в виде машиночитаемых кодов. Машиночитаемые носители включают в себя все виды записывающих устройств, в которых хранятся данные, считываемые компьютерной системой. Машиночитаемые носители включают в себя, например, ROM, RAM, CD-ROM, магнитные пленки, гибкие диски, оптические запоминающие устройства и т.п., а также включают в себя реализации типа несущей (например, передачу через Интернет). Кроме того, поток двоичных сигналов, сформированный способом кодирования, сохраняется на машиночитаемом носителе записи или может передаваться по сети проводной/беспроводной связи.
ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ
Соответственно, настоящее изобретение применимо для кодирования и декодирования звукового сигнала.
Несмотря на то, что в этом документе настоящее изобретение описано и проиллюстрировано со ссылкой на его предпочтительные варианты осуществления, специалистам в данной области техники будет очевидно, что в нем могут быть сделаны различные модификации и изменения без отклонения от сущности и объема изобретения. Таким образом, предполагается, что настоящее изобретение охватывает модификации и изменения этого изобретения, которые подпадают под объем прилагаемой формулы изобретения и ее эквивалентов.
Класс H04S5/00 Псевдостереосистемы, например в которых сигналы дополнительного канала извлекаются из монофонических сигналов с помощью вращения (сдвига) фазы, временной задержки или реверберации