способ передачи и/или запоминания цифровых сигналов нескольких каналов
Классы МПК: | G11B20/00 Обработка сигнала, не зависящая от способа записи или воспроизведения; схемы для них |
Автор(ы): | Эрнст Эберляйн (DE), Юрген Херре (DE), Бернхард Грилл (DE), Карл-Хайнц Бранденбург (DE), Дитер Зайтцер (DE) |
Патентообладатель(и): | Фраунхофер Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Фау (DE) |
Приоритеты: |
подача заявки:
1993-11-02 публикация патента:
20.04.1999 |
Изобретение относится к способу для передачи и/или хранения цифровых многоканальных сигналов, который особенно пригоден для передачи пяти каналов стереофонии 3/2, а также для передачи двух стереоканалов и трех добавочных каналов комментариев. Подобным образом, например, может производиться передача телевизионных программ со звуковым сигналом на многих языках. Этот способ характеризуется тем, что за счет сокращения передаваемых данных для передачи требуется скорость передачи битов, равная 384 Кбит/с. Указанный технический результат, а именно сокращение данных, достигается посредством того, что К входных каналов отражаются в виде сегментов на NК виртуальных спектральных каналов данных, которые квантуются, кодируются и передаются с учетом принципов психоакустики и затем воспроизводятся К выходных каналов из передаваемого потока бит с помощью совместно передаваемого списка из NК спектральных каналов данных. 9 з.п. ф-лы.
Формула изобретения
1. Способ для передачи и/или хранения цифровых сигналов от К входных каналов, в котором первоначальные значения сигналов из временной области трансформируют в виде блоков в частотную область в качестве спектральных составляющих, эти спектральные составляющие кодируют и комбинируют в поток битов, который передается и/или хранится и впоследствии декодируется и трансформируется назад в К выходных каналов во временную область, отличающийся тем, что при кодировании в зависимости от спектральных значений блоков индивидуальных входных каналов в виде сегментов формируют переменное количество спектральных каналов передачи данных, т.е. чем больше различия в первоначальных входных каналах, тем больше используют различных каналов передачи данных, причем количество переданных спектральных каналов передачи данных на сегмент меньше или равно числу К входных или выходных каналов, что количество переданных спектральных каналов передачи данных и структура спектральных каналов передачи данных включают в поток битов и в последующем передаются этим потоком бит и что в декодере после передачи потока бит с использованием информации о количестве и структуре спектральных каналов передачи данных комбинируют К выходных каналов в сегменты. 2. Способ по п. 1, отличающийся тем, что информация для декодирования сегмента выходного канала объединяют в информационный блок, состоящий из поля для длины сегмента, из поля для выбора требуемого канала спектральных данных и поля для набора масштабных коэффициентов, которые определяют в декодере восстановление амплитуд закодированных спектральных составляющих спектральных каналов передачи данных. 3. Способ по п.1 или 2, отличающийся тем, что для декодирования определенного выходного канала из спектральных составляющих спектрального канала передачи данных используют информацию о сегментах, построенную в виде списка. 4. Способ по одному из пп.1-3, отличающийся тем, что для декодирования названных К выходных каналов из спектральных составляющих спектральных каналов передачи данных используют информацию для восстановления отдельных выходных каналов, построенную в виде списка. 5. Способ по одному из пп.1-4, отличающийся тем, что входные, соответственно выходные каналы формируют многоканальный звук. 6. Способ по одному из пп.1-4, отличающийся тем, что входные, соответственно выходные каналы формируют пару стереоканалов и другие добавочные каналы комментариев. 7. Способ по одному из пп.1-6, отличающийся тем, что при кодировании спектральных составляющих эти спектральные составляющие объединяют в группы, называемые полосами масштабных коэффициентов, таким образом, что спектральные составляющие в каждой группе масштабируются соответственно общим масштабным коэффициентом, и что не передают те группы спектральных составляющих, спектральные составляющие которых не востребованы ни в одном из информационных блоков. 8. Способ по п.7, отличающийся тем, что сигнализация неиспользуемых полос масштабных коэффициентов осуществляется неявно. 9. Способ по одному из пп.1-8, отличающийся тем, что кодирование входных каналов и отображение входных каналов на спектральные каналы передачи данных осуществляют таким образом, что для восстановления выходных каналов формируется линейная комбинация восстановленных спектральных составляющих из спектральных каналов передачи данных. 10. Способ по одному из пп.1-9, отличающийся тем, что скорость передачи битов для передачи кодированных данных всех каналов не превышает 384 Кбит/с.Описание изобретения к патенту
Область техники, к которой относится изобретениеИзобретение относится к способу передачи и/или хранения цифровых многоканальных сигналов в соответствии с ограничительной частью п. 1 формулы изобретения. Описание уровня техники
Способы, в которых сигналы, в частности, аудиосигналы, частотно кодируются, известны, например, из публикаций PCT WO 88/01811 и WO 69/08357. Для одноканальной и двухканальной передачи комитет стандартизации, Экспертная Группа Движущихся Изображений (MPEG) Международной Организации Стандартизации (ISO) установила стандарт ISO-11172-3 для кодирования и для передаваемого битового потока аудиосигналов. В упомянутом способе кодирования применяются психоакустические модели, которые позволяют уменьшить количество передаваемых данных, используя свойства человеческого слуха, с минимальными потерями качества. Объяснение всех неясных здесь терминов дано полностью в публикациях и стандарте. В дальнейших разработках международного стандарта выполняемая в настоящее время работа заключается в уменьшении данных при многоканальной передаче. В научной публикации "MUSICAM-Surround: A Universal Multi-Channel Coding System Compatible with ISO 11172-3", 93rd AES convention, 1992, San Francisco, предложен способ передачи до 5 каналов. Например, могут быть переданы два стереоканала и один центральный канал, вместе с двумя боковыми каналами (стереофония 3/2) или два стереоканала и три комментирующих канала. Дальнейшее уменьшение данных достигается в тех частях стереосигналов, которые незначительны по пространственному восприятию и передаются только по одному каналу. Кроме передаваемых существуют масштабные коэффициенты, которые представляют собой меру интенсивности сигналов, идущих с моноканала в соответствующий громкоговоритель. При помощи этого способа генерируются артефакты с более низким звуковым уровнем, в частности, на более низких частотах. Кроме того, предложено уменьшить количество передаваемых данных не определением так называемого внутриканального маскирующего порога для каждого кодирующего канала, а скорее посредством определения общего порога для всех каналов, учитывая внутриканальный маскирующий эффект. Однако использование общего маскирующего порога приводит к тому, что интерференционные шумы кодирования могут восприниматься вблизи от громкоговорителя. Описание изобретения
Задачей настоящего изобретения является предложить способ передачи и/или хранения многоканальных цифровых сигналов, позволяющий дальнейшее уменьшение количества передаваемых данных без субъективно воспринимаемых искажений передаваемых сигналов. Эта задача решается с помощью способа с признаками п. 1 формулы изобретения. В соответствии с настоящим изобретением сигналы различных каналов, в первую очередь, конвертируются в спектральную область. Последовательно, используя спектральные значения соответствующих сегментов различных каналов, определяется, в каких каналах встречаются одинаковые спектральные части. При этом исследуется, находится ли интерференция, вызванная совместным кодированием при комбинации с сегментами от различных каналов, ниже порога слышимости или же генерируются артефакты. Если не ожидается артефактов, то комбинация разрушена. Подобным образом K входных каналов отображаются в виде сегментов на спектральные каналы данных (передаваемые спектральные каналы). Чем больше различаются первоначальные входные каналы, тем больше различных каналов спектральных данных используется для передачи сигнальной информации. Если в предельном случае все каналы в сегменте практически одинаковы, может оказаться достаточным один спектральный канал данных, в частности, для более высокой части спектра. Амплитуды спектральных каналов могут управляться посредством относительных масштабных коэффициентов. Число NTSC-каналов (число передаваемых спектральных каналов) требуемых спектральных каналов данных является переменным и может быть меньше или самое большее равно числу K входных, соотв. выходных каналов. Чтобы управлять комбинацией K выходных каналов с помощью NTSC-каналов спектральных каналов данных в декодере, передается список информационных данных (SEGMENT_ DATA). Этот список описывает, как комбинируются спектральные данные выходных каналов с каналами спектральных данных. Предпочтительные варианты выполнения и усовершенствования настоящего изобретения определены в зависимых пунктах формулы изобретения. Согласно п. 2 формулы изобретения управляющие команды, требуемые для восстановления сегмента выходного канала, комбинируются в информационный блок (SEGMENT_INFO). Этот блок содержит поля для длины сегмента (SEG_LENGTH), для селекции каналов спектральных данных (TSC_SELECT) и для масштабируемых коэффициентов (scf). Закодированные спектральные данные (TSC_DATA) канала спектральных данных (TSC_ NUM) декодируются с помощью относительных масштабных коэффициентов (sfc), определяя матрицу восстановления. Информация для восстановления сегментов выходного сигнала в соответствии с п. 3 формулы изобретения выстраивается в форме списка (SEGMENT_LIST). Согласно по п. 4 формулы изобретения списки сегментов отдельных выходных каналов формируют глобальный список (SEGMENT_DATA). Таким образом, списки для левого канала (LEFT_CHANNEL), правого канала (RIGHT_CHANNEL), центрального канала (CENTER_CHANNEL) и дальнейших каналов перечислены в глобальном списке. В соответствии с предпочтительным вариантом выполнения настоящего изобретения в соответствии с п. 5 формулы изобретения каналы формируют многоканальный тон. Пусть, например, передаются 5 каналов стереофонии 3/2. Кроме двух стереоканалов передаются центральный канал, левый боковой канал (LS_ CHANNEL) и правый боковой канал (RS_CHANNEL). Переданные каналы подвергаются в последующем обратному преобразованию во временную область и передаются соответствующим громкоговорителям стереофонии 3/2. В другом варианте выполнения по п. 6 формулы изобретения, кроме основных двух стереоканалов, передается несколько дополнительных комментирующих каналов. По этим каналам, например, в ТВЧ (телевидении высокой четкости) звуковые сигналы могут передаваться на различных языках. Зритель в этом случае может выбрать желаемый язык для данной телевизионной картинки. Звук может быть динамично добавлен к двум стереоканалам. Согласно п. 7 формулы изобретения передача каналов спектральных данных осуществляется с помощью способа, совместимого со стандартом ISO 11172-3. Все три уровня этого стандарта могут формировать основу передачи каналов спектральных данных. Согласно п. 8 формулы изобретения в процессе кодирования группы спектральных значений, промасштабированные с помощью общего масштабного коэффициента, принадлежат поэтому частотной полосе масштабных коэффициентов и не передаются, если эта полоса не требуется ни в каком информационном блоке (SEGMENT_ INFO). В этом случае соответствующие спектральные значения для восстановления выходных каналов не нужны. Преимущество заключается в том, что используется деление фиксированных полос масштабных коэффициентов стандарта ISO. Сигнализация неиспользуемых частотных полос масштабных коэффициентов осуществляется согласно п. 9 формулы изобретения в неявном виде, что означает, что нет необходимости в передаче информации, добавочной к этой сигнализации. Согласно п. 10 формулы изобретения с помощью способа по изобретению можно также сформировать линейную комбинацию передаваемых каналов. Это ведет к дальнейшему сокращению количества данных, если спектральные значения в отдельных каналах сильно похожи. В этом случае сигналы выходных каналов формируются линейной комбинацией восстановленных спектральных значений. Согласно п. 11 формулы изобретения битовая скорость, требуемая для передачи закодированных данных из всех каналов, не превышает 384 Кбит/с. Таким образом, удовлетворяются требования стандарта ISO на максимум битовой скорости. Существенные преимущества настоящего изобретения заключаются в том, что значительное сокращение передаваемых данных достигается отображением входных каналов на малое число виртуальных спектральных каналов без каких-либо слышимых потерь в качестве. Таким образом, аудиосигналы передаются с очень высоким пространственным разрешением. Особенное преимущество достигается в больших помещениях с большим количеством слушателей. Кроме того, индивидуальным пользователям может быть доступно несколько каналов, из которых они могут выбрать желаемую информацию. Например, звуковые каналы могут передаваться одновременно с телевизионной программой, на нескольких языках, из которых зритель может выбрать желаемый. Для реализации способа в кодирующем устройстве предпринимаются более сложные шаги обработки передаваемого битового потока. Декодер обрабатывает только последовательную информацию прибывающего битового потока и построен существенно проще, чем кодирующее устройство. Способ по изобретению, таким образом, требует малого количества кодирующих устройств более высокой степени сложности, в то время как для пользователя требуется значительно большее количество слегка усложненных декодеров. Описание варианта выполнения
Настоящее изобретение описано ниже на примере варианта выполнения. Вариант основывается на использовании стандарта ISO 11172-3 Экспертной Группы по Движущимся Изображениям (MPEG) Международной Организации Стандартизации. Этот стандарт называется далее здесь как MPEG-1. Концепция ограничивается уровнем III стандарта без ограничения объема изобретения. Как и в стандарте MPEG-1, математические операции используются подобно программам языка Си. С помощью банка фильтров сигналы 5-ти входных каналов преобразуются из временной области в частотную, в подобласти (Sb), в которых входные сигналы разделяются на спектральные составляющие. Вычисления выполняются с использованием порядка, известного в психоакустике, так, что сегменты различных каналов могут быть скомбинированы без генерации артефактов, которые лежат выше порога слышимости. Частотные составляющие входных каналов квантуются и кодируются индивидуально или как их линейная комбинация. Это имеет место при условии, что ошибка квантования лежит ниже порога слышимости. Впоследствии комбинируется передаваемый битовой поток. Он содержит квантованные и закодированные частотные составляющие каналов спектральных данных, а также добавленную информацию. Она состоит из масштабных коэффициентов, местоположения битов, информации о таблицах и других параметрах, используемых в текущем блоке, и списков, показывающих, как декодированные спектральные составляющие каналов спектральных данных скомбинированы для восстановления выходных каналов. Эти списки присоединяются к битовому потоку согласно MPEG-1 как дополнительная информация. Это расширение (MPEG2_extension_data) выглядит следующим образом: MPEG2_ extension_data ()
signalling_byte ();
NTSC; ; 3 бит uimsbf
SEGMENT_DATA ();
for (i=3; i< < = NTSC; i+ +); первые два канала
TSC_DATA (i);
Термин signalling_byte указывает, сколько и какие входные, соотв. выходные каналы заняты. Это определяет, какой канал передается: моноканал, стереоканал, центральный канал или вспомогательный канал и т.д. NTSC показывает число требуемых каналов спектральных данных. SEGMENT_DATA описывает список для восстановления выходных каналов и содержит списки для восстановления отдельных каналов (SEGMENT_LIST). SEGMENT_DATA ()
for (i=0; i < NTSC; i + +); сброс used_sb_map
for (sb=0; sb < 21; sb + +)
used_sb_map i sb = 0;
SEGMENT_LIST (LEFT_CHANNEL);
SEGMENT_LIST (RIGHT_CHANNEL);
if (center_on)
SEGMENT_LIST (CENTER_CHANNEL);
if (stereo_surround); стереоэффект
SEGMENT_LIST (LS_CHANNEL);
SEGMENT_LIST (RS_CHANNEL);
if (mono_surround); моноэффект
SEGMENT_LIST (MS_CHANNEL);
for (i=0; i < no_of_commentary_chan; i + +)
SEGMENT_LIST(COM_CHANNELi);
Функция used_ sb_ map показывает, используется ли полоса масштабных коэффициентов, содержащих спектральные составляющие промасштабированного общим масштабным коэффициентом канала спектральных данных. Если такая полоса масштабных коэффициентов не используется ни в каком информационном блоке (SEGMENT_INFO), соответствующие спектральные составляющие не передаются. Список для восстановления специального канала (SEGMENT_LIST) содержит информацию о длине сегмента (SEG_LENGTH), о размере масштабных коэффициентов (scalefac_ size), о масштабных коэффициентах (scf) и о выборе канала спектральных данных (TSC_SELECT). SEGMENT_LIST ()
sb=0;
for (i = 0; 1; i + +)
SEWG_LENGTH i; ; 4 бит uimsbf
if (SEG_LENGTH i = = 0) break;
TSC_SELECT i; ; 3 бит uimsbf
if (SEG_LENGTH i = = 15)
sign = + 1; len = SEG_LENGTH i-1;
else if (SEG_LENGTH i = = 14)
sign = -1; len = SEG_LENGTH i-1;
else
sign = 0; len = SEG_LENGTH i-1;
if (TSC_SELECT i ; = 0)
scalefac_size; ; 4 бит, bslbf
for (1 = 0; 1 < len; 1 + +)
scf i sb + 1; ; 0..4 биты
used_sb_map TSC_SELECT
sb + 1 = 1; ; маркировать использование SBs
if (!sign) sb + = len;
В варианте выполнения составляющие 14 и 15 зарезервированы для формирования линейной комбинации восстановленных спектральных составляющих. При SEG_LENGTH = = 15 - суммируется и при SEG_LENGTH = = 14 - вычитается. Битовый поток для данных из каналов спектральных данных соответствует потоку битов основных данных в случае MPEG-1/уровень III и читается следующим образом:
TSC_DATA(TSC_NUM)
part2_3_length; ; см. MPEG-1/audio
scalefac_compress;
global_gain;
block_type;
big_values;
table_select 3;
countltable_select;
region_count 2;
for (sb = 0; sb < 21 >; sb + +)
if (used_sb_map TSC_NUM sb)
Huffmancodesection TSC_NUM sb;
Использованные символы обозначают:
+ + - увеличение;
= = - тождество;
= - оператор присваивания;
! - логическое НЕ;
bslbf - битовый поток, левый бит первый;
ch - канал;
sb - поддиапазон;
uimsbf - беззнаковое целое, наиболее значимый бит первый.
Класс G11B20/00 Обработка сигнала, не зависящая от способа записи или воспроизведения; схемы для них