способ сокращения числа данных при передаче и/или накоплении цифровых сигналов, поступающих из нескольких взаимосвязанных каналов

Классы МПК:
Автор(ы):, , ,
Патентообладатель(и):Фраунхофер-Гезельшафт цур Фердерунг дер Ангевандтен Форшунг Е.В. (DE)
Приоритеты:
подача заявки:
1993-05-18
публикация патента:

Изобретение относится к способу обработки данных при передаче или накоплении цифровых сигналов, поступающих из нескольких взаимосвязанных каналов. В заявленном способе с помощью спектральных параметров информационных блоков нескольких каналов проводится балансировка необходимого количества данных раздельного кодирования сигналов обоих каналов, а также совместного кодирования. Совместное кодирование сигналов, поступающих из каналов, происходит до тех пор, пока количество данных совместного кодирования не превысит количество данных раздельного кодирования сигналов соответствующих каналов на заданную величину. В этом случае спектральные параметры информационных блоков становятся похожими друг на друга, так что предпочитается совместное кодирование. При различных сигналах балансировка приводит к раздельной передаче сигналов. Для надежного предотвращения помех временно отказываются от применения совместного кодирования сигналов, поступающих из нескольких каналов. 9 з.п.ф-лы, 1 ил.
Рисунок 1

Формула изобретения

1. Способ сокращения числа данных для передачи и/или накопления цифровых звуковых сигналов, поступающих из нескольких зависящих друг от друга каналов, при котором считываемые параметры сигналов с помощью подходящей техники отображения поблочно переводят из временной области в частотную область в спектральные параметры, спектральные параметры с учетом определяемого с помощью психоакустической модели порога слышимости кодируют, передают и/или накапливают и передают обратно в частотной области в несколько зависящих друг от друга каналов, отличающийся тем, что с помощью спектральных параметров информационных блоков нескольких зависящих друг от друга каналов проводят балансировку количества данных для раздельного кодирования сигналов из нескольких зависящих друг от друга каналов, а также для совместного кодирования сигналов из зависящих друг от друга каналов, при этом совместное кодирование сигналов из нескольких зависящих друг от друга каналов проводят так долго, пока количество данных для совместного кодирования не превзойдет количество данных для раздельного кодирования сигналов из нескольких зависящих друг от друга каналов на заданную величину, а при превышении производят раздельное кодирование.

2. Способ по п.1, отличающийся тем, что балансировки требуемого количества данных для раздельного кодирования и для совместного кодирования образуют функцию оценки, которая показывает, какое число двоичных разрядов требуется для одного информационного блока для удержания при заданном способе кодирования уровня помех, вызванного способом кодирования, ниже порога слышимости.

3. Способ по п.2, отличающийся тем, что функцию оценки требуемого количества данных для раздельного кодирования сигналов из нескольких зависящих друг от друга каналов получают путем суммирования функций оценки сигналов из соответствующих, зависящих друг от друга каналов.

4. Способ по п. 1, отличающийся тем, что совместное кодирование осуществляют путем образования линейных комбинаций сигналов из зависящих друг от друга каналов, а при декодировании производят обратное разделение сигналов зависящих друг от друга каналов.

5. Способ по п.2 или 4, отличающийся тем, что функцию оценки требуемого количества данных для совместного кодирования сигналов из нескольких зависящих друг от друга каналов получают путем суммирования функции оценки линейных комбинаций сигналов.

6. Способ по одному из пп.1 - 5, отличающийся тем, что перед балансировкой для декодирования сигналов зависящих друг от друга каналов задают максимальную допустимую помеху, при этом для этой максимальной помехи рассчитывают соответствующий порог слышимости в зависящих друг от друга каналах и используют для определения функции оценки для совместного кодирования.

7. Способ по одному из пп.2, 3 и 6, отличающийся тем, что в качестве функции оценки при раздельном кодировании используют перцептуальную энтропию звукового сигнала.

8. Способ по одному из пп.3 - 7, отличающийся тем, что совместное кодирование сигналов зависящих друг от друга каналов производят при выполнении условия

SF (Mijk ....) < C1 способ сокращения числа данных при передаче и/или   накоплении цифровых сигналов, поступающих из нескольких   взаимосвязанных каналов, патент № 2119259 SF (Ki, Kj, Kk ...) + C2,

где SF (Mijk ...) - суммарная функция оценки требуемого количества данных для совместного кодирования сигналов из зависящих друг от друга каналов;

SF (Ki, Kj, Kk ...) - суммарная функция оценки требуемого количества данных при раздельном кодировании;

C1, C2 - задаваемые константы.

9. Способ по одному из пп.3 - 7, отличающийся тем, что совместное кодирование сигналов зависящих друг от друга каналов производят при выполнении условия

SF (Mijk ....) < C1 способ сокращения числа данных при передаче и/или   накоплении цифровых сигналов, поступающих из нескольких   взаимосвязанных каналов, патент № 2119259 SF (Ki, Kj, Kk ...),

где SF (Mijk . . . ) - суммарная функция оценки требуемого количества данных для совместного кодирования сигналов из зависящих друг от друга каналов;

SF (Ki, Kj, Kk ...) - суммарная функция оценки требуемого количества данных при раздельном кодировании;

C1 - задаваемая константа.

10. Способ по п.8 или 9, отличающийся тем, что константа C1 составляет величину между 1 и 2.

Описание изобретения к патенту

Изобретение относится к способу обработки (сокращению числа) данных при передаче и/или накоплении цифровых сигналов, поступающих из нескольких взаимосвязанных каналов.

Способы, с помощью которых звуковые сигналы передаются с закодированной частотой, известны, например, из опубликованных заявок PCT WO 88/001811 и WO 89/08357. На эти публикации следует сослаться для объяснения понятий, не освещенных здесь более подробно.

Для потока двиоичных разрядов передаваемого сигнала и формирования декодера органом стандартизации Moving Pictures Experts Group (MPEG) Международной организации Стандартизации (ISO) был установлен стандарт ISO-11172-3.

Многие известные способы кодирования цифровых звуковых сигналов для обработки данных кодируют сигналы в частотном диапазоне и используют для переноса сигналов из временного диапазона в частотный диапазон (в спектральные параметры) соответствующую технику изображения, например "FFT", "DCT", "MDCT", "Многофазный фильтрационный банк" или "Гибридный фильтрационный банк".

Благодаря применению этих способов может быть достигнута высокая степень использования избыточности сигналов и несущественной (для конкретной задачи) части информации.

Если при передаче сигналов, поступающих из нескольких каналов, сигналы не являются независимыми друг от друга, возможно дополнительное преобразование объема данных, подлежащих передаче. Это условие выполняется, например, когда речь идет о сигналах в каналах квадрофонического или стереофонического звучания.

В последнее время работают над усовершенствованием международного стандарта по трансляции нескольких каналов. В специальной публикации "MUSICAM- Surround: A Universal Multi-Channel Coding Compatible wiht ISO 11172-3", 93 r. dAES Convention, 1992, San Francisco предлагается способ трансляции по 5 каналам, например по двум стереоканалам, и одному центральному каналу, а также двум дополнительным (3/2 стереозвучания) или двум стереоканалам и трем образовательным каналам. Также и при этом способе сигналы в отдельных каналах зависят друг от друга.

Уровень техники

Способ использования избыточности информации, несущественной (для конкретной задачи) части информации между двумя каналами одного стереозвукового сигнала, описан в публикации J.D.Johnsten, "Perceptual Transform Coding of Wideband Stereo Signals", ICASSP 89. При этом так называемом M/S-кодировании (центральное/дополнительное-кодирование) вместо левого и правого каналов кодируется сумма (центральное) и разность (дополнительное) стереосигнала. Благодаря этому достигается экономия объема данных, подлежащих передаче.

Зависимость сигналов двух стереоканалов используется также в интенсивном методе стереокодирования (Jntensity-Stereo-verfahren), ставшем известным из публикации "Subband Coding of Stereophonie Digital Audio Signals", Proc.of the ICASSP, 1991, S.3601-3604. Этот способ предполагает передачу моносигнала, а также дополнительной информации благодаря разделению сигнала на левый и правый.

С помощью этих обоих способов при неблагоприятной структуре сигнала могут возникнуть сильные помехи. Например, сильно отличающаяся друг от друга структура сигнала левого и правого каналов при M/S-кодировании приводит к таким искусственно вызванным явлениям, которые нельзя замаскировать при помощи действительно существующего в канале сигнала. Поэтому, например, громкий сигнал саксофона, который присутствует практически только в правом канале, создает в левом канале помехи, которые не маскируются и поэтому четко воспринимаются. При использовании интенсивного метода стереокодирования нарушается пространственный эффект звучания, если сигналы левого и правого канала имеют сильно отличающийся спектральный состав.

Известные способы применяются, таким образом, только тогда, когда не ожидается никаких неблагоприятных явлений в структуре сигнала или когда для пользы обработки (преобразования) объема данных приходится мириться с помехами. Кроме того, известные способы ограничиваются стереокодированием.

Описание изобретения

В основе изобретения стоит задача создания способа обработки (сокращение числа) данных при передаче и/или накоплении цифровых сигналов, поступающих из нескольких взаимосвязанных каналов, при котором используется зависимость сигналов в различных каналах и который исключает появление каких-либо субъективно воспринимаемых помех в передаваемых сигналах.

Эта задача решается с помощью того, что с помощью спектральных параметров информационных блоков нескольких каналов проводят балансировку доли (количества данных), требуемой для отдельного кодирования (монокодирования) каналов, а также для общего кодирования сигналов, поступающих из каналов, при этом общее кодирование сигналов, поступающих из каналов, происходит до тех пор, пока количество данных общего кодирования не превзойдет количества данных раздельного кодирования обоих каналов на заданную величину.

Согласно изобретению сигналы различных каналов переводят сначала в спектральные области. Затем с помощью спектральных параметров информационных блоков нескольких каналов проводится балансировка необходимого количества данных для раздельного кодирования сигналов нескольких каналов. Общее кодирование сигналов указанных каналов происходит до тех пор, пока количество данных общего кодирования не превысит количество данных раздельного кодирования сигналов каналов на заданную величину. В этом случае спектральные параметры информационных блоков схожи, так что общее кодирование сигналов является предпочтительным.

Если количество данных общего кодирования превышает количество данных монокодирования на заданную величину, происходит монокодирование каналов. В этом случае спектральные параметры информационных блоков каналов так разнятся, что необходимо очень высокое количество данных, чтобы вследствие процесса кодирования в соответствующих информационных каналах не возникало искусственно вызванных явлений (ошибок), которые не маскируются с помощью сигнала, действительно имеющегося в этих каналах. Для надежного предотвращения таких искусственно вызванных явлений в заявленном способе отказались прежде всего от применения общего кодирования.

Другие варианты и усовершенствования изобретения даны в зависимых пунктах формулы.

Согласно п. 2 для балансировки необходимого количества данных для моно- или общего кодирования сформирована функция оценки SF, которая показывает, с каким двоичным разрядом должно кодироваться каждое считываемое значение, чтобы при заданном способе кодирования удерживать ниже порога прослушивания помехи, вызванные в процессе кодирования.

При способе кодирования, предусматривающем четкое распределение двоичных разрядов для отдельных частотных диапазонов, можно сначала рассчитать функцию оценки (см. , например, B.Theile G, Stoll G, Link M., Low bit-rate coding of high guality audio signals, in EBU Review N 230, 1988, S.158-181).

При способе кодирования с переменными двоичными разрядами, как, например, описывается в опубликованной заявке PCT WO88/001811, выбирается подходящая для соответствующего способа функция оценки. Наиболее предпочтительная функция оценки дается ниже.

В заявленном способе функция оценки возможного способа кодирования, а именно монокодирования и общего кодирования сигналов нескольких каналов, сравнивается, таким образом, поблочно. На основании такого сравнения решается вопрос применения в отношении сигнала монокодирования или общего кодирования нескольких каналов.

При сравнении функции оценки монокодирования или общего кодирования по п.3 получается требуемое количество данных для раздельного кодирования сигналов при помощи суммирования функций оценки соответствующих каналов.

При стереокодировании двух каналов, например, функция оценки SF (LR) для раздельного кодирования образуется путем суммирования функций оценки SF (L) и SF (R) сигналов, поступающих из левого (L) и правого (R) каналов.

При наиболее выгодном формировании способа общее кодирование каналов по п.4 происходит путем образования линейных комбинаций (создание матрицы данных) входящих сигналов. После декодирования сигнала делается обратное матрицирование (разделение данных). При трансляции по двум стереоканалам происходит кодирование с помощью центрального/дополнительного (M/S) стереокодирования. При таком кодировании вместо сигналов левого и правого каналов кодируются сумма (центральное) и разность (дополнительное) сигналов, поступающих из левого и правого канала. Благодаря этому достигается экономия объема данных, подлежащих передаче.

Согласно п. 5 формулы функция оценки SF (Mijk...) количества данных, требуемого для общего кодирования сигналов, поступающих из каналов Ki, Kj, Kk..., образуется путем суммирования функций оценки SF(Mi), SF(Mj), SF(Mk).. ., причем Mi является i-матрицированным каналом.

При кодировании сигналов двух стереоканалов функция оценки количества данных, требуемого для общего кодирования сигналов, получается при суммировании функции оценки центрального сигнала (M) и дополнительного сигнала (S). При этом центральный сигнал формируется из сигнала (L) левого канала и сигнала (R) правого канала и выражен через соотношение

способ сокращения числа данных при передаче и/или   накоплении цифровых сигналов, поступающих из нескольких   взаимосвязанных каналов, патент № 2119259

а дополнительный сигнал (S) - через соотношение

способ сокращения числа данных при передаче и/или   накоплении цифровых сигналов, поступающих из нескольких   взаимосвязанных каналов, патент № 2119259

При выгодном совершенствовании изобретения согласно п.6 перед балансировкой требуемого количества данных определяется необходимая точность кодирования. Для этого сначала задается максимально допустимая помеха. Ни в одном канале фактически возникающая помеха не должна превосходить эту допустимую помеху.

Для кодирования сигналов двух стереоканалов в зависимости от соответствующего сигнала для обоих каналов рассчитывается такой порог прослушивания из акустической модели, который обеспечивает это условие. Из двух рассчитанных порогов прослушивания выбирается меньший порог для кодирования сигналов обоих каналов. Благодаря этому способу гарантируется, что паразитный сигнал никогда не выйдет за рамки допустимого значения.

При дальнейшем выгодном выполнении изобретения по п.7 в качестве функции оценки применяется так называемая "перцептуальная энтропия" (Perceptual Entropy) (PE). PE звукового сигнала - это минимальный объем данных, необходимый при заданном кодировании для возможности кодировать и декодировать звуковой сигнал без субъективно воспринимаемых значений. Определение PE дано, например, у J.D.Johnston, Estimation of Perceptual Entropy, Using Noice Masking Criteria, ICASSP 1988,S.2524-2527.

Согласно п. 8 балансировка требуемого количества данных происходит с помощью соотношения

SF(Mijk) < (C1SF(Ki,Kj, Kk...) + C2,

причем C1 и C2 являются заданными константами. Если спектральные параметры из информационных блоков соответствующих каналов удовлетворяют заданным соотношениям, происходит общее кодирование. В случае стереокодирования сигналов двух каналов соотношение следующее:

SF(MS) < C1SF(LR) + C2.

Чем меньше константы C1 и C2, тем больше должны быть похожи спектральные параметры сигналов, поступающих из каналов, для выполнения условия общего кодирования. Тем больше также вероятность, что паразитный сигнал, сформированный в процессе кодирования другим каналом, будет замаскирован сигналом, действительно имеющимся в канале. Предпочтительные значения для постоянных C1 и C2 даны в пунктах 9 и 10 формулы.

Существенные преимущества изобретения заключаются в том, что без усложнения способа передачи достигается дополнительная обработка (преобразование) данных. Искусственные явления, которые могут быть вызваны в результате общего кодирования сигналов нескольких каналов в других каналах, надежно предотвращаются. Заявленный способ не зависит от специфического построения используемого процесса кодирования и поэтому может найти многостороннее применение. Способ, хотя и требует дополнительной обработки сигналов в кодирующих устройствах, которые необходимы в меньшем количестве на передающем конце линии, но не в декодерах, требуемых в большем количестве для конечных потребителей.

Краткое описание чертежа

Пример выполнения заявленного способа раскрывается далее более подробно при помощи чертежа. Для большей наглядности в качестве примера описывается кодирование двух стереоканалов.

Чертеж демонстрирует блок-схему определения начального (включающего) критерия стереокодирования.

Путь выполнения изобретения

Значения L(t) и R(t) стереосигналов, считываемых из левого и правого каналов источника стереозвучания, переводятся с помощью быстрого преобразования по Фурье (FFT, Fast Fourier Transfоrmation) из временного диапазона поблочно в частотный диапазон, в спектральные параметры L(f), R(f). Из спектральных параметров для обоих каналов рассчитываются пороги прослушивания (Ia, Ib).

После этого для балансировки требуемого количества данных, во-первых, для раздельного кодирования, во-вторых, для общего кодирования определяется функция оценки. В представленном предпочтительном варианте выполнения в качестве функции оценки используется перцептуальная энтропия PE.

Для определения PE (LR) раздельного кодирования PE определяют соответственно по отдельности (2a, 2b) при использовании рассчитанного порога прослушивания левого и правого каналов. Общая PE (LR) получается из суммы:

PE(LR) = PE(L) + PE(R) (3).

Для определения PE(MS) общего кодирования обоих каналов спектральные параметры в предпочтительном варианте выполнения подвергаются центральному/дополнительному матрицированию (4).

При этом центральный сигнал выражается следующим образом:

способ сокращения числа данных при передаче и/или   накоплении цифровых сигналов, поступающих из нескольких   взаимосвязанных каналов, патент № 2119259

а дополнительный сигнал

способ сокращения числа данных при передаче и/или   накоплении цифровых сигналов, поступающих из нескольких   взаимосвязанных каналов, патент № 2119259

В основе последующего определения PE этих сигналов лежит минимум (5) из расчета порогов прослушивания обоих каналов (1a, 1b).

При помощи этого минимального порога прослушивания отдельно определяют PE центрального сигнала и дополнительного сигнала (6a, 6b).

Общая PE (MS) для стереокодирования получается путем суммирования:

PE(MS) = PE(M) + PE(S) (7).

Наконец, происходит балансировка требуемого количества данных (8). Звуковые сигналы подвергаются стереокодированию при выполнении условия

PE(MS) < C1PE(LP) + C2.

Если условие не выполнено, во избежание паразитных искусственно вызванных явлений в процессе кодирования от стереокодирования отказываются.

Описанный пример выполнения не ограничивается определенным способом кодирования. Напротив, заявленный способ может найти универсальное применение независимо от соответствующего способа кодирования.

Наверх