кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения

Классы МПК:	G10L19/06 определение или кодирование характеристик полосы спектра, например коэффициентов прогнозирования краткосрочных предсказаний
Автор(ы):	ЭКУДДЕН Эрик (SE), ХАГЕН Роар (SE), ЙОХАНССОН Ингемар (SE)
Патентообладатель(и):	ТЕЛЕФОНАКТИЕБОЛАГЕТ ЛМ ЭРИКССОН (пабл) (SE)
Приоритеты:	подача заявки: 1999-11-08 публикация патента: 27.09.2004

Изобретение относится к радиосвязи, в частности к процессу кодирования речи, в котором в течение промежутков времени, в которых отсутствует речевая активность, создают искусственный фоновый шум. Технический результат - повышение пропускной способности системы. Посредством изменения значений параметра комфортного шума, обычно используемых для генерации комфортного шума, улучшают качество комфортного шума, генерацию которого осуществляет устройство декодирования речи в течение промежутков времени, в которых отсутствует речевой сигнал. Изменение значений параметра комфортного шума осуществляют в ответ на получение информации об изменчивости, соответствующей параметру комфортного шума. Измененные значения параметра комфортного шума затем используют для генерации комфортного шума. 2 с. и 24 з.п. ф-лы, 9 ил.

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10

Формула изобретения

1. Способ генерации комфортного шума в устройстве (93) декодирования речи, которое принимает информацию речевого сигнала и шума из канала (95) связи, включающий формирование множества значений (33) спектральных и энергетических параметров комфортного шума, обычно используемых в устройстве (93) декодирования речи для генерации комфортного шума, отличающийся тем, что включает этапы, при которых получают информацию (31) об изменчивости, которая указывает степень изменчивости спектральных и энергетических параметров (37) фонового шума, испытываемой устройством кодирования, в ответ на информацию об изменчивости осуществляют изменение (30) значений (33) спектральных и энергетических параметров комфортного шума для формирования измененных значений (35) спектральных и энергетических параметров комфортного шума и используют измененные значения (35) спектральных и энергетических параметров комфортного шума для генерации комфортного шума (25), причем информация об изменчивости указывает, как изменяются спектральные и энергетические параметры фонового шума относительно по меньшей мере одной из следующих величин: времени и средних значений параметров фонового шума.

2. Способ по п.1, отличающийся тем, что упомянутый этап получения включает вычисление средних значений (51) спектральных и энергетических параметров фонового шума по множеству значений спектральных и энергетических параметров (37) фонового шума и вычитание среднего значения из каждого соответствующего значения параметра (37) фонового шума для формирования множества значений (55) отклонения.

3. Способ по п.2, отличающийся тем, что упомянутый этап изменения включает случайный выбор одного из упомянутых значений отклонения, масштабирование выбранного случайным образом значения отклонения посредством умножения на масштабный коэффициент для формирования масштабированного значения отклонения, и объединение масштабированного значения отклонения с соответствующим значением (33) параметра комфортного шума для формирования одного из измененных значений (35) параметра комфортного шума.

4. Способ по п.1, отличающийся тем, что устройство (93) декодирования речи предусмотрено в устройстве радиосвязи.

5. Способ по п.4, отличающийся тем, что устройство (93) декодирования речи предусмотрено в сотовом телефоне.

6. Способ по п.1, отличающийся тем, что упомянутый этап получения включает получение в устройстве (93) декодирования речи информации (31) об изменчивости независимо от канала (95) связи.

7. Способ по п.1, отличающийся тем, что упомянутый этап получения включает прием устройством (93) декодирования речи информации (31) об изменчивости из устройства (91) кодирования речи через канал (95) связи.

8. Способ по п.1, отличающийся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости относительно среднего значения, указывающую, как изменяются спектральные и энергетические параметры фонового шума относительно средних значений спектральных и энергетических параметров (37) фонового шума.

9. Способ по п.8, отличающийся тем, что упомянутый этап получения включает использование множества значений каждого из параметров (37) фонового шума для вычисления средних значений (51) параметров (37) фонового шума в течение интервала времени и сравнение средних значений по меньшей мере с некоторыми из соответствующих значений (37) параметров фонового шума для формирования значений параметров фонового шума с исключенным средним значением.

10. Способ по п.9, отличающийся тем, что упомянутый этап получения включает использование множества значений параметров (37) фонового шума для вычисления коэффициентов (89) фильтрации и фильтрацию, по меньшей мере, некоторых из значений параметров (37) фонового шума с исключенным средним значением в соответствии с коэффициентами фильтрации.

11. Способ по п.10, отличающийся тем, что упомянутый этап использования включает вычисление коэффициентов фильтрации фильтра прогнозирующего устройства с автоматической регрессией.

12. Способ по п.8, отличающийся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры (37) фонового шума во времени.

13. Способ по п.1, отличающийся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры фонового шума во времени.

14. Устройство для формирования параметров (33) комфортного шума, используемое для генерации комфортного шума в устройстве (93) декодирования речи, которое принимает информацию речевого сигнала и шума из канала (95) связи, содержащее первый вход (33) для подачи множества значений (33) спектральных и энергетических параметров комфортного шума, обычно используемых в устройстве (93) декодирования речи для генерации комфортного шума, и второй вход (31) для подачи спектральных и энергетических параметров (37) фонового шума, отличающееся тем, что дополнительно содержит устройство (30) изменения, соединенное с первым (33) и вторым (31) входами и реагирующее на характеристики изменчивости спектральных и энергетических параметров (51) фонового шума, для изменения значений (33) спектральных и энергетических параметров комфортного шума для формирования измененных значений (30) спектральных и энергетических параметров комфортного шума, и выход (35), соединенный с устройством (30) изменения, для выдачи измененных значений (30) спектральных и энергетических параметров комфортного шума для их использования при генерации комфортного шума, причем характеристики изменчивости спектральных и энергетических параметров фонового шума указывают, как изменяются спектральные и энергетические параметры фонового шума относительно, по меньшей мере, одной из следующих величин: времени и средних значений параметров фонового шума.

15. Устройство по п.14, отличающееся тем, что устройство (30) изменения содержит устройство (41) оценки изменчивости, соединенное с вторым входом (31) и реагирующее на параметры (37) фонового шума, для формирования указанной информации об изменчивости.

16. Устройство по п.15, отличающееся тем, что устройство оценки изменчивости содержит устройство (51) определения среднего значения изменчивости для формирования информации (31) об изменчивости относительно среднего значения, указывающей, как изменяются параметры (37) фонового шума относительно средних значений параметров (37) фонового шума.

17. Устройство по п.16, отличающееся тем, что устройство (51) определения среднего значения изменчивости содержится в устройстве (93) декодирования речи.

18. Устройство по п.16, отличающееся тем, что устройство (51) определения среднего значения изменчивости содержится в устройстве (91) кодирования речи, которое осуществляет связь с устройством (93) декодирования речи через канал (95) связи.

19. Устройство по п.16, отличающееся тем, что устройство (51) определения среднего значения изменчивости в ответ на получение множества значений параметров (37) фонового шума осуществляет вычисление средних значений параметров (37) фонового шума на интервале времени (51) и дополнительно сравнивает средние значения, по меньшей мере, с некоторыми из значений параметров (37) фонового шума для формирования значений параметров (37) фонового шума с исключенным средним значением.

20. Устройство по п.19, отличающееся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры (37) фонового шума во времени.

21. Устройство по п.20, отличающееся тем, что устройство (41) оценки изменчивости содержит устройство (53) вычисления коэффициентов, которое в ответ на получение множества значений параметров (37) фонового шума осуществляет вычисление коэффициентов (89) фильтрации, причем указанная информация об изменчивости во времени включает в себя коэффициенты фильтрации.

22. Устройство по п.21, отличающееся тем, что коэффициенты фильтрации являются коэффициентами фильтрации фильтра прогнозирующего устройства с автоматической регрессией.

23. Устройство по п.21, отличающееся тем, что содержит фильтр (57), соединенный с устройством (53) вычисления коэффициентов для приема из него коэффициентов фильтрации и соединенный с устройством (51) определения среднего значения изменчивости для фильтрации, по меньшей мере, некоторых из значений параметров фонового шума с исключенным средним значением в соответствии с коэффициентами фильтрации.

24. Устройство по п.21, отличающееся тем, что устройство вычисления коэффициентов содержится в устройстве декодирования речи.

25. Устройство по п.21, отличающееся тем, что устройство (53) вычисления коэффициентов содержится в устройстве (91) кодирования речи, которое осуществляет связь с устройством (93) декодирования речи через канал (95) связи.

26. Устройство по п.15, отличающееся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры фонового шума во времени.

Описание изобретения к патенту

Данная заявка на изобретение, согласно статье 35 USC 119(е) (1) свода законов США, имеет приоритет находящей в процессе одновременного рассмотрения предварительной заявки на патент США №60/109,555 с датой подачи 23 ноября 1998 г.

ОБЛАСТЬ ТЕХНИКИ

Изобретение относится, в общем случае, к процессу кодирования речи, в частности к процессу кодирования речи, в котором в течение промежутков времени, в которых отсутствует речевая активность, создают искусственный фоновый шум.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Радиопередающие и радиоприемные устройства обычно снабжены устройствами соответственно кодирования и декодирования речи, которые взаимодействуют таким образом, что позволяют осуществлять передачу речевых сигналов между заданными передатчиком и приемником по линии радиосвязи. Совокупность устройства кодирования речи и устройства декодирования речи часто называют кодер-декодером речи. Типичным примером устройства связи, которое обычно содержит радиопередающее устройство, снабженное устройством кодирования речи, и радиоприемное устройство, снабженное устройством декодирования речи, является радиотелефон мобильной связи (например, телефонный аппарат сотовой связи).

В обычных устройствах, основанных на поблочном кодировании речи, входящий речевой сигнал разделяют на блоки, называемые кадрами. Для обычной телефонной связи с шириной полосы частот 4 кГц длина кадров обычно равна 20 миллисекундам (мс) или 160 выборкам. Кадры дополнительно разделяют на под-кадры, длина которых обычно равна 5 мс или 40 выборкам.

В обычных устройствах кодирования с линейным предсказанием посредством анализа через синтез (ЛПАС) используют модели, обусловленные речеобразованием. Параметры модели, описывающие речевой тракт человека, основной тон речевого сигнала и т.д. извлекают из входного речевого сигнала. Вычисление медленно изменяющихся параметров обычно осуществляют для каждого кадра. Примерами таких параметров являются, в том числе, параметры КСП (краткосрочного предсказания, которые характеризуют речевой тракт устройства, создающего речевой сигнал. Одним из примеров параметров КСП являются коэффициенты линейного предсказания (КПП), которые отображают форму спектра входного речевого сигнала. Примерами более быстро изменяющихся параметров являются, в том числе, параметры основного тона и поправки на форму/усиление, вычисление которых обычно осуществляют для каждого подкадра.

Квантование извлеченных параметров осуществляют с использованием соответствующих известных способов скалярного и векторного квантования. Параметры КСП, например, линейные коэффициенты предсказания, часто преобразуют в более удобный для квантования вид, например, в виде частот с линейчатым спектром (ЧЛС). После квантования параметры передают по каналу связи в устройство декодирования.

В обычном устройстве декодирования ЛПАС обычно выполняют операции, противоположные вышеуказанным, и синтезируют речевой сигнал. Для улучшения качества восприятия обычно используют последующую фильтрацию синтезированного речевого сигнала.

Для многих обычных типов фонового шума достаточно хорошую модель сигнала получают при значительно меньшей скорости передачи информации в битах, чем та, которая необходима для речевого сигнала. В существующих системах мобильной связи используют этот факт и осуществляют соответствующую регулировку скорости передачи информации в битах во время наличия фонового шума. В обычных системах, в которых применяют способы непрерывной передачи, в устройстве кодирования речи с переменной скоростью передачи (ПСП) может быть использована наиболее низкая скорость передачи информации в битах. В обычных схемах прерывистой передачи (ПРП), передатчик прекращает передачу закодированных кадров речевого сигнала при отсутствии активности говорящего абонента. Через одинаковые или неодинаковые промежутки времени (обычно через каждые 500 мс) передатчик осуществляет передачу надлежащих параметров речевого сигнала для генерации комфортного шума в устройстве декодирования. Кодирование этих параметров для генерации комфортного шума (ГКШ) обычно осуществляют в виде кадров, которые иногда называют кадрами дескриптора тишины (ДТШ). Устройство декодирования в приемнике использует параметры комфортного шума, принятые в кадрах ДТШ, для синтеза искусственного шума посредством обычного алгоритма введения комфортного шума (ВКШ).

После генерации комфортного шума в устройстве декодирования обычной системы ПРП шум обычно воспринимается как в высокой степени статический и сильно отличающийся от фонового шума, создаваемого в активном (не ПРП) режиме. Причина такого восприятия заключается в том, что передачу кадров ДТШ при ПРП выполняют реже, чем обычных кадров речевого сигнала. В кодер-декодерах ЛПАС, имеющих режим ПРП, обычно осуществляют оценку (например, усреднение) спектра и энергии фонового шума по нескольким кадрам, а затем вычисленные параметры квантуют и передают по каналу связи в устройство декодирования. На фиг.1 показан пример известного устройства кодирования комфортного шума, которое создает вышеуказанные оценочные параметры фонового шума (комфортного шума). Передачу квантованных параметров комфортного шума обычно осуществляют через каждые 100-500 мс.

Передача кадров ДТШ с низкой скоростью обновления вместо передачи обычных кадров речевого сигнала имеет двойное преимущество. Вследствие снижения потребляемой мощности продлевают ресурс аккумулятора, например, в приемопередатчике мобильной радиосвязи, и снижают помехи, создаваемые передатчиком, посредством чего обеспечивают более высокую пропускную способность системы.

В обычном устройстве декодирования прием и декодирование параметров комфортного шума могут быть осуществлены так, как показано на фиг.2. Поскольку устройство декодирования не принимает новые параметры комфортного шума также часто, как принимаются параметры речевого сигнала, то для обеспечения плавного изменения параметров при синтезе комфортного шума в блоке 23 обычно выполняют интерполяцию параметров комфортного шума, принятых в кадрах ДТШ. При операции синтеза, обозначенной ссылочной позицией 25, устройство декодирования вводит в синтезирующий фильтр 27 возбуждение в виде нормированного по усилению случайного шума (например, белого шума) и интерполированные параметры спектра. В результате, созданный комфортный шум S_c(n) будет восприниматься как в высокой степени стационарный ("статический") вне зависимости от изменения свойств фонового шума s(n) в устройстве кодирования (см. фиг.1). Эта проблема более явно выражена для сильно изменяющихся фоновых шумов, таких как уличный шум и невнятный шум от многих источников (например, шум в ресторане), но она также возникает в случае автомобильного шума.

Одним из традиционных подходов к решению этой проблемы "статического" комфортного шума является простое увеличение скорости обновления параметров комфортного шума при ПРП (например, использование более высокой скорости передачи кадров ДТШ). При подобном решении возникают такие проблемы, как увеличение энергопотребления аккумулятора (например, в приемопередатчике мобильной связи), обусловленное необходимостью более частой работы передатчика, и уменьшение пропускной способности системы вследствие увеличения скорости передачи кадров ДТШ. Поэтому в традиционных системах обычно соглашаются с неизбежностью наличия статического фонового шума.

Следовательно, желательным является устранение вышеуказанных недостатков, связанных с традиционным способом генерации комфортного шума.

Согласно изобретению параметры комфортного шума, полученные посредством традиционного способа генерации, изменяют исходя из их свойств реального фонового шума, воспринимаемого устройством кодирования. Комфортный шум, генерируемый исходя из измененных параметров, воспринимается как менее статический по сравнению с комфортным шумом, генерация которого осуществлена традиционным способом, и более похожий на реальный фоновый шум, существующий в устройстве кодирования.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 - схематичное представление процесса получения параметров комфортного шума в обычном устройстве кодирования речи.

Фиг.2 - схематичное представление процесса генерации комфортного шума в обычном устройстве декодирования речи.

Фиг.3 - блок-схема устройства изменения параметров комфортного шума, используемого при генерации комфортного шума согласно изобретению.

Фиг.4 - пример варианта осуществления устройства изменения по фиг.3.

Фиг.5 - пример варианта осуществления устройства оценки изменчивости по фиг.4.

Фиг.5 - пример устройства управления сигналом ВЫБОРА по фиг.5.

Фиг.6 - пример варианта осуществления устройства изменения по фиг.3-фиг.5, в котором устройство оценки изменчивости по фиг.5 выполнено частично в устройстве кодирования и частично в устройстве декодирования.

Фиг.7 - примерный вариант операций, которые могут быть выполнены устройством изменения по фиг.3 - фиг.6.

Фиг.8 - пример осуществления этапа оценочного вычисления по фиг.7.

Фиг.9 - блок-схема системы речевой связи, в которой могут быть реализованы варианты осуществления устройства изменения по фиг.3 - фиг.8.

ПОДРОБНОЕ ОПИСАНИЕ

На фиг.3 показано устройство 30 изменения параметров комфортного шума для изменения параметров комфортного шума согласно изобретению. Согласно фиг.3, на вход 33 устройства 30 изменения подают обычные интерполированные параметры комфортного шума, например спектральные и энергетические параметры, полученные с выхода интерполятора 23 по фиг.2. Также на вход 31 устройства 30 изменения подают спектральные и энергетические параметры, соответствующие фоновому шуму, поступающему в устройство кодирования. Устройство 30 изменения изменяет полученные параметры комфортного шума исходя из параметров фонового шума, полученных с входа 31, и создает измененные параметры комфортного шума на выходе 35. Измененные параметры комфортного шума могут быть затем поданы, например, в блок 25 синтеза комфортного шума по фиг.2 для их использования в обычных операциях синтеза комфортного шума. Измененные параметры комфортного шума, сформированные на выходе 35, позволяют осуществлять в блоке 25 синтеза генерацию комфортного шума, который более точно воспроизводит реальный фоновый шум, поступающий в устройство кодирования речи.

На фиг.4 показан пример варианта осуществления устройства 30 изменения параметров комфортного шума по фиг.3. Устройство 30 изменения содержит устройство 41 оценки изменчивости, соединенное со входом 31, осуществляющее прием спектральных и энергетических параметров фонового шума. Устройство 41 оценки изменчивости осуществляет оценку характеристик изменчивости параметров фонового шума и подает на выход 43 информацию, характеризующую изменчивость параметров фонового шума. В информации об изменчивости может быть указана степень изменчивости параметра относительно его среднего значения, например дисперсия параметра или максимальное отклонение параметра от его среднего значения.

В информации об изменчивости, полученной на выходе 43, также могут быть указаны корреляционные характеристики, эволюция параметра во времени или другие критерии оценки изменчивости параметра во времени. В качестве примеров информации об изменчивости во времени могут быть приведены, в том числе, простые критерии оценки, такие как скорость изменения параметра (быстрые или медленные изменения), дисперсия параметра, максимальное отклонение от среднего значения, другие статистические критерии оценки, характеризующие изменчивость параметра, и более сложные критерии оценки, такие как автокорреляционные характеристики и коэффициенты фильтрации прогнозирующего устройства с автоматической регрессией (АР), оценочное вычисление которых выполнено исходя из значения параметра. Одним из примеров простого критерия оценки по скорости изменения является вычисление частоты перехода через ноль, то есть, сколько раз параметр меняет знак при просмотре последовательности значений параметра от первого значения параметра до последнего значения параметра. Информацию, полученную на выходе 43 устройства оценки 41, подают на вход устройства 45 объединения, которое объединяет информацию, полученную на выходе 43, с интерполированными параметрами комфортного шума, принимаемыми на входе 33, для формирования на выходе 35 измененных параметров комфортного шума.

На фиг.5 показан пример варианта осуществления устройства 41 оценки изменчивости по фиг.4. Устройство оценки по фиг.5 содержит устройство 51 определения среднего значения изменчивости, соединенное со входом 31, для приема спектральных и энергетических параметров фонового шума. Как описано выше, устройство 51 определения среднего значения изменчивости может определять средние значения характеристик изменчивости.

Например, если буфер 37 фонового шума из фиг.3 содержит 8 кадров и 32 подкадра, то анализ изменчивости буферизованных спектральных и энергетических параметров может быть выполнен следующим образом. Может быть выполнено вычисление среднего (или усредненного) значения буферизованных спектральных параметров (как обычно делают в устройствах кодирования ПРП для создания кадров ДТШ) и его вычитание из буферизованных значений спектрального параметра, посредством чего получают вектор значений отклонения по спектру. Точно так же может быть выполнено вычисление среднего значения буферизованных энергетических параметров по подкадру (как обычно делают в устройствах кодирования ПРП для создания кадров ДТШ), а затем его вычитание из буферизованных значений энергетического параметра в подкадре, посредством чего получают вектор отклонения значений по энергии. Следовательно, векторы отклонения по спектру и энергии содержат спектральные и энергетические параметры с исключенным средним значением. Векторы отклонения по спектру и энергии передают из устройства 51 определения изменчивости в запоминающее устройство 55 для вектора отклонения через тракт 52 связи.

Для того чтобы устройство 53 вычисления коэффициентов могло получать параметры фонового шума, его также соединяют со входом 31. Приведенное в качестве примера устройство 53 вычисления коэффициентов осуществляет обычные оценочные вычисления способом АР с использованием соответствующих спектральных и энергетических параметров. Полученные из оценочных вычислений способом АР коэффициенты фильтрации передают из устройства 53 вычисления коэффициентов в фильтр 57 через тракт 54 связи. Посредством коэффициентов фильтрации, вычисленных в устройстве 53, могут быть заданы, например, соответствующие фильтры полюсов для спектральных и энергетических параметров.

В одном из вариантов осуществления устройство 53 вычисления коэффициентов выполняет оценочные вычисления АР первого порядка как для спектральных, так и для энергетических параметров, вычисляя коэффициенты фильтрации a1=Rxx(1)/Rxx(0) для каждого параметра обычным способом. Значения Rxx(0) и Rxx(1) представляют собой обычные значения автокорреляционной функции конкретного параметра:

кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения, патент № 2237296

В этих операциях вычисления Rxx представляет собой параметр фонового шума (например, спектральный или энергетический). Положительное значение а1 в общем случае означает, что параметр изменяется медленно, а отрицательное значение в общем случае означает, что он изменяется быстро.

Согласно одному из вариантов осуществления для каждого кадра спектральных параметров и для каждого подкадра энергетических параметров может быть, например, осуществлен выбор компоненты x(k) соответствующего вектора отклонения случайным образом (посредством входного сигнала ВЫБОР в запоминающем устройстве 55) и ее фильтрация посредством фильтра 57 с использованием соответствующих коэффициентов фильтрации. Затем выходной сигнал из фильтра нормируют, умножая его на постоянный масштабный коэффициент посредством устройства 59 масштабирования, например умножающего устройства. Нормированный выходной сигнал, обозначенный на фиг.5 как xp(k), подают на вход 43 устройства 45 объединения по фиг.4.

В одном из вариантов осуществления, который схематически изображен на фиг.5А, устройство 50 определения частоты перехода через ноль соединено с входом 31 для приема буферизованных параметров из блока 37. Устройство 50 определения определяет соответствующие частоты перехода через ноль спектральных и энергетических параметров. То есть для последовательности энергетических параметров, накопленных в буфере 37, а также для последовательности спектральных параметров, накопленных в буфере 37, устройство 50 определения частоты перехода через ноль определяет для соответствующей последовательности то, сколько раз значение соответствующего параметра меняет знак при просмотре буферизованной последовательности от первого значения параметра до последнего значения параметра. Затем эта информация о частоте перехода через ноль может быть использована в блоке 56 для управления сигналом ВЫБОР из фиг.5.

Например, для данного вектора отклонения управление сигналом ВЫБОР может быть выполнено для осуществления случайного выбора компонент x(k) вектора отклонения относительно более часто (с частотой каждого кадра или субкадра), если соответствующая этому параметру частота перехода через ноль относительно велика (что указывает на весьма большую изменчивость параметра), и для осуществления случайного выбора компонент x(k) вектора отклонения относительно менее часто (например, с меньшей частотой, чем частота каждого кадра или субкадра) в том случае, если соответствующая этому параметру частота перехода через ноль относительно низка (что указывает на весьма малую изменчивость параметра). В других вариантах осуществления частота выбора компонент x(k) данного вектора отклонения может быть установлена равной заранее заданному требуемому значению.

Устройство объединения по фиг.4 выполняет объединение нормированного выходного сигнала xp(k) с обычными параметрами комфортного шума. Объединение спектральных параметров осуществляют по кадру, а энергетических параметров - по субкадру. В одном из примеров устройство 45 объединения может представлять собой сумматор, который просто добавляет сигнал xp(k) к обычным параметрам комфортного шума. Следовательно, нормированный выходной сигнал xp(k) (фиг.5) может рассматриваться в качестве возмущающего сигнала, который используется в устройстве 45 объединения для оказания возмущающего воздействия на обычные параметры комфортного шума, принятые на входе 33, для формирования измененных (или полученных в результате возмущающего воздействия) параметров комфортного шума, подаваемых на вход блока 25 синтеза комфортного шума (см. фиг. 2 - фиг.4).

Использование полученных в результате возмущающего воздействия параметров комфортного шума в обычном блоке 25 синтеза может быть выполнено традиционным способом. Вследствие наличия возмущающего воздействия на обычные параметры, созданный комфортный шум будет изменяться квазислучайным образом, что значительно улучшает качество восприятия для сильно меняющегося фона, например, для невнятного шума от многих источников и уличного шума, а также автомобильного шума. В качестве одного из примеров, возмущающий сигнал xp(k) может быть выражен следующим образом:

xp(k)= кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения, патент № 2237296 _х(b0_хx(k)–a1_x_х(xp(k-1)),

где кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения, патент № 2237296 _х - масштабный коэффициент, b0_х и a1_x - коэффициенты фильтрации, a кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения, патент № 2237296 _x - коэффициент расширения полосы частот.

Пунктирной линией на фиг.5 показан вариант осуществления, в котором операция фильтрации опущена, а возмущающий сигнал xp(k) содержит в себе нормированные компоненты вектора отклонения.

В некоторых вариантах осуществления устройство 30 изменения по фиг.3 - фиг.5 полностью выполнено в составе устройства декодирования речи (см. фиг.9), а в других вариантах осуществления устройства изменения по фиг.3-5 распределено между устройством кодирования речи и устройством декодирования речи (см. пунктирные линии на фиг.9). В тех вариантах осуществления, в которых устройство 30 изменения полностью выполнено в устройстве декодирования, устройство декодирования должно опознавать параметры фонового шума, показанные на фиг.3. Это может быть выполнено посредством буферизации в блоке 37 требуемого количества (кадров и субкадров) спектральных и энергетических параметров, полученных из устройства кодирования через канал передачи. В схеме ПРП для принятия решения о том, что буфер 37 содержит только параметры, связанные с фоновым шумом, может быть использована неявная информация, обычно имеющаяся в устройстве декодирования. Например, в том случае, если буфер 37 может осуществить буферизацию N кадров, и если в режиме ПРП после фрагментов речи и до прерывания передачи используют N кадров блокировки при переходе (что является общепринятым), то, как известно, эти последние N кадров перед переключением в режим ПРП содержат только спектральные и энергетические параметры фонового шума. Как описано выше, эти параметры фонового шума могут быть затем использованы в устройстве 30 изменения.

В тех вариантах осуществления, в которых устройство 30 изменения распределено между устройством кодирования и устройством декодирования, устройство 51 определения среднего значения изменчивости и устройство 53 вычисления коэффициентов могут быть предусмотрены в устройстве кодирования. Следовательно, в таких вариантах осуществления тракты 52 и 54 связи аналогичны обычному каналу связи, используемому для передачи обычных параметров комфортного шума из устройства кодирования в устройство декодирования (см. фиг.1 и 2). В частности, как показано на фиг.6, тракты 52 и 54 проходят через устройство квантования (см. также фиг.1), канал связи (см. также фиг.1 и 2) и блок выполнения операции, обратной квантованию (см. также фиг.2), к запоминающему устройству 55 и к фильтру 57 (см. также фиг.5). Что касается информации о среднем значении изменчивости и коэффициентов фильтрации АР, могут быть применены известные способы квантования скалярных значений и коэффициенты фильтрации АР.

При использовании обычных средств в устройстве кодирования известно о наличии спектральных и энергетических параметров фонового шума, доступных для обработки посредством устройства 51 определения среднего значения изменчивости и устройства 53 вычисления коэффициентов, поскольку те же самые спектральные и энергетические параметры обычно используют в устройстве кодирования для создания обычных параметров комфортного шума. В традиционных устройствах кодирования среднее значение энергии и среднее значение спектрального распределения обычно вычисляют по нескольким кадрам и осуществляют передачу этих средних значений спектральных и энергетических параметров в устройство декодирования в качестве параметров комфортного шума. Поскольку требуется передавать коэффициенты фильтрации, полученные из устройства 53 вычисления коэффициентов, и векторы отклонения, полученные из устройства 51 определения среднего значения изменчивости, из устройства кодирования в устройство декодирования по каналу передачи, как показано на Фиг.6, то необходимо обеспечить дополнительную ширину полосы частот в том случае, когда устройство изменения является распределенным между устройством кодирования и устройством декодирования. В противном случае, когда устройство изменения выполнено полностью в устройстве декодирования, для его осуществления не требуется никакого дополнительного расширения полосы частот.

На фиг.7 показаны примеры описанных выше операций, которые могут быть выполнены посредством устройства изменения в вариантах осуществления по фиг.3-5. На этапе 71 определяют, соответствуют ли имеющиеся спектральные и энергетические параметры (например, в буфере 37 из фиг.3) речи или же фоновому шуму. Если имеющиеся параметры соответствуют фоновому шуму, то на этапе 73 вычисляют оценочные значения характеристик фонового шума, например среднее значение изменчивости и степень изменчивости во времени. После этого на этапе 75 в интерполированные параметры комфортного шума вносят возмущение в соответствии с оценочными значениями характеристик фонового шума. Процесс возмущения на этапе 75 выполняют до тех пор, пока на этапе 77 не будет обнаружен фоновый шум. Если на этапе 77 обнаружена речевая активность, то переходят к этапу 71, на котором ожидают получения дополнительных параметров фонового шума.

На фиг.8 показан пример операций, которые могут быть осуществлены при выполнении на этапе 73 оценочного вычисления (фиг.7). В процессе обработки на этапе 81 учитывают N кадров и kN подкадров, которые соответствуют вышеупомянутым N буферизованным кадрам. В одном из вариантов осуществления N=8, a k=4. На этапе 83 получают вектор отклонений по спектру, имеющий N компонент, а на этапе 85 получают вектор отклонений по энергии, имеющий kN компонент. На этапе 87 осуществляют выбор компоненты (например, случайным образом) из каждого вектора отклонения. На этапе 89 вычисляют коэффициенты фильтрации и производят соответствующую фильтрацию выбранных компонент векторов. На этапе 88 отфильтрованные векторные компоненты нормируют, создавая возмущающий сигнал, который используют на этапе 75 (фиг.7). Пунктирная линия на фиг.8 соответствует вариантам осуществления, обозначенным на фиг.5 пунктирной линией, то есть вариантам осуществления, в которых опущена фильтрация, а в качестве параметров возмущения используют нормированные компоненты вектора отклонения.

На фиг.9 показан пример системы речевой связи, в которой могут быть реализованы варианты осуществления устройства изменения параметров комфортного шума по фиг.3 - 8. Передатчик (ПРД) содержит устройство 91 кодирования речи, которое поддерживает связь с устройством 93 декодирования речи в приемнике (ЦРМ) через канал 95 передачи. Передатчик по фиг.9, приемник по фиг.9, либо оба из них могут являться частью, например, радиотелефона или иной составной части системы радиосвязи. Канал 95 может содержать, например, канал радиосвязи. Как показано на фиг.9, варианты осуществления устройства изменения по фиг.3-8 могут быть реализованы в устройстве декодирования, либо, как описано выше со ссылками на фиг.5 и 6, могут быть распределены между устройством кодирования и устройством декодирования (см. пунктирные линии).

Для специалистов в данной области техники очевидно, что приведенные на фиг.3-9 варианты осуществления могут быть легко реализованы в обычных устройствах кодирования-декодирования речи, например, посредством надлежащих видоизменений программного обеспечения и/или аппаратных средств.

Описанное выше изобретение улучшает естественность фонового шума (без выделения дополнительной ширины полосы частот или дополнительных затрат мощности в некоторых вариантах осуществления). Это позволяет реализовать в устройствах кодирования-декодирования речи более незаметное и, следовательно, более приемлемое для человеческого уха переключение между режимами наличия речи и отсутствия речи.

Несмотря на то, что подробное описание было приведено выше для вариантов осуществления настоящего изобретения, служащих в качестве примеров, это не ограничивает объем изобретения, которое может быть реализовано на практике в различных вариантах осуществления.

Класс G10L19/06 определение или кодирование характеристик полосы спектра, например коэффициентов прогнозирования краткосрочных предсказаний

способ многоканального адаптивного подавления акустических шумов и сосредоточенных помех и устройство для его осуществления - патент 2477533 (10.03.2013)
векторный квантователь, инверсный векторный квантователь и способы - патент 2469421 (10.12.2012)

способ и средство для кодирования информации фонового шума - патент 2461080 (10.09.2012)
системы, способы и устройство для широкополосного кодирования и декодирования активных кадров - патент 2441288 (27.01.2012)
системы, способы и устройство для широкополосного кодирования и декодирования активных кадров - патент 2437171 (20.12.2011)
системы, способы и устройство для широкополосного кодирования и декодирования активных кадров - патент 2419170 (20.05.2011)
способ и устройство для векторного квантования спектрального представления огибающей - патент 2387025 (20.04.2010)
способ адаптивного кодирования речевых сигналов на основе системы с переменной структурой - патент 2343564 (10.01.2009)
аудиокодирование - патент 2321901 (10.04.2008)
способы и устройства для кодирования и декодирования речевых сигналов - патент 2233010 (20.07.2004)