устройство поиска в фиксированных таблицах кодирования и способ поиска в фиксированных таблицах кодирования
Классы МПК: | G10L19/08 определение или кодирование функций возбуждения; определение или кодирование параметров долгосрочных прогнозов |
Автор(ы): | ЕХАРА Хироюки (JP), ЙОСИДА Кодзи (JP) |
Патентообладатель(и): | ПАНАСОНИК КОРПОРЭЙШН (JP) |
Приоритеты: |
подача заявки:
2007-03-08 публикация патента:
27.07.2011 |
Изобретение относится к устройству и способу формирования перцепционно взвешенного синтетического сигнала при поиске фиксированной таблицы кодирования. Это устройство оснащено модулем формирования вектора возбуждения, который формирует вектор импульсного возбуждения посредством алгебраической таблицы (101) кодирования; модуль (151) первой операции свертки, который выполняет свертку в отношении импульсной характеристики перцепционно взвешенного синтетического фильтра в вектор импульсной характеристики, который имеет значение в отрицательные моменты времени, чтобы сформировать второй вектор импульсной характеристики, который имеет значение во вторые отрицательные моменты времени; модуль (152) формирования матрицы, который формирует матрицу свертки посредством второго вектора импульсной характеристики сформированного модулем первой операции свертки, так чтобы матрица свертки представляла собой нижнюю треугольную матрицу Теплитца; и модуль (153) второй операции свертки, который выполняет обработку по свертке в отношении вектора импульсного возбуждения, сформированного модулем формирования вектора импульсного возбуждения, с помощью матрицы, сформированной модулем (152) формирования матрицы. Технический результат - минимизация повышения вычислительной нагрузки при малом влиянии на качество кодирования. 2 н. и 5 з.п. ф-лы, 3 ил.
Формула изобретения
1. Устройство для формирования перцепционно взвешенного синтетического сигнала при поиске фиксированной таблицы кодирования, содержащее:
модуль формирования вектора импульсного возбуждения, который формирует вектор импульсного возбуждения;
модуль первой операции свертки, который выполняет свертку в отношении импульсной характеристики перцепционно взвешенного синтетического фильтра с вектором импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени, чтобы сформировать второй вектор импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени;
модуль формирования матрицы, который формирует матрицу свертки посредством второго вектора импульсной характеристики, сформированного модулем первой операции свертки, так чтобы матрица свертки представляла собой нижнюю треугольную матрицу Теплитца, в которой удалены строки в количестве упомянутых одного или более значений второго вектора импульсной характеристики в отрицательные моменты времени; и
модуль второй операции свертки, который выполняет обработку по свертке в отношении вектора импульсного возбуждения, сформированного модулем формирования вектора импульсного возбуждения, с помощью матрицы, сформированной модулем формирования матрицы.
2. Устройство по п.1, в котором матрица свертки представлена следующим образом:
где h0(n) - второй вектор импульсной характеристики (n=-m, , 0, , N-1), который имеет одно или более значений в отрицательные моменты времени.
3. Устройство по п.1, в котором энергия компонентов второго вектора импульсной характеристики в отрицательные моменты времени меньше энергии компонентов в неотрицательные моменты времени.
4. Устройство по п.1, в котором длина компонентов второго вектора импульсной характеристики в отрицательные моменты времени меньше длины компонентов в неотрицательные моменты времени.
5. Устройство по п.1, в котором второй вектор импульсной характеристики, имеющий одно или более значений в отрицательные моменты времени, содержит один компонент в отрицательный момент времени.
6. Способ формирования перцепционно взвешенного синтетического сигнала при поиске фиксированной таблицы кодирования, содержащий:
этап формирования вектора импульсного возбуждения, на котором формируют вектор импульсного возбуждения;
этап первой операции свертки, на котором выполняют свертку в отношении импульсной характеристики перцепционно взвешенного синтетического фильтра с вектором импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени, чтобы сформировать второй вектор импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени;
этап формирования матрицы, на котором формируют матрицу свертки с помощью второго вектора импульсной характеристики, сформированного на этапе первой операции свертки, так чтобы матрица свертки представляла собой нижнюю треугольную матрицу Теплитца, в которой удалены строки в количестве упомянутых одного или более значений второго вектора импульсной характеристики в отрицательные моменты времени; и
этап второй операции свертки, на котором выполняют обработку по свертке в отношении вектора импульсного возбуждения с помощью матрицы свертки.
7. Способ по п.6, в котором матрица свертки представлена следующим образом:
где h0(n) -второй вектор импульсной характеристики (n=-m, , 0, , N-1), который имеет одно или более значений в отрицательные моменты времени.
Описание изобретения к патенту
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к устройству поиска фиксированных таблиц кодирования и способу поиска фиксированных таблиц кодирования, которые должны быть использованы во время кодирования посредством устройства кодирования речи, которое осуществляет кодирование методом линейного предсказания с кодовым возбуждением (CELP) речевых сигналов.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Поскольку обработка по поиску фиксированной таблицы кодирования в устройстве кодирования речи CELP-типа, в общем, является причиной наибольшей нагрузки обработки для обработки кодирования речи, различные конфигурации фиксированной таблицы кодирования и способы поиска фиксированной таблицы кодирования традиционно разрабатывались.
Фиксированные таблицы кодирования, использующие алгебраическую таблицу кодирования, которые широко приспособлены в кодеках по международным стандартам, таких как ITU-T Recommendation G.729 и G. 723.1 или AMR по стандарту 3GPP и т.п., являются одними из фиксированных таблиц кодирования, которые относительно снижают нагрузку обработки по поиску (см., например, непатентные документы 1-3). С помощью этих фиксированных таблиц кодирования посредством разбрасывания числа импульсов, формируемых из алгебраической таблицы кодирования, нагрузка обработки, требуемая для поиска фиксированной таблицы кодирования, может быть снижена. Тем не менее, поскольку имеется предел на характеристики сигнала, которые могут быть представлены посредством разреженного импульсного возбуждения, имеются случаи, когда возникает проблема в качестве кодирования. Чтобы разрешить эту проблему, предложена методика, посредством которой фильтр применяется для того, чтобы задавать характеристики импульсному возбуждению, формируемому из алгебраической таблицы кодирования (см., например, непатентный документ 4).
Непатентный документ 1. ITU-T Recommendation G.729, "Coding of Speech at 8 kbit/s using Conjugate-structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP)", март 1996 года.
Непатентный документ 2. ITU-T Recommendation G.723.1, "Dual Rate Speech Coder for Multimedia Communications Transmitting at 5.3 and 6.3 kbit/s", март 1996 года.
Непатентный документ 3. 3GPP TS 26. 090, "AMR speech codec; Trans-coding functions" V4.0.0, март 2001 года.
Непатентный документ 4. R. Hagen et al., "Removal of sparse-excitation artifacts in CELP", IEEE ICASSP '98, стр.145-148, 1998 года.
Тем не менее в случае, если фильтр, применяемый к возбуждающему импульсу, не может быть представлен посредством нижней треугольной матрицы Теплитца (Toeplitz) (например, в случае, когда фильтр принимает значения в отрицательные моменты времени в случаях, таких как случай обработки по циклической свертке, описанный в непатентном документе 4), дополнительная нагрузка на память и вычислительные ресурсы требуются для матричных операций.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Проблемы, разрешаемые изобретением
Следовательно, цель настоящего изобретения заключается в том, чтобы предоставить устройство кодирования речи, которое минимизирует повышение вычислительной нагрузки, даже если фильтр, применяемый к возбуждающему импульсу, имеет характеристику, которая не может быть представлена посредством нижней треугольной матрицы, а также чтобы реализовать квазиоптимальный поиск фиксированной таблицы кодирования.
Настоящее изобретение достигает вышеупомянутой цели с помощью устройства для формирования перцепционно взвешенного синтетического сигнала при поиске фиксированной таблицы кодирования, содержащего: модуль формирования вектора импульсного возбуждения, который формирует вектор импульсного возбуждения; модуль первой операции свертки, который выполняет свертку в отношении импульсной характеристики перцепционно взвешенного синтетического фильтра с вектором импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени, чтобы сформировать второй вектор импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени; модуль формирования матрицы, который формирует матрицу свертки посредством второго вектора импульсной характеристики, сформированного модулем первой операции свертки, так чтобы матрица свертки представляла собой нижнюю треугольную матрицу Теплитца, в которой удалены строки в количестве упомянутых одного или более значений второго вектора импульсной характеристики в отрицательные моменты времени; и модуль второй операции свертки, который выполняет обработку по свертке в отношении вектора импульсного возбуждения, сформированного модулем формирования вектора импульсного возбуждения, с помощью матрицы, сформированной модулем формирования матрицы.
Кроме того, настоящее изобретение достигает вышеупомянутой цели с помощью способа формирования перцепционно взвешенного синтетического сигнала при поиске фиксированной таблицы кодирования, содержащего: этап формирования вектора импульсного возбуждения, на котором формируют вектор импульсного возбуждения; этап первой операции свертки, на котором выполняют свертку в отношении импульсной характеристики перцепционно взвешенного синтетического фильтра с вектором импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени, чтобы сформировать второй вектор импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени; этап формирования матрицы, на котором формируют матрицу свертки с помощью второго вектора импульсной характеристики, сформированного на этапе первой операции свертки, так чтобы матрица свертки представляла собой нижнюю треугольную матрицу Теплитца, в которой удалены строки в количестве упомянутых одного или более значений второго вектора импульсной характеристики в отрицательные моменты времени; и этап второй операции свертки, на котором выполняют обработку по свертке в отношении вектора импульсного возбуждения с помощью матрицы свертки.
Согласно настоящему изобретению передаточная функция, которая не может быть представлена посредством матрицы Теплитца, аппроксимируется посредством матрицы, созданной путем отбрасывания некоторых строчных элементов из нижней треугольной матрицы Теплитца, с тем чтобы было возможно выполнять обработку по кодированию речевых сигналов практически с такими же требованиями по памяти и вычислительной нагрузкой, как в случае причинного фильтра, сформированного посредством нижней треугольной матрицы Теплитца.
ПЕРЕЧЕНЬ ФИГУР
Фиг.1 - блок-схема, иллюстрирующая устройство формирования вектора фиксированной таблицы кодирования в устройстве кодирования речи согласно варианту осуществления настоящего изобретения;
Фиг.2 - блок-схема, иллюстрирующая пример устройства поиска фиксированной таблицы кодирования в устройстве кодирования речи согласно варианту осуществления настоящего изобретения; и
Фиг.3 - блок-схема, иллюстрирующая пример устройства кодирования речи согласно варианту осуществления настоящего изобретения.
ОПТИМАЛЬНЫЙ РЕЖИМ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Признаки настоящего изобретения включают в себя конфигурацию для выполнения поиска фиксированных таблиц кодирования с помощью матрицы, созданной посредством усечения нижней треугольной матрицы Теплитца посредством удаления некоторых строчных элементов.
Далее приводится подробное описание варианта осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.
(Вариант осуществления)
Фиг.1 - это блок-схема, иллюстрирующая конфигурацию устройства 100 формирования вектора фиксированной таблицы кодирования в устройстве кодирования речи согласно варианту осуществления настоящего изобретения. В настоящем варианте осуществления устройство 100 формирования вектора фиксированной таблицы кодирования используется в качестве фиксированной таблицы устройства кодирования речи CELP-типа, которое должно быть установлено и использовано в устройстве терминала связи, таком как мобильный телефон и т.п.
Устройство 100 формирования вектора фиксированной таблицы кодирования имеет алгебраическую таблицу 101 кодирования и модуль 102 операции свертки.
Алгебраическая таблица 101 кодирования формирует вектор сk импульсного возбуждения, образуемый посредством компоновки возбуждающих импульсов алгебраическим образом в позициях, указываемый индексом k таблицы кодирования, который введен, и выводит сформированный вектор импульсного возбуждения в модуль 102 операции свертки. Структура алгебраической таблицы кодирования может принимать любую форму. Например, он может принимать форму, описанную в ITU-T Recommendation G.729.
Модуль 102 операции свертки выполняет свертку в отношении вектора импульсной характеристики, который вводится отдельно и который имеет одно или более значений в отрицательные моменты времени, причем вектор импульсного возбуждения вводится из алгебраической таблицы 101 кодирования, и выводит вектор, который является результатом свертки, в качестве вектора фиксированной таблицы кодирования. Вектор импульсной характеристики, имеющий одно или более значений в отрицательные моменты времени, может принимать любую форму. Тем не менее вектор предпочтительной формы имеет наибольший по амплитуде элемент в момент времени 0, и большая часть энергии всего вектора концентрируется в момент времени 0. Кроме того, предпочтительно, чтобы векторная длина непричинной части (т.е. соответствующей элементам вектора в отрицательные моменты времени) была короче векторной длины причинной части, включающей в себя момент времени 0 (т.е. соответствующей элементам вектора в неотрицательные моменты времени). Вектор импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени, может быть сохранен заранее в памяти как фиксированный вектор, или он также может быть переменным вектором, который определяется посредством вычисления, когда требуется. Далее в настоящем варианте осуществления приводится описание примера, где импульсная характеристика, имеющая одно или более значений в отрицательные моменты времени, имеет значения от момента времени "-m" (другими словами, все значения равны 0 до момента времени "-m-1").
На фиг.1 вектор фиксированной таблицы кодирования, который пропускается с вектором Ck импульсного возбуждения, сформированным из фиксированной таблицы кодирования посредством обращения к введенному индексу k фиксированной таблицы кодирования, через сверточный фильтр F (соответствующий модулю 102 операции свертки по фиг.1), может быть записан как Fck. Перцепционно взвешенный синтетический сигнал, который получается посредством пропускания вектора Fck фиксированной таблицы кодирования через непроиллюстрированный перцепционно взвешенный синтетический фильтр Н, обозначается посредством S. Затем S может быть записано как следующее уравнение (1):
Здесь h(n), где n=0, , N-1, показывает импульсную характеристику перцепционно взвешенного синтетического фильтра, f(n), где n=-m, , N-1 показывает импульсную характеристику непричинного фильтра (т.е. импульсную характеристику, имеющую одно или более значений в отрицательные моменты времени), и ck(n), где n=0, , N-1 показывает вектор импульсного возбуждения, отмеченный индексом k, соответственно.
Поиск фиксированной таблицы кодирования выполняется посредством нахождения k, который максимизирует следующее уравнение (2). В уравнении (2) C k - это скалярное произведение (или кросс-корреляция) перцепционно взвешенного синтетического сигнала s, полученного посредством пропускания вектора импульсного возбуждения (вектора фиксированной таблицы кодирования) ck, обозначенного посредством индекса k, через сверточный фильтр F и перцепционно взвешенный синтетический фильтр Н, и целевой вектор х, который должен быть описан ниже, и Ek - это энергия перцепционно взвешенного синтетического сигнала s, полученного посредством пропускания ck через сверточный фильтр F и перцепционно взвешенный синтетический фильтр Н (т.е. |s|2).
х - это так называемый целевой вектор в CELP-кодировании речи, и он получается посредством удаления нулевой входной характеристики перцепционно взвешенного синтетического фильтра из перцепционно взвешенного входного речевого сигнала. Перцепционно взвешенный входной речевой сигнал - это сигнал, получаемый посредством применения перцепционно взвешенного фильтра к входному речевому сигналу, который является объектом кодирования. Перцепционно взвешенный фильтр - это полюсный фильтр или фильтр с полюсами и нулями, сконфигурированный посредством использования коэффициентов линейного предсказания, полученных посредством выполнения анализа линейного предсказания входного речевого сигнала, и он широко используется в устройстве кодирования речи CELP-типа. Перцепционно взвешенный синтетический фильтр - это фильтр, в котором фильтр с линейным предсказанием, сконфигурированный посредством коэффициентов линейного предсказания, квантованных посредством устройства кодирования речи CELP-типа (т.е. синтетический фильтр), и вышеупомянутый перцепционно взвешенный фильтр соединены в каскаде. Хотя эти компоненты не проиллюстрированы в настоящем варианте осуществления, они являются общими в устройстве кодирования речи CELP-типа.
Например, они описаны в ITU-T Recommendation G.729 как "целевой вектор", "взвешенный синтетический фильтр" и "отклик при отсутствии входного сигнала взвешенного синтетического фильтра. Суффикс "t" представляет транспонированную матрицу.
Тем не менее, как можно понять из уравнения (1), матрица Н'', которая свертывает импульсную характеристику перцепционно взвешенного синтетического фильтра, который свертывается с импульсной характеристикой, которая имеет одно или более значений в отрицательные моменты времени, не является матрицей Теплитца. Поскольку столбцы с первого по m-й матрицы Н'' вычисляются с помощью столбцов, в которых часть или все непричинные компоненты импульсной характеристики, которые должны быть свернуты, отсекаются, они отличаются от компонентов столбцов после (m+1)-го столбца, которые вычисляются с помощью всех непричинных компонентов импульсной характеристики, которая должна быть свернута, и поэтому матрица Н'' не является матрицей Теплитца. По этой причине m типов импульсных характеристик, от h(1) до h(m) , должны быть отдельно вычислены и сохранены, что приводит к повышению вычислительной нагрузки и требований по памяти для вычисления d и Ф.
Здесь уравнение (2) аппроксимируется посредством уравнения
Здесь d't показано посредством следующего уравнения (4):
Другими словами, d' (i) показано посредством следующего уравнения (5):
Здесь х(n) показывает n-й элемент целевого вектора (n=0, 1, , N-1; причем N является длиной кадра или субкадра, которая является единичным временем для кодирования сигнала возбуждения), h(0) (n) показывает элемент n (n=-m, 0, , N-1) вектора, полученного посредством свертки импульсной характеристики, которая имеет одно или более значений в отрицательные моменты времени, с импульсной характеристикой перцепционно взвешенного фильтра, соответственно. Целевой вектор - это вектор, который обычно используется при CELP-кодировании и получается посредством удаления отклика при отсутствии входного сигнала перцепционно взвешенного синтетического фильтра из перцепционно взвешенного речевого входного сигнала, h(0) (n) - это вектор, полученный посредством применения непричинного фильтра (импульсной характеристики f(n), n=-m, , 0, , N-1) к импульсной характеристике h(n) (n=0, 1, , N-1) перцепционно взвешенного фильтра, и он показан посредством следующего уравнения (6). h(0) (n) также становится импульсной характеристикой непричинного фильтра (n=-m, , 0, , N-1).
Кроме того, матрица Ф' показана посредством следующего уравнения (7):
Другими словами, каждый элемент ' (i, j) матрицы Ф' показан посредством следующего уравнения (8):
Более конкретно матрица Н'' становится матрицей Н' посредством аппроксимации р-го элемента столбца h(p) (n), р=1, m с помощью другого элемента столбца h(0) (n). Эта матрица Н' является матрицей Теплитца, в которой строчные элементы нижней треугольной матрицы Теплитца усекаются. Даже если такая аппроксимация введена, когда энергия непричинных элементов (компонентов в отрицательные моменты времени) является достаточно малой по сравнению с энергией причинных элементов (компонентов в неотрицательные моменты времени, другими словами, в положительные моменты времени, включая время 0) в векторе импульсной характеристики, имеющем одно или более значений в отрицательные моменты времени, влияние аппроксимации является незначительным. Так же, поскольку аппроксимация вводится только в элементы от первого столбца до m-го столбца матрицы Н" (здесь m - это длина непричинных элементов), чем короче становится m, тем более пренебрежительно малым становится влияние аппроксимации.
С другой стороны, есть существенное различие между матрицей Ф' и матрицей Ф в вычислительной нагрузке для их вычисления, т.е. большое различие проявляется в зависимости от того, используется ли или не используется аппроксимация уравнения (3). Например, в сравнении со случаем определения матрицы Ф 0=НtH (Н является нижней треугольной матрицей Теплитца, которая свертывает импульсную характеристику перцепционно взвешенного фильтра в уравнении (1)) в общей алгебраической таблице кодирования, которая свертывает импульсную характеристику, которая не имеет значения в отрицательные моменты времени, m-кратные операции произведения-суммы, как правило, увеличиваются при вычислении матрицы Н' посредством использования аппроксимации уравнения (3), как понятно из уравнения (8). Так же, как и выполняется с помощью С-кода ITU-T Recommendation G.72 9, ' (i, j) может быть рекурсивно вычислена для элементов, где (j-i) является константой (например, '(N-2, N-1), ' (N-3, N-2), , ' (0, 1)). Этот конкретный признак реализует эффективные вычисления элементов матрицы Ф', что означает, что m-кратные операции произведения-суммы не всегда добавляются в вычисление элементов матрицы Ф'.
С другой стороны, при вычислении матрицы Ф, в котором аппроксимация уравнения (3) не используется, уникальные вычисления корреляции должны быть выполнены для вычисления элементов (р, k)= (k, р), где р=0, , m, k=0, , N-1. Т.е. векторы импульсной характеристики, используемые для этих вычислений, отличаются от вектора импульсной характеристики, используемого для вычислений других элементов матрицы Ф (другими словами, определение не корреляции h(0) и h(0) , а корреляции h(0) и h(p), р=1, m). Эти элементы являются элементами, результаты вычисления которых получаются к концу рекурсивного определения. Другими словами, то преимущество, что "элементы могут быть рекурсивно определены, а следовательно, элементы матрицы Ф могут быть эффективно вычислены", как описано выше, теряется. Это означает, что объем операций возрастает примерно в пропорции к числу непричинных элементов вектора импульсной характеристики, имеющего одно или более значений в отрицательные моменты времени (например, объем операций практически удваивается даже в случае m=1).
Фиг.2 - блок-схема, показывающая один пример устройства 150 поиска фиксированной таблицы кодирования, которое осуществляет вышеописанный способ поиска фиксированной таблицы кодирования.
Вектор импульсной характеристики, который имеет одно или более значений в отрицательные моменты времени, и вектор импульсной характеристики перцепционно взвешенного синтетического фильтра вводятся в модуль 151 операции свертки. Модуль 151 операции свертки вычисляет h(0) (n) посредством уравнения (6) и выводит результат в модуль 152 формирования матрицы.
Модуль 152 формирования матрицы формирует матрицу Н' с помощью h(0) (n), введенного модулем 151 операции свертки, и выводит результат в модуль 153 операции свертки.
Модуль 153 операции свертки свертывает элемент h (0) (n) матрицы Н', введенной модулем 152 формирования матрицы, с вектором ck импульсного возбуждения, введенным посредством алгебраической таблицы 101 кодирования, и выводит результат в сумматор 154.
Сумматор 154 вычисляет разностный сигнал перцепционно взвешенного синтетического сигнала, введенного из модуля 153 операции свертки, и целевого вектора, который отдельно вводится, и выводит результат в модуль 155 минимизации ошибок.
Модуль 155 минимизации ошибок задает индекс k таблицы кодирования для формирования вектора сk импульсного возбуждения, при котором энергия разностного сигнала, введенного из сумматора 154, становится минимальной.
Фиг.3 - блок-схема, показывающая конфигурацию общего устройства 200 кодирования речи CELP-типа, которое оснащено устройством 100 формирования вектора фиксированной таблицы кодирования, показанным на фиг.1, в качестве модуля 100а формирования вектора фиксированной таблицы кодирования.
Входной речевой сигнал вводится в модуль 201 предварительной обработки. Модуль 201 предварительной обработки выполняет предварительную обработку, такую как удаление компонентов постоянного тока, и выводит обработанный сигнал в модуль 202 анализа с линейным предсказанием и сумматор 203.
Модуль 202 анализа с линейным предсказанием выполняет анализ с линейным предсказанием в отношении сигнала, введенного из модуля 201 предварительной обработки, и выводит коэффициенты линейного предсказания, которые являются результатом анализа, в модуль 204 LPC-квантования и перцепционно взвешенный фильтр 205.
Сумматор 203 вычисляет разностный сигнал входного речевого сигнала, который получен после предварительной обработки и введен из модуля 201 предварительной обработки, и синтезированного речевого сигнала, введенного из синтетического фильтра 206, и выводит результат в перцепционно взвешенный фильтр 205.
Модуль 204 LPC-квантования выполняет обработку по квантованию и кодированию коэффициентов линейного предсказания, введенных из модуля 202 анализа с линейным предсказанием, и соответственно выводит квантованные LPC в синтетический фильтр 206, а результаты кодирования - в модуль 212 формирования битового потока.
Перцепционно взвешенный фильтр 205 - это фильтр с полюсами и нулями, который сконфигурирован с помощью коэффициентов линейного предсказания, введенных из модуля 202 анализа с линейным предсказанием, и осуществляет обработку по фильтрации разностного сигнала входного речевого сигнала, который получен после предварительной обработки и введен из сумматора 203, и синтетического речевого сигнала, и выводит результат в модуль 207 минимизации ошибок.
Синтетический фильтр 206 - это фильтр с линейным предсказанием, сконструированный посредством использования коэффициентов линейного предсказания, введенных посредством модуля 204 LPC-квантования, и он принимает в качестве ввода возбуждающий сигнал от сумматора 211, выполняет обработку по синтезу с линейным предсказанием и выводит результирующий синтетический речевой сигнал в сумматор 203.
Модуль 207 минимизации ошибок принимает решение касаемо параметров, связанных с усилением относительно модуля 100а формирования вектора адаптивной таблицы кодирования, вектора адаптивной таблицы кодирования и вектора фиксированной таблицы кодирования, с тем чтобы энергия сигнала, введенного перцепционно взвешенным фильтром 205, становилась минимальной, и выводит эти результаты кодирования в модуль 212 формирования битового потока. На этой блок-схеме параметры, связанные с усилением, как предполагается, должны быть квантованы и должны привести в результате к получению одной кодовой информации в модуле 207 минимизации ошибок. Тем не менее модуль квантования усиления может быть вне модуля 207 минимизации ошибок.
Модуль 208 формирования вектора адаптивной таблицы кодирования имеет адаптивную таблицу кодирования, которая буферизует возбуждающие сигналы, введенные из сумматора 211 ранее, формирует вектор адаптивной таблицы кодирования и выводит результат в усилитель 209. Вектор адаптивной таблицы кодирования задается согласно командам из модуля 207 минимизации ошибок.
Усилитель 209 умножает усиление адаптивной таблицы кодирования, введенное из модуля 207 минимизации ошибок, на вектор адаптивной таблицы кодирования, введенный из модуля 208 формирования вектора адаптивной таблицы кодирования, и выводит результат в сумматор 211.
Модуль 100а формирования вектора адаптивной таблицы кодирования имеет ту же конфигурацию, что и конфигурация модуля 100 формирования вектора адаптивной таблицы кодирования, показанного на фиг.1, и принимает в качестве ввода информацию, касающуюся индекса таблицы кодирования и импульсной характеристики непричинного фильтра, из модуля 207 минимизации ошибок, формирует вектор фиксированной таблицы кодирования и выводит результат в усилитель 210.
Усилитель 210 умножает усиление фиксированной таблицы кодирования, введенное из модуля 207 минимизации ошибок, на вектор фиксированной таблицы кодирования, введенный из модуля 208 формирования вектора фиксированной таблицы кодирования, и выводит результат в сумматор 211.
Сумматор 211 суммирует вектор адаптивной таблицы кодирования, умноженный на усиление, и вектор фиксированной таблицы кодирования, которые введены из сумматоров 209 и 210, и выводит результат в качестве возбуждающего сигнала фильтра в синтетический фильтр 206.
Модуль 212 формирования битового потока принимает в качестве входа результат кодирования коэффициентов линейного предсказания (т.е. LPC), введенных модулем 204 LPC-квантования, и принимает результаты кодирования вектора адаптивной таблицы кодирования и вектора фиксированной таблицы кодирования и информацию усиления для них, которые введены из модуля 207 минимизации ошибок, и преобразует их в битовый поток, и выводит битовый поток.
При принятии решения касаемо параметров вектора фиксированной таблицы кодирования в модуле 207 минимизации ошибок используется вышеописанный способ поиска фиксированной таблицы кодирования и устройство, такое как описанно на фиг.2, используется в качестве фактического устройства поиска фиксированной таблицы кодирования.
Таким образом, в настоящем варианте осуществления в случае, когда фильтр, имеющий импульсную характеристику, которая имеет одно или более значений в отрицательные моменты времени (в общем, называемый непричинным фильтром), применяется к вектору возбуждения, сформированному из алгебраической таблицы кодирования, передаточная функция блока обработки, в которой непричинный фильтр и перцепционно взвешенный синтетический фильтр соединены каскадом, аппроксимируется посредством нижней треугольной матрицы Теплитца, в которой элементы матрицы усекаются только на число строк длиной непричинной части. Эта аппроксимация дает возможность сдерживать повышение вычислительной нагрузки, требуемой для поиска алгебраической таблицы кодирования. Кроме того, в случае, если число непричинных элементов меньше числа причинных элементов и/или если энергия непричинных элементов меньше энергии причинных элементов, влияние вышеупомянутой аппроксимации на качество кодирования может быть подавлено.
Настоящий вариант осуществления может быть модифицирован или использован так, как описано далее.
Число причинных компонентов в импульсной характеристике непричинного фильтра может быть ограничено заданным числом в диапазоне, в котором оно больше числа непричинных компонентов.
В настоящем варианте осуществления приведено описание только для обработки во время поиска фиксированной таблицы кодирования.
В устройстве кодирования речи CELP-типа квантование усиления обычно выполняется после поиска фиксированной таблицы кодирования.
Поскольку вектор таблицы кодирования фиксированного возбуждения, который прошел через перцепционно взвешенный синтетический фильтр (т.е. синтетический сигнал, полученный посредством прохождения выбранного вектора таблицы кодирования фиксированного возбуждения через перцепционно взвешенный синтетический фильтр), требуется в это время, общепринято вычислять данный "вектор таблицы кодирования фиксированного возбуждения, который прошел через перцепционно взвешенный синтетический фильтр" после того, как поиск фиксированной таблицы кодирования завершен. Матрица свертки импульсной характеристики, которая должна быть использована в это время, не является матрицей свертки импульсной характеристики Н(0) для аппроксимации, которая использована во время поиска, но предпочтительно матрица Н", в которой только элементы столбцов с первого по m-й (равно случаю, когда число непричинных элементов является m) отличаются от других элементов.
Кроме того, в настоящем варианте осуществления описано, что длина вектора в непричинной части (т.е. элементы вектора в отрицательные моменты времени) предпочтительно короче, чем в причинной части, включая время 0 (т.е. элементы вектора в неотрицательные моменты времени). Тем не менее длина непричинной части задается равной не менее N/2 (N - это длина вектора импульсного возбуждения).
Выше приведено описание варианта осуществления настоящего изобретения.
Устройство поиска фиксированной таблицы кодирования и устройство кодирования речи согласно настоящему изобретению не ограничены вышеописанным вариантом осуществления и могут быть модифицированы и осуществлены различными способами.
Устройство поиска фиксированной таблицы кодирования и устройство кодирования речи согласно настоящему изобретению могут быть установлены в устройстве терминала связи и устройстве базовой станции в системах мобильной связи, и это дает возможность предоставлять устройство терминала связи, устройство базовой станции и системы мобильной связи, которые имеют такие же функциональные эффекты, что и описано выше.
Кроме того, хотя здесь описан пример случая, когда настоящее изобретение сконфигурировано в аппаратных средствах, настоящее изобретение также может быть реализовано посредством программного обеспечения. Например, алгоритм способа поиска фиксированной таблицы кодирования и способа кодирования речи согласно настоящему изобретению могут быть описаны посредством языка программирования, и посредством сохранения этой программы в памяти и исполнения программы модулем обработки информации можно реализовать такие же функции, что и функции устройства поиска фиксированной таблицы кодирования и устройства кодирования речи по настоящему изобретению.
Термины "фиксированная таблица кодирования" и "адаптивная таблица кодирования", используемые в вышеописанном варианте осуществления, также могут упоминаться как "таблица кодирования фиксированного возбуждения" и "таблица кодирования адаптивного возбуждения".
Каждый функциональный блок, используемый в описании каждого из вышеупомянутых вариантов осуществления, типично может быть реализован как LSI, состоящая из интегральной микросхемы. Это могут быть отдельные микросхемы, либо они могут частично или полностью содержаться на одной микросхеме.
В данном документе употребляется термин LSI, но она также может упоминаться как IC, "системная LSI", "супер-LSI" или "ультра-LSI" в зависимости от отличающейся степени интеграции.
Более того, способ интеграции микросхем не ограничен LSI, и реализация с помощью специализированных схем или процессора общего назначения также возможна. После изготовления LSI использование FPGA (программируемой пользователем матричной БИС) или реконфигурируемого процессора, где соединения или разъемы ячеек схемы в рамках LSI могут быть переконфигурированы, также возможно.
Кроме того, если появится технология интегральных микросхем, чтобы заменить LSI в результате усовершенствования полупроводниковой технологии или другой производной технологии, разумеется, также можно выполнять интеграцию функциональных блоков с помощью этой технологии. Применение в биотехнологии также допускается.
Устройство поиска фиксированной таблицы кодирования по настоящему изобретению имеет такой эффект, что в устройстве кодирования речи CELP-типа, которое использует алгебраическую таблицу кодирования в качестве фиксированной таблицы кодирования, можно добавлять характеристику непричинного фильтра к вектору импульсного возбуждения, сформированному из алгебраической таблицы кодирования, без увеличения размера памяти и существенной вычислительной нагрузки, и используется при поиске фиксированной таблицы кодирования устройства кодирования речи, используемого в устройствах терминала связи, таких как мобильные телефоны, где доступный размер памяти и ограничен, и где радиосвязь принудительно должна выполняться на небольшой скорости.
Класс G10L19/08 определение или кодирование функций возбуждения; определение или кодирование параметров долгосрочных прогнозов