устройство и способ кодирования видеоизображения и носитель данных, хранящий программу кодирования видеоизображения

Классы МПК:H04N7/50 включающие преобразование и прогнозное кодирование
Автор(ы):,
Патентообладатель(и):НИППОН ТЕЛЕГРАФ ЭНД ТЕЛЕФОН КОРПОРЕЙШН (JP)
Приоритеты:
подача заявки:
2008-07-10
публикация патента:

Изобретение относится к устройству и способу кодирования видеоизображения. Техническим результатом является обеспечение устройства кодирования видеоизображения, которое не требует повторного кодирования или кодирования, соответствующего двум или нескольким режимам кодирования, и осуществляет кодирование, объем формируемого кода которого не выходит за верхний предел, без ожидания результата измерений объема сформированного кода. Предложено устройство кодирования видеоизображения и соответствующий способ для применения ортогонального преобразования к сигналу ошибки предсказания между сигналом видеоизображения для целевой области кодирования и предсказанным сигналом для сигнала видеоизображения, и квантования полученного коэффициента ортогонального преобразования с использованием заданного размера шага квантования, для того чтобы кодировать коэффициент. Вычисляется мощность ошибки предсказания, которая является мощностью сигнала ошибки предсказания. Для входной информации, такой как вычисленная мощность ошибки предсказания, заданный шаг квантования, и верхний предел для объема кода, формируемого для целевой области кодирования, определяется, превышает или не превышает верхний предел объем кода, формируемого при выполнении квантования с использованием заранее заданного размера шага квантования, а процесс кодирования изменяется на основании результата определения. 3 н. и 2 з.п. ф-лы, 20 ил. устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857

устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857 устройство и способ кодирования видеоизображения и носитель данных,   хранящий программу кодирования видеоизображения, патент № 2444857

Формула изобретения

1. Устройство кодирования видеоизображения для применения ортогонального преобразования к сигналу ошибки предсказания между сигналом видеоизображения из целевой области кодирования и предсказанным сигналом для сигнала видеоизображения, и квантования полученного коэффициента ортогонального преобразования с использованием заранее заданного размера шага квантования для того, чтобы кодировать коэффициент, причем устройство содержит:

вычислительное устройство, которое вычисляет значение сигнала ошибки предсказания, которое является мощностью сигнала ошибки предсказания;

устройство определения, которое принимает значение сигнала ошибки предсказания, вычисленное вычислительным устройством, заранее заданный размер шага квантования и верхний предел для объема кода, формируемого для целевой области кодирования, и определяет, превышен или не превышен верхний предел объемом кода, формируемого при выполнении квантования с использованием заранее заданного размера шага квантования; и

устройство изменения, которое изменяет процесс кодирования на основании результата определения посредством устройства определения,

при этом устройство определения вычисляет разрешающее значение для значения сигнала ошибки предсказания на основании верхнего предела и заранее заданного размера шага квантования и сравнивает разрешающее значение со значением сигнала ошибки предсказания, чтобы определить, превышен или не превышен верхний предел объемом кода, формируемого при выполнении квантования с использованием заранее заданного размера шага квантования.

2. Устройство кодирования видеоизображения по п.1, в котором: устройство определения вычисляет разрешающее значение для значения сигнала ошибки предсказания путем установки переменных функции, которыми являются верхний предел и размер шага квантования, в значения верхнего предела и размера шага квантования, где значением функции является разрешающее значение.

3. Устройство кодирования видеоизображения по п.1, в котором: устройство определения вычисляет разрешающее значение для значения сигнала ошибки предсказания путем обращения к таблице, в которой заданы взаимосвязи между значениями данных для верхнего предела, размера шага квантования и разрешающего значения.

4. Способ кодирования видеоизображения для применения ортогонального преобразования к сигналу ошибки предсказания между сигналом видеоизображения для целевой области кодирования и предсказанным сигналом для сигнала видеоизображения, и квантования полученного коэффициента ортогонального преобразования с использованием заранее заданного размера шага квантования для того, чтобы кодировать коэффициент, при этом способ содержит:

этап вычисления, на котором вычисляют значение сигнала ошибки предсказания, которое является мощностью сигнала ошибки предсказания;

этап определения, на котором принимают вычисленное значение сигнала ошибки предсказания, заранее заданный размер шага квантования и верхний предел для объема кода, формируемого для целевой области кодирования, и определяют, превышен или не превышен верхний предел объемом кода, формируемого при выполнении квантования с использованием заранее заданного размера шага квантования; и

этап изменения, на котором изменяют процесс кодирования на основе результата определения,

при этом на этапе определения вычисляют разрешающее значение для значения сигнала ошибки предсказания на основании верхнего предела и размера шага квантования и сравнивают разрешающее значение со значением сигнала ошибки предсказания, чтобы определить, превышен или не превышен верхний предел объемом кода, формируемого при выполнении квантования с использованием размера шага квантования.

5. Машиночитаемый носитель данных, который хранит программу кодирования видеоизображения, при помощи которой компьютер исполняет процесс для осуществления устройства кодирования видеоизображения по п.1.

Описание изобретения к патенту

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к устройству кодирования видеоизображения и соответствующему способу для применения ортогонального преобразования к сигналу ошибки предсказания между сигналом видеоизображения для целевой области кодирования, и предсказанным сигналом для такового, и квантования полученного коэффициента ортогонального преобразования с использованием размера шага квантования для того, чтобы кодировать коэффициент, а также относится к программе кодирования видеоизображения, используемой для осуществления устройства кодирования видеоизображения, и к носителю данных, хранящему программу. В частности, настоящее изобретение относится к устройству кодирования видеоизображения и соответствующему способу, которые не требуют повторного кодирования или кодирования, оперирующего двумя или несколькими режимами кодирования, и осуществляют кодирование, которое формирует коды меньше верхнего предельного (максимального) объема кода, к программе кодирования видеоизображения, используемой для осуществления устройства кодирования видеоизображения, и к носителю данных, который хранит программу.

Приоритет испрашивается на основании заявки на патент Японии № 2007-185374, поданной 17 июля 2007, содержание которой тем самым включено в настоящий документ путем ссылки.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

В стандарте H.264 в качестве международного стандарта кодирования определен верхний предельный объем кода для одного макроблока (см., например, непатентный документ 1).

Следовательно, устройство кодирования видеоизображения на основе H.264 должно выполнять кодирование таким образом, чтобы объем сформированного кода, формируемого для одного макроблока, не превышал вышеупомянутого верхнего предельного объема.

Для того чтобы осуществить вышеупомянутое условие, объем формируемого кода измеряется после кодирования, и если измеренный объем превышает верхнее предельное значение, кодирование должно повторяться снова с пересмотренными условиями кодирования.

Однако в таком способе объем вычисления или время обработки увеличиваются вследствие повторного кодирования с пересмотренными условиями кодирования.

В предложенном способе, предназначенном для решения вышеупомянутой проблемы, процессы кодирования (ортогональное преобразование, квантование, кодирование источника информации и подобное), соответствующие двум или нескольким режимам кодирования, для которых назначены различные условия кодирования, выполняются одновременно, и выбирается тот, который дает результат кодирования, объем формируемого кода которого не превышает соответствующий (условиям) верхний предел.

Однако в таком способе процессы кодирования, соответствующие двум или нескольким режимам кодирования, имеющим различные условия кодирования, должны исполняться одновременно, и не всегда получают результат кодирования, объем сформированного кода которого не превышает верхний предел.

Следовательно, для надежного кодирования каждого макроблока любого входного изображения с числом битов, которое меньше верхнего предела, стандарт H.264 применяет режим импульсно-кодовой модуляции (ИКМ, PCM), в котором непосредственно передается значение пиксела без сжатия (то есть без квантования).

В традиционной методике, использующей вышеупомянутое, как показано на Фиг.18, кодирование исполняется после определения режима кодирования, и измеряется объем кода, формируемого в ходе кодирования. Если измеренное значение превышает верхний предел, повторное кодирование выполняется в режиме ИКМ.

С другой стороны, по сравнению с традиционным способом кодирования с использованием кодовой таблицы, используемый в H.264 способ арифметического кодирования имеет такую особенность, что объем кода не может немедленно измеряться.

Следовательно, превышение над верхним предельным числом битов может быть выявлено после того, как начата обработка следующего макроблока. В такой ситуации возникает проблема в том, что имеется задержка при работе в конвейерном режиме (то есть параллельного исполнения).

Соответственно, в аппаратном устройстве для выполнения конвейерного режима для макроблоков (в качестве единиц), если входное изображение для макроблока, число битов которого превышает верхний предел, повторно кодируется в вышеописанном режиме ИКМ, является необходимой дополнительная машинная память, чтобы хранить входное изображение, пока кодирование не достигнет конечной стадии.

Следовательно, в ныне предлагаемой методике (см., например, непатентный документ 2), относящейся к аппаратно реализованным устройствам, предназначенным для выполнения конвейерного режима для макроблоков в качестве единиц, при наличии макроблока, число битов которого превышает верхний предел, не входное изображение для макроблока, а локальное декодированное изображение для такового повторно кодируется в режиме ИКМ в соответствующем кодере.

Непатентный документ 1: рекомендации Международного союза электросвязи, сектора телекоммуникаций (ITU-T) по стандарту H.264, "Advanced video coding for generic audio visual services" (Усовершенствованное кодирование видео для общих аудиовизуальных услуг), стр.249-256, 2003.

Непатентный документ 2: Keiichi Chono, Yuzo Senda, Yoshihiro Miyamoto, "A PCM coding method using decoded images for obeying the upper limit on the number of bits of MB in H.264 encoding" (Способ ИКМ-кодирования, использующий декодированные изображения, чтобы удовлетворять условию верхнего предела на число битов в макроблоке в кодировании по H.264), стр.119-120, PCSJ2006.

РАСКРЫТИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Техническая задача изобретения

Как описано выше, в устройстве кодирования видеоизображения на основе H.264, кодирование следует выполнять таким образом, чтобы объем кода, формируемого для одного макроблока, находился в рамках конкретного верхнего предела. Для того чтобы осуществить это условие, объем сформированного кода измеряется после процесса кодирования, и если объем сформированного кода превышает конкретный верхний предел, может выполняться повторное кодирование с пересмотренными условиями кодирования.

Однако в таком способе объем вычислений или время обработки увеличиваются вследствие повторного кодирования с пересмотренными условиями кодирования.

В предлагаемом способе, предназначенном для решения вышеупомянутой задачи, процессы кодирования, соответствующие двум или нескольким режимам кодирования, для которых назначены различные условия кодирования, исполняются одновременно, и выбирается тот, который дает результат кодирования, чей объем сформированного кода не превышает соответствующий верхний предел.

Однако в таком способе процессы кодирования, соответствующие двум или нескольким режимам кодирования, имеющим различные условия кодирования, должны исполняться одновременно, и не всегда получают результат кодирования, объем сформированного кода которого не превышает верхний предел.

Следовательно, в традиционной методике, как показано на вышеупомянутой Фиг.18, кодирование выполняется после определения режима кодирования, и измеряется объем кода, формируемого в ходе кодирования. Если измеренное значение превышает верхний предел, исполняется повторное кодирование в режиме ИКМ.

Однако в вышеупомянутой традиционной методике даже если объем формируемого кода может быть уменьшен по сравнению с повторным кодированием в режиме ИКМ, такая возможность игнорируется.

Кроме того, способ арифметического кодирования, используемый в H.264, имеет особенность, что объем кода не может измеряться немедленно, и, таким образом, возникает задержка обработки в аппаратном устройстве, которое исполняет конвейерный режим.

В свете вышеуказанных обстоятельств задача настоящего изобретения состоит в том, чтобы обеспечить новую методику кодирования изображения, которая не требует повторного кодирования или кодирования, соответствующего двум или нескольким режимам кодирования, и осуществляет кодирование, объем формируемого кода которого не выходит за верхний предел, без ожидания результата измерений объема сформированного кода.

Средство решения технической задачи изобретения

Для достижения цели изобретения настоящее изобретение обеспечивает устройство кодирования видеоизображения, предназначенное для применения ортогонального преобразования к сигналу ошибки предсказания между сигналом видеоизображения для целевой области кодирования и предсказанного сигнала для сигнала видеоизображения, и квантования полученного коэффициента ортогонального преобразования с использованием заранее заданного размера шага квантования для того, чтобы кодировать коэффициент. Устройство содержит:

(1) вычислительное устройство, которое вычисляет мощность ошибки предсказания, которая является мощностью сигнала ошибки предсказания;

(2) устройство определения, которое принимает мощность ошибки предсказания, вычисленную посредством вычислительного устройства, заранее заданный размер шага квантования, подлежащий использованию в соответствующем кодировании, и верхний предел для объема кода, формируемого для целевой области кодирования, и определяет, превышает или не превышает верхний предел объем кода, формируемого при выполнении квантования с использованием размера шага квантования, подлежащего использованию в кодировании; и

(3) устройство изменений, которое изменяет процесс кодирования на основании результата определения посредством устройства определения,

при этом устройство определения вычисляет разрешающую мощность для мощности ошибки предсказания, вычисляемой посредством вычислительного устройства, на основании верхнего предела объема формируемого кода и размера шага квантования, подлежащего использованию в кодировании, и сравнивает разрешающую мощность с мощностью ошибки предсказания, вычисленной посредством вычислительного устройства, чтобы определить, превышает или не превышает верхний предел объем кода, формируемого при выполнении квантования с использованием размера шага квантования, подлежащего использованию в кодировании.

Вышеописанные устройства обработки также могут осуществляться посредством компьютерной программы. Такая компьютерная программа может предоставляться согласно сохранению таковой на соответствующем машиночитаемом носителе данных, или посредством сети, и может устанавливаться и функционировать в устройстве управления, таком как центральный процессор (ЦП, CPU), чтобы осуществлять настоящее изобретение.

В целом, объем G формируемого кода и размер Q шага квантования имеют нижеследующие соотношения:

G = X/Q,

где X является значением, зависящим от входного сигнала.

Кроме того, для того же размера Q шага квантования имеется корреляция между объемом G формируемого кода и мощностью D входного сигнала. Следовательно, в выборе режима предсказания, используемого в кодировании, выбирается режим для минимизации мощности ошибки предсказания.

В соответствии с вышеуказанными соотношениями может оцениваться приблизительный объем формируемого кода.

Принимая во внимание вышеуказанное, вычисляется мощность ошибки предсказания, которая является мощностью сигнала ошибки предсказания (в качестве целевого объекта кодирования). На основании вычисленной мощности ошибки предсказания и размера шага квантования, подлежащего использованию в кодировании, оценивается объем кода, формируемого при выполнении квантования с использованием размера шага квантования, подлежащего использованию в кодировании. Значение оценки сравнивается с соответствующим верхним пределом объема формируемого кода, так что может быть определено, превышает или не превышает верхний предел объем формируемого кода при выполнении квантования с использованием размера шага квантования, подлежащего использованию в кодировании.

В вышеуказанном процессе определения непосредственно оценивается объем формируемого кода. Однако процесс определения является эквивалентным процессу, предназначенному для определения, находится ли мощность ошибки предсказания в пределах диапазона разрешающей мощности, заданного на основании верхнего предельного объема для формируемого кода.

Следовательно, в устройстве кодирования видеоизображения по настоящему изобретению разрешающая мощность для мощности ошибки предсказания вычисляется на основании верхнего предельного объема формируемого кода и размера шага квантования, подлежащего использованию в кодировании, и разрешающая мощность сравнивается с вычисленной мощностью ошибки предсказания, чтобы определить, превышает или не превышает верхний предел объем кода, формируемого при выполнении квантования с использованием размера шага квантования, подлежащего использованию в кодировании.

Значение оценки объема формируемого кода или разрешающей мощности для мощности ошибки предсказания, которая используется в процессе определения, может быть легко вычислена посредством функции или таблицы.

То есть возможно оценивать объем формируемого кода путем установки переменных функции, которыми являются мощность ошибки предсказания и размер шага квантования, в значения мощности ошибки предсказания и размера шага квантования, где значением функции является соответствующий объем формируемого кода. Также является возможным оценивать объем формируемого кода путем обращения к таблице, в которой заданы взаимосвязи между значениями данных для мощности ошибки предсказания, размера шага квантования, и соответствующим объемом формируемого кода.

Также является возможным вычислять разрешающую мощность для мощности ошибки предсказания путем установки переменных функции, которыми являются верхний предел объема формируемого кода и размер шага квантования, в значения верхнего предела и размера шага квантования, где значением функции является разрешающая мощность для мощности ошибки предсказания. Также является возможным вычислять разрешающую мощность для мощности ошибки предсказания путем обращения к таблице, в которой заданы взаимосвязи между значениями данных предельного объема формируемого кода, размером шага квантования и разрешающей мощностью для мощности ошибки предсказания.

Собственно говоря, различные режимы кодирования (режимы предсказания) имеют различные служебные объемы кода или подобное, и такая функция или справочная таблица зависит от режима кодирования. Следовательно, является предпочтительным, что такая функция или справочная таблица предусматривается для каждого режима кодирования, и выбирается и используется одна, подходящая для режима кодирования в целевой области кодирования.

Если посредством вышеуказанного процесса определения определяется, что объем кода, формируемого при выполнении квантования с использованием размера шага квантования, подлежащего использованию в кодировании, превышает верхний предел, то (i) в первом примере квантованное значение коэффициента ортогонального преобразования может не кодироваться, но сигнал видеоизображения может кодироваться без квантования сигнала видеоизображения ; и (ii) во втором примере может быть получен размер шага квантования, который вычисляется на основании мощности ошибки предсказания и верхнего предела для объема формируемого кода и обеспечивает выполнение формирования кода в объеме, не превышающем верхний предел, и размер шага квантования может переключаться из размера шага квантования, подлежащего использованию в кодировании, в полученный размер шага квантования.

Вычисление размера шага квантования, используемого в вышеуказанной операции переключения, осуществляется с использованием обратной функции относительно функции, которая используется для вышеописанной оценки объема формируемого кода. Следовательно, также в этом случае может легко вычисляться соответствующий размер шага квантования с использованием функции или таблицы.

То есть возможно вычислять размер шага квантования, который обеспечивает формирование объема кода, не превышающего верхний предел, путем установки переменных функции, которыми являются мощность ошибки предсказания и верхний предел для объема формируемого кода, в значения мощности ошибки предсказания и верхнего предела, где значением функции является размер шага квантования, обеспечивающего формирование объема кода, который не превышает верхний предел.

Также является возможным вычислять размер шага квантования, который обеспечивает выполнение формирования объема кода, не превышающего верхний предел для объема формируемого кода, путем обращения к таблице, в которой заданы взаимосвязи между значениями данных для мощности ошибки предсказания, верхнего предела и размером шага квантования, который обеспечивает выполнение формирования объема кода, который не превышает верхний предел.

Собственно говоря, различные режимы кодирования (режимы предсказания) имеют различные служебные объемы кода или подобное, и такая функция или справочная таблица зависит от режима кодирования. Следовательно, является предпочтительным, что такая функция или справочная таблица предусматривается для каждого режима кодирования, и выбирается и используется одна, подходящая для режима кодирования для целевой области кодирования.

Эффект изобретения

Как описано выше, настоящее изобретение может применяться для устройства, предназначенного для применения ортогонального преобразования к сигналу ошибки предсказания между сигналом видеоизображения для целевой области кодирования и предсказанным сигналом для сигнала видеоизображения, и квантования полученного коэффициента ортогонального преобразования с использованием размера шага квантования для того, чтобы кодировать коэффициент. Настоящее изобретение может осуществлять кодирование, которое формирует коды меньше верхнего предельного объема кода, без измерения объема сформированного кода. Следовательно, настоящее изобретение не требует повторного кодирования или кодирования, которое оперирует двумя или несколькими режимами кодирования, и может осуществлять кодирование, которое формирует коды меньше верхнего предельного объема кода.

Дополнительно, поскольку настоящее изобретение может осуществлять кодирование, объем формируемого кода которого не превышает верхний предел без ожидания результата измерений объема сформированного кода, не возникает задержки обработки в аппаратном устройстве, исполняющем конвейерный режим.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 - схема, показывающая устройство кодирования видеоизображения в виде варианта осуществления настоящего изобретения.

Фиг.2 - схема, показывающая примерную структуру блока оценки объема кода в варианте осуществления.

Фиг.3 - схема, показывающая примерную структуру блока вычисления размера шага квантования в варианте осуществления.

Фиг.4 - последовательность действий, исполняемая устройством кодирования видеоизображения по варианту осуществления.

Фиг.5A - также последовательность действий, исполняемая устройством кодирования видео.

Фиг.5B - также последовательность действий, исполняемая устройством кодирования видео.

Фиг.6 - схема, показывающая другую примерную структуру блока оценки объема кода в варианте осуществления.

Фиг.7 - последовательность действий, исполняемая устройством кодирования видеоизображения, применяющим структуру по Фиг.6.

Фиг.8A - также последовательность действий, исполняемая устройством кодирования видео.

Фиг.8B - также последовательность действий, исполняемая устройством кодирования видео.

Фиг.9 - схема, показывающая устройство кодирования видеоизображения в виде другого варианта осуществления настоящего изобретения.

Фиг.10 - последовательность действий, исполняемая устройством кодирования видеоизображения по варианту осуществления.

Фиг.11 - другая последовательность действий, исполняемая устройством кодирования видеоизображения по варианту осуществления.

Фиг.12 - схема, показывающая примерную структуру блока оценки объема формируемого кода.

Фиг.13 - схема, показывающая другую примерную структуру блока оценки объема формируемого кода.

Фиг.14 - схема, показывающая примерную структуру блока вычисления разрешающей мощности ошибки предсказания.

Фиг.15 - схема, показывающая другую примерную структуру блока вычисления разрешающей мощности ошибки предсказания.

Фиг.16 - схема, показывающая примерную структуру блока вычисления размера шага квантования.

Фиг.17 - схема, показывающая другую примерную структуру блока вычисления размера шага квантования.

Фиг.18 - последовательность действий, поясняющая традиционную методику.

Обозначения ссылочных позиций

10 - структурная часть в виде основанного на стандарте H.264 устройства кодирования видеоизображения по H.264

20 - блок оценки объема кода

21 - блок вычисления размера шага квантования

22 - селекторный переключатель

200 - блок вычисления мощности ошибки предсказания

201 - блок оценки объема формируемого кода

202 - блок сравнения объема кода

210 - блок вычисления мощности ошибки предсказания

211 - блок вычисления минимального размера шага квантования

ЛУЧШИЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Ниже, настоящее изобретение будет подробно поясняться в соответствии с вариантами осуществления такового.

На Фиг.1 показано устройство кодирования видеоизображения в виде варианта осуществления настоящего изобретения.

На Фиг.1 числовая ссылочная позиция 10 указывает структурную часть (окруженную пунктиром) в виде основанного на стандарте H.264 устройства кодирования видеоизображения по H.264, числовая ссылочная позиция 20 указывает блок оценки объема кода, предусмотренный для осуществления настоящего изобретения, числовая ссылочная позиция 21 указывает блок вычисления размера шага квантования, предусмотренный для осуществления настоящего изобретения, и числовая ссылочная позиция 22 указывает селекторный переключатель (предусмотренный) для осуществления настоящего изобретения.

Подобно традиционным устройствам кодирования видеоизображения на основе стандарта H.264, часть 10, в виде устройства кодирования видеоизображения по H.264, включает в состав блок 100 определения движения, блок 101 компенсации движения, память 102 кадров, блок 103 определения режима межкадрового предсказания, блок 104 определения режима внутрикадрового предсказания, селекторный переключатель 105, блок 106 вычитания, блок 107 ортогонального преобразования, квантователь 108, контроллер 109 квантования, обратный квантователь 110, блок 111 обратного ортогонального преобразования, сумматор 112, контурный фильтр 113 и кодер 114 источника информации. После того, как блок 106 вычитания формирует сигнал ошибки предсказания между сигналом видеоизображения для целевого макроблока кодирования и предсказанным сигналом такового, блок 107 ортогонального преобразования подвергает сформированный сигнал ошибки предсказания ортогональному преобразованию. В соответствии с размером шага квантования, установленного контроллером 109 квантования, квантователь 108 квантует коэффициенты ортогонального преобразования, полученные посредством ортогонального преобразования. Кодер 114 источника информации подвергает квантованные значения энтропийному кодированию с тем, чтобы кодировать сигнал видеоизображения.

На Фиг.2 показана примерная структура блока 20 оценки объема кода.

Блок 20 оценки объема кода принимает значение верхнего предела для объема кода, формируемого для соответствующего макроблока (то есть верхний предельный объем кода), сигнал ошибки предсказания, формируемый блоком 106 вычитания, и размер шага квантования, установленный контроллером 109 квантования, и включает в состав блок 200 вычисления (электрической) мощности ошибки предсказания, блок 201 оценки объема формируемого кода и компаратор 202 объема кода.

Блок 200 вычисления мощности ошибки предсказания вычисляет мощность ошибки предсказания, которая является мощностью сигнала ошибки предсказания, формируемого блоком 106 вычитания.

На основе мощности ошибки предсказания, вычисленной блоком 200 вычисления мощности ошибки предсказания, и размера шага квантования, установленного контроллером 109 квантования, блок 201 оценки объема формируемого кода осуществляет оценку объема формируемого кода при выполнении квантования целевого макроблока кодирования при соответствующем размере шага квантования.

Компаратор 202 объема кода сравнивает оценку объема формируемого кода, полученного посредством блока 201 оценки объема формируемого кода, с верхним пределом (определенном в H.264) для объема кода, формируемого для макроблока. Если оценка объема формируемого кода, полученная посредством блока 201 оценки объема формируемого кода, больше верхнего предела для объема кода, формируемого для макроблока, компаратор 202 объема кода управляет селекторным переключателем 22, чтобы переключить размер шага квантования, поданный на квантователь 108, от размера шага квантования, установленного контроллером 109 квантования, на размер шага квантования, вычисленный блоком 21 вычисления размера шага квантования. Напротив, если оценка объема формируемого кода, полученная посредством блока 201 оценки объема формируемого кода, меньше или равна верхнему пределу для объема кода, формируемого для макроблока, компаратор 202 объема кода управляет селекторным переключателем 22, чтобы непосредственно использовать размер шага квантования, установленный контроллером 109 квантования, в качестве размера шага квантования, подаваемого на квантователь 108.

На Фиг.3 показана примерная структура блока 21 вычисления размера шага квантования.

Блок 21 вычисления размера шага квантования принимает верхнее предельное значение для объема кода, формируемого для соответствующего макроблока (то есть верхний предельный объем кода), и сигнал ошибки предсказания, формируемый блоком 106 вычитания, и включает в состав блок 210 вычисления (электрической) мощности ошибки предсказания и блок 211 вычисления минимального размера шага квантования.

Блок 210 вычисления мощности ошибки предсказания вычисляет мощность ошибки предсказания, которая является мощностью сигнала ошибки предсказания, формируемого блоком 106 вычитания.

На основе мощности ошибки предсказания, вычисленной блоком 210 вычисления мощности ошибки предсказания, и верхнего предела для объема кода, формируемого для макроблока, блок 211 вычисления минимального размера шага квантования вычисляет размер шага квантования для обеспечения формирования объема кода, который не превышает верхний предел (то есть минимальный размер шага квантования).

На Фиг.4-Фиг.5B показаны последовательности действий, исполняемые устройством кодирования видеоизображения настоящего осуществления.

На основе последовательностей действий будет подробно поясняться работа устройства кодирования видеоизображения в настоящем осуществлении.

Как показано на блок-схеме по Фиг.4, в устройстве кодирования видеоизображения по настоящему осуществлению режим кодирования определяется на первом этапе S10. На следующем этапе S11 оценивается объем кода, формируемый при выполнении кодирования при использовании текущего установленного размера шага квантования.

На следующем этапе S12 определяется, является ли оценка объема кода, формируемого для соответствующего макроблока, больше верхнего предела, заданного для него. Если определяется, что оценка объема больше верхнего предела, действие переходит на этап S13, где изменяется размер шага квантования. На следующем этапе S14 исполняется кодирование с использованием текущего установленного размера шага квантования.

Если в определении по этапу S12 определяется, что оценка объема меньше или равна верхнему пределу, действие переходит непосредственно на этап S14, пропуская этап S13, и кодирование выполняется с использованием текущего установленного размера шага квантования.

На Фиг.5A показана последовательность действий для процесса выполнения оценки объема формируемого кода на этапе S11, и на Фиг.5B показана последовательность действий для процесса выполнения изменения размера шага квантования на этапе S13.

Как показано на блок-схеме по Фиг.5A, на этапе S110 принимают сигнал ошибки предсказания, чтобы вычислить мощность ошибки предсказания (см. первый этап S110), и на следующем этапе S111 принимают текущий установленный размер шага квантования. На следующем этапе S112, на основе вычисленной мощности ошибки предсказания и принятом размере шага квантования, оценивается объем кода, формируемого при выполнении кодирования с использованием текущего установленного размера шага квантования.

На поясненном выше этапе S13, как показано на блок-схеме по Фиг.5B, значение верхнего предела для объема кода, формируемого для соответствующего макроблока (то есть верхний предельный объем для кода), принимают на первом этапе S130, и на следующем этапе S131 принимают сигнал ошибки предсказания, чтобы вычислить мощность ошибки предсказания. На следующем этапе S132, на основе принятого верхнего предела для объема формируемого кода и вычисленной мощности ошибки предсказания, вычисляется размер шага квантования для обеспечения, что формирование объема кода не превысит верхний предел. На следующем этапе S133, в соответствии с вычисленным размером шага квантования, изменяется размер шага квантования, используемый в соответствующем кодировании.

Соответственно, устройство кодирования видеоизображения, показанное на Фиг.1, выполняет оценку объема кода, формируемого при выполнении кодирования, использующего текущий установленный размер шага квантования, на основе взаимосвязи между объемом формируемого кода и размером шага квантования. Если значение оценки больше верхнего предела для объема кода, формируемого для соответствующего макроблока, вычисляется размер шага квантования для обеспечения формирования объема кода, не превышающего верхний предел, и размер шага квантования, используемый в кодировании, изменяется на вычисленное значение.

Следовательно, в соответствии с устройством кодирования видеоизображения по настоящему варианту осуществления, повторное кодирование или кодирование, соответствующее двум или нескольким режимам кодирования, являются ненужными, и кодирование, объем формируемого кода которого не превышает верхний предел, может осуществляться без ожидания результата измерения объема сформированного кода.

На Фиг.6 показана другая примерная структура блока 20 оценки объема кода.

При использовании показанной структуры блок 20 оценки объема кода принимает значение верхнего предела для объема кода, формируемого для соответствующего макроблока (то есть верхний предельный объем для кода), сигнал ошибки предсказания, формируемый блоком 106 вычитания, и размер шага квантования, установленный контроллером 109 квантования, и включает в состав блок 200 вычисления мощности ошибки предсказания, блок 203 вычисления разрешающей мощности ошибки предсказания и компаратор 204 ошибки предсказания.

Блок 200 вычисления мощности ошибки предсказания вычисляет мощность ошибки предсказания, которая является мощностью сигнала ошибки предсказания, формируемого блоком 106 вычитания.

Блок 203 вычисления разрешающей мощности ошибки предсказания вычисляет разрешающую мощность для мощности ошибки предсказания (то есть разрешающую мощность ошибки предсказания) на основе верхнего предела для объема кода, формируемого для макроблока, и размера шага квантования, установленного контроллером 109 квантования.

Компаратор 204 ошибки предсказания сравнивает мощность ошибки предсказания, вычисленную блоком 200 вычисления мощности ошибки предсказания, с разрешающей мощностью ошибки предсказания, вычисленной блоком 203 вычисления разрешающей мощности ошибки предсказания. Если мощность ошибки предсказания, вычисленная блоком 200 вычисления мощности ошибки предсказания, больше разрешающей мощности ошибки предсказания, вычисленной блоком 203 вычисления разрешающей мощности ошибки предсказания, компаратор 204 ошибки предсказания управляет селекторным переключателем 22, чтобы переключить размер шага квантования, подаваемый на квантователь 108, от размера шага квантования, установленного контроллером 109 квантования, на размер шага квантования, вычисленный блоком 21 вычисления размера шага квантования. Напротив, если мощность ошибки предсказания, вычисленная блоком 200 вычисления мощности ошибки предсказания, меньше или равна разрешающей мощности ошибки предсказания, вычисленной блоком 203 вычисления разрешающей мощности ошибки предсказания, компаратор 204 ошибки предсказания управляет селекторным переключателем 22, чтобы использовать непосредственно размер шага квантования, установленный контроллером 109 квантования в качестве размера шага квантования, подаваемого на квантователь 108.

На Фиг.7-Фиг.8B показаны последовательности действий, исполняемые устройством кодирования видеоизображения по настоящему варианту осуществления, если блок 20 оценки объема кода имеет структуру, как показано на Фиг.6.

На основе схем последовательностей действий будет подробно поясняться работа устройства кодирования видеоизображения в этом случае.

Как показано на блок-схеме по Фиг.7, когда блок 20 оценки объема кода имеет структуру, как показано на Фиг.6, устройство кодирования видеоизображения согласно настоящему осуществлению на первом этапе S20 определяет режим кодирования. На следующем этапе S21 вычисляется разрешающая мощность ошибки предсказания в качестве разрешающей мощности для мощности ошибки предсказания.

На следующем этапе S22 определяется, является ли мощность ошибки предсказания больше разрешающей мощности ошибки предсказания. Если определяется, что мощность ошибки предсказания больше разрешающей мощности, действие переходит на этап S23, где размер шага квантования изменяется. На следующем этапе S24 выполняется кодирование с использованием текущего установленного размера шага квантования. Хотя на блок-схеме по Фиг.7 не показывается, при вычислении на этапе S21 разрешающей мощности ошибки предсказания также вычисляется мощность ошибки предсказания, используемая на этапе S22.

Если в определении по этапу S22 определяется, что мощность ошибки предсказания меньше или равна разрешающей мощности ошибки предсказания, действие переходит непосредственно на этап S24, пропуская этап S23, и выполняется кодирование с использованием текущего установленного размера шага квантования.

На Фиг.8A показана последовательность действий для процесса вычисления разрешающей мощности ошибки предсказания на этапе S21, и на Фиг.8B показана последовательность действий для процесса изменения размера шага квантования на этапе S23.

Как показано на блок-схеме Фиг.8A, на этапе S21 принимают сигнал ошибки предсказания, чтобы вычислить мощность ошибки предсказания (см. первый этап S210), и на следующем этапе S211 принимают верхний предел для объема кода, формируемого для макроблока (то есть верхний предельный объем для кода). На следующем этапе S212 принимают текущий установленный размер шага квантования, и на следующем этапе S213 вычисляется разрешающая мощность ошибки предсказания на основании принятого верхнего предела для объема формируемого кода и принятого размера шага квантования.

На поясненном выше этапе S23, как показано на блок-схеме по Фиг.8B, на первом этапе S230 принимают верхнее предельное значение для кода, формируемого для макроблока (то есть верхний предельный объем для кода), и на следующем этапе S231 принимают сигнал ошибки предсказания, чтобы вычислить мощность ошибки предсказания. На следующем этапе S232, на основании принятого верхнего предела для объема формируемого кода и вычисленной мощности ошибки предсказания, вычисляется размер шага квантования для обеспечения формирования объема кода, не превышающего верхний предел. На следующем этапе S233, в соответствии с вычисленным размером шага квантования, изменяется размер шага квантования, используемый в соответствующем кодировании.

Соответственно, если блок 20 оценки объема кода имеет структуру, показанную на Фиг.6, устройство кодирования видеоизображения, показанное на Фиг.1, на основании разрешающей мощности для мощности ошибки предсказания, полученной согласно верхнему пределу для объема формируемого кода и размеру шага квантования, определяет, превышает или не превышает верхний предел объем кода, формируемый при выполнении кодирования с использованием текущего установленного размера шага квантования. Если соответствующий объем формируемого кода больше верхнего предела, вычисляется размер шага квантования для обеспечения формирования объема кода, не превышающего верхний предел, и размер шага квантования, используемый в кодировании, изменяется на вычисленное значение.

Следовательно, в соответствии с устройством кодирования видеоизображения по настоящему осуществлению повторное кодирование или кодирование, соответствующее двум или нескольким режимам кодирования, являются ненужными, и кодирование, объем формируемого кода которого не превышает верхний предел, может осуществляться без ожидания результата измерения объема сформированного кода.

На Фиг.9 показан другой вариант осуществления устройства кодирования видеоизображения в соответствии с настоящим изобретением. На Фиг.9 частям, идентичным таковым, поясненным на Фиг.1, даны идентичные числовые ссылочные позиции.

На Фиг.9 числовая ссылочная позиция 10 обозначает структурную часть (окруженную пунктиром) в виде основанного на стандарте H.264 устройства кодирования видеоизображения по H.264, числовая ссылочная позиция 30 обозначает блок оценки объема кода, предусмотренный для осуществления настоящего изобретения, числовая ссылочная позиция 31 обозначает кодер ИКМ, предусмотренный для осуществления настоящего изобретения, и числовая ссылочная позиция 32 обозначает селекторный переключатель (предусмотренный) для осуществления настоящего изобретения.

Кодер 31 ИКМ подвергает ИКМ-кодированию соответствующий сигнал видеоизображения в качестве целевого объекта кодирования без квантования и выводит кодированные данные через селекторный переключатель 32 на кодер 114 источника информации.

Блок 30 оценки объема кода имеет базовую структуру, идентичную таковой для блока 20 оценки объема кода в варианте осуществления, показанном на Фиг.1, и может иметь структуру, показанную на Фиг.2. При наличии структуры, показанной на Фиг.2, если значение оценки для объема формируемого кода больше верхнего предела для объема формируемого кода, блок 30 оценки объема кода управляет селекторным переключателем 32, чтобы подать сигнал, выводимый от кодера 31 ИКМ, на кодер 114 источника информации. Напротив, если значение оценки объема формируемого кода меньше или равно верхнему пределу такового, блок 30 оценки объема кода управляет селекторным переключателем 32, чтобы подать сигнал, выводимый от квантователя 108, на кодер 114 источника информации.

То есть, как показано на блок-схеме по Фиг.10, если блок 30 оценки объема кода имеет структуру, показанную на Фиг.2, устройство кодирования видеоизображения по настоящему осуществлению сначала определяет режим кодирования (см. первый этап S30). На следующем этапе S31 оценивается объем кода, формируемого при выполнении кодирования с использованием текущего установленного размера шага квантования. На следующем этапе S32 определяется, является ли значение оценки объема формируемого кода больше верхнего предела для соответствующего объема формируемого кода. Если определяется, что оценка объема больше верхнего предела, действие переходит на этап S33, где исполняется ИКМ-кодирование. Если определяется, что оценка объема меньше или равна верхнему пределу, действие переходит на этап S34, где исполняется обычное кодирование.

Блок 30 оценки объема кода может иметь структуру, показанную на Фиг.6. В таком случае, если мощность ошибки предсказания выше разрешающей мощности ошибки предсказания, блок 30 оценки объема кода управляет селекторным переключателем 32, чтобы подать сигнал, выводимый от кодера 31 ИКМ, на кодер 114 источника информации. Напротив, если мощность ошибки предсказания ниже или равна разрешающей мощности ошибки предсказания, блок 30 оценки объема кода управляет селекторным переключателем 32, чтобы подать сигнал, выводимый от квантователя 108, на кодер 114 источника информации.

То есть, как показано на блок-схеме по Фиг.11, если блок 30 оценки объема кода имеет структуру, показанную на Фиг.6, устройство кодирования видеоизображения по настоящему осуществлению сначала определяет режим кодирования (см. первый этап S40). На следующем этапе S41 вычисляется разрешающая мощность ошибки предсказания в качестве разрешающей мощности для мощности ошибки предсказания. На следующем этапе S42 определяется, является ли мощность ошибки предсказания выше разрешающей мощности ошибки предсказания. Если определяется, что мощность ошибки предсказания выше разрешающей мощности, действие переходит на этап S43, где исполняется ИКМ-кодирование. Если определяется, что мощность ошибки предсказания ниже или равна разрешающей мощности, действие переходит на этап S44, где исполняется обычное кодирование.

Как описано выше, устройство кодирования видеоизображения по настоящему осуществлению (см. Фиг.9) определяет, превышает ли объем кода, формируемого при исполнении кодирования с использованием текущего установленного размера шага квантования, верхний предел, заданный таким образом. Если объем формируемого кода превышает верхний предел, ИКМ-кодирование исполняется без квантования.

Конкретно, каждый блок из блока оценки объема кода 201, показанного на Фиг.2, блока 203 вычисления разрешающей мощности ошибки предсказания, показанного на Фиг.6, и блока 211 вычисления минимального размера шага квантования, показанного на Фиг.3, может быть осуществлен с использованием функции или справочной таблицы.

Собственно говоря, различные режимы предсказания (режимы кодирования) имеют различные служебные объемы кода или подобное, и как таковая функция или справочная таблица зависит от режима предсказания. Следовательно, является предпочтительным, чтобы такая функция или справочная таблица предусматривалась для каждого режима предсказания, и выбиралась и использовалась одна, подходящая для режима предсказания для целевого макроблока кодирования.

То есть в предпочтительном примере, показанном на Фиг.12, блок 201 оценки объема формируемого кода по Фиг.2 имеет множество функций (от функции 1 до функции N), соответствующих множеству режимов предсказания, и выбирается и используется одна из функций, которая является подходящей для режима предсказания для целевого макроблока кодирования.

В другом предпочтительном примере, показанном на Фиг.13, блок 201 оценки объема формируемого кода по Фиг.2 имеет множество справочных таблиц (LT1-LTN), соответствующих множеству режимов предсказания, и выбирается и используется одна из справочных таблиц, которая является подходящей для режима предсказания целевого макроблока кодирования.

В другом предпочтительном примере, показанном на Фиг.14, блок 203 вычисления разрешающей мощности ошибки предсказания по Фиг.6 имеет множество функций (от функции 1 до функции N), соответствующих множеству режимов предсказания, и выбирается и используется одна из функций, которая является подходящей для режима предсказания целевого макроблока кодирования.

В другом предпочтительном примере, показанном на Фиг.15, блок 203 вычисления разрешающей мощности ошибки предсказания по Фиг.6 имеет множество справочных таблиц (LT1-LTN), соответствующих множеству режимов предсказания, и выбирается и используется одна из справочных таблиц, которая является подходящей для режима предсказания целевого макроблока кодирования.

В другом предпочтительном примере, показанном на Фиг.16, блок 211 вычисления минимального размера шага квантования, показанный на Фиг.3, имеет множество функций (от функции 1 до функции N), соответствующих множеству режимов предсказания, и выбирается и используется одна из функций, которая является подходящей для режима предсказания целевого макроблока кодирования.

В другом предпочтительном примере, показанном на Фиг.17, блок 211 вычисления минимального размера шага квантования, показанный на Фиг.3, имеет множество справочных таблиц (LT1-LTN), соответствующих множеству режимов предсказания, и выбирается и используется одна из справочных таблиц, которая является подходящей для режима предсказания целевого макроблока кодирования.

ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ

Настоящее изобретение может применяться для устройства кодирования видеоизображения, чтобы применять ортогональное преобразование к сигналу ошибки предсказания между сигналом видеоизображения из целевой области кодирования и предсказанным сигналом для сигнала видеоизображения и выполнять квантование полученного коэффициента ортогонального преобразования с использованием размера шага квантования для кодирования коэффициента. Настоящее изобретение не требует повторного кодирования или кодирования, которое оперирует двумя или несколькими режимами кодирования, и может осуществлять кодирование, которое формирует коды меньше верхнего предельного объема для кода, без ожидания результата измерений объема сформированного кода.

Класс H04N7/50 включающие преобразование и прогнозное кодирование

сжатие видеоданных без видимых потерь -  патент 2504107 (10.01.2014)
способ кодирования и способ декодирования видео, устройства для них, программы для них, а также носители хранения данных, которые сохраняют программы -  патент 2504106 (10.01.2014)
способ и устройство для высокомасштабируемого внутрикадрового видеокодирования -  патент 2503137 (27.12.2013)
кодирование видео при помощи больших макроблоков -  патент 2502218 (20.12.2013)
система сжатия видео и способ компенсации для ограничения полосы пропускания канала связи -  патент 2501180 (10.12.2013)
быстрое принятие решения о дельте параметра квантования макроблока -  патент 2498523 (10.11.2013)
видео кодирование с использованием преобразования больше чем 4×4 и 8×8 -  патент 2497303 (27.10.2013)
способ и устройство для кодирования видео и способ и устройство для декодирования видео -  патент 2493671 (20.09.2013)
фрагментированная ссылка во временном сжатии для кодирования видео -  патент 2485712 (20.06.2013)
устройство для кодирования изображений, устройство для декодирования изображений, способ кодирования изображений и способ декодирования изображений -  патент 2479148 (10.04.2013)
Наверх