способ масштабируемого кодирования и декодирования видеосигнала
Классы МПК: | H04N7/30 с использованием кодирования с преобразованием |
Автор(ы): | ДЗЕОН Биеонг Моон (KR), ПАРК Сеунг Воок (KR), ПАРК Дзи Хо (KR), ЙООН Дое Хиун (KR) |
Патентообладатель(и): | ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) |
Приоритеты: |
подача заявки:
2006-04-14 публикация патента:
10.01.2011 |
Изобретение относится к способам масштабируемого кодирования и декодирования видеосигналов и, в частности, к способам, которые кодируют и декодируют слой повышения качества, получая информацию о движении из базового слоя. Техническим результатом является обеспечение качественного изображения, даже если декодирована только часть полной последовательности изображений, генерируемой в результате кодирования (последовательности кадров, прерывисто выбранных из полной последовательности). Указанный технический результат достигается тем, что информация о движении, такая как опорные индексы, вектор движения, режимы и т.д. для слоя повышения качества, может быть получена из базового слоя, и опорный индекс для блока изображения слоя повышения качества определяют с использованием медианного критерия на основе базового слоя. Опорный индекс для блока, имеющего наибольшее количество пикселей, соответствующих пикселям блока изображения, в базовом слое выбирают в качестве опорного индекса для блока изображений, и если более одного блока в базовом слое имеет одинаковое количество пикселей, соответствующих пикселям блока изображения, выбирают более близкий опорный индекс. Также в качестве вектора движения для блока изображения выбирают вектор движения для блока базового слоя, относящегося к выбранному опорному индексу. 2 н.п. ф-лы, 6 ил.
Формула изобретения
1. Способ декодирования видеосигнала, содержащий этапы, на которых получают выборку межслойного прогнозирования текущего блока в слое повышения качества на основе информации движения по меньшей мере одного соответствующего блока в базовом слое; обновляют выборку межслойного прогнозирования текущего блока до выборки внутрислойного прогнозирования текущего блока, когда режимом кодирования упомянутого соответствующего блока является интра-режим и отношение пространственного разрешения между слоем повышения качества и базовым слоем является небинарным, при этом выборку внутрислойного прогнозирования текущего блока получают на основе значения пикселя упомянутого соответствующего блока; и восстанавливают текущий блок на основе выборки внутрислойного прогнозирования текущего блока и остаточного значения, причем данное остаточное значение представляет собой разницу изображений между значением пикселя текущего блока и упомянутым значением пикселя упомянутого соответствующего блока.
2. Устройство декодирования видеосигнала, содержащее декодер слоя повышения качества, получающий выборку, межслойного прогнозирования текущего блока в слое повышения качества на основе информации движения по меньшей мере одного соответствующего блока в базовом слое, при этом декодер слоя повышения качества обновляет выборку межслойного прогнозирования текущего блока до выборки внутрислойного прогнозирования текущего блока, когда режимом кодирования упомянутого соответствующего блока является интра-режим и отношение пространственного разрешения между слоем повышения качества и базовым слоем является небинарным, при этом выборку внутрислойного прогнозирования текущего блока получают на основе значения пикселя упомянутого соответствующего блока, при этом декодер слоя повышения качества восстанавливает текущий блок на основе выборки внутрислойного прогнозирования текущего блока и остаточного значения, причем данное остаточное значение представляет собой разницу изображений между значением пикселя текущего блока и упомянутым значением пикселя упомянутого соответствующего блока.
Описание изобретения к патенту
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится в общем к способам масштабируемого кодирования и декодирования видеосигналов и более конкретно к способам, которые кодируют и декодируют слой повышения качества, получая информацию о движении из базового слоя.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ
Трудно выделить широкую полосу частот, такую как полоса частот, которая необходима для телевизионных (TV) сигналов, для цифровых видеосигналов, передаваемых беспроводным способом через мобильные телефоны или ноутбуки, которые в настоящее время широко используются, или через мобильные телевизоры или портативные компьютеры, которые будут широко использоваться в будущем. Следовательно, необходимо, чтобы стандарт, который должен быть использован в схеме сжатия видеосигнала для таких мобильных устройств, имел более высокую эффективность сжатия видеосигнала.
Кроме того, такие мобильные устройства неизбежно имеют различные присущие им характеристики обработки и представления видеосигналов. Следовательно, сжатое изображение должно быть заранее различным образом приготовлено, чтобы соответствовать таким характеристикам, что означает, что для одного источника изображения должны быть обеспечены видеоданные, имеющие различное качество изображения по отношению к различным обобщенным параметрам, таким как количество кадров в секунду, разрешение и количество битов на пиксел, таким образом неизбежно создавая большую нагрузку для поставщиков информации.
По этой причине поставщик информации готовит сжатые видеоданные, имеющие высокий расход битов (битрейт), для каждого отдельного источника изображения и, когда мобильное устройство запрашивает видеоданные, выполняет процесс декодирования сжатого изображения и кодирования декодированного изображения в видеоданные, которые подходят для характеристики обработки видеосигнала мобильного устройства, запрашивающего изображение, и затем обеспечивает закодированные видеоданные. Тем не менее, такая схема должна сопровождаться процессом перекодирования (декодирование + масштабирование + кодирование), так что во время обеспечения изображения, запрашиваемого мобильным устройством, происходит незначительная временная задержка. Дополнительно, процесс перекодирования также требует сложных аппаратных устройств и алгоритмов, зависящих от разнообразия целей кодирования.
Для преодоления этих трудностей был предложен масштабируемый видеокодек (SVC). SVC является схемой для кодирования видеосигналов с самым высоким качеством изображения при кодировании видеосигналов и дает возможность до некоторой степени гарантировать качество изображения, даже если декодирована только часть полной последовательности изображений (кадров), генерируемой в результате кодирования (последовательности кадров, прерывисто выбранных из полной последовательности).
Схема (MCTF) временной фильтрации с компенсацией движения является примером схемы кодирования, предложенной для использования в масштабируемом видеокодеке. Существует большая вероятность того, что MCTF схему будут применять к средам передачи, таким как среда мобильной передачи, которая имеет ограниченную полосу частот, следовательно, MCTF-схема требует высокой эффективности сжатия, то есть высокой эффективности кодирования для уменьшения количества битов, передаваемых за секунду.
Как описано выше, даже если принята и обработана только частичная последовательность последовательности изображений, закодированной с помощью MCTF, которая является масштабируемой схемой, качество изображения может быть до некоторой степени гарантировано. Тем не менее, если уменьшается битрейт, ухудшение качества изображения становится серьезным. Для решения этой проблемы может быть обеспечена отдельная последовательность суб-изображений для низкого битрейта, например уменьшенные экраны и/или последовательность изображений, которая имеет небольшое количество кадров в секунду.
Последовательность суб-изображений называют базовым слоем, а главную последовательность изображений называют слоем повышения качества. Тем не менее, так как базовый слой и слой повышения качества получают кодированием одного и того же содержимого изображения с различными временными разрешениями и различными частотами смены кадров, в видеосигналах двух слоев присутствует избыточная информация (избыточность). Следовательно, чтобы повысить эффективность кодирования слоя повышения качества, видеосигнал слоя повышения качества прогнозируют и кодируют, используя информацию о движении и/или информацию о текстуре базового слоя. Такой способ кодирования называют способом межслойного прогнозирования.
Информация о движении базового слоя, используемая в способе межслойного прогнозирования, включает в себя информацию опорного индекса, которая указывает изображение (кадр), включающее в себя опорный блок, информацию о векторе движения, которая показывает перемещение к опорному блоку, информацию о разбиении соответствующего блока (блока, который помещен в кадр базового слоя, временно совпадающий с кадром слоя повышения качества, включающего в себя макроблок, который должен быть закодирован, и имеет область, покрывающую макроблок, когда блок увеличивается согласно отношению размера экрана слоя повышения качества к размеру экрана базового слоя) и т.д.
Фиг.1 является диаграммой, показывающей воплощение традиционного способа получения информации о движении макроблока слоя повышения качества, например информации о разбиении, информации опорного индекса, информации о векторе движения и т.д. из базового слоя. На фиг.1(а) показано воплощение, в котором опорный индекс и вектор движения для 4х4 суб-блока b извлекаются из базового слоя.
Сначала опорный индекс и вектор движения для каждого из четырех угловых пикселей от с1 до с4 блока, который должен быть закодирован, могут быть заданы как соответственно опорный индекс и вектор движения для блока базового слоя, соответствующего каждому пикселю.
Тем не менее, когда блок, соответствующий каждому пикселю, не существует в базовом слое, как в случае, когда совпадающий во временном отношении кадр не существует в базовом слое или когда блок, соответствующий каждому угловому пикселю, закодирован во внутрислойном режиме кодирования (интра-режиме), блок b может быть задан как интра-блок.
Если блок, соответствующий угловому пикселю, не использует кадр, существующий в списке эталонных изображений List_0, кадр, существующий в List_0, и вектор движения, направленный по направлению к кадру в List_0, не заданы в блоке b. В равной мере это применимо к List_1.
Опорный индекс rb(List_x) для блока b устанавливают в минимальное значение опорных индексов rci(List_x), определенное для соответствующих угловых пикселей, а вектор mvb(List_x) движения для блока b устанавливают в среднее значение векторов движения угловых пикселей, имеющих установленный опорный индекс rb(List_x).
На фиг.1(b) показано воплощение, в котором информацию о движении 8×8 блока B получают из 4×4 суб-блоков.
В случае, когда все четыре 4×4 суб-блока являются внутренними блоками, 8×8 блок B задают как интра-блок. В других случаях информацию опорного индекса и информацию о разбиении 8×8 блока B определяют с помощью следующего процесса.
Для соответствующих 4×4 суб-блоков опорные индексы для списков List_0 и List_1 эталонных изображений устанавливаются в одинаковые значения. Описание делают, используя List_0, в качестве примера и выполняют ту же операцию для List_1.
В случае, когда ни один 4×4 суб-блок не использует кадр в List_0, опорный индекс и вектор движения для List_0 не задаются для 8×8 блока B.
В других случаях опорный индекс rB(List_0) для 8×8 блока B вычисляют как минимальное значение опорных индексов для четырех 4×4 суб-блоков. Вычисляют средний вектор движения mvmean(List_0) 4×4 суб-блоков, имеющих вычисленное значение опорного индекса rB(List_0). Дополнительно, в 4×4 суб-блоках опорный индекс и вектор движения для каждого из i) интра-блока, ii) блока, не использующего List_0 или iii) блока, имеющего опорный индекс rB(List_0), принудительно устанавливают в вычисленное значение опорного индекса rB(List_0) и вычисленное значение вектора mvmean(List_0) движения соответственно.
После этого режим разбиения для 8x8 блока B определяют следующим образом. Если вектора движения двух соседних 4×4 суб-блоков равны друг другу, суб-блоки считают равными друг другу и затем объединяют друг с другом. На фиг.1(b), если суб-блоки b1 и b2 равны друг другу и b3 и b4 равны друг другу, режим разбиения определяют как режим BLK_8×4. В это время, если суб-блоки b1 и b3 также равны друг другу, режим разбиения определяют как режим BLK_8×8. Подобным образом, если суб-блоки b1 и b3 равны друг другу и b2 и b4 равны друг другу, режим разбиения определяют как режим BLK_4×8. В других случаях режим разбиения определяют как режим BLK_4×4.
Тем не менее, когда отношение размера экрана (или разрешение) слоя повышения качества к размеру экрана базового слоя не кратно 2 (небинарный случай), например когда размер экрана базового слоя составляет 1/3, 2/3 и т.д. от размера экрана слоя повышения качества, трудно получить информацию о движении, такую как информация опорного индекса, информация о векторе движения или информация о разбиении, из базового слоя, так что способ межслойного прогнозирования не может быть в достаточной мере применен к масштабируемому кодированию слоя повышения качества.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Следовательно, настоящее изобретение принимает во внимание вышеописанные проблемы, и задачей настоящего изобретения является обеспечение способа, который эффективно применяет способ межслойного прогнозирования даже для небинарного случая для улучшения эффективности кодирования.
Другой задачей настоящего изобретения является обеспечение способа, который извлекает соответствующую информацию о движении из базового слоя, что приводит к тому, что отношение размеров экранов имеет значение, не кратное 2, и новым критериям для этого.
Согласно одному аспекту настоящего изобретения для выполнения вышеописанных задач обеспечивают способ кодирования видеосигнала, содержащий масштабируемое кодирование видеосигнала и генерирование потока битов первого слоя, кодирование видеосигнала с использованием предопределенного способа и генерирование потока битов второго слоя, причем информацию о движении, соответствующую первому слою, получают из второго слоя, а опорный индекс для блока изображения в первом слое определяют, используя медианный критерий на основе второго слоя.
Согласно другому аспекту настоящего изобретения для выполнения вышеописанных задач обеспечивают способ декодирования кодированного потока битов, содержащий декодирование потока битов первого слоя, который был закодирован с масштабированием и принят, и декодирование потока битов второго слоя, который был закодирован с использованием предопределенного способа и принят, причем информацию о движении, соответствующую первому слою, получают из второго слоя, а опорный индекс для блока изображения в первом слое определяют, используя медианный критерий на основе второго слоя.
Согласно воплощению настоящего изобретения в качестве опорного индекса для блока изображения может быть выбран опорный индекс для блока второго слоя, соответствующего максимальному количеству пикселей в блоке изображения, и в качестве опорного индекса для блока изображения может быть выбран более близкий опорный индекс, если одно и то же количество пикселей соответствует более чем двум блокам во втором слое. Если опорные индексы для более чем двух блоков во втором слое, соответствующие одному и тому же количеству пикселей, равны друг другу, может быть выбран вектор движения, имеющий меньшую абсолютную величину.
Согласно другому воплощению настоящего изобретения в качестве вектора движения для блока изображения может быть выбран вектор движения для блока второго слоя, имеющего упомянутый определенный опорный индекс, и среди векторов движения двух или более блоков может быть выбран вектор движения, имеющий меньшую длину, если количество блоков второго слоя, имеющих упомянутый определенный опорный индекс, равно двум или больше.
Согласно дополнительному воплощению настоящего изобретения опорный индекс для каждого из двух или более суб-блоков, составляющих блок изображения и имеющих одинаковый размер, может быть определен, используя медианный критерий на основе второго слоя, и опорный индекс для блока изображения может быть определен, используя медианный критерий на основе опорного индекса для каждого из суб-блоков. Если выбраны два или более различных опорных индексов, более близкий опорный индекс может быть определен в качестве опорного индекса для блока изображения.
Согласно другому воплощению настоящего изобретения каждый суб-блок, составляющий блок изображения, может быть произвольно извлечен из блока второго слоя, соответствующего суб-блоку в интра-режиме или режиме линейного кодирования - интер-режиме. Опорный индекс и вектор движения для блока изображения могут быть получены из второго слоя на основе только суб-блоков, полученных в интер-режиме, отличных от суб-блоков, полученных в интра-режиме.
ПЕРЕЧЕНЬ ФИГУР ЧЕРТЕЖЕЙ
Сопроводительные чертежи, которые включены для обеспечения дополнительного понимания изобретения, иллюстрируют предпочтительные воплощения изобретения и вместе с описанием служат для объяснения принципов настоящего изобретения.
Фиг.1 является диаграммой, которая показывает воплощение традиционного способа получения информации о движении макроблока слоя повышения качества из базового слоя;
фиг.2 является диаграммой, которая показывает конструкцию устройства кодирования видеосигнала, к которому применяется способ масштабируемого кодирования видеосигнала согласно настоящему изобретению;
фиг.3 является диаграммой, которая показывает воплощение способа получения опорного индекса и вектора движения для 4×4 суб-блоков из базового слоя согласно настоящему изобретению;
фиг.4 является диаграммой, которая показывает воплощение способа получения опорного индекса и вектора движения для 8×8 блока из базового слоя согласно настоящему изобретению;
фиг.5 является диаграммой, которая показывает воплощение способа получения режима для 8×8 блока из базового слоя согласно настоящему изобретению; и
фиг.6 является диаграммой, которая показывает конструкцию устройства для декодирования потока битов, закодированного устройством по фиг.2.
Признаки, элементы и аспекты изобретения, которые имеют одинаковые ссылочные позиции на различных фигурах, представляют одинаковые, эквивалентные или похожие признаки, элементы или аспекты согласно одному или более воплощениям.
РЕЖИМЫ ДЛЯ ВЫПОЛНЕНИЯ ИЗОБРЕТЕНИЯ
Ниже будут подробно описаны воплощения настоящего изобретения со ссылкой на приложенные чертежи.
Фиг.2 является диаграммой, которая показывает конструкцию устройства кодирования видеосигнала, к которому применяется способ масштабируемого кодирования видеосигнала согласно настоящему изобретению.
Устройство кодирования видеосигнала по фиг.2 включает в себя кодер 100 слоя повышения качества (EL) для масштабируемого кодирования входящего видеосигнала в макроблоки, используя, например, схему (MCTF) временной фильтрации с компенсацией движения и генерирования соответствующей управляющей информации, модуль 110 текстурного кодирования для преобразования данных каждого закодированного макроблока в сжатый поток битов, модуль 120 кодирования движения для кодирования векторов движения блоков изображения, полученных с помощью EL-кодера 100, в сжатый поток битов при использовании предопределенного способа, кодер 140 базового слоя (BL) для кодирования входящего видеосигнала, используя предопределенный способ, например MPEG 1, 2 или 4 или H.261 или H.264, и генерирования последовательности уменьшенных экранов, например последовательности изображений, имеющих размер, который составляет 25% от исходного размера или 33% от исходного размера в небинарном случае, и мультиплексор 130 для инкапсуляции выходных данных модуля 110 текстурного кодирования, последовательности уменьшенных экранов кодера 140 базового слоя (BL) и выходных данных модуля 120 кодирования движения, мультиплексирования данных в инкапсулированном формате в предопределенный формат передачи и вывода данных в этом формате передачи.
EL-кодер 100 выполняет операцию прогнозирования по вычитанию опорного блока, полученного с помощью оценки движения, из макроблока в произвольном видеокадре (или изображении), и может выполнить операцию обновления по выборочному добавлению к опорному блоку разницы изображений между макроблоком и опорным блоком.
EL-кодер 100 может разделить входную последовательность видеокадров на кадры, которые имеют разницу изображений, и остальные кадры (или кадры, к которым разница изображений добавлена выборочно), например кадры с нечетным номером и кадры с четным номером, и может выполнить операцию прогнозирования и/или операцию обновления по нескольким уровням временной декомпозиции, например вплоть до уровня временной декомпозиции, на котором по отношению к одной группе изображений (GOP) генерируют один высокочастотный кадр (кадр, генерируемый с помощью операции прогнозирования, 'H'-кадр) и один низкочастотный кадр (кадр, генерируемый с помощью операции обновления, 'L'-кадр).
EL-кодер 100 выполняет процесс деления кадра, который имеет разницу изображений из входных видеокадров или низкочастотных кадров, получаемых на предыдущем уровне временной декомпозиции, на макроблоки, причем каждый макроблок имеет предопределенный размер, обнаружения блока, имеющего изображение, наиболее схожее с изображением каждого макроблока, полученного разделением, в предыдущих и последующих кадрах или в его собственном кадре, генерирования спрогнозированного изображения и получения векторов движения. EL-кодер 100 выполняет вышеописанный процесс для всех макроблоков в кадре, таким образом завершая высокочастотный кадр, который является спрогнозированным изображением для соответствующего кадра.
Альтернативно, EL-кодер 100 может обнаружить опорный блок для макроблока в кадре базового слоя, используя способ прогнозирования внутри BL-слоя. В этом случае EL-кодер 100 может обнаружить соответствующий блок, закодированный в интра-режиме, в совпадающем во временном отношении кадре базового слоя, сгенерированном BL-кодером 140 (соответствующий блок помещен в кадр базового слоя, совпадающий во временном отношении с кадром, имеющим макроблок, и имеет область, покрывающую текущий макроблок, когда блок увеличивается согласно отношению размера экрана слоя повышения качества к размеру экрана базового слоя), таким образом генерируя спрогнозированное изображение.
Дополнительно, как описано выше, EL-кодер 100 может не только кодировать макроблок слоя повышения качества, используя данные изображений (текстуры) базового слоя с помощью способа прогнозирования внутри BL-слоя, но может также кодировать макроблок слоя повышения качества на основе информации о движении, такой как режим, опорный индекс или вектор движения для соответствующего блока базового слоя.
Дополнительно, EL-кодер 100 выполняет операцию обновления для каждого макроблока в кадре, к которому будет добавлена разница изображений, входного видеокадра или низкочастотных кадров, полученных на предыдущем уровне временной декомпозиции, по добавлению к макроблоку соответствующей области в закодированном кадре для получения разницы изображений с помощью операции прогнозирования, выполненной на основе части или всей области макроблока, если необходимо. В этом случае информацию о движении макроблока, которую необходимо обновить, получают из соответствующего блока базового слоя, так что макроблок может быть обновлен на основе информации о движении. EL-кодер 100 выполняет вышеописанную операцию для всех макроблоков кадра, таким образом завершая низкочастотный кадр для соответствующего кадра.
Подробно описан способ получения из базового слоя информации о движении, такой как информация о разбиении, информация опорного индекса или информация о векторе движения макроблока слоя слоя повышения качества, из базового слоя в течение процесса прогнозирования и/или процесса обновления согласно настоящему изобретению.
Воплощение способа получения опорного индекса и вектора движения для каждого 4×4 суб-блока из базового слоя описано со ссылкой на фиг.3. Для определения опорного индекса используют медианный критерий.
Определяют блок базового слоя, соответствующий каждому пикселю в 4×4 суб-блоке слоя повышения качества. В качестве опорного индекса для 4×4 суб-блока слоя повышения качества выбирают опорный индекс для блока базового слоя, соответствующего максимальному количеству пикселей. В этом случае, если одинаковое количество пикселей соответствует двум блокам базового слоя, выбирают более близкий опорный индекс. Если опорные индексы для двух блоков равны друг другу, может быть выбран вектор движения, имеющий меньшее абсолютное значение.
В качестве вектора движения выбирают вектор движения для блока базового слоя, который имеет выбранный опорный индекс. Если количество блоков базового слоя, которые имеют выбранный опорный индекс, равно двум или более, может быть выбран вектор движения, который имеет меньшую длину среди векторов движения двух или более блоков.
Воплощение способа получения опорного индекса и вектора движения для 8×8 блока описано со ссылкой на фиг.4. Аналогично, средний критерий также используют для определения опорного индекса.
Сначала, как показано на фиг.4(а), получают опорные индексы и вектора движения для четырех 4×4 суб-блоков согласно вышеописанному воплощению настоящего изобретения. Оптимальный опорный индекс и оптимальный вектор движения могут быть получены из опорных индексов и векторов движения для четырех суб-блоков.
В качестве другого способа оптимальный опорный индекс может быть выбран из опорных индексов для блоков базового слоя, соответствующих 8×8 блоку, вместо выбора возможных опорного индекса и вектора движения для 8×8 блока из 4×4 суб-блоков, для которых опорные индексы и вектора движения получают ранее. Подобно случаю 4×4 суб-блоков опорный индекс, который наиболее часто используется, может быть выбран из используемых опорных индексов.
Например, как показано на фиг.4(b), для каждого пикселя, принадлежащего 8×8 блоку, опорный индекс для блока базового слоя, соответствующего пикселю, связан с опорным индексом для соответствующего пикселя, и опорный индекс, связанный с максимальным количеством пикселей, может быть выбран в качестве опорного индекса для 8×8 блока.
В этом случае, если для 8×8 блока выбраны два и более различных опорных индекса, в качестве опорного индекса для 8×8 блока определяют более близкий опорный индекс.
Между тем, когда режим для 8×8 блока получают из базового слоя, в 8×8 блоке сосуществуют интра-режим NЧN суб-блоков и интер-режим NЧN суб-блоков. Следовательно, в настоящем изобретении, как показано на фиг.5, может быть также получен режим 8×8 блока, состоящий из 4×4 интра-режима и 8×4 интер-режима. В этом случае к комбинации блоков может быть применен традиционный способ.
Если режим 8×8 блока получен и определен, единственный опорный индекс выбирают на основе только суб-блоков интер-режима, а не 4×4 суб-блоков, полученных в интра-режиме в 8×8 блоке, согласно вышеописанному способу.
Поток данных, закодированный вышеописанным способом, может быть передан на устройство декодирования проводным или беспроводным способом или может быть передан с помощью носителя записи. Устройство декодирования восстанавливает исходный видеосигнал согласно способу, описанному ниже.
Фиг.6 является диаграммой устройства для декодирования потока битов, закодированного устройством по фиг.2. Устройство декодирования по фиг.6 включает в себя демультиплексор 200 для разделения принятого потока битов на сжатый поток векторов движения и сжатый поток информации макроблоков, модуль 210 текстурного декодирования для восстановления сжатого потока информации макроблоков в исходный распакованный поток, модуль 220 декодирования движения для восстановления сжатого потока векторов движения в исходный распакованный поток, декодер 230 слоя повышения качества (EL) для выполнения обратного преобразования в отношении распакованного потока информации макроблоков и распакованного потока векторов движения, используя, например, MCTF, и получения исходного видеосигнала, и декодер 240 базового слоя (BL) для декодирования потока базового слоя, используя преопределенный способ, например, MCTF, MPEG-4 или H.264.
EL-декодер 230 выполняет обратную операцию обновления макроблока в 'L'-кадре, который был закодирован и введен или был декодирован и сгенерирован на предыдущем временном уровне, чтобы определить, существует ли область 'H'-кадра, которая была спрогнозирована на основе части или всей области макроблока и была закодирована в качестве разницы изображений, со ссылкой на опорный индекс и вектор движения и чтобы вычесть разницу изображений определенной области из значения изображения макроблока, если необходимо. EL-декодер 230 выполняет вышеописанную операцию для всех макроблоков в 'L'-кадре, таким образом завершая 'L'-кадр на соответствующем временном уровне.
В этом случае информация опорного индекса и информация о векторе движения могут быть обеспечены модулем 220 декодирования вектора движения или могут быть получены из базового слоя на основе информации или данных, обеспеченных BL-декодером 240, используя способ, описанный со ссылкой на фиг.3 и 4.
Дополнительно, форма каждого суб-блока макроблока слоя повышения качества и вектор движения для каждого суб-блока могут быть получены на основе информации о разбиении, записанной в заголовке макроблока. Альтернативно, форма каждого суб-блока макроблока и режим и вектор движения для каждого суб-блока могут быть получены из базового слоя при использовании способа, описанного со ссылкой на фиг.5.
Дополнительно, EL-декодер 230 выполняет обратную операцию прогнозирования для каждого макроблока в 'H'-кадре на произвольном временном уровне, который был закодирован и введен, чтобы определить опорную область в 'L'-кадре на следующем временном уровне, который был сгенерирован с помощью обратной операции обновления, со ссылкой на опорный индекс, информацию о разбиении и вектор движения, которые обеспечивает модуль 220 декодирования вектора движения или которые извлекаются из базового слоя, и чтобы добавить значение изображения опорной области к разнице изображений макроблока. EL-декодер 230 выполняет вышеописанную операцию для всех макроблоков в 'H'-кадре, таким образом завершая 'L'-кадр на следующем временном уровне. Завершенный 'L'-кадр является обратно обновленным, так что обратно обновленный 'L'-кадр и завершенный 'L'-кадр выполнены альтернативно.
Согласно вышеописанному способу закодированный поток данных восстанавливают в завершенную последовательность видеокадров. В частности, когда операцию прогнозирования и операцию обновления выполняют N раз (N уровней временной декомпозиции) в отношении одной GOP в течение описанного процесса кодирования при использовании способа MCTF в качестве примера, качество изображения, соответствующее качеству изображения исходного видеосигнала, может быть получено, если обратная операция обновления и обратная операция прогнозирования выполнены N раз в течение процесса MCTF-декодирования. Если обратная операция обновления и обратная операция прогнозирования выполнены менее чем N раз, качество изображения может быть немного ухудшено, но может быть получена последовательность видеокадров, которая имеет более низкую скорость передачи битов. Следовательно, устройство декодирования спроектировано для выполнения обратной операции обновления и обратной операции прогнозирования в той степени, которая необходима для их выполнения.
Вышеописанное устройство декодирования может быть установлено в терминал мобильной связи или устройство для воспроизведения носителя записи.
Следовательно, настоящее изобретение может получать информацию о разбиении, информацию опорного индекса или информацию о векторе движения из базового слоя, в частности может получать информацию о движении и т.д. из базового слоя, что приводит к тому, что отношение размеров экрана слоя повышения качества к размерам экрана базового слоя имеет значение, не кратное двум, таким образом повышая эффективность кодирования.
Хотя предпочтительное воплощение настоящего изобретения было раскрыто с целью иллюстрации, специалисты в данной области техники оценят возможность различных модификаций, дополнений и замещений, которые могут быть сделаны без отклонения от объема изобретения, определяемого следующей формулой изобретения.
Класс H04N7/30 с использованием кодирования с преобразованием