способ сжатия данных

Классы МПК:H03M7/40 преобразование в коды переменной длины или из них, например код Шеннона-Фано, код Хафмана, код Морзе
H03M7/46 преобразование в коды с переменной длиной серий или из них, те путем представления определенного числа последовательных цифр или групп цифр того же типа с помощью кодового слова и цифры, указывающей этот тип
Автор(ы):
Патентообладатель(и):Государственное образовательное учреждение высшего профессионального образования "Поволжская государственная академия телекоммуникаций и информатики" (RU)
Приоритеты:
подача заявки:
2006-08-04
публикация патента:

Изобретение относится к технике передачи и хранения информации и может быть использовано в банках данных и в системах электросвязи. Достигаемый технический результат - простота реализации, повышение скорости кодирования, уменьшение времени передачи данных по каналу связи, сжатие ширины спектра передаваемых сигналов, повышение помехоустойчивости передачи, обеспечение скрытности передаваемой или хранящейся информации. Способ сжатия данных осуществляется с помощью кодера. В первом блоке памяти кодера хранятся предварительно записанные кодовые комбинации (KK 1) с числом разрядов n, где n=2, 3, 4способ сжатия данных, патент № 2386210 , представляющие собой полный набор возможных входных кодовых комбинаций (КК). Во втором блоке памяти кодера хранятся предварительно записанные кодовые комбинации КК2, однозначно соответствующие KK1, с числом разрядов, меньшим или таким же, как в КК1. Входной поток данных разделяют на КК с одинаковым числом разрядов n. KK последовательно вводят в кодер, идентифицируют путем сравнения с

КК1, отображают соответствующей выходной кодовой комбинацией КК2. КК2 представляют собой последовательность групп с одинаковым числом разрядов n в каждой. Совокупное число кодовых комбинации КК2-mn, где m=2, 3, 4способ сжатия данных, патент № 2386210 , n=1, 2, 3способ сжатия данных, патент № 2386210 . Число последовательных групп КК2 определяют как mn-1, mn-2способ сжатия данных, патент № 2386210 Разрядность КК2 в группе выравнивают за счет добавления незначащего нуля перед кодовой комбинацией. 1 з.п. ф-лы, 1 ил., 5 табл.

способ сжатия данных, патент № 2386210

Формула изобретения

1. Способ сжатия данных, при котором кодовые комбинации КК 1, предварительно записанные в первом блоке памяти кодера - статическом словаре, отображают кодовыми комбинациями КК 2 - метками из второго блока памяти кодера, отличающийся тем, что входной поток или некоторый объем данных разделяют на равномерные кодовые комбинации КК с числом разрядов n=2, 3, 4способ сжатия данных, патент № 2386210 , которые последовательно вводят в кодер, кодовые комбинации КК1 в первом блоке памяти кодера представляют собой полный набор разных кодовых комбинаций КК; каждую из кодовых комбинаций КК идентифицируют с одной из кодовых комбинаций КК 1, после чего последнюю отображают одной из хранящихся во втором блоке памяти кодера кодовых комбинаций КК2 с меньшим, чем в кодовых комбинациях КК1, или таким же числом разрядов; число кодовых комбинаций КК2 равно числу кодовых комбинаций КК1; кодовые комбинации КК 2 не содержат индивидуальных данных об отображаемых ими кодовых комбинациях КК1; совокупность кодовых

комбинаций КК2 формируют как последовательность групп с полным набором из mn m-ичных кодовых комбинаций с одинаковым числом разрядов n в каждой группе, где основание кода m=2, 3, 4, способ сжатия данных, патент № 2386210 , а n=1, 2, 3, способ сжатия данных, патент № 2386210 ; число разрядов в кодах группы выравнивают за счет добавления незначащих символов «0» перед кодовыми комбинациями с числом разрядов меньше n', n'=2, 3,способ сжатия данных, патент № 2386210 , за исключением группы с выбранным максимальным значением n, которая может быть неполной и в которой число разрядов может быть таким же, как в кодовых комбинациях КК1; в результате каждая кодовая комбинация

КК2 характеризуется двумя параметрами - числом разрядов и численным значением; при числе кодовых комбинаций КК1, равном mn , число кодовых комбинаций КК2 с таким же основанием m, но меньшим, чем n, числом разрядов определяют по формуле

способ сжатия данных, патент № 2386210

где основание кода m=2, 3, 4способ сжатия данных, патент № 2386210 , число разрядов n=2, 3, 4способ сжатия данных, патент № 2386210 , n>i; а число кодовых комбинаций КК2 с таким же, как у кодовых комбинаций КК1, числом разрядов n, определяют соответственно по формуле

способ сжатия данных, патент № 2386210 ,

где также основание кода m=2, 3, 4способ сжатия данных, патент № 2386210 , число разрядов n=2, 3, 4способ сжатия данных, патент № 2386210 , n>i; при этом каждое слагаемое в правой части (1) равно числу кодовых комбинаций в соответствующей группе и, кроме последнего слагаемого (m), может быть представлено в форме (1).

2. Способ по п.1, отличающийся тем, что если кодовыми комбинациями КК2 с учетом их длины заменить соответствующие кодовые комбинации в методе Хаффмана, то будет получен выигрыш в числе двоичных разрядов.

Описание изобретения к патенту

Изобретение относится к технике передачи и хранения информации (в цифровом виде) и может использоваться в банках данных и в системах электросвязи, когда необходимо уменьшить время передачи данных по каналу или увеличить длительность элементарных посылок - носителей данных (с целью повышения помехоустойчивости передачи) при сохранении или увеличении скорости создания цифровой информации в источнике сообщений; когда необходимо сократить объём памяти некоторой базы данных или, наоборот, увеличить объём цифровой информации, предназначенной для хранения в существующем устройстве памяти; когда необходимо сжать ширину спектра передаваемых сигналов для уменьшения полосы частот проводного или радиоканала; когда требуется обеспечить скрытность передаваемой или хранящейся в устройстве памяти цифровой информации.

Известно много разных способов сжатия данных (СД). Наиболее близким техническим решением (прототипом) можно считать использование статического словаря в словарных методах СД /1, 2, 3/. Суть этого метода заключается в том, что некоторые последовательности символов - слова (создающие избыточность в сообщениях) - сохраняют в словаре и взаимно однозначно отображают метками (индексами, адресами и т.п.), которые состоят из меньшего числа символов, чем исходные последовательности, и наделены индивидуальными данными, позволяющими при необходимости восстановить конкретную последовательность символов в словаре. Каждое слово (последовательность символов) входного файла, объём (размер) которого предполагается уменьшить (сжать), ищется в словаре. Если этот поиск оказывается успешным, то в выходной файл вместо слова записывается соответствующая словарная метка (индекс, адрес). В противном случае в выходной файл записывается не индекс, а само слово без сжатия.

Статический словарь по составу обычно понимается как постоянный, хотя в него иногда добавляют новые последовательности, но из словаря последовательности никогда не удаляют /2, 3/ (в отличие от динамического (адаптивного) словаря, в котором разрешается и добавление, и удаление данных).

Недостатками разработанных словарных способов СД с применением статического словаря являются их сложная реализация, относительно невысокая эффективность (степень сжатия), привязанность каждого словаря к одному типу (характеру) текста, сравнительно низкая скорость кодирования и декодирования. Словарные методы с использованием динамических словарей обеспечивают несколько более высокую эффективность сжатия, но значительно сложнее в реализации и имеют другие недостатки.

Предлагаемый способ сжатия данных (В литературе о сжатии данных в настоящее время имеется множество терминов-«синонимов», вносящих некоторую неоднозначность в те или иные понятия, например: компрессор - кодер, символ - буква, слово - последовательность символов - кодовая комбинация, метки - индексы и т.д. Поэтому в рассматриваемом здесь процессе сжатия и восстановления данных для определённости примем следующее: поток (или некоторый объём) данных разделяется на блоки - входные кодовые комбинации (КК) - с числом разрядов n и основанием кода m, последовательно, один за другим поступающие в кодер (компрессор), в памяти (в статическом словаре) которого содержатся кодовые комбинации КК1, представляющие собой полный набор возможных (разных) КК (для современной техники это вполне реально даже при больших значениях n); каждая из входных КК идентифицируется с той или иной КК1, а все КК 1 отображаются метками - кодовыми комбинациями КК2 с меньшим, чем в КК1, или таким же числом разрядов. При восстановлении данных в декодере (декомпрессоре) входные КК2 последовательно преобразуются в КК1 , выходные КК - блоки, из которых далее формируется требуемый поток (или некоторый объём) данных.) (СД) прост в реализации; повышает скорость кодирования и декодирования; обеспечивает сжатие без потерь; имеет высокую эффективность даже на начальной стадии разработки (при любой реальной последовательности разных двоичных кодовых комбинаций (КК) длиной n, общее число которых равно двум в целой степени n (n=2, 3, 4,способ сжатия данных, патент № 2386210 ), всегда только две из них оказываются несжатыми, и ими могут быть самые маловероятные последовательности из одних «0» или одних «1»; отношение средней длины ncp неравномерных кодов в выходном файле к одинаковой длине (n) равномерных кодов во входном файле ncp/n<1; после реализации любого известного способа СД или нескольких последовательно выполненных таких известных способов, если в результате будет получен поток (объём) данных, допускающий разделение на блоки одинаковой или разной длины, то предлагаемый способ СД всегда может обеспечить дополнительное СД.

Техническим результатом предлагаемого изобретения является: простота в реализации и повышение скорости кодирования и декодирования; уменьшение времени передачи данных по каналу связи при сохранении или увеличении скорости создания цифровой информации в источнике сообщений, что позволяет в том же канале или повысить скорость передачи данных, или увеличить длительность элементарных сигналов и тем самым получить выигрыш в помехоустойчивости передачи; сокращение необходимого объёма памяти некоторой базы данных или, наоборот, увеличение объёма цифровой информации, предназначенной для хранения в существующем устройстве памяти; сжатие ширины спектра передаваемых сигналов (без уменьшения скорости передачи информации) для уменьшения полосы частот проводного или радиоканала; обеспечение скрытности передаваемой или хранящейся в устройстве памяти цифровой информации.

Сущность предлагаемого изобретения заключается в том, что, как и в способе-прототипе /1, 2, 3/, последовательности символов (слова, кодовые комбинации КК1), предварительно записанные в статическом словаре (в первом блоке памяти кодера), заменяют специальными метками (кодовыми комбинациями КК2 ) из второго блока памяти кодера, но в отличие от указанного способа /1, 2, 3/ эти метки не содержат индивидуальных данных об отображаемых ими конкретных последовательностях символов (до процесса сжатия любой метке КК2 может быть поставлена в соответствие любая последовательность символов КК1 , лишь бы в декодере была зафиксирована такая же связь метка - последовательность символов (КК2-КК1), как и в кодере); кроме того, число таких разных меток может быть столь большим и так мало отличаться от числа разных последовательностей символов, что теряется смысл различать в кодере две категории - метки и слова (КК) без сжатия; поэтому в первый блок памяти кодера предварительно записывают (под именем КК1) все (без исключения) возможные (разные) последовательности символов (КК), которые могут возникнуть на входе кодера, и все поступающие при СД в кодер последовательности символов (КК) идентифицируют с одной из КК1; в свою очередь каждой КК1 ставится в соответствие одна из меток - кодовая комбинация КК 2, совокупность которых представляет собой последовательность групп с полным набором из mn m-ичных кодовых комбинаций одинаковой длины n в каждой группе (m - основание кода, m=2, 3, 4,способ сжатия данных, патент № 2386210 ; число разрядов n=1, 2, 3, способ сжатия данных, патент № 2386210 ; разрядность кода в группе выравнивается за счёт добавления незначащих символов «0» перед кодовыми комбинациями с числом разрядов меньше n, n=2, 3,способ сжатия данных, патент № 2386210 ) за исключением последней группы (с выбранным максимальным значением n), которая может быть неполной и в КК2 которой число разрядов может быть таким же, как в КК1 ; кодовые комбинации КК2 в разных группах различаются числом разрядов, но могут отличаться или совпадать в численном выражении; в памяти и кодера, и декодера хранятся одинаковые наборы последовательностей символов (или КК1) и КК 2.

Поскольку каждая КК2 характеризуется двумя параметрами - числом раз рядов и численным значением, процесс декодирования (декомпрессии, идентификации входной КК2 и КК2, а затем и КК1 в памяти декодера) может проводиться в два этапа: 1) выбор в памяти декодера группы из КК2 с числом разрядов, равным числу разрядов входной КК2, 2)определение внутри установленной группы кодовой комбинации КК2 с численным значением, таким же, как у входной КК2. Так как в этом случае отпадает необходимость идентификации входной КК2 с КК2 других групп, записанных в памяти декодера, скорость декодирования соответственно повышается.

Скорость кодирования по сравнению с аналогичной операцией в способе-прототипе тоже увеличивается, так как, во-первых, для каждой метки (в способе-прототипе в случае, например, радикального изменения характера текста метки приходится обновлять) не требуются выбор и анализ соответствующей последовательности символов (создающей избыточность в сообщениях), а также формирование индивидуальных данных; во-вторых, для ускорения процесса идентификации очередной КК с КК1 в памяти кодера цепь подачи КК в кодер можно разветвить на несколько цепей и соединить их с разными участками, на которые целесообразно разбить всю память КК1.

Если не раскрывать посторонним связи КК1-КК2 в кодере и декодере (а эти связи не сложно время от времени изменять), то можно обеспечить скрытность передаваемой или хранящейся в устройстве памяти цифровой информации.

В /4/ рассмотрен способ сжатия ширины спектра информационных электрических сигналов с ограниченной полосой частот, в основе которого лежит объединение нескольких отсчётов сигнала в один групповой отсчёт. При этом исходные отсчёты представляются двоичными кодовыми комбинациями, и если с помощью предлагаемого способа СД обеспечить сжатие последовательности указанных кодовых комбинаций, то можно объединить в один больше исходных отсчётов и увеличить тем самым сжатие ширины спектра передаваемых сигналов для уменьшения полосы частот проводного или радиоканала.

Если все кодовые комбинации (КК) на входе кодера, как и все КК1, имеют одинаковую длину k, то суммарное число кодовых комбинаций КК2 с меньшим, чем k, числом разрядов определяется алгоритмом

способ сжатия данных, патент № 2386210

где основание кода m=2, 3, 4,способ сжатия данных, патент № 2386210 , число разрядов k=2, 3, 4способ сжатия данных, патент № 2386210 - неотрицательные целые значения, k>i. Если, например, m=2 и k=10, то (см. (1) и табл.1)

(210 -2)/(2-1)=512+256+128+64+32+16+8+4+2=1022.

Это означает, например, что для 1024 последовательностей символов (КК1), записанных в словаре, существует 1022 метки с выигрышем в числе символов.

Каждое слагаемое в правой части (1) равно числу КК2 в соответствующей группе и, кроме последнего слагаемого (m), может быть представлено в форме (1).

Если все КК на входе кодера, как и все КК1, имеют одинаковую длину k, то суммарное число кодовых комбинаций КК2 с таким же числом разрядов k определяется алгоритмом

способ сжатия данных, патент № 2386210

где основание кода m=2, 3, 4,способ сжатия данных, патент № 2386210 , число разрядов k=2, 3, 4способ сжатия данных, патент № 2386210 - неотрицательные целые значения. Если, например, m=2 и k=10, то (см. (1) и табл.1)

210-(2 10-2)/(2-1)=1024-1022=2.

Пример 1. Все кодовые комбинации (КК) на входе кодера, как и КК1 в памяти кодера, имеют одинаковую длину и состоят из n=10 двоичных разрядов (m=2), т.е. общее число таких КК1 равно 210 =1024; эти КК1 в произвольном порядке размещены в колонке 1 таблицы 1 (выбран один из [(210)!] возможных вариантов); в колонке 2 приведены десятичные номера КК1 от 1 до 210=1024; в колонке 3 содержатся двоичные кодовые комбинации КК2 (метки, индексы, адреса и т.п.) разной длины, взаимно однозначно отображающие соответствующие КК1 с назначенными им десятичными номерами (заметим, что в отличие от некоторых словарных методов СД роль этих номеров здесь весьма второстепенна: они лишь напоминают, что общее число как КК1, так и КК2 в рассматриваемом примере равно 1024, и ни коим образом не влияют на формирование КК 2); в колонке 4 указан выигрыш в числе двоичных разрядов - как разность в длине соответствующих КК1 и КК 2; в предположении, что все разные 10-разрядные блоки данных поступают на вход устройства СД (кодера) с одинаковой вероятностью Р=1/1024, в колонке 5 указаны суммарные вероятности P1 выбора КК2 одинаковой длины (эти же вероятности характеризуют и соответствующие значения выигрыша в числе двоичных разрядов).

Для примера 1, когда n=10, определим величину среднего выигрыша Vcp и отношение средней длины КК2 ncp к длине КК1 n. Используя приведённые в таблице 1 вероятности P1, а также соответствующие значения выигрыша и размеры (в числе двоичных разрядов - дв.р.) КК2 имеем

способ сжатия данных, патент № 2386210

способ сжатия данных, патент № 2386210

Пример 2. Все условия аналогичны соответствующим условиям примера 1, но n=20 и общее число КК1 равно 220=1048576; результаты - в таблице 2,

***способ сжатия данных, патент № 2386210 * в колонке 1 символизируют «1» и «0» в кодовых комбинациях КК1.

В этом примере, как и в предыдущем, когда длина входных КК и КК1 была вдвое меньше, лишь две комбинации из 1048576 не подверглись сжатию. Определим теперь для примера 2 средний выигрыш Vcp и отношение средней длины КК2 ncp к длине КК1 n. С учётом табл.2, по аналогии с (2) и (3) имеем

способ сжатия данных, патент № 2386210

способ сжатия данных, патент № 2386210

Даже если с целью более надёжного разделения комбинаций КК2 (на стороне декодера) каждую из них (в табл. 2) сопровождать специальной меткой, например паузой, равной длительности сигнала одного двоичного разряда, то n cp=19,00004, а (ncp/n)=0,950002<1. Хотя, очевидно, разделение комбинаций КК2 можно целиком построить на различии сигналов, отображающих следующие один за другим соседние КК2.

Из сравнения средних выигрышей Vcp в примерах 1 и 2 следует, что вариант, когда длина КК и КК1 n=10, предпочтительнее, т.к. в этом случае Vcpспособ сжатия данных, патент № 2386210 2 приходится на 10, а не на 20 двоичных разрядов.

В таблицах 1, 2 и в формулах (2)способ сжатия данных, патент № 2386210 (5) учтено, что все KK на входе каждого из кодеров равновероятны. В реальных ситуациях указанные КК поступают с разными вероятностями, и если эти вероятности известны или находятся и уточняются в процессе передачи данных, то размещение комбинаций КК1 относительно КК2 в табл. 1 и 2 надо изменить так, чтобы, следуя известному методу Хаффмана [1, 2, 3], наиболее вероятным входным КК и соответствующим комбинациям КК1 назначались самые короткие комбинации КК2, а наименее вероятным - самые длинные КК2.

Пример 3. В отличие от табл.1 и табл.2 в табл.3 принято, что n=4 (т.е. число разных 4-разрядных КК1 равно 24=16) и выбор (источником) таких комбинаций в одном случае производится с одинаковой вероятностью P1=1/16, а в другом случае (P2) - согласно методу Хаффмана.

При равновероятных входных кодах средняя длина неравномерных кодов КК2 в выходном файле

способ сжатия данных, патент № 2386210

отношение способ сжатия данных, патент № 2386210

средний выигрыш способ сжатия данных, патент № 2386210

При разных вероятностях Р2 :

способ сжатия данных, патент № 2386210

способ сжатия данных, патент № 2386210

способ сжатия данных, патент № 2386210

Таким образом, при учёте разных вероятностей поступления кодовых комбинаций на вход кодера все показатели сжатия данных улучшаются.

Пример 4. Рассмотрим алгоритм и код Хаффмана для английского алфавита /3/ - чертёж.

Средняя длина кода на чертеже (сумма произведений числа разрядов в i-й кодовой комбинации, отображающей соответствующую букву, на вероятность её появления; i = 1, 2, способ сжатия данных, патент № 2386210 , 26)

способ сжатия данных, патент № 2386210

В табл.4 указаны те же 26 букв английского алфавита и длины кодов Хаффмана с соответствующими вероятностями их появления (как на чертеже). Но вместо кода Хаффмана использован способ СД с применением КК2 (см. табл.1, табл.2 и табл.3). Так как число 26 не является целой степенью числа 2 (4<n<5 и соответственно 24<26<25 ), правило (1) не применимо. Расчёт средней длины КК2 (ncp) по данным табл.4 выполняется аналогично (9).

способ сжатия данных, патент № 2386210

Это примерно в 1,8 раз меньше, чем при кодировании по Хаффману (см. (12)).

В колонке 5 таблицы 4 приведены значения выигрыша в числе двоичных разрядов (дв.р.) при переходе от кодовых комбинаций Хаффмана (чертёж) к соответствующим КК2. С учётом указанных вероятностей выбора букв средняя величина такого выигрыша

V cp=1·(0,065+0,02+0,02+0,02+0,015+0,015+0,015+0,01)+2·(0,13+0,08++0,08+0,07+0,065+0,06+0,06+0,04+0,035+0,03+0,03+0,03+0,005+0,005+0,005)+3·(0,09+0,0025+0,0025)=0,18+1,51+0,285=1,975 дв.р.

Таким образом, выигрыш за счёт применения КК2 получается как при равномерных, так и при неравномерных входных кодах. При этом средние величины таких выигрышей в обоих случаях очень близки.

Пример 5. Выражения (1) и (1') допускают ситуации, когда m>2.

Примем, что m=4, а n=10. Из (1) следует, что в этом случае суммарное число кодовых комбинаций КК2 с меньшим чем 10 числом разрядов равно

способ сжатия данных, патент № 2386210

Из (1') находим суммарное число кодовых комбинаций КК2 с числом разрядов, равным 10 (без выигрыша):

способ сжатия данных, патент № 2386210

В таблице 5 приведены в произвольном порядке 10-разрядные 4-ичные числа - КК1 (колонка 1), порядковые номера, чтобы ориентироваться в этом множестве чисел (колонка 2), четверичные КК2 (колонка 3), выигрыш в числе четверичных разрядов при замене входных 10-разрядных КК на КК2 - эффект при СД (колонка 4) и суммарные вероятности P1 выбора одной из КК2 в соответствующей группе КК2 (колонка 5) при одинаковых (так принимаем) вероятностях Р появления разных КК на входе кодера.

Данные табл.5 подтверждают результаты, приведённые в (14) и (15). Если при m=2 (см. табл.1, 2 и 3) только две входные КК оказывались после кодера без выигрыша (без сжатия), то при m=4, n=10 (см. (15) и табл.5) число таких КК выросло до 699052, что составляет более 66% от всех КК (1048576). С учётом данных таблицы 5 по аналогии с (2) и (3) определим величину среднего выигрыша V cp и отношение средней длины КК2 ncp к длине КК1 n:

Vcp=(1/1048576)·(9·4+8·16+7·64+6·256+5·1024+4·4096+3·16384+2·65536+1·262144+0·699052)=(1/1048576)·(36+128+448+1536+5120+16384+49152+131072+262144)=466020/1048576способ сжатия данных, патент № 2386210 0,444 четверичного разряда,

ncp /n=(1/10)·(1/1048576)·(1·4+2·16+3·64+4·256+5·1024+6·4096+7·16384+8·65536+9·262144+10·699052)=(1/10485760)·(36+192+1024+5120+24576+114688+524288+2359296+6990520)=10019740/10485760способ сжатия данных, патент № 2386210 0,955.

Если полученный средний выигрыш (V cp>0!) перевести в двоичные разряды, он всё равно оказывается меньше, чем средний выигрыш при m=2 (см. примеры 1способ сжатия данных, патент № 2386210 3), но ncp/n<1 и при m>2.

Источники информации

1. Теория электрической связи: Учебник для вузов. / А.Г.Зюко, Д.Д.Кловский, В.И.Коржик, М.В.Назаров. / Под ред. Д.Д.Кловского. - М.: Радио и связь, 1998. - 432 с.: 204 ил.

2. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. М.: Диалог - МИФИ, 2002.

3. Д.Сэломон. Сжатие данных, изображений и звука. Москва: Техносфера, 2004. - 368 с.

4. Патент на изобретение № 2192708. Способ сжатия ширины спектра информационных электрических сигналов с ограниченной полосой частот. Автор: Дороднов Игорь Ливериевич. Москва, 10 ноября 2002 г.

способ сжатия данных, патент № 2386210

способ сжатия данных, патент № 2386210

способ сжатия данных, патент № 2386210

Таблица 3
Иллюстрация сжатия данных при m=2, n=4, одинаковых (P1 ) и разных (Р2) вероятностях КК
№ № КК1 КК2 Выигрыш P1Р 2
12 34 56
1 10100 31/16 0,195
2 0101 13 1/160,194
3 101100 21/16 0,098
4 0100 012 1/160,095
5 110010 21/16 0,089
6 0111 112 1/160,087
7 1101000 11/16 0,045
8 0011 0011 1/160,045
9 0110010 11/16 0,035
10 1110 0111 1/160,029
11 1001100 11/16 0,028
12 0010 1011 1/160,025
13 0001110 11/16 0,015
14 1000 1111 1/160,015
15 00000000 01/16 0,003
16 1111 00010 1/160,002

Таблица 4
Иллюстрация сжатия данных для английского алфавита
Буквы/дв.р. Вероят. P1 № № КК2 Выигрыш
12 34 5
Е/3 0,1300 10 2
Т/4 0,0900 21 3
А/4 0,0800 300 2
O/4 0,0800 401 2
N/4 0,0700 510 2
R/4 0,0650 611 2
I/4 0,0650 7000 1
Н/5 0,0600 8001 2
S/5 0,0600 9010 2
D/5 0,0400 10011 2
L/5 0,0350 11100 2
С/5 0,0300 12101 2
U/5 0,0300 13110 2
М/5 0,0300 14111 2
F/5 0,0200 150000 1
Р/5 0,0200 160001 1
Y/5 0,0200 170010 1
R/5 0,0150 180011 1
W/5 0,0150 190100 1
G/5 0,0150 200101 1
V/5 0,0100 210110 1
J/6 0,0050 220111 2
К/6 0,0050 231000 2
Х/6 0,0050 241001 2
Q/7 0,0025 251010 3
Z/7 0,0025 261011 3

способ сжатия данных, патент № 2386210

способ сжатия данных, патент № 2386210

Класс H03M7/40 преобразование в коды переменной длины или из них, например код Шеннона-Фано, код Хафмана, код Морзе

способ восстановления искаженных сжатых файлов -  патент 2510957 (10.04.2014)
кодирование кодов переменной длины с эффективным использованием памяти -  патент 2426227 (10.08.2011)
способ обработки движущегося изображения, носитель записи, на котором записана программа способа обработки движущегося изображения, и устройство обработки движущегося изображения -  патент 2423017 (27.06.2011)
аппаратура и способ оценки объема кода, а также носитель информации для его реализации -  патент 2420911 (10.06.2011)
эффективное кодирование и декодирование блоков преобразования -  патент 2417518 (27.04.2011)
эффективное по использованию памяти адаптивное блочное кодирование -  патент 2413360 (27.02.2011)
способ формирования и проверки заверенного цифровым водяным знаком электронного изображения -  патент 2399953 (20.09.2010)
адаптивная группировка параметров для улучшенной эффективности кодирования -  патент 2368074 (20.09.2009)
вставка дополнительных данных в кодированный сигнал -  патент 2251819 (10.05.2005)
прогнозирование данных в передающей системе -  патент 2227368 (20.04.2004)

Класс H03M7/46 преобразование в коды с переменной длиной серий или из них, те путем представления определенного числа последовательных цифр или групп цифр того же типа с помощью кодового слова и цифры, указывающей этот тип

переключение между режимами кодирования коэффициентов дискретного косинусного преобразования -  патент 2487473 (10.07.2013)
эффективное кодирование и декодирование блоков преобразования -  патент 2417518 (27.04.2011)
комбинированное кодирование длин серий коэффициентов уточнения и значимых коэффициентов на уровнях расширения масштабируемого кодирования видео -  патент 2411688 (10.02.2011)
способы и системы для кодирования значимых коэффициентов при видеосжатии -  патент 2406256 (10.12.2010)
способ кодирования и способ декодирования сигнала изображения, способ кодирования и декодирования источника информации, устройства для них и носители информации, на которых сохранены программы для них -  патент 2406222 (10.12.2010)
способ группового кодирования потока растровых данных -  патент 2350035 (20.03.2009)
способ и формат записи для сжатия изображений -  патент 2346332 (10.02.2009)
Наверх