способ распознавания кодированных изображений

Классы МПК:	G06K9/70 выбор следующего эталона в зависимости от результата предыдущего сравнения
Автор(ы):	Лысенко В.Л. (RU)
Патентообладатель(и):	Войсковая часть 45807 (RU)
Приоритеты:	подача заявки: 2003-02-06 публикация патента: 20.10.2004

Изобретение относится к автоматике и вычислительной технике. Его применение при распознавании и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации позволяет получить технический результат в виде повышения точности распознавания заданных фрагментов в кодированном факсимильном изображении. Этот результат достигается благодаря тому, что в способ введены операции разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов a_k (k=1,2,...,К), представления на этапе обучения каждого "q"-го эталонного фрагмента цепочкой A_q номеров а^(q)_k субинтервалов, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а^(x)_k заданных субинтервалов, сравнения друг с другом элементов а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами "k" и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов. 2 з.п. ф-лы, 1 ил.

Рисунок 1

Формула изобретения

1. Способ распознавания кодированных изображений, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, отличающийся тем, что интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на К субинтервалов a_k (k=1,2,... ,К), нумерованных в порядке возрастания значений длин этих строк, представляют на этапе обучения каждый q-й (q=1,2,... ,Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами k, входящими в текущую цепочку А_х и в эталонные цепочки A_q и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

2. Способ по п.1, отличающийся тем, что оценивают абсолютные величины разностей | а^(x)_k-а^(x)_k-1|и | а^(x)_k-а^(x)_k+1|между значениями текущего элемента а^(x)_k цепочки А_х и значениями предыдущего а^(x)_k-1 и последующего a^(x)_k+1 элементов цепочки А_х и заменяют элемент а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины д.

3. Способ по п.1, отличающийся тем, что выносят решение о принадлежности текущего фрагмента, заданного цепочкой А_х, q-му эталонному фрагменту, заданному цепочкой A_q, если абсолютные величины разностей значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами k не превышают заданных величин способ распознавания кодированных изображений, патент № 2238587 ^(q)_k.

Описание изобретения к патенту

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации.

Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига.

Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением.

Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении.

Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов.

В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров N_i этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N₀ и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N₁, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Q_r, оценивают абсолютные величины i_p разностей размеров соседних кодированных “небелых” строк, вычисляют отношения d_p максимальных и минимальных значений разностей i_p, сравнивают полученные величины отношений d_p с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений).

Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении.

Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов a_k(k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущую цепочку A_x номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами "k", входящие в текущую цепочку А_х и в эталонные цепочки A_q, и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

Оценивают абсолютные величины разностей | a^(x)_k-a^(x)_k-1|и | a^(x)_k|-a^(x)_k+1 между значениями текущего элемента а^(x)_k цепочки А_х и значениями предыдущего a^(x)_k-1 и последующего a^(x)_k+1 элементов цепочки А_хи заменяют элемент а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины способ распознавания кодированных изображений, патент № 2238587 .

Выносят решение о принадлежности текущего фрагмента, заданного цепочкой A_x, "q"-мy эталонному фрагменту, заданному цепочкой A_q, если абсолютные величины разностей значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин способ распознавания кодированных изображений, патент № 2238587 ^(q)_k.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов a_k (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнения друг с другом элементов а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами "k", входящими в текущую цепочку А_х и в эталонные цепочки A_q и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов; а также введены операции оценки абсолютной величины разностей | a^(x)_k-a^(x)_k-1|и | a^(x)_k-a^(x)_k+1|между значениями текущего элемента а^(x)_k цепочки А_х и значениями предыдущего a^(x)_k-1 и последующего a^(x)_k+1 элементов цепочки А_х и замены элемента а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины способ распознавания кодированных изображений, патент № 2238587 ; а также введены операции вынесения решения о принадлежности текущего фрагмента, заданного цепочкой А_х, "q"-мy эталонному фрагменту, заданному цепочкой A_q, если разности значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин способ распознавания кодированных изображений, патент № 2238587 ^(q)_k.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники.

Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Предлагаемый способ реализуется следующим образом.

В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов a_k (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, и полученные цепочки размещаются в банке эталонных цепочек. На этапе распознавания эталонных фрагментов в текущем факсимильном изображении формируется текущая цепочка А_х номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, производится оценка абсолютной величины разностей | a^(x)_k-a^(x)_k-1|и | a^(x)_k-a^(x)_k+1|между значениями текущего элемента а^(х)_k цепочки А_х и значениями предыдущего а^(x)_k-1 и последующего а^(x)_k+1 элементов цепочки А_х и замена элемента а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины способ распознавания кодированных изображений, патент № 2238587 ; элементы а^(x)_k и а^(q)_kс одинаковыми порядковыми номерами "k", входящими в текущую цепочку А_х и в эталонные цепочки A_q, сравниваются друг с другом и выносится решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов, если разности значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин способ распознавания кодированных изображений, патент № 2238587 ^(q)_k.

Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных.

Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении.

Источники информации

1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93.

2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93.

3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6.

4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17.

5. Патент РФ №2126552, МКИ G 06 K 9/00.

Класс G06K9/70 выбор следующего эталона в зависимости от результата предыдущего сравнения

способ оценки фото-, кино- и видеоматериалов, содержащих нежелательное изображение (варианты) - патент 2510905 (10.04.2014)
способ определения гряд и поясов торосов на ледяном покрове акваторий - патент 2500031 (27.11.2013)

способ сегментации изображений - патент 2489752 (10.08.2013)
обнаружение водяных знаков путем корреляционного анализа формы - патент 2368009 (20.09.2009)
обнаружение водяного знака - патент 2352992 (20.04.2009)
обнаружение водяного знака - патент 2351013 (27.03.2009)
способ вычисления сдвига в датчике перемещения с высокой разрешающей способностью - патент 2328768 (10.07.2008)
способ формирования изображения - патент 2171499 (27.07.2001)