способ распознавания кодированных изображений
Классы МПК: | G06K9/70 выбор следующего эталона в зависимости от результата предыдущего сравнения |
Автор(ы): | Лысенко В.Л. (RU) |
Патентообладатель(и): | Войсковая часть 45807 (RU) |
Приоритеты: |
подача заявки:
2003-02-06 публикация патента:
20.10.2004 |
Изобретение относится к автоматике и вычислительной технике. Его применение при распознавании и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации позволяет получить технический результат в виде повышения точности распознавания заданных фрагментов в кодированном факсимильном изображении. Этот результат достигается благодаря тому, что в способ введены операции разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1,2,...,К), представления на этапе обучения каждого "q"-го эталонного фрагмента цепочкой Aq номеров а(q)k субинтервалов, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k заданных субинтервалов, сравнения друг с другом элементов а(x)k и а(q)k с одинаковыми порядковыми номерами "k" и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов. 2 з.п. ф-лы, 1 ил.
Формула изобретения
1. Способ распознавания кодированных изображений, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, отличающийся тем, что интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на К субинтервалов ak (k=1,2,... ,К), нумерованных в порядке возрастания значений длин этих строк, представляют на этапе обучения каждый q-й (q=1,2,... ,Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а(x)k и а(q)k с одинаковыми порядковыми номерами k, входящими в текущую цепочку Ах и в эталонные цепочки Aq и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.
2. Способ по п.1, отличающийся тем, что оценивают абсолютные величины разностей | а(x)k-а(x)k-1| и | а(x)k-а(x)k+1| между значениями текущего элемента а(x)k цепочки Ах и значениями предыдущего а(x)k-1 и последующего a(x)k+1 элементов цепочки Ах и заменяют элемент а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины д. 3. Способ по п.1, отличающийся тем, что выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ах, q-му эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами k не превышают заданных величин (q)k.
Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации. Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига. Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением. Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении. Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов. В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе. Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров Ni этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N0 и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Qr, оценивают абсолютные величины ip разностей размеров соседних кодированных “небелых” строк, вычисляют отношения dp максимальных и минимальных значений разностей ip, сравнивают полученные величины отношений dp с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме. Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений). Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении. Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущую цепочку Ax номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а(x)k и а(q)k с одинаковыми порядковыми номерами "k", входящие в текущую цепочку Ах и в эталонные цепочки Aq, и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов. Оценивают абсолютные величины разностей | a(x)k-a(x)k-1| и | a(x)k| -a(x)k+1 между значениями текущего элемента а(x)k цепочки Ах и значениями предыдущего a(x)k-1 и последующего a(x)k+1 элементов цепочки Ах и заменяют элемент а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины . Выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ax, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин (q)k. Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнения друг с другом элементов а(x)k и а(q)k с одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов; а также введены операции оценки абсолютной величины разностей | a(x)k-a(x)k-1| и | a(x)k-a(x)k+1| между значениями текущего элемента а(x)k цепочки Ах и значениями предыдущего a(x)k-1 и последующего a(x)k+1 элементов цепочки Ах и замены элемента а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины ; а также введены операции вынесения решения о принадлежности текущего фрагмента, заданного цепочкой Ах, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если разности значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин (q)k. Таким образом, заявляемый способ соответствует критерию изобретения "новизна". Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники. Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость". На чертеже представлена блок-схема алгоритма распознавания кодированных изображений. Предлагаемый способ реализуется следующим образом. В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, и полученные цепочки размещаются в банке эталонных цепочек. На этапе распознавания эталонных фрагментов в текущем факсимильном изображении формируется текущая цепочка Ах номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, производится оценка абсолютной величины разностей | a(x)k-a(x)k-1| и | a(x)k-a(x)k+1| между значениями текущего элемента а(х)k цепочки Ах и значениями предыдущего а(x)k-1 и последующего а(x)k+1 элементов цепочки Ах и замена элемента а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины ; элементы а(x)k и а(q) kс одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq, сравниваются друг с другом и выносится решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов, если разности значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин (q)k. Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных. Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении. Источники информации 1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93. 2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93. 3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6. 4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17. 5. Патент РФ №2126552, МКИ G 06 K 9/00.
Описание изобретения к патенту
Класс G06K9/70 выбор следующего эталона в зависимости от результата предыдущего сравнения