способ взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения
Классы МПК: | G06F17/00 Устройства или методы цифровых вычислений или обработки данных, специально предназначенные для специфических функций G06F17/20 манипулирование данными, представленными на естественном языке G06F17/21 обработка текста G06F17/22 манипулирование или регистрация с помощью кодов, например, в последовательности символов текста |
Автор(ы): | Анисимович К.В., Терещенко В.В., Ян Д.Е. |
Патентообладатель(и): | Закрытое акционерное общество "Аби Программное обеспечение" |
Приоритеты: |
подача заявки:
1999-03-10 публикация патента:
20.04.2001 |
Изобретение относится к области электроники и может быть использовано, например, в способе взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения. Техническим результатом является совершенствование способов активирования компьютерных кодов и соответствующих им фрагментов изображений с достижением технического результата в виде повышения усредненной точности активирования результирующих компьютерных кодов и соответствующих им фрагментов изображений. Способ заключается в том, что в процессе преобразования получают дополнительный массив данных объема V1, взаимосвязывающих исходные фрагменты изображения объема V2 с соответствующими им компьютерными кодами V3, причем V1 выбирают в пределах 1(V1+ V2+V3)/(V2)<1000, где и - экспериментальные коэффициенты, которые выбирают соответственно в пределах 0,1536, 0,2445. Затем активируют фрагменты исходной информации с глубиной 2 их охвата, которые выбирают в пределах 1 (1+2)/1 8,1, где - экспериментальный коэффициент, который выбирают в пределах 0,34 5,7. После чего устанавливают однозначную временную и/или пространственную связь с задержкой между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов информации.
Формула изобретения
Способ взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения, заключающийся в установлении в процессе преобразования фрагментов изображения в компьютерные коды однозначной временной и/или пространственной связи между активированием компьютерных кодов и активированием соответствующих им преобразуемых фрагментов изображений, при этом в процессе преобразования получают дополнительный массив данных объема 1, взаимосвязывающих исходные фрагменты изображения объема V2 с соответствующими им компьютерными кодами объема V3, выбирают в пределах1(V1+V2+V3)/(V2)1000,
где V1 - объем получаемого дополнительного массива данных;
V2 - объем исходных фрагментов изображения;
V3 - объем компьютерных кодов, соответствующих исходным фрагментам изображения объема V2;
- экспериментальный коэффициент, который выбирают в зависимости от вида и характера исходной информации в пределах 0,1536,
- экспериментальный коэффициент, который выбирают в зависимости от объема и вероятностного распределения компьютерных кодов в пределах 0,2445, затем активируют исходные фрагменты изображения с глубиной 1 их охвата и соответствующие им компьютерные коды с глубиной 2 их охвата, при этом глубины охвата 1 и 2 выбирают в пределах
1(1+2)/18,1,
где 1 - глубина исходных фрагментов изображения;
2 - глубина охвата компьютерных кодов, соответствующих исходным фрагментам изображения;
- экспериментальный коэффициент, который выбирают в зависимости от параметров преобразования и от вида и характера исходной информации в пределах 0,345,7, и устанавливают однозначную временную связь с задержкой между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения, при этом минимальное значение t1 и максимальное значение t2 задержки выбирают в пределах
1(t1+t2)/t22,
где t1 - минимальное значение времени задержки между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения;
t2 - максимальное значение времени задержки между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения;
- экспериментальный коэффициент, который выбирают в зависимости от величин объемов V1, V2, V3 в пределах 0,1774,
а также устанавливают минимальное допустимое пространственное отклонение D1 и максимальное допустимое пространственное отклонение D2 между средним арифметическим минимального и максимального значения функции, описывающей активируемые результирующие компьютерные коды, выполненные в виде символов, и средним арифметическим минимального и максимального значения функции, описывающей активируемые исходные компьютерные коды, выполненные в виде символов, при этом D1 и D2 выбирают в пределах
1(D1+D2)/D22,
где D1 - минимальное допустимое пространственное отклонение;
D2 - максимальное допустимое пространственное отклонение;
- экспериментальный коэффициент, который выбирают в зависимости от величин объемов V1, V2, V3 в пределах 0,2663.
Описание изобретения к патенту
Изобретение относится к области электроники и может быть использовано, например, в способе взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения. Известен способ активирования результирующих компьютерных кодов и соответствующих им оригиналов, включающий преобразование исходной символьной информации оригинала документа в совокупность адекватных ей компьютерных кодов в найденных и отобранных полях документа и приведение в соответствие компьютерных кодов с оригиналом [Patent USA N 5153927: Character reading system and method., МПК Oct. 6, 1992]. Известен также способ взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения, заключающийся в установлении в процессе преобразования фрагментов изображения в компьютерные коды однозначной временной и/или пространственной связи между активированием компьютерных кодов и активированием соответствующих им преобразуемых фрагментов изображений [Руководство пользователя Fine Reader 4.0 ABBYY Software House, Москва 1998. Казанский производственный комбинат программных средств. Заказ Ф-377 - прототип]. Недостатком известных способов являются относительно низкие их функциональные и технические характеристики, в том числе низкие значения достигаемой усредненной точности активирования результирующих компьютерных кодов и соответствующих им фрагментов изображений. Решаемой изобретением задачей является совершенствование способов активирования компьютерных кодов и соответствующих им фрагментов изображений с достижением технического результата в виде повышения усредненной точности активирования результирующих компьютерных кодов и соответствующих им фрагментов изображений. Для удобства и однозначного понимания целесообразно привести расшифровки и определения используемых далее обозначений, символов и/или терминов. Оригинал - преобразуемая информация, материализованная преимущественно в виде совокупности компьютерных кодов, соответствующих исходному объекту, например, распознаваемому фрагменту изображения. Компьютерный код (например, символ) - компьютерное представление некоторого фрагмента информации (в частности, символьной или в виде изображений). Компьютерные коды символов, в частности, получают в процессе компьютерного распознавания графического изображения, введенного в компьютер, например, с помощью сканера, или его фрагментов. Процесс распознавания - процесс обработки системой распознавания введенного в компьютер графического изображения, например, некоторого символа, в результате чего система распознавания приписывает изображению компьютерный код этого символа. Глубина охвата компьютерных кодов - это, например, максимальное отклонение некоторого выбранного подмножества компьютерных кодов от геометрического центра другого подмножества компьютерных кодов, описывающего, в частности, преобразуемый фрагмент информации. Геометрический центр или опорное значение компьютерных кодов - это, например, среднее арифметическое минимального и максимального значений функции, описывающей компьютерные коды. Процесс взаимосвязанного активирования - производимое человеком и/или заменяющим его устройством, и/или компьютерной программой установление однозначной временной и пространственной связи между активированием результирующих компьютерных кодов и активированием соответствующим им исходных компьютерных кодов или соответствующих им фрагментов изображения. Точность процесса активирования - усредненный процент правильно взаимосвязано активированных компьютерных кодов и соответствующих им фрагментов изображений по статистически представительному практически релевантному множеству массивов исходных данных. Точно взаимосвязано активированные компьютерные коды и соответствующие им фрагменты изображений - это однозначно и корректно установленные, выделенные визуально, пространственно и во времени взаимосвязанные компьютерные коды и соответствующие им фрагменты изображений. Неточно взаимосвязано активированные компьютерные коды и соответствующие им фрагменты изображений - это не корректно установленные, выделенные визуально, пространственно и во времени взаимосвязанные компьютерные коды и соответствующие им фрагменты изображений. Активированные символы и/или компьютерные коды и соответствующие им фрагменты изображений - выделенные визуально или любым другим способом объекты для их обработки. В качестве кратких сведений, раскрывающих сущность изобретения следует отметить, что достигаемый технический результат обеспечивают с помощью предложенного способа взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения, заключающегося в установлении в процессе преобразования фрагментов изображения в компьютерные коды однозначной временной и/или пространственной связи между активированием компьютерных кодов и активирование соответствующих им преобразуемых фрагментов изображений. Другие существенные особенности заявленного способа заключаются в том, что в процессе преобразования получают дополнительный массив данных объема V1, взаимосвязывающих исходные фрагменты изображения объема V2 с соответствующими им компьютерными кодами объема V3, которые выбирают в пределах 1(V1 + V2 + V3)/(V2)1000, где - - экспериментальный коэффициент, причем V1 выбирают в пределах,1(V1 + V2 + V3)/(V2)1000,
где V1 - объем получаемого дополнительного массива данных;
V2 - объем исходных фрагментов изображения;
V3 - объем компьютерных кодов, соответствующих исходным фрагментам изображения объема V2;
- экспериментальный коэффициент, который выбирают в зависимости от вида и характера исходной информации в пределах 0,15 36;
- экспериментальный коэффициент, который выбирают в зависимости от объема и вероятностного распределения компьютерных кодов в пределах 0,2445. Затем активируют исходные фрагменты изображения с глубиной 1 их охвата и соответствующие им компьютерные коды с глубиной 2 их охвата, при этом глубины охвата 1 и 2 выбирают в пределах
1 (1+2)/1 8,1,
где 1 - глубина охвата исходных фрагментов изображения;
2 - глубина охвата компьютерных кодов, соответствующих исходным фрагментам изображения;
- экспериментальный коэффициент, который выбирают в зависимости от параметров преобразования и от вида и характера исходной информации в пределах 0,345,7,
и устанавливают однозначную временную связь с задержкой между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения, при этом минимальное значение t1 и максимальное значение t2 задержки выбирают в пределах
1(t1 + t2)/t22,
где t1 - минимальное значение времени задержки между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения;
t2 - максимальное значение времени задержки между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения;
- эспериментальный коэффициент, который выбирают в зависимости от величин объемов V1, V2, V3 в пределах 0,17 74. Также при этом устанавливают минимальное допустимое пространственное отклонение D1 и максимальное допустимое пространственное отклонение D2 между средним арифметическим минимального и максимального значения функции, описывающей активируемые результирующие компьютерные коды, выполненные в виде символов, и средним арифметическим минимального и максимального значения функции, описывающей активируемые исходные компьютерные коды, выполненные в виде символов, при этом D1 и D2 выбирают в пределах,
1(D1 + D2)/D22,
где D1 - минимальное допустимое пространственное отклонение;
D2 - максимальное допустимое пространственное отклонение;
- экспериментальный коэффициент, который выбирают в зависимости от величин объемов V1, V2, V3 в пределах 0,2663. При изложении сведений, подтверждающих возможность осуществления изобретения целесообразно более детально описать предложенный способ взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения. При описании способа нецелесообразно детально останавливаться на известных из опубликованных данных особенностях выполнения его операций, в частности, взаимосвязанного активирования компьютерных кодов в виде символов и соответствующих им фрагментов изображения, заключающегося в установлении в процессе преобразования фрагментов изображения в компьютерные коды однозначной временной и/или пространственной связи между активированием компьютерных кодов и активированием соответствующих им преобразуемых фрагментов изображений. Детально целесообразно остановиться только на требующих дополнительного описания существенных особенностях осуществления операций предложенного способа, заключающихся в том, что в процессе преобразования, получают дополнительный массив данных объема V1, взаимосвязывающих исходные фрагменты изображения объема V2 с соответствующими им компьютерными кодами объема V3, причем V1 выбирают в пределах
1(V1 + V2 + V3)/V21000,
где V1 - объем получаемого дополнительного массива данных;
V2 - объем исходных фрагментов изображения;
V3 - объем компьютерных кодов, соответствующих исходным фрагментам изображения объема V2;
- экспериментальный коэффициент, который выбирают в зависимости от вида и характера исходной информации в пределах 0,1536;
- экспериментальный коэффициент, который выбирают в зависимости от объема и вероятностного распределения компьютерных кодов в пределах 0,2445. Затем активируют исходные фрагменты изображения с глубиной 1 их охвата и соответствующие им компьютерные коды с глубиной 2 их охвата, при этом глубины охвата 1 и 2 выбирают в пределах
1 (1+2)/1 8,1,
где 1 - глубина охвата исходных фрагментов изображения;
2 - глубина охвата компьютерных кодов, соответствующих исходным фрагментам изображения;
- экспериментальный коэффициент, который выбирают в зависимости от параметров преобразования и от вида и характера исходной информации в пределах 0,34 57,
и устанавливают однозначную временную связь с задержкой между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения, при этом минимальное значение t1 и максимальное значение t2 задержки выбирают в пределах
1(t1 + t2)/t22,
где t1 - минимальное значение времени задержки между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения;
t2 - максимальное значение времени задержки между активированием результирующих компьютерных кодов и активированием соответствующих им фрагментов изображения;
- экспериментальный коэффициент, который выбирают в зависимости от величин объемов V1, V2, V3 в пределах 0,1774. Также при этом устанавливают минимальное допустимое пространственное отклонение D1 и максимальное допустимое пространственное отклонение D2 между средним арифметическим минимального и максимального значения функции, описывающей активируемые результирующие компьютерные коды, выполненные в виде символов, и средним арифметическим минимального и максимального значения функции, описывающей активируемые исходные компьютерные коды, выполненные в виде символов, при этом D1 и D2 выбирают в пределах
1(D1 + D2)/D22,
где D1 минимальное допустимое пространственное отклонение;
D2 - максимальное допустимое пространственное отклонение;
- экспериментальный коэффициент, который выбирают в зависимости от величин объемов V1, V2, V3 в пределах 0,2663. Как уже определялось выше, геометрический центр компьютерных кодов - это, например, среднее арифметическое минимального и максимального значений функции, описывающей компьютерные коды. При этом, если компьютерные коды отображают двумерное изображение, то геометрический центр, в частности, таких компьютерных кодов может быть адекватен центру масс изображения плоской фигуры, описываемой компьютерными кодами. Скажем примером такой функции, описывающей компьютерные коды (символы), может служить функция y = f(x), описывающая кривую на плоскости, совпадающую с начертанием символа. Геометрическим центром такой функции тогда может служить точка (x, y),
где x = (xman - xmin)/2,
а y = (ymax - ymin)/2. Если в результате выделения в соответствии с приведенными аналитическими соотношениями необходимых количеств компьютерных кодов получают дробные, отрицательные значения и какие-либо другие значения, некорректные исходя из условий возможности их дальнейшего использования, то их исключают из рассмотрения и/или автоматически удаляют. Качество исходных графических изображений определяется, в частности, тем, что предъявляют для распознавания, например, изготовленное на ксерокопировальном аппарате изображение, факсограмму, машинописный или рукописный текст. Для дополнительного пояснения целесообразно привести следующий пример практического применения заявленного способа взаимосвязанного активирования результирующих компьютерных кодов в виде символов и соответствующих им фрагментов изображения. Иллюстрацией практического применения способа может являться, в частности, метод связи изображения с текстом, реализованный в программе ABBYY Fine Reader. Эта программа осуществляет преобразование отсканированного изображения документа в формат, поддерживаемый текстовыми редакторами. После завершения распознавания, зачастую возникает необходимость сравнить результаты распознавания с оригиналом или преобразуемыми фрагментами изображений. Например, это особенно актуально, когда распознанный текст написан на незнакомом языке, или содержит много незнакомых слов. Провести такое сопоставление напрямую зачастую затруднительно, поскольку приходится искать глазами соответствующее место в преобразуемых фрагментах изображений. При распознавании создается дополнительный массив данных объема V1, например, координат прямоугольников, описывающих изображения символов оригинала, взаимосвязывающих исходные фрагменты (символы текста) объема V2 изображения текстовой информации в соответствующие им компьютерные коды распознанных символов объема V3, которые выбирают, например, в пределах (V1 + V2) + V3)/(V2) = 215, где выбран в пределах 0,91,2, a выбран в пределах 1,11,3. Реализуется следующая вещь: перемещение курсора по результатам распознавания однозначно связывается с перемещением квадратика по изображению оригинала. При этом активируют изображения символов текстовой информации с глубиной 1 их охвата и соответствующие им символы компьютерных кодов с глубиной 2 их охвата, которые для удобства выбирают в пределах
(1+2)/1 = 4,3-5,7,
где - выбрана в пределах 0,81,1. Вариант возможного осуществления активирования можно также пояснить на следующем примере, если представим себе последовательность X символов компьютерных кодов (СКК), скажем расположенных в оперативной памяти компьютера. Выберем функцию f(X), выделяющую из этой последовательности заданный символ. Представим себе другую функцию g(x) от произвольного элемента x из СКК, возвращающую 0, если символ не передан. В этом случае, по отношению к g(x) функция f(X), является функцией активирования. На практике часто операцию активирования, например, группы компьютерных кодов реализуют как операцию выделения и/или маркировки их для последующей обработки, и/или перевод в состояние, позволяющее производить над выбранными конгломератами компьютерных кодов необходимые действия (см. прототип). Точно также как человек, имея карандаш может выделить символ на листе бумаги, компьютер, на котором установлена программа распознавания (например Fine Reader 4.0) может выделить (активировать) изображение символа на изображении страницы, и, скажем, обвести его изображение рамкой. Для пояснения, что представляет собой компьютерный код до активирования и после, можно отметить, что, например, в компьютерном коде может быть предусмотрено дополнительное битовое поле. До активирования его значение 0, а после активирования 1. Процесс активирования компьютерных кодов выполняют функциональные узлы компьютера в соответствии с задаваемой системой команд. Затем устанавливают однозначную временную связь с задержкой между активированием результирующих символов компьютерных кодов и активированием соответствующих им изображений символов исходной текстовой информации, минимальное значение t1 и максимальное значение t2, которой выбирают в пределах (t1) + t2)/t2 = 1,2-1,3, где - выбирают в пределах 3,65,7. Также при этом устанавливают минимальное допустимое пространственное отклонение D1 и максимальное допустимое пространственное отклонение D2 между средним арифметическим минимального и максимального значения функции, описывающей активируемые результирующие компьютерные коды, выполненные в виде символов, и средним арифметическим минимального и максимального значения функции, описывающей активируемые исходные компьютерные коды, выполненные в виде символов, при этом D1 и D2 выбирают в пределах 1,3(D1 + D2)/D21,6, где - выбирают в пределах 0,861,4. Окно с оригиналом можно сильно увеличить, что позволяет различать символ даже на оригинале плохого качества. Таким образом, например, оператор, занимающийся вводом текста, получает возможность быстро осуществлять проверку результатов распознавания и исправлять ошибки в орфографии и оформлении текста. Достигаемый технический результат, как показали данные экспериментов и приведенный практический пример выполнения способа, может быть реализован только взаимосвязанной совокупностью всех существенных признаков заявленного объекта, отраженных в формуле изобретения. Указанные в ней отличия дают основание сделать вывод о новизне данного технического решения, а совокупность испрашиваемых притязаний в связи с их не очевидностью - о его изобретательском уровне, что доказывается также вышеприведенным их детальным описанием. Нижние и верхние значения заявленных пределов были получены на основе статистической обработки результатов экспериментальных исследований, анализа и обобщения их, и известных из опубликованных источников данных, а также с использованием изобретательской интуиции, исходя из условия достижения указанного технического результата. Соответствие критерию промышленная применимость предложенного способа доказывается отсутствием в заявленных притязаниях каких-либо практически трудно реализуемых признаков и известностью средств для их осуществления. В отношении технических средств, необходимых для реализации заявленного способа целесообразно в дополнении к вышеизложенному отметить, что ими могут быть как специализированные функциональные блоки, так и функциональные узлы компьютера, управляемые задаваемой системой команд. На практике техническими средствами реализации способа взаимосвязанного активирования компьютерных кодов и соответствующих им оригиналов могут являться, в частности, система, состоящая из сканера, компьютера с загруженной в оперативную память программой сканирования, программой Fine Reader, подсистемой синхронизации компьютерных кодов, а также монитора, либо печатающего устройства и манипулятора для контроля и управления процессом. Особенности использования способа и других объектов, не отраженные в описании, общеизвестны и не являются предметом изобретения. Кроме указанного выше технического результата практическое осуществление заявленного объекта позволяет существенно расширить возможности его использования применительно, например, к различным документам, заполняемым рукописными символами.
Класс G06F17/00 Устройства или методы цифровых вычислений или обработки данных, специально предназначенные для специфических функций
Класс G06F17/20 манипулирование данными, представленными на естественном языке
Класс G06F17/21 обработка текста
Класс G06F17/22 манипулирование или регистрация с помощью кодов, например, в последовательности символов текста