устройство и способ записи

Классы МПК:G06K9/22 с помощью ручных приборов
G06K9/34 сегментация соприкосновения или перекрытия образов на поле изображения
H04N1/047 детектирование, управление или компенсация ошибки скорости сканирования или положения сканирования
H04N1/107 с ручным сканированием
Автор(ы):, ,
Патентообладатель(и):К ТЕКНОЛОДЖИЗ АБ (SE)
Приоритеты:
подача заявки:
1997-11-03
публикация патента:

Изобретение относится к перу для записи выбранной последовательности символов и к способу осуществления такой записи. Техническим результатом является возможность записи выбранной последовательности символов без помощи измерителя расстояния и без сохранения постоянной скорости движения. Перо содержит светочувствительное устройство считывания для отображения символов и блок обработки сигналов для идентификации отображенных символов и их записи в формате кодирования символов в оперативной памяти пера. 2 с. и 13 з. п. ф-лы, 14 ил.
Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6

Формула изобретения

1. Перо для записи выбранной последовательности символов путем перемещения пера над последовательностью символов, содержащее светочувствительное устройство считывания (8) для отображения символов и блок (20-24) обработки сигналов для идентификации отображенных символов и их записи в формате кодирования символов в оперативной памяти (23) пера, отличающееся тем, что светочувствительное устройство считывания (8) имеет двумерную поверхность устройства считывания, причем устройство считывания выполнено с возможностью отображения выбранной последовательности символов при помощи множества изображений с частично перекрывающимся содержимым таким образом, что содержимое каждого изображения частично перекрывает содержимое предыдущего изображения, блок (20-24) обработки сигналов выполнен с возможностью сведения вместе при помощи только перекрывающегося содержимого, каждого изображения с предыдущим изображением как вертикально, так и горизонтально таким образом, что комбинированное изображение генерируется из этого множества изображений и получается компенсация для различных скоростей движения и различных углов вращения пера, идентификация отображенных символов осуществляется на основе комбинированного изображения.

2. Перо по п.1, отличающееся тем, что дополнительно содержит средство освещения (6), которое выполнено с возможностью испускания световых импульсов для подсветки символов, которые должны быть записаны.

3. Перо по любому из предыдущих пунктов, отличающееся тем, что блок (20-24) обработки сигналов содержит нейронную сеть для идентификации символов.

4. Перо по любому из предыдущих пунктов, отличающееся тем, что блок обработки сигналов выполнен с возможностью деления комбинированного изображения на множество изображений, каждое из которых содержит только один символ.

5. Перо по любому из предыдущих пунктов, отличающееся тем, что дополнительно содержит индикаторное устройство (29) для указания того, что перо готово сканировать последовательность символов.

6. Перо по любому из предыдущих пунктов, отличающееся тем, что дополнительно содержит дисплей (25) для показа идентифицированных символов.

7. Способ записи выбранной последовательности символов при помощи пера, содержащий стадии перемещения пера над выбранной последовательностью символов и одновременного отображения выбранной последовательности символов при помощи множества изображений таким образом, что содержимое каждого изображения частично перекрывает содержимое предыдущего изображения, использования блока обработки сигналов в пере для сведения вместе при помощи только перекрывающего содержимого каждого изображения с предыдущим изображением как вертикально, так и горизонтально таким образом, что комбинированное изображение генерируют из множества изображений и получают компенсацию для различных скоростей движения и различных углов вращения пера, идентификации символов в комбинированном изображении и записи идентифицированных символов в оперативную память пера при помощи заданного формата кодирования символов.

8. Способ по п.7, отличающийся тем, что дополнительно содержит стадию освещения символов, которые должны быть записаны, световыми импульсами, когда перо перемещают над символами.

9. Способ по одному из п.7 или 8, отличающийся тем, что стадия сведения вместе множества изображений содержит проверку в парах изображений, записанных один за другим, относительно возможных положений перекрывания для определения положения перекрывания, которое доставляет наилучшее соответствие между содержимым каждой пары изображений, записанных одно за другим, причем положение перекрывания, определенное таким образом, используют в сведении вместе изображений этой пары.

10. Способ по любому из пп.7-9, отличающийся тем, что сведение вместе записанных изображений выполняют в реальном времени.

11. Способ по п.9, отличающийся тем, что записанные изображения состоят из множества пикселей, причем каждый имеет значение интенсивности по шкале полутонов, дополнительно содержащий стадии при сведении вместе изображений пары после определения наилучшего положения перекрывания, определения значения интенсивности по шкале полутонов, предпочтительно среднего значения, для каждого перекрывающего пикселя, причем значение интенсивности пикселя по шкале полутонов основано на значениях интенсивности по шкале полутонов для рассматриваемого пикселя в изображениях пары, использования определенных таким образом значений интенсивности пикселей по шкале полутонов в комбинированном изображении.

12. Способ по одному из пп.7-11, отличающийся тем, что стадия идентификации символов включает в себя деление комбинированного изображения на множество фрагментов изображений, причем каждый содержит только один символ.

13. Способ по п.12, отличающийся тем, что комбинированное изображение состоит из множества пикселей, причем каждый имеет значение интенсивности по шкале полутонов, в котором стадия деления комбинированного изображения на множество фрагментов изображения включает в себя сложение значений интенсивности по шкале полутонов для пикселей ряд за рядом и столбец за столбцом в комбинированном изображении для получения множества сумм по рядам и сумм по столбцам, так же, как и идентифицирующие локальные минимумы между суммами по рядам и суммами по столбцам, полученные для деления комбинированного изображения на фрагменты изображения.

14. Способ по одному из п.12 или 13, отличающийся тем, что каждый фрагмент изображения состоит из множества пикселей, причем каждый имеет значение интенсивности по шкале полутонов, в котором стадия идентификации символов в записываемых изображениях включает в себя определение значения интенсивности по шкале полутонов для каждого пикселя во фрагменте изображения и его подачу в качестве входного сигнала в нейронную сеть, которая выполнена с возможностью идентификации символа во фрагменте изображения при помощи входных сигналов.

15. Способ по любому из пп.7-14, отличающийся тем, что дополнительно предусматривает перед идентификацией символов стадию вращения комбинированного изображения таким образом, что символы в этом изображении образуют горизонтальный ряд.

Описание изобретения к патенту

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Данное изобретение относится к перу для записи выбранной последовательности символов согласно преамбуле пункта 1 формулы изобретения, а также к способу для осуществления такой записи согласно преамбуле пункта 7 формулы изобретения.

УРОВЕНЬ ТЕХНИКИ

Читатель, который читает текст, часто желает отметить наиболее важные разделы текста для того, чтобы быть способным легко их найти во время следующего чтения текста и тем самым избежать необходимости чтения несущественных частей текста. Известно использование с этой целью так называемых высвечивающих перьев.

Читателю может также потребоваться поместить вместе выбранные части текста в новый документ, который может быть отредактирован в программе обработки текстов в компьютере. Известным способом подачи текста в компьютер является применение сканера. Существуют стационарные сканеры и портативные сканеры. Стационарный сканер применяется для сканирования целых страниц текста, причем сканер проходит текст автоматически с постоянной скоростью. Этот тип сканера не подходит для сканирования выбранных частей текста на странице. Портативный сканер, с другой стороны, может быть использован с этой целью.

Патент США 5301243 раскрывает ручной сканер для считывания символов со строки символов на подложке. Сканер, который пропускают над символами, которые должны быть считаны, в контакте с подложкой, имеет оптическую систему, которая "видит" малую часть подложки. Эта оптическая система содержит линейное устройство считывания типа ПЗС (прибора с зарядовой связью), которое имеет множество светочувствительных элементов, расположенных в ряд. Когда сканер пропускают над символами на подложке, последовательность вертикальных "срезов" символов и интервалов между ними записывается. Эти "срезы" запоминаются в сканере как цифровое побитовое отображение. Впоследствии программное обеспечение ОРС (ОРС - оптическое распознавание символов) используется для идентификации сканированных символов и запоминания их в кодируемом символами формате, например, с помощью Американского стандартного кода для обмена информацией (ASCII) в памяти. Распознавание символов может выполняться либо в сканере, либо во внешнем компьютере, к которому были переданы отображенные побитово символы.

Проблема, связанная с применением портативных сканеров, состоит в том, что сканер должен знать расстояние между сканированными "срезами" для того, чтобы быть способным правильно идентифицировать символы. Это значит, что сканер или должен пропускаться над символами с постоянной скоростью, чего очень сложно достигнуть вручную, или же содержать очень точный измеритель расстояния.

В вышеупомянутом патенте США 5301243 проблема расстояния устраняется при помощи механического измерителя расстояния в форме колесика. Однако механический измеритель расстояния содержит движущиеся части, что является недостатком, поскольку они снижают срок службы измерителя расстояния и удорожают его производство. Кроме того, измеритель расстояния делает сложной запись информации с газеты и т.п., если последняя не помещена на твердую подложку. Кроме того, измеритель расстояния ослабляет возможность видеть информацию, которая должна быть записана, так как колесико должно примыкать к поверхности, с которой должна быть записана информация, и в результате делает конец сканера, который примыкает к этой поверхности, более громоздким.

Еще одной проблемой, связанной с известными портативными сканерами, является то, что они должны удерживаться, по существу, все время в одном и том же заданном направлении. Более конкретно, устройство считывания должно быть ориентировано перпендикулярно направлению, в котором передвигают перо, т.е. перпендикулярно последовательности символов. Если сканер удерживается в другом направлении или вращается вокруг его продольной оси во время записи последовательности символов, то у этого сканера могут быть трудности в идентификации записываемых символов, так как отсутствует информация о направлении в сканированных "срезах". Это серьезный недостаток известного уровня техники, так как различные индивидуумы (пользователи) часто держат сканер различными способами. В частности, следует учитывать различия в том, как сканеры удерживаются индивидуумами правой рукой и левой рукой. Кроме того, индивидуум часто изменяет положение своих рук при движении сканера по линии. Особой проблемой является тот случай, когда кто-то держит книгу или что-либо подобное в своей руке и желает записать текст.

Патент США 4949391 раскрывает оптический сканер без измерителя расстояния. Более конкретно, этот оптический сканер содержит двумерное устройство считывания, которое записывает изображения с частично перекрывающимся содержимым текста, по которому проходит сканер. Однако ручной сканер является действительно "неинтеллектуальным" блоком записи, который записывает символы без их интерпретации. Вместо этого обработка ОРС выполняется в компьютере, с которым соединен сканер. Сканер коррелируется с каждыми другими изображениями, записываемыми один за другим, для того, чтобы устранить столбцы с избыточной информацией от изображений таким образом, что они потребуют меньше объема памяти. Сканер может передвигаться только в заданном направлении, которое определено колесиком.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Одной целью данного изобретения является устранение, или, по меньшей мере, сокращение описанных выше недостатков известного уровня техники для портативных сканеров, и, более конкретно, объектами настоящего изобретения являются способ и перо, которые могут использоваться для записи выбранной последовательности символов без помощи измерителя расстояния и без требования постоянной скорости движения.

В этой связи еще одними объектами изобретения являются такие способ и такое перо, которое можно держать с возможностью вращения различными способами вокруг его продольной оси и которое специфически позволяет ему вращаться вокруг его продольной оси, в то время как записывается выбранная последовательность символов, без значительного уменьшения надежности идентификации записанных символов.

Эти цели достигаются пером и способом записи выбранной последовательности символов, которые имеют признаки, определенные в пунктах 1 и 7 формулы изобретения, соответственно.

Как отмечено выше, перо и способ согласно данному изобретению используются для записи выбранной последовательности символов путем перемещения пера над последовательностью символов. Выбранная последовательность может, например, состоять из одного или нескольких слов или одного или нескольких предложений, выбранных из более длинного текста. Этими символами могут быть буквы, числа и/или другие написанные символы или знаки. Эти символы могут быть сканированы с бумаги или другого носителя, который может быть оптически сканирован.

Перо содержит светочувствительное устройство считывания с двумерной поверхностью устройства считывания. В данном контексте двумерная поверхность устройства считывания относится к поверхности устройства считывания, которая может записывать больше, чем один пиксель в двух направлениях, перпендикулярных один к другому. Устройство считывания предпочтительно выполнено типа ПЗС. Оно может записывать двумерные изображения в шкале полутонов (шкале яркости) или в цвете. Изображения состоят из множества пикселей, причем каждый определен величиной интенсивности. Высота изображений должна быть такой, чтобы, в сущности, было место в изображении для более высокого символа, который будет записываться. Ширина изображений может быть выбрана на основе требуемой частоты записи изображений и доступных устройств считывания.

Кроме того, перо содержит блок обработки сигналов, который должен содержать, по меньшей мере, центральный процессор, память, схемы ввода/вывода и программные команды для осуществления способа согласно данному изобретению. Блок обработки сигналов предпочтительно содержит подходящим образом запрограммированный микропроцессор. Блок обработки сигналов использует частично перекрывающееся содержимое изображений для сведения записанных изображений вместе в одно изображение. Сведение вместе выполняется как вертикально, так и горизонтально таким образом, чтобы была использована информация как вертикального, так и горизонтального направлений. В результате, в комбинированном изображении нет дубликата содержимого.

Когда изображение сведено вместе, блок обработки сигналов идентифицирует символы в изображении и сохраняет их в кодируемом символами формате в памяти в пере. Это значит, что перо имеет автономный тип. Однако его можно подходящим образом соединить с внешним компьютером таким образом, что информация может быть передана последнему. Комбинированное изображение предпочтительно имеет заданную максимальную длину. Чтобы увеличить скорость и уменьшить требования к памяти для изображений, которые были записаны, но еще не сведены вместе, сведение вместе подходящим образом выполняется последовательно при записи изображений. Таким образом, тот факт, что сведение вместе может быть выполнено в реальном времени, уменьшает требования к памяти для записываемых изображений. Сведение вместе обычно продолжается, пока все записанные изображения не будут сведены вместе. Однако оно прерывается, если достигнута заданная максимальная длина комбинированного изображения. Альтернативно, сведение вместе может быть выполнено после того, как закончена запись, в случае чего может быть записано максимальное количество изображений, которые впоследствии сводятся в изображение. Перо может иметь указывающее устройство для указания того, что оно готово возобновить запись.

Путем использования устройства считывания с двумерной поверхностью устройства считывания, посредством которой могут быть записаны изображения с частично перекрывающимися частями содержимого, и путем сведения этих изображений в одно изображение можно устранить требование постоянной скорости движения или обеспечения измерителя расстояния. Благодаря частичному перекрыванию частей содержимого изображений, изображения будут сами содержать информацию об их относительном положении, т.е. информацию о расстоянии, и в результате нет необходимости записывать эту информацию при помощи измерителя расстояния. Кроме того, пользователь может держать перо при произвольном угле вращения относительно текста и может даже вращать перо во время записи изображений без ухудшения идентификации символов, так как перекрывающиеся изображения содержат информацию о направлении, которая указывает их относительное положение. Это значительно улучшает характеристику "дружественного отношения" к пользователю.

Предпочтительно, чтобы у пера был дисплей, таким образом, чтобы пользователь мог читать записываемое предложение символов без того, чтобы сначала быть вынужденным передать его на обычный компьютер.

Как упомянуто выше, для того, чтобы для него было возможным осуществить сведение вместе, необходимо наличие определенного перекрывания содержимого записанных изображений. Степень перекрывания предпочтительно должна быть больше, чем 20%, предпочтительно больше, чем 50%.

Чтобы сделать контрастность в записываемых изображениях достаточно большой и избежать размытости, вызываемой пером, передвигаемым относительно последовательности символов, символы, которые должны быть записаны, предпочтительно подсвечиваются световыми импульсами, когда перо проходит над последовательностью символов. Эта подсветка может быть подходящим образом достигнута при помощи средства подсветки, например светоизлучающего диода (СИД), который смонтирован в устройстве или на нем. Частота световых импульсов должна быть такой же или синхронизированной с частотой записи изображений, т.е. частотой чтения содержания светочувствительного устройства считывания. Быстрая механическая задвижка, например, могла бы быть использована вместо импульсной подсветки. Однако это ведет к более сложному устройству.

Когда изображения сводятся вместе, изображения, записываемые один за другим, предпочтительно исследуются попарно относительно возможных положений перекрывания для определения положения перекрывания, которое дает наилучшее соответствие между содержимым каждой пары. Положение перекрывания, определенное таким образом, используется при сведении вместе изображений этой пары.

Когда положение наилучшего перекрывания было определено, для каждого пикселя перекрывания предпочтительно определяется значение интенсивности пикселя. Это значение интенсивности пикселя основано на значениях интенсивности рассматриваемого пикселя в изображениях пары. Значения интенсивности пикселей, определенные таким образом, используются в окончательном комбинированном изображении.

Когда все изображение было сведено вместе, это изображение предпочтительно делится на множество фрагментов изображения (субизображений), причем каждый содержит некоторый символ. Такое деление, которое, таким образом, не должно быть физическим делением, а скорее может быть произведено в целом изображении, составляет подготовку для действительного распознавания символов, причем каждый символ предпочтительно интерпретируется отдельно. Альтернативно, могли бы интерпретироваться целые слова или части слов.

Деление изображения на фрагменты изображения может подвергаться влиянию интенсивности пикселей, добавляемых ряд за рядом и столбец за столбцом в комбинированном изображении для того, чтобы получить множество сумм рядов и множество сумм столбцов, и путем локальных минимумов быть идентифицированным среди полученных сумм рядов и сумм столбцов.

На идентификацию символов в комбинированном изображении успешно воздействуют при помощи нейронной сети.

Подходящим образом, в этой связи, значение интенсивности каждого пикселя во фрагменте изображения определяется и подается в качестве входного сигнала в нейронную сеть, которая адаптирована для идентификации символа во фрагменте изображения при помощи входных сигналов.

Перед идентификацией символов комбинированное изображение может быть повернуто, если необходимо, таким образом, что символы в изображении образуют горизонтальный ряд. Это облегчает идентификацию.

Перо согласно данному изобретению может, например, быть использовано для записи текста во время учебы, для сканирования числовых значений, для составления новых документов на основе старых документов, которые существуют только в бумажной форме, и для многих других приложений.

КРАТКОЕ ОПИСАНИЕ РИСУНКОВ

Данное изобретение будет описано ниже путем примера, который показывает, как изобретение может быть реализовано и использовано. Описание ссылается на сопроводительные чертежи, в которых

фиг. 1 схематически показывает вариант высвечивающего пера согласно данному изобретению,

фиг. 2 является блок-схемой электронных схем в варианте высвечивающего пера согласно данному изобретению,

фиг.3 является блок-схемой и показывает воплощение способа согласно данному изобретению,

фиг.4а-4е показывает пример воплощения способа согласно данному изобретению,

фиг. 5а-5с показывает другой пример воплощения способа согласно данному изобретению,

фиг.6а-6с показывает еще один пример воплощения способа согласно данному изобретению.

ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНОГО ВАРИАНТА

В варианте пера согласно изобретению, показанном на фиг.1, оно имеет корпус 1 приблизительно такой же формы, что и стандартное выделяющее перо. Один короткий конец корпуса 1 имеет окно 2, которое должно примыкать или удерживаться на коротком расстоянии от носителя данных, обычно листа бумаги, с которого должны записываться символы. Ширина окна 2 выбирается на основе требуемой частоты записи изображения, требуемой максимальной скорости протягивания и доступных устройств считывания. Высота окна 2 является несколько большей, чем наиболее высокий символ, который должен быть записан. Окно 2 образует острый угол с продольной осью пера таким образом, что пользователь вынужден держать перо под заданным углом к листу бумаги. Кроме того, окно несколько отведено в корпус, так что оно не будет истираться о бумагу.

Корпус 1 по существу содержит оптическую часть 3, электронную часть 4 и источник питания 5.

Оптическая часть 3 содержит СИД 6, систему линз 7 и светочувствительное устройство считывания, которое составляет интерфейс к электронной части 4.

СИД 6 имеет задачу освещения части носителя данных, которая в данный момент находится под окном. Диффузор 9 смонтирован спереди от СИД 6 для рассеивания света.

Задачей системы линз 7 является наиболее точное проецирование изображения части носителя данных, которая расположена под окном 2 светочувствительного устройства считывания 8. Если устройство считывания 8 имеет меньшую светочувствительную область, чем окно 2, то система линз 7 должна также уменьшить изображение. Специалист сможет сконструировать большое количество различных систем линз для выполнения этой задачи.

В этом примере, светочувствительное устройство считывания 8 состоит из двумерного прямоугольного блока ПЗС со встроенным аналого-цифровым преобразователем. Такие устройства считывания имеются в продаже. Здесь устройство считывания 8 смонтировано под малым углом к окну 2 и на своей собственной печатной плате 11.

Источник питания для пера получается из батареи 12, которая смонтирована в отдельном отсеке 13 в корпусе.

Блок-схема на фиг.2 схематично показывает электронную часть 4. Она содержит процессор 20, который через посредство шины 21 соединен с ПЗУ 22, в котором хранятся программы процессора, с оперативной памятью 23, которая составляет рабочую память процессора и в которой хранятся изображения от устройства считывания, также как и идентифицированные и интерпретированные символы, с логическим блоком управления 24, также как и с устройством считывания 8 и с СИД 6. Логический блок управления 24 в свою очередь соединен с большим количеством периферийных блоков, которые содержат дисплей 2, который смонтирован в корпусе, инфракрасный приемопередатчик 26 для передачи информации к внешнему компьютеру или от него, кнопки 27, посредством которых пользователь может управлять устройством, следящее устройство 28 СИД, которое испускает луч света, который помогает пользователю следовать за текстом, и указательное устройство 29, например СИД, указывающее на то, что перо готово записывать символы. Управляющие сигналы в запоминающие устройства, устройство считывания и периферийные блоки генерируются в логическом блоке управления 24. Логический блок управления также управляет генерированием и установлением приоритета прерываний для процессора. Кнопки 27, инфракрасный приемопередатчик 26, дисплей 25 и следящее устройство 28 СИД и СИД 6 доступны путем записи и считывания процессором в регистр в логическом блоке управления. Кнопки 27 генерируют прерывания для процессора 20, когда они активированы.

Перо работает следующим образом. Пользователь держит перо у листа бумаги с текстом в том месте, где он желает начать запись последовательности символов. Он нажимает на кнопку 27 для активации пера и перемещает его над текстом, который он желает записать, следуя тексту таким же образом, каким кто-либо читает текст. Следящее устройство 28 СИД испускает луч света, который облегчает следование строкам. Когда пользователь активирует перо, процессор 20 дает команду СИД 6 начать генерировать строб-импульсы с заданной частотой 25 Гц, причем изображения, записываемые устройством считывания, запоминаются в оперативной памяти 23 с той же частотой. Однако текст, который хранится в форме изображений, требует большого объема памяти и не может быть немедленно использован компьютером, например, в программе обработки текстов. Впоследствии символы в изображениях идентифицируются и запоминаются при помощи кода ASCII. Когда пользователь переместил перо над выбранной последовательностью символов или подошел к концу строки, он поднимает перо от бумаги и отпускает активирующую кнопку, посредством чего процессор 20 выключает СИД 6. Когда выбранные последовательности символов были записаны, пользователь может управлять пером для показа записанного текста на дисплее 25 или для передачи текста на внешний компьютер через посредство инфракрасного приемопередатчика 12. Возможность показа сканированной символьной информации непосредственно на дисплее оказалась очень существенной, так как пользователь часто желает проверить, что был сканирован правильный символ.

Блок-схема на фиг.3 показывает воплощение способа согласно данному изобретению. На шаге 301 изображения с перекрывающимся содержимым сканируются при помощи пера, описанного выше, и запоминаются в области текущего изображения в оперативной памяти 23. Эти изображения хранятся как изображения, т.е. при помощи множества пикселей, причем каждый имеет значение шкалы полутонов в диапазоне от белого до черного.

Как только целый кадр запоминается в области текущего изображения, соответствующим способом начинается сведение вместе изображения с предыдущим изображением, т.е. шаг 302, если такое изображение доступно. Если предыдущего изображения нет, то текущее изображение вводится непосредственно в область изображений строк в оперативной памяти.

Чтобы определить, как текущее изображение должно быть сведено вместе с предыдущим изображением таким образом, что наилучшее соответствие достигается между содержимым изображений, проверяется каждое возможное положение перекрывания между изображениями на уровне пикселей и измерение перекрывания определяется следующим образом:

1) Для каждой позиции перекрывающихся пикселей значения шкалы полутонов двух рассматриваемых пикселей суммируются, если последние не являются белыми. Позиция пикселей, в которой ни один из пикселей не является белым, обозначается положительной позицией.

2) Суммы шкалы полутонов для всех положительных позиций суммируются.

3) Проверяются соседние с позицией каждого пикселя позиции. Если позиция перекрывающихся пикселей не является соседней с положительной позицией и состоит из пикселя, который является белым, и позиции пикселя, который не является белым, то значение шкалы полутонов небелого пикселя вычитается, возможно умноженное на константу, из суммы в пункте 2).

4) Выбирается позиция перекрывания, которая обеспечивает наиболее высокое измерение перекрывания, как установлено выше. В результирующем комбинированном изображении используется среднее значение значения шкалы полутонов перекрывающихся пикселей. Таким образом, помехи могут быть подавлены в области перекрывания. Сведение вместе, таким образом, выполняется как вертикально, так и горизонтально. Если обнаружено, что при сведении вместе изображения не заканчиваются на горизонтальной линии, то комбинированное изображение соответствующим образом регулируется таким образом, что оно становится горизонтальным, например путем вращения комбинированного изображения.

Комбинированное изображение постепенно разрабатывается в область изображений строк в оперативной памяти. Предпочтительно, чтобы область изображений строк была достаточно большой для хранения строки А4 обычного напечатанного текста.

На шаге 303 программное обеспечение процессора 20 делит комбинированное изображение в области изображений строк на фрагменты изображения, причем каждый содержит только один символ. Целью этого является создание входных сигналов для программного обеспечения нейронной сети, которая должна интерпретировать символы. Деление осуществляется путем сложения значений шкалы полутонов пикселей для каждого ряда пикселей и каждого столбца пикселей в комбинированном изображении. Путем изучения локальных минимумов интенсивности для полученных сумм рядов и сумм столбцов можно определить границы для величины каждого символа в изображении.

Если комбинированное изображение содержит более чем одну строку текста, что может иметь место, если текст небольшой, то строки текста должны быть разделены и рассматриваемая строка должна быть выбрана до того, как выполнено деление на фрагменты изображения. Разделение может быть выполнено при помощи способа, подобного способу, используемому для разделения на фрагменты изображения.

На шаге 304 каждый из фрагментов изображения пропорционально уменьшается до заданного формата пикселей фрагмента изображения, который делится на группы пикселей, каждая из которых заменена пикселем, значение шкалы полутонов которого соответствует среднему значению из значений шкалы полутонов пикселей, включенных в группу. Если требуется, подобное уменьшение масштаба может быть выполнено между другими шагами в способе согласно данному изобретению. Далее, символ центрируется относительно его точки баланса, и значения шкалы полутонов нормируются таким образом, что сумма квадрата значения шкалы полутонов каждого пикселя задана фиксированным значением.

Затем на шаге 305 каждый символ в комбинированном изображении изображенной последовательности символов интерпретируется. Значения шкалы полутонов пикселей, которые вместе составляют фрагмент изображения, содержащий только один символ, подаются в качестве входных сигналов в нейронную сеть. Любой выход из нейронной сети представляет символ, который сеть может идентифицировать. Выход из сети, который имеет наиболее высокий выходной сигнал, выбирается, и выбранный таким образом символ сохраняется на шаге 306 с использованием заданного формата кодирования символов, например, кода ASCII, в оперативной памяти 23 в области памяти для интерпретированных символов. Когда идентификация символов и сохранение в формате, кодируемом символами, завершена, процессор активирует указательное устройство 29 для информирования пользователя о том, что он готов записать новую последовательность символов на шаге 307. Затем он переходит обратно на шаг 301.

Шаги, описанные выше, выполняются, таким образом, процессором 20 с помощью связанных блоков и подходящего программного обеспечения. Такое программное обеспечение может быть создано специалистом с помощью вышеприведенных инструкций. Распознавание символов выполняется с помощью программного обеспечения нейронной сети, которое обучено подходящим образом. Программное обеспечение нейронной сети имеется в продаже, например, от MATLAB Neural Network Toolbox, The MathWorks Inc., 24 Prime Park Way, Natick, MA 01760, USA.

Фиг. 4а-4е показывают, как способ согласно данному изобретению работает, когда сканируется последовательность символов устройство и способ записи, патент № 2198428. Фиг.4а показывает текст на листе бумаги, который также имеет определенное количество "точечных помех" в форме малых черных пятен. Фиг.4b показывает изображения, которые записываются с помощью устройства считывания. Как можно видеть из этой фигуры, содержимое изображений частично перекрывается. Буква 1 появляется полностью на изображении 1 и частично на изображении 2. Степень перекрывания зависит от скорости протягивания, т.е. скорости, с которой пользователь тащит устройство над текстом, относительно частоты, с которой считывается содержимое устройства считывания. Фиг.4с показывает, как выглядит все комбинированное изображение. Следует отметить, что изображение все еще хранится в форме пикселей. Фиг.4d показывает деление всего изображения на фрагменты изображения. Фиг.4е показывает масштабированные и нормированные буквы, которые используются в качестве входных сигналов для нейронной сети. Когда способ был воплощен, текст устройство и способ записи, патент № 2198428 сохраняется в оперативной памяти пера в виде кода ASCII.

В показанном примере перо держали прямо и не вращали вообще, в то время как записывалась последовательность символов. Если бы перо удерживали с поворотом на постоянный угол вокруг ее продольной оси, то изображения вместо этого выглядели подобно изображениям на фиг.5а. В этом случае, когда изображения сведены вместе, получается наклонное изображение, см. фиг.5b, которое должно быть повернуто для того, чтобы последовательность символов была горизонтальной, фиг. 5с. Чтобы определить, насколько большой поворот надо произвести, положение символов в комбинированном изображении детектируется в паре мест.

Если перо вращают вокруг его продольной оси во время записи, то наклон изображений будет различным. Пример этого показан на фиг.6а. Когда изображения сведены вместе, см. фиг.6b, получается волнообразная последовательность символов. Она может быть выпрямлена в горизонтальную линию путем детектирования положения символов в комбинированном изображении во множестве мест и путем вращения различных сегментов в различной степени (см. фиг.6с).

Класс G06K9/22 с помощью ручных приборов

способ считывания маркировочных меток сканером, создающим дополнительный рассеянный световой поток для расширения зоны считывания сканера -  патент 2481634 (10.05.2013)
местная локализация с использованием быстрого согласования изображений -  патент 2369901 (10.10.2009)
средство для ввода символов или команд в компьютер -  патент 2236036 (10.09.2004)
способ идентификации личности по особенностям подписи -  патент 2148274 (27.04.2000)

Класс G06K9/34 сегментация соприкосновения или перекрытия образов на поле изображения

устройство и способ обработки информации и система обработки информации -  патент 2524677 (10.08.2014)
способ сегментации сложноструктурированных растровых полутоновых изображений на основе составных морфологических операторов -  патент 2510897 (10.04.2014)
способ сегментации изображений -  патент 2489752 (10.08.2013)
способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью -  патент 2445699 (20.03.2012)
способ сегментации растровых изображений на основе выращивания и слияния областей -  патент 2440609 (20.01.2012)
способ обработки выходных данных оптического распознавания символов (ocr), где выходные данные содержат изображения дважды отпечатанных символов -  патент 2439700 (10.01.2012)
способ и система выделения данных об изображении объекта переднего плана на основе данных о цвете и глубине -  патент 2426172 (10.08.2011)
устройство обработки изображения, способ обработки изображения и программа -  патент 2423736 (10.07.2011)
способ автоматического кадрирования фотографий -  патент 2329535 (20.07.2008)
система идентификации изображений -  патент 2302656 (10.07.2007)

Класс H04N1/047 детектирование, управление или компенсация ошибки скорости сканирования или положения сканирования

Класс H04N1/107 с ручным сканированием

Наверх