способ компьютерного распознавания объектов

Классы МПК:G06K9/80 комбинация операций предварительной обработки и распознавания изображения
Автор(ы):, , ,
Патентообладатель(и):Иванов Александр Львович (RU),
Кловский Олег Данилович (RU),
Юдашкин Александр Анатольевич (RU)
Приоритеты:
подача заявки:
2003-11-17
публикация патента:

Изобретение относится к автоматике и вычислительной технике. Его применение в системах искусственного интеллекта, таких как системы контроля доступа, позволяет получить технический результат в виде сужения области распознавания, за счет чего сокращается время распознавания. Этот результат достигается благодаря тому, что обрабатывают введенное в компьютер изображение распознаваемого объекта, выявляя фрагменты и опорные точки его контура, проводят виртуальный охват фрагментов и опорных точек его контура округлой фигурой, все точки которой сближают с точками контура обрабатываемого изображения объекта до тех пор, пока одни ее точки не совпадут с точками контура обрабатываемого изображения, а другие ее точки не образуют сплошную границу между двумя близлежащими точками контура обрабатываемого изображения, замыкая, таким образом, полностью его контур с получением максимально приближенного к распознаваемому обработанного замкнутого контура изображения распознаваемого объекта, приводят изображение распознаваемого объекта, стандартному для данного способа виду - изменяют масштаб, поворачивают в требуемое положение, центрируют, вписывают в прямоугольник, проводят очистку информационного фона на площади между обработанным контуром изображения и прямоугольником, накладывают шаблоны на область изображения, ограниченную обработанным замкнутым контуром, сравнивают их и распознают. 1 з.п. ф-лы.

Формула изобретения

1. Способ компьютерного распознавания объектов, предусматривающий приведение изображения распознаваемого объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменение масштаба, поворот в требуемое положение, центрирование, вписание изображения распознаваемого объекта в прямоугольник, последующее поочередное наложение на изображение распознаваемого объекта изображений шаблонов, хранящихся в памяти компьютера, и фиксирование изображения, как распознанного, в случае тождественных, а значит и имеющих одинаковый контур изображений распознаваемого объекта и шаблона, отличающийся тем, что введенное в компьютер изображение распознаваемого объекта вначале обрабатывают, выявляя фрагменты и опорные точки его контура, а перед вписанием изображения распознаваемого объекта в прямоугольник производят виртуальный охват фрагментов и опорных точек его контура округлой фигурой, все точки которой затем сближают с точками контура обрабатываемого изображения объекта до тех пор, пока одни ее точки не совпадут с точками контура обрабатываемого изображения, а другие ее точки не образуют сплошную границу между двумя близлежащими точками контура обрабатываемого изображения, замыкая, таким образом, полностью его контур с получением обработанного замкнутого контура изображения, максимально приближенного к контуру распознаваемого объекта, а после вписания изображения распознаваемого объекта в прямоугольник производят очистку информационного фона на площади между обработанным контуром изображения и прямоугольником, при этом наложение шаблонов производят на область изображения распознаваемого объекта, ограниченную обработанным замкнутым контуром.

2. Способ компьютерного распознавания объекта по п.1, отличающийся тем, что выявление фрагментов и опорных точек контура изображения распознаваемого объекта производят, например, фильтрацией скользящим окном.

Описание изобретения к патенту

Изобретение относится к автоматике и вычислительной технике и может быть использовано в системах искусственного интеллекта: системах контроля доступа, робототехнических системах, взаимодействующих с человеком-оператором в условиях производства и других системах.

Известен способ распознавания объектов, например, лица человека, на основе анализа структуры его лица по видеоизображению, основанный на выделении и анализе характерных черт лица - глаз, бровей, носа, рта и т.п. (US, патент №5710833 от 20.01.1998).

Недостатками этого способа являются большие временные и вычислительные затраты на идентификацию, а также высокая стоимость оборудования, необходимого для реализации способа, а также высокие требования к оптическому датчику, равномерности и монохромности освещения объекта идентификации.

Вместе с тем, известны способы распознавания объектов, включающие преобразование изображения распознаваемого объекта в систему электрических импульсов, последующее переведение их в цифровую форму и сравнение с аналогично преобразованными шаблонами.

Известны также применяемые в системах автоматического компьютерного проектирования методы приведения изображения распознаваемого объекта к нормальному, стандартному для данного метода виду - изменение масштаба, поворот в требуемое положение, например расположение наибольшего длиннового размера по оси, расположенной вдоль горизонтальной стороны экрана монитора, центрирование изображения по центру экрана монитора, вписание в прямоугольник требуемого размера (“Компьютер обретает разум”, перевод с английского, изд-во “Мир”, 1990 г., стр. 28).

Также известен способ распознавания объектов, например, лица человека, включающий последовательное наложение масок на контур изображения распознаваемого лица человека с целью формирования контура пиксельного изображения, в котором после первого наложения маски производят отсечение части изображения, расположенного вне маски и формируют первый пиксельный контур из оставшейся части изображения, а затем создают новую маску на основе первого пиксельного изображения и накладывают на нее контур изображения с отсеченной частью, после чего формируют второй контур и новую маску и сравнивают второй контур с первым и т.д. до тех пор, пока число различий между контурами не уменьшится до заданного значения (патент US 5740266 А, МПК 6 G 06 К 9/46, выданный 14.04.98).

Недостатком этого известного способа распознавания объектов следует отнести невозможность использования большого количества шаблонов, т.к. с их увеличением значительно увеличивается длительность процессов распознавания, обусловленная необходимостью выполнения большого количества операций, связанных всякий раз как с формированием новых пиксельных контуров и новых масок, так и с их обработкой и сравнением между собой.

Наиболее близким к предлагаемому изобретению является способ компьютерного распознавания объектов, предусматривающий предварительное приведение изображения распознаваемого объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменение масштаба, поворот в требуемое положение, центрирование, вписание изображения распознаваемого объекта в прямоугольник и последующее поочередное наложение на изображение распознаваемого объекта изображений шаблонов, хранящихся в памяти компьютера, что позволяет увидеть и зафиксировать как распознанное изображение объекта, в случае тождественных, а значит и имеющих одинаковый контур изображений распознаваемого объекта и шаблона (патент РФ №2191431 от 3.12.1999 г., опубл. 27.09.2001 г.).

Этот известный способ компьютерного распознавания объектов обеспечивает возможность ускорения процесса распознавания, при котором не требуется создание большого количества пиксельных изображений и варьирование ими, из-за применения в нем простой операции вписания изображения распознаваемого объекта в прямоугольник и приводят изображение объекта к нормальному, стандартному для данного способа виду, с которым впоследствии сравнивают шаблоны.

Однако использование этого наиболее близкого к заявляемому известного способа компьютерного распознавания объектов все же приводит к неоправданным затратам как по времени, так и по качеству распознавания, т.к. в нем процесс распознавания (сравнения с шаблонами) производят внутри незамкнутого контура изображения распознаваемого объекта, т.е. наложение шаблонов производят на область изображения распознаваемого объекта, площадь которой не ограничена площадью замкнутого контура изображения самого распознаваемого объекта. При этом прямоугольник, в который вписывают изображение распознаваемого объекта и все стороны которого имеют с изображением распознаваемого объекта общие точки, предназначен только для ограничения области, на площади которой производят сравнение изображения распознаваемого объекта с шаблонами, а не для локализации контура изображения самого распознаваемого объекта. Кроме того, прямоугольная фигура не является оптимальной для локализации контура, например, лица человека.

Вместе с тем, этот способ требует дополнительных усилий на очистку информационного шума, внесенного другими объектами, расположенными вне контура изображения распознаваемого объекта.

Предлагаемым изобретением решается задача оптимизации процесса распознавания при сокращении времени на весь процесс.

Технический результат от использования предлагаемого изобретения заключается в сужении области распознавания до площади, ограниченной контуром изображения распознаваемого объекта, что позволяет в дальнейшем не только эффективно вести обработку изображения объекта внутри этого локализованного контура изображения объекта, но и производить внутри него ускоренное сравнение распознаваемого изображения объекта с шаблонами изображений объектов, выполненных в таком же виде, хранящихся в памяти компьютера, и за счет этого существенно сократить время на распознавание объектов.

Это достигается тем, что в способе компьютерного распознавания объектов, предусматривающем приведение изображения распознаваемого объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменение масштаба, поворот в требуемое положение, центрирование, вписание изображения распознаваемого объекта в прямоугольник, последующее поочередное наложение на изображение распознаваемого объекта изображений шаблонов, хранящихся в памяти компьютера, и фиксирование изображения, как распознанное, в случае тождественных, а значит и имеющих одинаковый контур изображений распознаваемого объекта и шаблона, ... введенное в компьютер изображение распознаваемого объекта вначале обрабатывают, выявляя фрагменты и опорные точки его контура, а перед вписанием изображения распознаваемого объекта в прямоугольник производят виртуальный охват фрагментов и опорных точек его контура округлой фигурой, все точки которой затем сближают с точками контура обрабатываемого изображения объекта до тех пор, пока одни ее точки не совпадут с точками контура обрабатываемого изображения, а другие ее точки не образуют сплошную границу между двумя близлежащими точками контура обрабатываемого изображения, замыкая, таким образом, полностью его контур с получением максимально приближенного к распознаваемому обработанного замкнутого контура изображения объекта, а после вписания изображения распознаваемого объекта в прямоугольник производят очистку информационного фона на площади между обработанным контуром изображения и прямоугольником, при этом наложение шаблонов производят на область изображения распознаваемого объекта, ограниченную обработанным замкнутым контуром.

Выявление фрагментов и опорных точек контура изображения распознаваемого объекта производят, например, фильтрацией скользящим окном.

Предложенный способ распознавания объектов характеризуется следующей последовательностью операций:

1. Операция получения изображения распознаваемого объекта, например, с помощью оптического устройства.

2. Преобразование изображения в цифровой набор данных в формате представленной информации и ввод ее в компьютер.

3. Операция выделения фрагментов и опорных точек контура изображения распознаваемого объекта, осуществляемая в два этапа:

- перевод изображения объекта в формат градации серого;

- очистка фона изображения объекта фильтром размытия.

4. Операция запоминания изображения распознаваемого объекта в запоминающем устройстве компьютера.

5. Операция выбора округлой фигуры, предназначенной для виртуального охвата обрабатываемого изображения объекта.

6. Операция сближения точек округлой фигуры с точками контура обрабатываемого изображения распознаваемого объекта до получения замкнутого контура обрабатываемого изображения.

7. Фиксирование и запоминание обработанного контура изображения распознаваемого объекта.

8. Операция приведения изображения распознаваемого объекта к нормальному, стандартному для данного способа виду, т.е. изменяют масштаб обрабатываемого изображения, поворачивают его в требуемое положение и центрируют.

9. Вписывание изображения распознаваемого объекта в прямоугольник.

10. Очищение информационного фона между обработанным контуром изображения и прямоугольником.

11. Операция распознавания предлагаемого объекта средствами, например, операционной системы вычислительного устройства, имеющей доступ к авторизованной базе данных шаблонов, путем последовательного наложения шаблонов на зафиксированный контур обработанного изображения распознаваемого объекта и их сравнения.

12. Принятие решения об идентификации одного из шаблонов с изображением распознаваемого объекта или формирование сигнала о несходстве изображения распознаваемого объекта с каждым из сравниваемых шаблонов.

Вначале производят преобразование изображения распознаваемого объекта в цифровой набор данных в формате представления информации для обработки в компьютере и запоминают его в запоминающем устройстве компьютера (операция 2).

Для ускорения распознавания объектов компьютерным способом вначале введенное в компьютер изображение распознаваемого объекта обрабатывают, выявляя фрагменты и опорные точки его контура фильтрацией скользящим окном (операция 3) и таким образом обработанное изображение запоминают (операция 4). Для определения расположения точек, обозначающих границы оптического изображения распознаваемого объекта, и определения их ориентации (операция 3) применяют специальную программу по использованию математических методов выделения резких перепадов яркости света с помощью фильтров. При этом каждой точке обрабатываемого изображения объекта присваивается число, равное максимальному значению функции перепада. Если в конкретной точке функция не достигает некоторого порогового значения, то это означает отсутствие границ в этой точке и ей присваивается нулевое значение. Операцию 3 проводят в два этапа: вначале переводят изображение объекта в формат градации серого, а затем его очищают от шума и выделяют области резких перепадов яркости света фильтрацией скользящим окном.

После этого выбирают округлую фигуру (операция 5), предназначенную для виртуального охвата обрабатываемого изображения объекта, например, эллипс, как наиболее удобный для использования при распознавании лица человека, и приступают к виртуальному охвату округлой фигурой обрабатываемого изображения объекта.

Затем производят сближение всех точек округлой фигуры с точками контура обрабатываемого изображения объекта (операция 6) до тех пор, пока одни ее точки не совпадут с точками контура обрабатываемого изображения, а другие ее точки не образуют сплошную границу между двумя близлежащими опорными точками контура обрабатываемого изображения, замыкая, таким образом, полностью его контур с получением максимально приближенного к распознаваемому обработанного замкнутого контура изображения объекта. Эту операцию выполняют с использованием специальной программы.

Обработка контура изображения распознаваемого объекта позволяет в дальнейшем вести сравнение шаблонов в замкнутом контуре изображения распознаваемого объекта, резко сократить информационный шум за обработанным контуром изображения объекта и, тем самым, ускорить сам процесс распознавания в цифровом формате.

После этого фиксируют и запоминают обработанный контур изображения распознаваемого объекта (операция 7).

Затем приводят изображения распознаваемого объекта к нормальному, стандартному для данного способа виду, т.е. изменяют масштаб обрабатываемого изображения, поворачивают его в требуемое положение и центрируют (операция 8).

После этого обработанное изображение распознаваемого объекта вписывают его в прямоугольник, предназначенный для ограничения области, на площади которой впоследствии производят сравнение изображения распознаваемого объекта с шаблонами (операция 9).

Затем очищают информационный фон между контуром обработанного изображения и прямоугольником (операция 10).

При распознании обращаются в базу данных о шаблонах, затем последовательно накладывают эти шаблоны на зафиксированный контур обработанного изображения объекта и сравнивают их (операция 11).

Сравнение изображения распознаваемого объекта с изображениями шаблонов, хранящихся в памяти компьютера, производят с использованием одного из известных методов (см. А.Л.Горелик и др., современное состояние проблемы распознавания. М.: Радио и связь, 1985, стр. 53-67) и определяют качественную меру их сходства. На основании полученных в результате этого сравнения количественных данных и с учетом динамически настроенных порогов принятия решения о сходстве производят интегральную оценку меры сходства распознаваемого изображения с каждым из шаблонов и выбирают шаблоны, в сравнении с которыми получена наилучшая интегральная оценка сходства. При этом фиксирование изображения как распознанное производят в случае тождественных, а значит, как обычно, имеющих одинаковый контур изображений распознаваемого объекта и шаблона (операция 12).

В качестве метода принятия решения об идентификации был использован, например, критерий Неймана-Пирсона, согласно которому максимизировалась вероятность правильной идентификации при заданной вероятности ошибок второго рода.

Решение об идентификации (операция 12) принимается, если полученная количественно интегральная оценка превышает порог, соответствующий некоторому квантиль - уровню вероятности.

Предлагаемый к регистрации способ был испытан на базе 100 изображений лиц с разрешениями 320 240, 640 480, 1280 1024 и показал достаточно точные контуры лиц в 75% случаев, в остальных случаях округлая фигура, в которую вписывали изображение объекта, захватывала и другие элементы изображения объекта, однако, при этом изображение объекта также оставалось внутри округлой фигуры.

Таким образом, предлагаемый способ компьютерного распознавания объектов позволяет за счет предварительной локализации контура распознаваемого объекта не только эффективно вести обработку изображения лица внутри этого локализованного контура, но и производить внутри него быстрое сравнение распознаваемого изображения объекта с шаблонами изображений объектов, хранящихся в памяти компьютера.

Предлагаемый способ компьютерного распознавания объектов легко реализуем и позволяет упростить работу компьютера по распознаванию, применяя для этого несложную программу.

Проведенный заявителем анализ уровня техники, включающий поиск по патентным и научно-техническим источникам информации и выявление источников, содержащих сведения об аналогах изобретения, позволил установить, что заявитель не обнаружил аналогов, характеризующихся признаками, тождественными (идентичными) всем существенным признакам заявляемого изобретения.

Ознакомление с аналогами прототипа позволило выявить совокупность существенных, по отношению к усматриваемому техническому результату, отличительных признаков в заявляемом способе компьютерного распознавания объектов, изложенного в формуле изобретения.

Следовательно, заявленное изобретение “способ компьютерного распознавания объектов” соответствуют критерию “новизна”.

Критерий изобретения “промышленная применимость” подтверждается тем, что предлагаемый способ компьютерного распознавания объектов с его новыми признаками прошел успешные испытания на предприятии заявителей и в настоящее время ведется подготовка к его серийному использованию.

Класс G06K9/80 комбинация операций предварительной обработки и распознавания изображения

технологии для детектирования видеокопии -  патент 2505859 (27.01.2014)
способ идентификации личности человека -  патент 2488882 (27.07.2013)
способ распознавания контентного содержания сообщений графических форматов -  патент 2479028 (10.04.2013)
способ анализа иммунологической пробы -  патент 2477488 (10.03.2013)
способ копирования двусторонних оригиналов -  патент 2435217 (27.11.2011)
способ наложения одного изображения на другое, способ персонализации носителя данных с использованием способа наложения изображений и персонализированный носитель данных -  патент 2418683 (20.05.2011)
система и способ отслеживания объекта -  патент 2370817 (20.10.2009)
способ и система адаптивного переформатирования цифровых изображений -  патент 2368006 (20.09.2009)
способ идентификации человека по изображению его лица -  патент 2304307 (10.08.2007)
способ компьютерного распознавания и визуального воспроизведения цветных изображений -  патент 2295767 (20.03.2007)
Наверх