способ и система поиска нарушений авторских прав на изображения
Классы МПК: | G06K9/62 способы и устройства для распознавания с использованием электронных средств G06F7/06 устройства для сортировки, выборки, подборки или сравнения данных на отдельных носителях информации G06F17/00 Устройства или методы цифровых вычислений или обработки данных, специально предназначенные для специфических функций |
Автор(ы): | Погребняк Михаил Львович (RU), Черкашин Павел Александрович (RU), Валенсия-Кампо Александр Владимирович (RU) |
Патентообладатель(и): | Общество с ограниченной ответственностью "Кузнеч" ООО "Кузнеч" (RU) |
Приоритеты: |
подача заявки:
2012-08-21 публикация патента:
20.05.2014 |
Изобретение относится к вычислительной технике и может быть использовано в компьютерных системах для поиска и выявления изображений, авторские права на которые нарушены. Техническим результатом является повышение точности, качества и скорости поиска идентичных или сходных до степени смешения изображений. В способе поиска нарушений авторских прав на изображения, выполняемом на компьютерной системе, производят расчет дескриптора для изображения № 1, располагающегося в блоке памяти № 1. Выполняют расчет дескриптора для изображения № 2, располагающегося в блоке памяти № 2. Сравнивают значения дескрипторов изображений № 1 и № 2. Если значения дескрипторов изображений № 1 и № 2 равны, то выполняют сравнение изображений № 1 и № 2. После чего отображают результаты сравнения на устройстве для отображения информации. 6 н. и 7 з.п. ф-лы, 5 ил.
Формула изобретения
1. Способ поиска нарушений авторских прав на изображения, выполняемый на компьютерной системе, включающий:
- расчет дескриптора для изображения № 1, располагающийся в блоке памяти № 1;
- расчет дескриптора для изображения № 2, располагающийся в блоке памяти № 2;
- сравнение значений дескрипторов изображений № 1 и № 2;
- если значения дескрипторов изображений № 1 и № 2 равны, то
i - сравнение изображений № 1 и № 2;
ii - отображение результатов сравнения на устройстве для отображения информации.
2. Способ по п.1, отличающийся тем, что производят расчет двух или более для изображений № 1 и № 2 и сравнение изображений № 1 и № 2 начинается в случае, если, по крайней мере, одно из значений дескрипторов изображения № 1 равно соответствующему значению дескриптора изображения № 2.
3. Способ по п.1, отличающийся тем, что дескриптор реализован в виде хеш-функции.
4. Способ по п.1, отличающийся тем, что блоки памяти № 1 и № 2 располагаются на разных компьютерных системах, а взаимодействие между компьютерными системами осуществляется с помощью устройств для установки и поддержания сетевого соединения.
5. Способ поиска нарушений авторских прав на изображения, выполняемый на компьютерной системе, включающий:
- расчет дескриптора для изображения № 1, располагающегося в блоке памяти № 1;
- расчет дескриптора для двух и более изображений, располагающихся в блоке памяти № 2;
- сравнение значений дескрипторов изображения № 1 и изображений, которые располагаются в блоке памяти № 2;
- если значение дескриптора изображения № 1 равно значению дескриптора одного или более изображений, располагающихся в блоке памяти № 2, то:
i - сравнение изображений № 1 и № 2;
ii - отображение результатов сравнения на устройстве для отображения информации.
6. Блок памяти, содержащий компьютерный программный продукт, изображение № 1 и изображение № 2, обеспечивающий выполнение поиска нарушений авторских прав на изображения, включающий:
- компьютерный код для расчета дескриптора для изображения № 1;
- компьютерный код для расчета дескриптора для изображения № 2;
- компьютерный код для сравнения значений дескрипторов изображений № 1 и № 2;
- компьютерный код для сравнения изображений № 1 и № 2, который выполняется в случае равенства значений дескрипторов изображений № 1 и № 2;
- компьютерный код для отображения результатов сравнения на устройстве для отображения информации, который выполняется в случае равенства значений дескрипторов изображений № 1 и № 2.
7. Блок памяти по п.6, отличающийся тем, что компьютерный код содержит инструкции и команды для расчета двух или более дескрипторов для изображений № 1 и № 2 и сравнение изображений № 1 и № 2 начинается в случае, если, по крайней мере, одно из значений дескрипторов изображения № 1 равно соответствующему дескриптору изображения № 2.
8. Блок памяти, содержащий компьютерный программный продукт и не менее трех изображений, обеспечивающий выполнение поиска нарушений авторских прав на изображения, включающий:
- компьютерный код для расчета дескриптора для изображения № 1;
- компьютерный код для расчета дескриптора для двух и более изображений, исключая изображение № 1;
- компьютерный код для сравнения значений дескрипторов изображений;
- компьютерный код для сравнения изображений с изображением № 1, который выполняется в случае равенства значений дескриптора изображения № 1 и дескриптора одного или нескольких изображений, исключая изображение № 1;
- компьютерный код для отображения результатов сравнения на устройстве для отображения информации, который выполняется в случае равенства значений дескриптора изображения № 1 и дескриптора одного или нескольких изображений, исключая изображение № 1.
9. Блок памяти по п.7, отличающийся тем, что компьютерный код содержит инструкции и команды для расчета двух или более дескрипторов для изображений и сравнение изображения № 1 с одним или более изображениями, за исключением изображения № 1, начинается в случае, если, по крайней мере, одно из значений дескрипторов изображения № 1 равно соответствующему дескриптору одного или нескольких изображений, за исключением изображения № 1.
10. Блок памяти по любому из пп.6-9, отличающееся тем, что дескриптор реализован в виде хеш-функции.
11. Устройство, осуществляющее поиск нарушений авторских прав на изображения, содержащее:
- один или несколько процессоров;
- устройство для отображения информации;
- устройство для хранения данных, содержащее:
i - блок памяти № 1, содержащий изображение № 1;
ii - блок памяти № 2, содержащий изображение № 2;
iii - блок памяти № 3, содержащий одну или несколько программ, которые, при выполнении одним или несколькими процессорами, заставляет устройство, осуществляющее поиск нарушений авторских прав на изображения:
1 - производить расчет дескриптора для изображения № 1;
2 - производить расчет дескриптора для изображения № 2;
3 - сравнивать значения дескрипторов изображений № 1 и № 2;
4 - если значения дескрипторов изображений № 1 и № 2 равны, то
а - сравнивать изображения № 1 и № 2;
b - отображать результаты сравнения на устройстве для отображения информации.
12. Устройство по п.11, отличающееся тем, что дескриптор реализован в виде хеш-функции.
13. Машиночитаемый носитель информации, хранящий программу, которая обеспечивает выполнение компьютером операций способа по любому из пп.1-4.
Описание изобретения к патенту
Область техники
Изобретение относится к вычислительной технике и может быть использовано в компьютерных системах для поиска и выявления изображений, авторские права на которые нарушены.
Предшествующий уровень техники
В настоящее время проблема поиска и выявления изображений, которые неправомерно используются третьими лицами, является актуальной. Большинство Интернет ресурсов содержат изображения, которые были взяты с других Интернет сайтов без уведомления и/или разрешения автора изображений.
По состоянию на сегодняшний день поиск неправомерно используемых изображений выполняется путем отправки запроса в поисковые машины, например Google® или Яндекс®. У приведенных поисковых систем имеется функция поиска по изображениям. Изображения в Интернете и на стационарном компьютере идентифицируются с помощью имени файла и/или тегов. В рамках настоящего описания изобретения, под термином «тег» подразумевается информативная метка, служащая для описания характеристик и содержимого изображения. Теги могут назначаться как вручную пользователем, так и в автоматическом режиме. В итоге, теги одних и тех же изображений могут различаться, что затрудняет поиск идентичных или сходных до степени смешения изображений в сети Интернет.
Пользователь производит поиск путем отправки запроса в поисковую систему. Получив запрос пользователя, поисковая система производит поиск по базе данных тегов изображений. После того, как поиск проведен, поисковая система отображает наиболее релевантные изображения, теги которых соответствуют запросу пользователя. Следует отметить, что одни и те же теги могут быть назначены совершенно разным изображениям. В итоге пользователь получает отчет о поиске, который содержит большое количество изображений, сильно отличающихся от исходного изображения.
Главный недостаток вышеприведенного подхода заключается в том, что проведение поиска не гарантирует выявления всех случаев нарушения авторских прав. Другим недостатком вышеприведенного способа поиска и выявления неправомерно используемых изображений является отсутствие универсальных правил по составлению тегов к изображениям.
Раскрытие изобретения
Технической задачей настоящего изобретения является повышение точности, качества и скорости поиска идентичных или сходных до степени смешения изображений.
Способ поиска нарушений авторских прав на изображения, согласно настоящему изобретению, состоит из следующих этапов.
На первом этапе производится расчет одного или нескольких дескрипторов для изображения, соблюдение авторских прав на который подлежит проверке. В рамках настоящего изобретения под термином «дескриптор» следует понимать какую-либо характеристику изображения, например форму, текстуру, цвет, размер и т.д. Под термином «расчет дескриптора» следует понимать буквы, символы, цифры или комбинацию символов, цифр и символов, которые назначаются в соответствии с установленными пользователем и/или администратором компьютерной системы правилами. Например, для дескриптора «цвет» могут быть применены следующие правила:
- черному цвету соответствует следующая комбинация символов, цифр и букв -«1e3@k»;
- белому цвету соответствует следующая комбинация символов, цифр и букв - «5»;
- всем остальным цветам соответствует следующая комбинация символов, цифр и букв - «ПZs2».
Следует отметить, что вышеприведенный пример никак не ограничивает действие настоящего изобретения. Как было упомянуто выше, пользователь и/или администратор компьютерной системы могут выбрать любые дескрипторы и правила их расчета.
Исходное изображение может располагаться на устройстве для хранения данных или базе данных локальной компьютерной системы либо на устройстве для хранения данных или базе данных удаленной компьютерной системы, в том числе в сети Интернет. Следует отметить, что:
- правила расчета дескрипторов задаются до начала использования настоящего изобретения;
- перечень дескрипторов, по которым планируется проводить анализ, составляется до начала использования настоящего изобретения и распространяется на все изображения как на исходные, так и на анализируемые.
Исходное изображение хранится в электронном виде на устройстве для хранения данных в компьютерной системе.
На втором этапе производится расчет одного или нескольких дескрипторов для одного или более изображений, далее «Анализируемые изображения», которые, предположительно, нарушают авторские права на исходное изображение. Анализируемые изображения могут располагаться на устройстве для хранения данных или базе данных локальной компьютерной системы либо на устройстве для хранения данных или базе данных удаленной компьютерной системы, в том числе в сети Интернет.
На третьем этапе производится сравнение значений дескрипторов исходного изображения со значениями дескрипторов одного или более изображений, за исключением исходного изображения. Если значения всех дескрипторов исходного изображения не равны соответствующим значениям дескрипторов Анализируемых изображений, то это означает, что:
- исходное изображение и Анализируемые изображения не имеют сходных характеристик, и
- авторские права на использование исходного изображения, с высокой долей вероятности, не нарушены.
Если значение одного или более дескрипторов исходного изображения равны значениям соответствующих дескрипторов Анализируемых изображений, то система выполняет дополнительное сравнение изображений (этап № 4) и отображение результатов сравнения (этап № 5).
На четвертом этапе производится сравнение исходного изображения с той частью Анализируемых изображений, значение одного или более дескрипторов которых идентичны значениям соответствующих дескрипторов исходного изображения, далее «Сравниваемые изображения». Сравнение изображений может выполняться, но не ограничивается, следующими методами и/или технологиями: вычисление разности цветов пикселей исходного и Сравниваемых изображений, метод цветовых гистограмм (описание: http://ccv- dinalt.blogspot.com/), метод «Keypoint Extraction» (Книга: «Feature points in image, Keypoint extraction», автор Artiom Kovnatsky, издана 21 октября 2011 г., США; веб-ресурс: http://stackoverflow.com/questions/843972/imaae-comparison-fast-algonthm) и др. Следует отметить, что настоящее изобретение не ограничено вышеприведенными способами сравнения, которые приведены исключительно в качестве примера технологий, которые могут быть использованы при работе настоящего изобретения.
На пятом этапе выполняется отображение результатов сравнения изображений на устройстве для отображения информации и/или на устройстве для печати информации. Результаты могут быть отображены в виде таблицы, списка, строки. Устройство для отображения информации может быть выполнено в виде дисплея, touch-screen экрана, сенсорного экрана. Устройство для печати текста может быть выполнено в виде принтера как локального, так и удаленного. Следует отметить, что настоящее изобретение не ограничено вышеприведенными устройствами для отображения информации и устройствами для печати информации, которые приведены исключительно в качестве примера устройств, которые могут быть использованы при работе настоящего изобретения.
В соответствии с настоящим изобретением система поиска нарушений авторских прав на изображения состоит из следующих устройств:
1) один или несколько процессоров;
2) устройство для отображения информации;
3) устройство для хранения данных.
Устройство для хранения данных содержит следующие элементы:
- блок памяти или таблица в базе данных № 1, содержащая исходное изображение;
- блок памяти или таблица в базе данных № 2, содержащая Анализируемые изображения;
- блок памяти № 3, содержащий одну или несколько программ, которые, при выполнении одним или несколькими процессорами, заставляет устройство, осуществляющее поиск нарушений авторских прав на изображения:
- производить расчет одного или нескольких дескрипторов для исходного изображения;
- производить расчет одного или нескольких дескрипторов для Анализируемых изображений;
- сравнивать значения дескрипторов исходного изображения со значениями дескрипторов Анализируемых изображений;
- если значения дескрипторов исходного изображения равны соответствующим значениям дескрипторов Анализируемых изображений, то
- сравнивать изображений № 1 и № 2;
- отображать результаты сравнения на устройстве для отображения информации.
Базы данных № 1 и № 2 могут располагаться как на одной компьютерной системе, так и на разных компьютерных системах, в том числе в сети Интернет.
Блоки памяти № 1 и № 2 могут располагаться как на одной компьютерной системе, так и на разных компьютерных системах, в том числе в сети Интернет.
Блок памяти, в соответствии с настоящим изобретением, содержит компьютерный программный продукт и не менее трех изображений, обеспечивающих выполнение поиска нарушений авторских прав на изображения, включающий:
- компьютерный код для расчета одного или более дескрипторов исходного изображения;
- компьютерный код для расчета одного или более дескрипторов Анализируемых изображений;
- компьютерный код для сравнения значений дескрипторов изображений;
- компьютерный код для сравнения Анализируемых изображений с исходным изображением, который выполняется в случае равенства значений одного или более дескрипторов исходного изображения с соответствующим значениями дескрипторов Анализируемых изображений;
- компьютерный код для отображения результатов сравнения на устройстве для отображения информации, который выполняется в случае равенства значений одного или более дескрипторов исходного изображения с соответствующим значениями дескрипторов Анализируемых изображений.
Краткое описание чертежей
Фиг.1 отображает пример исходного изображения в соответствии с лучшим вариантом осуществления изобретения.
Фиг.2 отображает изображение № 1, которое подлежит проверке в соответствии с лучшим вариантом осуществления изобретения.
Фиг.3 отображает изображение № 2, которое подлежит проверке в соответствии с лучшим вариантом осуществления изобретения.
Фиг.4 отображает изображение № 3, которое подлежит проверке в соответствии с лучшим вариантом осуществления изобретения.
Фиг.5 отображает изображение № 4, которое подлежит проверке в соответствии с лучшим вариантом осуществления изобретения.
Лучший вариант осуществления изобретения
Настоящее изобретение может быть осуществлено следующим способом.
На фиг.1 изображен прямоугольник черного цвета, который располагается в центре изображения. На фиг.2 изображен прямоугольник черного цвета, располагающийся в центре изображения, ширина которого больше, чем у прямоугольника, изображенного на фиг.1. На фиг.3 изображен прямоугольник черного цвета, располагающийся в центре изображения, внутри которого наложена текстура из белых диагоналей. На фиг.4 изображен прямоугольник черного цвета, размеры которого идентичны прямоугольнику, изображенному на фиг.1, смещенный относительно центра изображения на определенное расстояние. На фиг.5 изображен треугольник черного цвета, располагающийся в центре изображения. В качестве исходного изображения выбран прямоугольник черного цвета, изображенный на фиг.1. В качестве Анализируемых изображений выбраны изображения на фиг.2-5.
В качестве дескрипторов выбраны следующие характеристики изображения - форма, цвет, текстура. Расчет дескрипторов будет производиться с помощью следующей хеш-функции:
- если на фигуре изображен прямоугольник, то хеш-функция принимает значение 0003000;
- если на фигуре изображен треугольник, то хеш-функция принимает значение 0004060;
- если изображение содержит черный цвет, то хеш-функция принимает значение 0000001;
- если текстура изображения отсутствует, то хеш-функция принимает значение 000000;
- если текстура изображения включает в себя белые диагонали, то хеш-функция принимает значение 834790.
На первом этапе работы изобретения выполняется расчет дескрипторов для исходного изображения. После применения хеш-функции были получены следующие результаты:
- значение дескриптора формы - 0003000;
- значение дескриптора цвета - 0000001;
- значение дескриптора текстуры - 000000.
На втором этапе работы изобретения выполняется расчет дескрипторов для Анализируемых изображений. После применения хеш-функции были получены следующие результаты для изображения, отображенного на фиг.2:
- значение дескриптора формы - 0003000;
- значение дескриптора цвета - 0000001;
- значение дескриптора текстуры - 000000.
После применения хеш-функции были получены следующие результаты для изображения, отображенного на фиг.3:
- значение дескриптора формы - 0003000;
- значение дескриптора цвета - 0000001;
- значение дескриптора текстуры - 834790.
После применения хеш-функции были получены следующие результаты для изображения, отображенного на фиг.4:
- значение дескриптора формы - 0003000;
- значение дескриптора цвета - 0000001;
- значение дескриптора текстуры - 000000.
После применения хеш-функции были получены следующие результаты для изображения, отображенного на фиг.5:
- значение дескриптора формы - 0004060;
- значение дескриптора цвета - 0000001;
- значение дескриптора текстуры - 000000.
На третьем этапе происходит сравнение значений дескрипторов исходного изображения со значениями дескрипторов Анализируемых изображений. В данном осуществление изобретения все Анализируемые изображения содержат хотя бы одно значение дескриптора, которое идентично соответствующему значению дескриптора исходного изображения.
Поэтому все Анализируемые изображения подлежат сравнению с исходным изображением.
На четвертом этапе происходит сравнение исходного изображения с Анализируемыми изображениями. В качестве метода сравнения был выбран способ расчета разности цветов пикселей исходного и Анализируемых изображений. Способ расчета разности цветов заключается в следующем:
- приведение изображений к одинаковому размеру,
- для каждой точки изображений производится расчет разность между значениями RGB (Red Green Blue - Красный Зеленый Синий) составляющих пикселей,
- суммирование значений по всем пикселям.
Из полученной суммы релевантность можно получить по следующей формуле:
где - сумма разностей значений RGB компонент в каждой точки изображения,
255*З*image size - максимально возможная разность.
Применяя вышеприведенную формулу, вычисляется релевантность или «степень сходности» изображений по отношению к исходному изображению. Значения релевантности получаются следующими:
- Изображение, отображенное на фиг.2 - 0.916
- Изображение, отображенное на фиг.3 - 0.893
- Изображение, отображенное на фиг.4 - 0.880
- Изображение, отображенное на фиг.5 - 0.847
Полученные результаты можно трактуются следующим образом:
- Изображение, отображенное на фиг.2, с вероятностью - 100*0.916=91.6% совпадает с исходным изображением, и, тем самым, с вероятностью 91.6% нарушает авторские права на исходное изображение.
- Изображение, отображенное на фиг.3, с вероятностью - 100*0.893=89.3% совпадает с исходным изображением, и, тем самым, с вероятностью 89.3% нарушает авторские права на исходное изображение.
- Изображение, отображенное на фиг.4, с вероятностью - 100*0.880=88,0% совпадает с исходным изображением, и, тем самым, с вероятностью 88.0% нарушает авторские права на исходное изображение.
- Изображение, отображенное на фиг.5, с вероятностью - 100*0.847=84.7% совпадает с исходным изображением, и, тем самым, с вероятностью 84.7% нарушает авторские права на исходное изображение.
На пятом этапе производится отображение полученных выше результатов на экран компьютера в следующем виде:
- Изображение, отображенное на фиг.2 - 91.6%.
- Изображение, отображенное на фиг.3 - 89.3%.
- Изображение, отображенное на фиг.4 - 88,0%.
- Изображение, отображенное на фиг.5 - 84.7%.
Хотя данное изобретение описано примером его реализации, это описание не является ограничивающим, но приведено лишь для иллюстрации и лучшего понимания существа изобретения, объем которого определяется прилагаемой формулой изобретения.
Класс G06K9/62 способы и устройства для распознавания с использованием электронных средств
Класс G06F7/06 устройства для сортировки, выборки, подборки или сравнения данных на отдельных носителях информации
Класс G06F17/00 Устройства или методы цифровых вычислений или обработки данных, специально предназначенные для специфических функций