способ отображения рекламы на ресурсах интернет в зависимости от их комбинированного содержания
Классы МПК: | G06F17/30 информационный поиск; структуры баз данных для этой цели G09F19/00 Рекламные и демонстрационные средства, не отнесенные к другим группам |
Автор(ы): | Юдашкин Александр Анатольевич (RU) |
Патентообладатель(и): | Общество с ограниченной ответственностью "Виси Рус" (RU) |
Приоритеты: |
подача заявки:
2011-03-15 публикация патента:
27.05.2012 |
Изобретение относится к контентно-ориентированному отображению рекламных объявлений на Интернет-ресурсах. Техническим результатом является повышение достоверности и сокращение времени поиска за счет комбинированного запроса. В способе в зависимости от комбинированного содержания разделяют данные, содержащиеся на веб-странице, на текстовые и мультимедийные, передают эти данные в систему отображения рекламы и производят их сопоставление с имеющимися в базе данных системы отображения рекламы по принципу визуального сходства мультимедийных данных с веб-страницы с мультимедийными данными из базы данных системы отображения рекламы и по принципу соответствия текста с веб-страницы с текстовыми описаниями из базы данных системы отображения рекламы, получают списки релевантности отдельных типов данных с веб-страницы соответствующим категориям рекламы или рекламным объявлениям путем сопоставления данных из базы данных системы отображения рекламы отдельным категориям рекламы или рекламным объявлениям, формируют список данных с веб-страницы, который сортируют по степени убывания значений, на веб-страницу выводят ограниченный набор рекламных объявлений, соответствующих максимальным значениям из списка. 8 з.п. ф-лы, 2 ил.
Формула изобретения
1. Способ отображения рекламы на ресурсах Интернет в зависимости от их комбинированного содержания, заключающийся в том, что разделяют данные, содержащиеся на веб-странице, на текстовые и мультимедийные, передают эти данные в систему отображения рекламы и производят их сопоставление с имеющимися в базе данных системы отображения рекламы по принципу визуального сходства мультимедийных данных с веб-страницы с мультимедийными данными из базы данных системы отображения рекламы и по принципу соответствия текста с веб-страницы с текстовыми описаниями из базы данных системы отображения рекламы, вычисляют степени релевантности отдельных видов данных, получают один или несколько списков числовой релевантности отдельных типов данных с веб-страницы соответствующим категориям рекламы или рекламным объявлениям типам данных с веб-страницы путем сопоставления данных из базы данных системы отображения рекламы отдельным категориям рекламы или рекламным объявлениям, по совокупности отдельных списков релевантности формируют один общий список численной релевантности данных с веб-страницы рекламным категориям или рекламным объявлениям, накладывают на полученный список дополнительные численные условия, сортируют полученный список по степени убывания значений, на веб-страницу выводят ограниченный набор рекламных объявлений, соответствующих максимальным значениям из списка.
2. Способ по п.1, отличающийся тем, что дополнительные численные условия зависят от весов или логических условий рекламных объявлений или категорий рекламы в системе отображения рекламы.
3. Способ по п.1, отличающийся тем, что анализу подвергаются данные, введенные пользователем в качестве поискового запроса в поисковой системе.
4. Способ по п.1, отличающийся тем, что анализу подвергаются данные, отображающиеся на веб-странице, посещаемой пользователем.
5. Способ по п.1, отличающийся тем, что анализу подвергаются данные, содержащиеся в сообщении электронной почты, и отличающийся тем, что рекламные объявления выводятся в сообщении электронной почты.
6. Способ по п.1, отличающийся тем, что анализу подвергаются данные, переданные одним пользователем другому через систему обмена Интернет-сообщениями, а рекламные объявления выводятся в окне системы обмена Интернет-сообщениями.
7. Способ по п.1, отличающийся тем, что рекламные объявления выводятся непосредственно внутри мультимедийных данных путем наложения текста рекламного объявления на мультимедийное изображение.
8. Способ по п.1, отличающийся тем, что рекламные объявления не выводятся вследствие обнаружения данных, соответствующих запрещенным категориям содержания.
9. Способ по любому из пп.1-8, отличающийся тем, что общий список численной релевантности данных с веб-страницы формируют путем вычисления по каждой найденной категории рекламы или рекламному объявлению функции от нескольких значений релевантности одной и той же категории рекламы или рекламному объявлению.
Описание изобретения к патенту
Изобретение относится к контентно-ориентированному отображению рекламных объявлений на Интернет-ресурсах.
Уже известен способ построения системы индексирования для поиска объектов на цифровых изображениях (см. патент РФ № 2345414, опубл. 27.01.2009), а также способ поиска WEB-страниц по комбинированному запросу (см. патент РФ № 2393537, опубл. 27.06.2010), которые могут быть использованы как способы реализации отдельных частей заявленного способа.
Однако выше указные способы не идентичны заявленному способу, так как направлены на достижение иных задач и иными средствами.
Уже известен способ отображения рекламы, в котором решение принимается на основании информации об изображении и поведении пользователя (т.н. поведенческая или behavioral-based ads) (см. патентный документ Китая № 101520782, опубл. 02.09.2009). Недостатком вышеуказанного способа является использование информации, связанной изображением, в отличие от заявленного способа, в котором используется вся совокупность данных на ресурсе и об изображении (или группе изображений), и о тексте, не связанном с изображением вообще (например, текст новостной статьи на сайте или комментарий пользователя в своем блоге), причем решение в известном способе принимается на основании поведенческой рекламы, которая являемся иным техническим сегментом, по поводу которого в настоящий момент существуют много противоречивых мнений (в т.ч. с юридической точки зрения).
Наиболее близким но технической сущности является способ отображения рекламы, в котором разделяют данные, содержащиеся на веб-странице, на текстовые и мультимедийные, передающие данные в систему отображения рекламы, и производят их сопоставление с имеющимися в базе данных системы отображения рекламы по принципу визуального сходства мультимедийных данных с веб-страницы с мультимедийными данными из базы данных системы отображения рекламы и по принципу соответствия текста с веб-страницы с тестовым описанием из базы данных системы отображения рекламы, получают один тип данных с веб-страницы, соответствующих категориям рекламы или рекламным объявлениям типам данных с веб-страницы (см. патентный документ US 7856358, опубл. 21.12.2010).
Недостатком прототипа является то, что работа происходит с единственным образцом мультимедиа (например, с единственным изображением или фильмом), и вывод делается на основе анализа единственного объекта, в отличие от заявленного, в котором вывод делается на основе взвешенного анализа одного или совокупности объектов, что существенно меняет ситуацию, так как предполагает учет различных результатов для вывода одной или нескольких реклам.
Техническим результатом, на достижение которого направлено данное изобретение, является повышение качества поиска информационных ресурсов за счет предоставления пользователю эффективного инструмента для построения комбинированного запроса, включающего в себя текстовый запрос и любые мультимедийные данные (статические изображения, видео, музыку), причем вывод делается на основе взвешенного анализа одного или совокупности объектов, что существенно меняет ситуацию, так как предполагает учет различных результатов для вывода одной или нескольких реклам, возможность вывода рекламы и в поиске, и на странице стороннего сайта, и в сообщениях электронной почты.
Технический результат, на достижение которого направлено создание данного изобретения, заключается в том, что в способе отображения рекламы на ресурсах Интернет в зависимости от их комбинированного содержания разделяют данные, содержащиеся на веб-странице, на текстовые и мультимедийные, передают эти данные в систему отображения рекламы и производят их сопоставление с имеющимися в базе данных системы отображения рекламы по принципу визуального сходства мультимедийных данных с веб-страницы с мультимедийными данными из базы данных системы отображения рекламы и по принципу соответствия текста с веб-страницы с текстовыми описаниями из базы данных системы отображения рекламы, вычисляют степени релевантности отдельных видов данных, получают один или несколько списков числовой релевантности отдельных типов данных с веб-страницы соответствующим категориям рекламы или рекламным объявлениям типам данных с веб-страницы путем сопоставления данных из базы данных системы отображения рекламы отдельным категориям рекламы или рекламным объявлениям, по совокупности отдельных списков релевантности формируют один общий список численной релевантности данных с веб-страницы рекламным категориям или рекламным объявлениям, накладывают на полученный список дополнительные численные условия, сортируют полученный список по степени убывания значений, на веб-страницу выводят ограниченный набор рекламных объявлений, соответствующих максимальным значениям из списка.
Дополнительные численные условия могут зависеть от весов или логических условий рекламных объявлений, или категорий рекламы в системе отображения рекламы.
Анализу могут подвергаться данные, введенные пользователем в качестве поискового запроса в поисковой системе.
Анализу могут подвергаться данные, отображающиеся на веб-странице, посещаемой пользователем.
Анализу могут подвергаться данные, введенные пользователем для занесения в свою регистрационную запись на веб-ресурсе.
Анализу могут подвергаться данные, содержащиеся в сообщении электронной почты, и отличающийся тем, что рекламные объявления выводятся в сообщении электронной почты.
Анализу могут подвергаться данные, переданные одним пользователем другому через систему обмена Интернет-сообщениями, а рекламные объявления выводятся в окне системы обмена Интернет-сообщениями.
Рекламные объявления могут выводиться непосредственно внутри мультимедийных данных путем наложения текста рекламного объявления на мультимедийное изображение. Рекламные объявления могут не выводиться вследствие обнаружения данных, соответствующих запрещенным категориям содержания.
Общий список численной релевантности данных с веб-страницы могут быть сформированы путем вычисления по каждой найденной категории рекламы или рекламному объявлению функции от нескольких значений релевантности одной и той же категории рекламы или рекламному объявлению.
В способе отображения рекламы из содержания веб-ресурса или данных, предоставленных пользователем Интернет при поиске или использовании иных ресурсов, выделяют текстовые и мультимедийные данные и осуществляют их классификацию по принципу сходства с имеющимися в базе данных данными, которым сопоставляют отдельные категории рекламы или рекламные объявления. Одна или более таких категорий может определять как целевые рекламные темы, так и виды данных, рядом с которыми нельзя демонстрировать рекламу. По каждому виду выделенных данных производят операцию расчета релевантности данным, имеющимся в базе данных системы показа рекламы. По каждому отдельному списку релевантности составляют список релевантности категориям рекламы или рекламным объявлениям, рассчитанный как функция от совокупности значений релевантности различных единиц данных, соответствующих категории рекламы или рекламному объявлению. По спискам релевантности рекламе по разным типам данных составляют один список, содержащий значения релевантности, рассчитанные как функции совокупности значений релевантности различных видов данных категории рекламы или рекламному объявлению. На полученный список накладывают дополнительные численные условия, зависящие от весов рекламных объявлений или категорий рекламы в системе отображения рекламы, и сортируют получившийся список по степени убывания значений. Результатом является отображение на веб-ресурс тех рекламных объявлений, которые соответствуют ограниченному по длине набору максимальных значений из списка при открытии пользователем данного веб-ресурса, либо остановка отображения рекламы в случае обнаружения данных, соответствующих запрещенным категориям.
В качестве примера заявленный способ иллюстрируется последовательностью операций, приведенных на фиг.1, где
10 - запрос;
20 - операция текстового поиска;
60 - список url-адресов, сформированный в результате текстового поиска;
100, 200, 300 - сформированные пользователем запросы по различным типам мультимедийных данных (изображения, видео, музыка);
110, 210, 310 - операции выделения характерных объектов из запросов по различным типам мультимедийных данных (изображения, видео, музыка) и формирования для каждого из найденных объектов сигнатур;
120, 220, 320 - списки сигнатур характерных объектов, выделенных из мультимедийных запросов различных типов (изображения, видео, музыка);
130, 230, 330 - операции поиска похожих объектов соответствующего типа мультимедийных данных;
140, 240, 340 - списки найденных объектов соответствующих типов мультимедийных данных, содержащие url-адрес, по которому расположен объект и значение релевантности;
150, 250, 350 - операции расчета значений релевантности для каждого url-адреса в зависимости от количества располагающихся по адресу объектов и значений релевантности объектов;
160, 260, 360 - списки url-адресов, сформированные в результате поиска по каждому из типов мультимедийных данных;
400 - операция расчета обобщенного значения релевантности url-адреса;
410 - общий список url-адресов, отсортированных в порядке убывания значений обобщенной релевантности.
Для поиска по любому из типов мультимедийных данных в зависимости от типа анализируемых данных из предъявленных к поиску данных выделяются характерные объекты или признаки. В качестве объекта могут быть выделены предметы, например лица, автомобили и пр. - на изображениях или в видео, музыкальная тема - в музыке, либо могут быть выделены признаки предметов, такие как форма, цвет и т.п. Для каждого объекта формируется ряд подобия - отсортированный в порядке убывания сходства ряд объектов из базового набора (сигнатура) - с помощью, например, искусственной нейронной сети.
Для выделенных объектов осуществляется поиск мультимедийных данных, содержащих похожие объекты и формирование списка url-адресов веб-страниц с найденными мультимедийными данными.
Список url-адресов веб-страниц формируется независимо, по каждому из типов мультимедийных данных и независимо по текстовому запросу. Индекс каждого объекта из базы данных системы рассчитывается по количеству совпадений объектов из базового набора в сигнатуре предъявленного на поиск объекта и в сигнатурах хранящихся в базе данных проиндексированных объектов. Таким образом, релевантность для каждого проиндексированного объекта может быть рассчитана как отношение количества совпадений объектов из базового набора к общему количеству объектов из базового набора в сигнатуре. Данный способ не является единственным. На одной веб-странице (по одному и тому же url-адресу) может располагаться несколько найденных объектов, поэтому релевантность каждого url-адреса из списка url-адресов рассчитывается путем взвешенного суммирования максимального значения релевантности находящихся на веб-странице объектов и значения нелинейной функции с насыщением от суммы значений релевантности всех найденных на ней объектов.
Далее система формирует общий список url-адресов, группируя одинаковые адреса из списков-результатов текстового поиска и поисков по мультимедийным типам данных и рассчитывая итоговое значение релевантности как взвешенную сумму значений релевантности результатов текстового поиска и поиска по каждому типу мультимедийных данных. Общий список url-адресов, отсортированный по убыванию обобщенного значения релевантности, предоставляется пользователю как результат комбинированного запроса.
Пользователь инициирует поиск, формируя произвольную комбинацию запросов: текстовый запрос (10) и/или запрос на поиск по изображениям (100), и/или запрос на поиск по видео (200), и/или запрос на поиск по музыке (300).
Операция текстового поиска (20) обрабатывает сформированный пользователем текстовый запрос (10), формируя список url-адресов (60) со значениями релевантности каждого url-адреса текстовому запросу (10).
Операция выделения характерных объектов на предъявленных пользователем изображениях (110) формирует список сигнатур всех объектов (120), найденных на этих изображениях. Данный способ работы с мультимедиа не является единственным. Сигнатуры из списка (120) по очереди поступают на вход операции поиска похожих объектов (130), которая формирует список похожих объектов (140), находящихся в базе данных поисковой системы. Каждая строка списка содержит url-адрес, по которому располагается найденный объект и значение релевантности, рассчитанное для данного объекта по отношению к одному из объектов, находящихся в запросе пользователя (100). В итоге список (140) может содержать несколько строк с одинаковыми значениями url-адресов и соответствующими им значениями релевантности. Список (140) обрабатывается в результате операции расчета релевантности для каждого url-адреса (150). Одинаковые url-адреса группируются, затем рассчитывается значение релевантности для каждой группы путем взвешенного суммирования максимального для каждой группы значения релевантности и значения нелинейной функции с насыщением от суммы значений релевантности всех объектов группы. В результате операции (150) формируется список (160), содержащий url-адрес каждой группы и рассчитанное значение релевантности группы.
Аналогичные действия проводятся для запросов (200) и (300). Выделяются характерные объекты с помощью выполнения операций (210) и (310), по которым и будет выполняться поиск. Сигнатуры, сформированные для каждого из выделенных характерных объектов, заносятся в списки (220) и (320). В результате выполнения операций (230) и (330) соответственно и на базе списков найденных объектов (240), (340) путем выполнения операций (250), (350) формируются списки (260), (360), содержащие url-адреса каждой группы и рассчитанное значение релевантности группы для запроса по видео (200) и музыки (300) соответственно.
Сформированные списки (60), (160), (260), (360) подвергаются операции расчета обобщенного значения релевантности url-адреса (400). Из всех списков формируется единый список, который группируется по url-адресам. Обобщенное значение релевантности рассчитывается как сумма значений релевантности каждой группы, отнесенная к количеству типов компонентов комбинированного запроса. Список (410) url-адресов и обобщенных значений релевантности, отсортированный в порядке убывания значений, возвращается пользователю как результат комбинированного запроса.
На фиг.2 приведен пример работы системы при обработке комбинированного запроса, здесь:
11 - текстовый запрос;
61 - список url-адресов, сформированный в результате текстового поиска;
101 - изображение-запрос;
102, 103 - изображения объектов (OBJ1 и OBJ2), которые найдены системой на изображении-запросе и используются для дальнейшего формирования запроса;
121 - список сигнатур для найденных на изображении-запросе объектов;
141 - список, в каждой строке которого указывается: искомый объект; url-адрес, по которому расположен объект, похожий на искомый; значение релевантности (степень сходства). Список сгруппирован по url-адресам;
142 - пример группы с одним url-адресом;
161 - список url-адресов, сформированный после расчета значения релевантности для каждой группы;
411 - общий список url-адресов, отсортированных в порядке убывания значений обобщенной релевантности.
Операции (20), (110), (130), (400) выполняют те же действия, что и ранее.
В пример на фиг.2 пользователь формирует запрос, состоящий из текстового запроса (11) и изображения (101).
В результате обработки текстового запроса формируется список url-адресов (61).
Для обработки запроса по изображению (101) система находит на изображении-запросе изображения двух объектов (102) и (103), для которых формируется список сигнатур (121).
Далее, для каждого из объектов (102) и (103) находятся все похожие на него объекты в базе системы и формируется список (141), сгруппированный по одинаковым url-адресам (см. пример 142). Для каждой группы рассчитывается ее релевантность и формируется список url-адресов (161), отсортированный по убыванию релевантности.
Списки (61) и (161) используются для формирования окончательного результата поиска - списка (411), который возвращается пользователю в качестве результата запроса.
Важное отличие предложенного способа от существующих состоит в том, что для определения, какую рекламу следует показывать, используется не только анализ произвольного числа единиц текста, но и анализ мультимедийных данных на веб-странице или в запросе пользователя (например, статических изображений или видео) и составление обобщенного рейтинга ресурса относительно категорий рекламы или отдельных рекламных объявлений. При этом возможны любые варианты: анализ только текста, только мультимедиа или и текста, и мультимедиа вместе здесь мы говорим о выдаче рекламы, наилучшим образом соответствующей содержанию страницы. Одним из вариантов работы способа является блокирование отображения рекламы на данном ресурсе (странице), если на нем обнаружено запрещенное содержание (например, порно). В данном случае основным достижением является именно способ определения, какую именно рекламу выводить в зависимости от содержания ресурса, а не место, где рекламу выводят.
Класс G06F17/30 информационный поиск; структуры баз данных для этой цели
Класс G09F19/00 Рекламные и демонстрационные средства, не отнесенные к другим группам