способ и система ранжирования объектов на основе отношений внутри типа и между типами
Классы МПК: | G06F17/30 информационный поиск; структуры баз данных для этой цели |
Автор(ы): | ЧЖАН Бэньюй (US), ЦЗЭН Хуа-Цзюнь (US), МА Вэй-Ин (US), СИ Вэнси (US), ЧЭНЬ Чжэн (US) |
Патентообладатель(и): | МАЙКРОСОФТ КОРПОРЕЙШН (US) |
Приоритеты: |
подача заявки:
2005-05-13 публикация патента:
20.04.2010 |
Изобретение относится к области ранжирования объектов. Техническим результатом является улучшенное ранжирование объектов. Представлен способ и система ранжирования объектов на основе взаимоотношений с объектами другого объектного типа. Система ранжирования задает уравнение для каждого атрибута каждого типа объекта. Уравнения задают значения атрибута на основе взаимоотношений между атрибутом и атрибутами, ассоциативно связанными с тем же типом объекта и другими типами объектов. Система ранжирования итеративно рассчитывает значения атрибута для объектов с помощью уравнений, пока значения атрибута не сойдутся в решение. Затем система ранжирования ранжирует объекты на основе значений атрибута. 4 н. и 31 з.п. ф-лы, 4 ил.
Формула изобретения
1. Способ в вычислительной системе для определения значений атрибута объектов, при этом способ содержит этапы, на которых:
предоставляют типы, причем каждый тип имеет задающий тип атрибут;
определяют объекты, причем каждый объект ассоциативно связан с типом;
для каждого из типов определяют взаимоотношения для данного типа между объектами, ассоциативно связанными с этим типом; и
определяют взаимоотношения для данного типа между объектом, ассоциативно связанным с этим типом, и объектом, ассоциативно связанным с другими типами; и
для каждого из типов вычисляют значение для атрибута объекта на основе определенных взаимоотношений, используя функцию для каждого типа, которая вычисляет значение атрибута, при этом функция определяется как
Fi=FiRi+ j iFjRji,
где Fi представляет значение атрибута, ассоциативно связанного с объектом i, Ri представляет взаимоотношения внутри типа между объектами типа объекта i, Fj представляет значение атрибута, ассоциативно связанного с объектом j, а Rji представляет взаимоотношения между типами между объектами типа объекта i и других типов j;
и сохраняют вычисленные значения.
2. Способ по п.1, по которому типы включают в себя тип авторитетного источника, тип подборки и тип экспертной оценки.
3. Способ по п.2, по которому взаимоотношение для объектов типа авторитетного источника основано на том, имеет ли веб-страница ссылку на другую веб-страницу.
4. Способ по п.3, по которому взаимоотношение между типом авторитетного источника и объектом типа экспертной оценки основано на осуществлении доступа пользователем к веб-странице.
5. Способ по п.2, по которому взаимоотношение для объектов типа подборки основано на том, имеет ли веб-страница ссылку на другую веб-страницу.
6. Способ по п.5, по которому взаимоотношение между типом подборки и объектом типа экспертной оценки основано на осуществлении доступа пользователем к веб-странице.
7. Способ по п.1, по которому взаимоотношения между объектами одного типа являются взаимоотношения внутри типа.
8. Способ по п.1, по которому взаимоотношения между объектами различных типов являются взаимоотношения между типами.
9. Способ по п.1, по которому ранжируют объекты типа на основе их значения атрибута.
10. Способ по п.1, по которому предоставляют уравнение для каждого типа, которое задает значение атрибута этого типа.
11. Способ по п.10, по которому на этапе вычисления итеративно решают уравнения.
12. Способ по п.10, по которому уравнения задаются рекурсивно на основе значений атрибута других уравнений.
13. Способ в вычислительной системе для определения значения атрибута объекта, при этом способ содержит этапы, на которых:
предоставляют функцию для вычисления значений атрибута задающего тип атрибута для объектов типа на основе взаимоотношений между объектами этого типа и объектами другого типа, который имеет задающий тип атрибут, при этом предоставленная функция рассчитывает значения атрибута также основываясь на взаимоотношении между объектами этого типа и, при этом функция определяется как
Fi=FiRi+ j iFjRji,
где Fi представляет значение атрибута, ассоциативно связанного с объектом i, Ri представляет взаимоотношения внутри типа между объектами типа объекта i, Fj представляет значение атрибута, ассоциативно связанного с объектом j, a Rji представляет взаимоотношения между типами между объектами типа объекта i и других типов j;
принимают данные, задающие взаимоотношения между объектами этого типа и объектами другого типа; и
вычисляют предоставленную функцию, чтобы определить значения атрибута объектов данного типа и сохраняют вычисленные значения.
14. Способ по п.13, по которому предоставляют функцию для вычисления значений атрибута, задающего тип атрибута для объектов другого типа.
15. Способ по п.14, по которому функции заданы рекурсивно.
16. Способ по п.15, по которому на этапе вычисления итеративно вычисляют каждую функцию, пока значения атрибута не сойдутся в решение.
17. Способ по п.15, по которому функции представляют собой линейные уравнения.
18. Машиночитаемый носитель, содержащий инструкции для управления вычислительной системой, чтобы определять значения атрибута объектов, посредством способа, по которому
предоставляют первую функцию, которая вычисляет значения задающего первый тип атрибута для объектов первого типа на основе взаимоотношений между объектами первого типа и объектами второго типа, которые имеют задающий второй тип атрибута;
предоставляют вторую функцию, которая вычисляет значения атрибута, задающего второй тип атрибута, для объектов второго типа;
принимают данные, задающие взаимоотношения между объектами первого типа и объектами второго типа; и
вычисляют предоставленные функции, которые определяют значения атрибута объектов первого типа и второго типа; и
сохраняют вычисленные значения, при этом функция определяется как
Fi=FiRi+ j iFjRji,
где Fi представляет значение атрибута, ассоциативно связанного с объектом i, Ri представляет взаимоотношения внутри типа между объектами типа объекта i, Fj представляет значение атрибута, ассоциативно связанного с объектом j, a Rji представляет взаимоотношения между типами между объектами типа объекта i и других типов j.
19. Машиночитаемый носитель по п.18, в котором вторая функция вычисляет значения атрибута на основе взаимоотношения между объектами второго типа.
20. Машиночитаемый носитель по п.18, в котором первая функция также вычисляет значения атрибута на основе взаимоотношения между объектами первого типа.
21. Машиночитаемый носитель по п.18, в котором вторая функция вычисляет значения атрибута на основе значений атрибута объекта первого типа.
22. Машиночитаемый носитель по п.18, в котором функции заданы рекурсивно.
23. Машиночитаемый носитель по п.22, в котором вычисление включает в себя итеративное вычисление каждой функции, пока значения атрибута не сойдутся в решение.
24. Машиночитаемый носитель по п.18, в котором функции представляют линейные уравнения.
25. Способ в вычислительной системе для определения значений атрибута объектов, при этом способ содержит этапы, на которых:
предоставляют типы, причем каждый тип имеет задающий тип атрибута;
определяют объекты, причем каждый объект ассоциативно связан с типом;
для каждого из типов определяют взаимоотношения для данного типа между объектами, ассоциативно связанными с этим типом; и
определяют взаимоотношения для данного типа между объектом, ассоциативно связанным с этим типом, и объектом, ассоциативно связанным с другими типами; и
для каждого из типов вычисляют значение для атрибута объекта на основе определенных взаимоотношений, используя функцию для каждого типа, которая вычисляет значение атрибута, при этом функция определяется как
и сохраняют вычисленные значения.
26. Способ по п.25, по которому типы включают в себя тип авторитетного источника, тип подборки и тип экспертной оценки.
27. Способ по п.26, по которому взаимоотношение для объектов типа авторитетного источника основано на том, имеет ли веб-страница ссылку на другую веб-страницу.
28. Способ по п.27, по которому взаимоотношение между типом авторитетного источника и объектом типа экспертной оценки основано на осуществлении доступа пользователем к веб-странице.
29. Способ по п.26, по которому взаимоотношение для объектов типа подборки основано на том, имеет ли веб-страница ссылку на другую веб-страницу.
30. Способ по п.29, по которому взаимоотношение между типом подборки и объектом типа экспертной оценки основано на осуществлении доступа пользователем к веб-странице.
31. Способ по п.25, по которому взаимоотношения между объектами одного типа являются взаимоотношения внутри типа.
32. Способ по п.25, по которому взаимоотношения между объектами различных типов являются взаимоотношения между типами.
33. Способ по п.25, по которому предоставляют уравнение для каждого типа, которое задает значение атрибута этого типа.
34. Способ по п.33, по которому на этапе вычисления итеративно решают уравнения.
35. Способ по п.33, по которому уравнения задаются рекурсивно на основе значений атрибута других уравнений.
Описание изобретения к патенту
Область техники, к которой относится изобретение
Описанная технология относится, в общем, к ранжированию объектов и, конкретно, к ранжированию на основе взаимоотношений между объектами.
Уровень техники
Многие службы поисковых машин, например Google и Overture, предоставляют возможность поиска информации, которая доступна посредством Интернета. Эти службы поисковых машин позволяют пользователям искать страницы для отображения, например веб-страницы, которые могут представлять интерес для пользователей. После того, как пользователь отправляет запрос на поиск (также называемый "запрос"), который включает в себя условия поиска, служба поисковой машины определяет веб-страницы, которые могут быть связаны с этими условиями поиска. Чтобы быстро определить связанные веб-страницы, служба поисковой машины может хранить привязку ключевых слов к веб-страницам. Служба поисковой машины может генерировать эту привязку посредством тщательного осмотра всемирной паутины (т.е. World Wide Web), чтобы извлекать ключевые слова каждой веб-страницы. Чтобы перемещаться по всемирной паутине, служба поисковой машины может использовать список корневых веб-страниц и определять все веб-страницы, которые доступны посредством этих корневых веб-страниц. Ключевые слова любой конкретной веб-страницы могут быть извлечены с помощью различных широко распространенных методик извлечения, таких как определение слов заголовка, слов, представленных в метаданных веб-страницы, слов, которые выделены, и т.п. Служба поисковой машины может вычислять показатель релевантности, который определяет, насколько релевантна каждая веб-страница для поискового запроса на основе близости каждого совпадения, популярности веб-страницы (к примеру, Google PageRank) и т.п. Служба поисковой машины затем отображает пользователю ссылки на эти веб-страницы в порядке, основанном на их релевантности. Поисковые машины могут в более общем смысле предоставлять возможность поиска информации в любом наборе документов. Например, наборы документов могут включать в себя все патенты (США), все решения федерального суда, все архивные документы компании и т.п.
Две широко известные методики ранжирования веб-страниц - это PageRank и HITS ("поиск тем по гиперссылкам"). PageRank основана на том принципе, что веб-страницы имеют ссылки (т.е. "исходящие ссылки") на важные веб-страницы. Таким образом, важность веб-страницы основана на количестве и важности других веб-страниц, которые ссылаются на эту веб-страницу (т.е. "входящих ссылок"). В простой форме ссылки между веб-страницами могут быть представлены матрицей A, где Aij представляет количество исходящих ссылок с веб-страницы i на веб-страницу j. Показатель важности wj для веб-страницы j может быть представлен следующим уравнением:
Это уравнение может быть решено посредством итеративных вычислений на основе следующего уравнения:
ATw = w,
где w - вектор показателя важности веб-страниц и главный собственный вектор AT.
Методика HITS дополнительно основана на том принципе, что веб-страница, которая имеет множество ссылок на другие важные веб-страницы, может быть важна сама по себе. Таким образом, HITS делит "важность" веб-страниц на два взаимосвязанных атрибута: "подборка" и "авторитетный источник". Подборка измеряется показателем "авторитетный источник" веб-страниц, на которые данная веб-страница ссылается, а "авторитетный источник" измеряется показателем "подборка" веб-страниц, которые ссылаются на данную веб-страницу. В отличие от PageRank, которая рассчитывает важность веб-страниц независимо от запроса, HITS рассчитывает важность на основе веб-страниц результата и веб-страниц, которые связаны с веб-страницами результата следующими входящими и исходящими ссылками. HITS отправляет запрос в службу поисковой машины и использует веб-страницы результатов в качестве исходного набора веб-страниц. HITS добавляет в набор те страницы, которые являются пунктами назначения входящих ссылок, и те веб-страницы, которые являются источниками исходящих ссылок веб-страниц результата. Затем HITS рассчитывает показатели авторитетного источника и подборки каждой веб-страницы с помощью итеративного алгоритма. Показатели авторитетного источника и подборки представляются следующими уравнениями:
и
где a(p) представляет показатель авторитетного источника для веб-страницы p, а h(p) представляет показатель подборки для веб-страницы p. HITS использует матрицу смежности A, чтобы представить ссылки. Матрица смежности представляется следующим уравнением:
Векторы a и h соответствуют показателям авторитетного источника и подборки, соответственно, всех веб-страниц в наборе и могут быть представлены следующими уравнениями:
a=ATh и h = Aa.
Таким образом, a и h - собственные векторы матриц ATA и AAT . HITS может также быть модифицирована так, чтобы учитывать популярность веб-страницы, измеряемую количеством посещений. На основе анализа веб-журналов bij матрицы смежности может быть увеличен каждый раз, когда пользователь переходит с веб-страницы i на веб-страницу j.
Данные методики ранжирования веб-страниц основывают ранжирование в основном на атрибутах самих веб-страниц. Эти атрибуты включают в себя ссылки с одной веб-страницы на другую и переходы с одной веб-страницы на другую. Методики ранжирования не учитывают атрибуты, которые не связаны напрямую с веб-страницами. Например, важность веб-страницы более точно может быть определена, когда учитывается экспертная оценка пользователей, которые осуществляют доступ к веб-странице. Желательно иметь методику вычисления важности веб-страниц на основе атрибутов, которые не связаны напрямую с веб-страницами. Вообще, желательно сгенерировать показатель для объекта одного типа (к примеру, веб-страниц) на основе взаимоотношений с объектами другого типа (к примеру, пользователями).
Раскрытие изобретения
Представлен способ и система ранжирования объектов на основе взаимоотношений с объектами другого объектного типа. Система ранжирования задает уравнение для каждого атрибута каждого типа объекта. Уравнения задают значения атрибута на основе взаимоотношений между атрибутом и атрибутами, ассоциативно связанными с тем же типом объекта и другими типами объектов. Поскольку значения атрибута могут быть взаимозависимыми, т.е. один атрибут может быть задан в показателях другого атрибута, и наоборот, уравнения представляют рекурсивное задание атрибутов. Система ранжирования итеративно рассчитывает значения атрибута для объектов с помощью уравнений, пока значения атрибута не сойдутся в решение. Затем система ранжирования ранжирует объекты на основе значений атрибута.
Краткое описание чертежей
Фиг.1 - блок-схема алгоритма, которая иллюстрирует компоненты системы ранжирования в одном варианте осуществления.
Фиг.2 - блок-схема алгоритма, которая иллюстрирует обработку компонента ранжирования объектов в одном варианте осуществления.
Фиг.3 - блок-схема алгоритма, которая иллюстрирует обработку компонента установления взаимоотношений в одном варианте осуществления.
Фиг.4 - блок-схема алгоритма, которая иллюстрирует обработку вычисления показателей в одном варианте осуществления.
Осуществление изобретения
Представлен способ и система ранжирования объектов данных одного типа объектов данных на основе взаимоотношений с объектами данных того же или другого типа объектов данных. В одном варианте осуществления система ранжирования определяет объекты данных различных типов объектов данных. Например, одним типом объекта данных могут быть веб-страницы, другим типом объекта данных могут быть запросы, а еще одним типом объекта данных могут быть пользователи. Каждый тип объекта данных может иметь различные задающие типы атрибуты. Например, веб-страница может иметь атрибут авторитетного источника, а пользователь может иметь атрибут экспертной оценки. Атрибут авторитетного источника веб-страницы может быть основан на количестве входящих ссылок данной веб-страницы. Атрибут экспертной оценки пользователя может быть увеличен, когда пользователь осуществляет доступ к веб-страницам, которые имеют высокие значения атрибута авторитетного источника. Система ранжирования рассчитывает значения атрибута для объектов данных и может ранжировать объекты данных на основе их значений атрибута.
Система ранжирования задает "типы" объектов так, чтобы каждый тип содержал один атрибут. Например, система ранжирования может задать тип, соответствующий атрибуту авторитетного источника веб-страницы, и другой тип, соответствующий атрибуту подборки веб-страницы. Таким образом, два типа могут представлять одни и те же базовые объекты данных (к примеру, веб-страницы). Система ранжирования определяет различные взаимоотношения между объектами одного типа, называемые взаимоотношениями внутри типа, и между объектами различных типов, называемые взаимоотношениями между типами. Например, когда отправляется запрос, система ранжирования может использовать его результаты в качестве объектов типа авторитетного источника и может использовать веб-журналы, чтобы определять пользователей, которые осуществили доступ к этим веб-страницам, в качестве объектов типа экспертной оценки. Объекты типа авторитетного источника с взаимоотношениями внутри типа могут включать в себя взаимоотношения входящей ссылок и исходящей ссылки веб-страниц. Например, если веб-страница имеет ссылку на другую веб-страницу, то эта веб-страница имеет взаимоотношение исходящей ссылки с другой веб-страницей, а другая веб-страница имеет взаимоотношение входящей ссылки с этой веб-страницей. Взаимоотношениями между типами между объектом типа авторитетного источника и типа экспертной оценки может быть основано на осуществлении доступа пользователем к веб-страницам. Например, если пользователь осуществляет доступ к веб-странице, то эта веб-страница и пользователь имеют взаимоотношение доступа. Система ранжирования извлекает значения атрибута для объектов определенного типа с помощью взаимоотношений между типами и взаимоотношений внутри типа, объединенных со значениями атрибута объектов других типов. Например, система ранжирования может использовать взаимоотношения входящей и исходящей ссылок и взаимоотношения доступа пользователя, чтобы извлечь атрибуты авторитетного источника и подборки веб-страниц и атрибут экспертной оценки пользователей.
В одном варианте осуществления система ранжирования представляет взаимоотношения и атрибуты с помощью набора уравнений, например линейных уравнений. Система ранжирования представляет значения атрибута каждого типа с помощью линейного уравнения, которое может быть рекурсивно задано на основе значений атрибута другого типа. Например, линейное уравнение для атрибута авторитетного источника может быть задано на основе значений атрибута экспертной оценки и наоборот. Поскольку линейные уравнения могут быть заданы рекурсивно, система ранжирования решает линейные уравнения посредством итеративного вычисления значений атрибута каждого линейного уравнения, пока значения атрибута не сойдутся в решение. После решения линейных уравнений система ранжирования может ранжировать объекты данных на основе значений атрибута. Например, система ранжирования может ранжировать веб-страницы на основе их значений атрибута авторитетного источника.
Система ранжирования представляет значения атрибута для объектов на основе взаимоотношений внутри типа и между типами объектов. Значение атрибута может быть представлено следующими уравнениями:
Fi=Fi Ri+ j iFjRji,
где Fi представляет значение атрибута, ассоциативно связанное с объектом i, Ri, представляет взаимоотношения внутри типа между объектами типа объекта i, a Rji представляет взаимоотношения между типами между объектами типа объекта i и других типов j. Если имеется два типа объектов x={x1 ,x2, xm} и y={y1,y2, yn}, то взаимоотношения внутри типа могут быть представлены как Rx и Rr, а их взаимоотношения между типами могут быть представлены как RXY и R YX. Система ранжирования использует матрицы смежности, чтобы представить информацию о взаимоотношениях. LX и LY представляют матрицы смежности отношений внутри типа в наборе X и Y, соответственно. LXY и LYX представляют матрицу смежности взаимоотношений между типами от объектов в X к объектам Y и матрицу смежности взаимоотношений между типами от объектов в Y к объектам X, соответственно. Система ранжирования представляет матрицу смежности следующим образом:
где LXY(i,j) указывает, существует ли взаимоотношение (также называемое "ссылка") от объекта i в наборе X к объекту j в наборе Y. Линейные уравнения для значений атрибута могут быть представлены как следующие уравнения:
где wx - это вектор атрибута объектов в X, а wy - вектор атрибута объектов в Y. Уравнение 1 может быть обобщено к следующей форме:
где M представляет матрицу векторов атрибута.
Поскольку взаимное укрепление взаимоотношений между объектами может приводить к чрезмерным значениям атрибута объекта, система ранжирования может нормализовать бинарные матрицы смежности таким образом, что, если объект связан с n других объектов в одной матрице смежности, то каждый связанный с ним объект получает 1/nth своего значения атрибута. Система ранжирования также может ввести модель произвольного серфинга PageRank, чтобы эмулировать произвольные взаимоотношения и, таким образом, не допускать узлов стока в ход вычисления, как описано ниже. Помимо этого, поскольку атрибуты различных типов могут иметь различную важность для атрибута друг друга, система ранжирования может использовать веса для каждого сочетания типов. Таким образом, система ранжирования может учитывать нормализацию, модель произвольного серфинга и веса, чтобы представлять значения атрибута следующим уравнением:
где U - это матрица вероятностей равномерных переходов (uij=1/n для всех i, j; где n - общее количество объектов в пространстве данных N), LM и LNM - нормализованные матрицы смежности, и - коэффициенты сглаживания, используемые, чтобы эмулировать произвольные взаимоотношения в матрицах LM и L NM, а M и NM представляют веса взаимоотношений. Система ранжирования итеративно вычисляет уравнение 3, пока оно не сойдется. Уравнение 3 может быть представлено объединенной квадратной матрицей A, которая представляется следующим уравнением:
Матрица A имеет на диагонали, и - в других частях объединенной матрицы.
Система ранжирования использует итеративный подход для того, чтобы преобразовывать вектор w, который является вектором атрибута всех объектов данных в различных областях данных, использующих матрицу A (к примеру, w = ATw). Когда итерации сходятся, вектор w становится главным собственным вектором матрицы A.
Когда M и N - разнородные пространства данных, система ранжирования использует произвольное взаимоотношение, чтобы представить отсутствие взаимоотношения. Когда объект в M не имеет связывающего взаимоотношения с какими-либо объектами в N, то подматрица будет равна нулю и будет представлять "узел стока", которому вычисления могут присваивать все значение атрибута. Во избежание этого система ранжирования задает все элементы в соответствующей строке подматрицы равными 1/n, где n - общее количество объектов в пространстве данных N. Альтернативно, система ранжирования может задать соответствующие веса равными 0 для нежелательных взаимоотношений внутри типа и между типами. Тем не менее, если MN больше 0, то NM должна быть больше 0, если итеративные вычисления должны сойтись. Таким образом, если взаимоотношение нежелательно, система ранжирования задает NM равным очень небольшому положительному весу, чтобы уменьшить эффект .
Посредством создания объединенной матрицы с помощью всех матриц смежности система ранжирования создает объединенное пространство данных, которое содержит различные типы объектов. Таким образом, предыдущие взаимоотношения между типами могут быть рассмотрены как взаимоотношения внутри типа в объединенном пространстве, и система ранжирования эффективно выполняет анализ связей в одном пространстве данных.
Фиг.1 - блок-схема алгоритма, которая иллюстрирует компоненты системы ранжирования в одном варианте осуществления. Система 110 ранжирования подключена к различным веб-узлам 101 посредством канала 102 связи. Система ранжирования включает в себя компонент 111 ранжирования объектов, который активирует компонент 112 сбора объектов, компонент 113 установления взаимоотношений, компонент 114 вычисления показателей и компонент 115 упорядочивания объектов, чтобы ранжировать объекты. Компонент ранжирования объектов может принимать набор веб-страниц и ранжировать веб-страницы на основе взаимоотношений внутри типа и между типами. Компонент сбора объектов извлекает информацию о взаимоотношениях, относящихся к объектам различных типов. Например, компонент сбора объектов может осуществлять доступ к веб-журналам веб-узлов, чтобы определять, какие пользователи осуществляют доступ в веб-страницам. Компонент установления взаимоотношений создает матрицы взаимоотношений внутри типа и между типами. Например, матрица взаимоотношений может привязывать пользователей к веб-страницам, к которым они осуществляют доступ. Компонент вычисления показателей рекурсивно рассчитывает значения атрибута с помощью уравнения 3, пока значения атрибута не сойдутся в решение. Компонент упорядочивания объектов сортирует объекты данных на основе значений атрибута. Например, компонент упорядочивания объектов может использовать значение атрибута авторитетного источника для веб-страницы, чтобы сортировать веб-страницы.
Вычислительное устройство, на котором реализована система ранжирования, может включать в себя центральное обрабатывающее устройство, память, устройства ввода (к примеру, клавиатура и указательное устройство), устройства вывода (к примеру, дисплейные устройства) и устройства хранения данных (к примеру, накопители на дисках). Память и устройства хранения данных - это машиночитаемая среда, которая может содержать инструкции, которые реализуют систему ранжирования. Помимо этого, системы данных и системы сообщений могут быть сохранены или переданы посредством носителя передачи данных, такого как сигнал в канале связи.
Могут быть использованы различные каналы связи, например Интернет, локальная сеть, глобальная сеть или двухточечное коммутируемое соединение.
Система ранжирования может быть реализована в различных операционных окружениях. Различные широко распространенные вычислительные системы, окружения и конфигурации, которые могут быть подходящими для использования, включают в себя персональные вычислительные машины, серверные вычислительные машины, "карманные" или "дорожные" устройства, многопроцессорные системы, системы на базе микропроцессоров, программируемую бытовую электронную аппаратуру, сетевые ПЭВМ, мини-ЭВМ, мейнфреймы, распределенные вычислительные окружения, которые содержат любые из вышеуказанных систем или устройств, и т.п.
Система ранжирования может также быть описана в общем контексте составляющих машиноисполняемых инструкций, таких как программные модули, являющиеся исполняемыми одной или более вычислительными машинами или другими устройствами. Как правило, программные модули включают в себя процедуры, программы, объекты, компоненты, структуры данных и т.п., которые выполняют конкретные задачи или реализуют конкретные абстрактные типы данных. Типично, функциональность программных модулей может быть сочетаема или распространена, как требуется в различных вариантах осуществления.
Фиг.2 - блок-схема алгоритма, которая иллюстрирует обработку компонента ранжирования объектов в одном варианте осуществления. Компонент собирает информацию об объектах, устанавливает взаимоотношения между объектами, рассчитывает значения атрибута для объектов и упорядочивает объекты на основе атрибута. На этапе 201 компонент собирает информацию, относящуюся к различным объектам. На этапе 202 компонент активирует компонент установления взаимоотношений, чтобы сгенерировать матрицы смежности. Компонент установления взаимоотношений может также извлекать и настраивать веса и . На этапе 203 компонент активирует компонент вычисления показателей для того, чтобы итеративно вычислять значения атрибута, пока они не сойдутся в решение. На этапе 204 компонент упорядочивает данные объектов на основе значения атрибута. Например, компонент может упорядочить веб-страницы на основе атрибута авторитетного источника.
Фиг.3 - блок-схема алгоритма, которая иллюстрирует обработку компонента установления взаимоотношений в одном варианте осуществления. На этапах 301-303 компонент циклически обрабатывает установление матриц смежности для каждого типа. На этапе 301 компонент выбирает следующий тип. На этапе 302 принятия решения, если все типы уже были выбраны, то компонент осуществляет возврат, иначе компонент переходит к этапу 303. На этапе 303 компонент устанавливает взаимоотношения между объектами выбранного типа и объектами всех типов. Например, компонент установит взаимоотношение между типом авторитетного источника и типом подборки, типом авторитетного источника и типом экспертной оценки. Затем компонент циклически переходит к этапу 301, чтобы выбрать следующий тип.
Фиг.4 - блок-схема алгоритма, которая иллюстрирует обработку вычисления показателей в одном варианте осуществления. Компонент итеративно рассчитывает уравнения, пока значения атрибута не сойдутся. На этапе 401 компонент извлекает взаимоотношения между объектами, представленными матрицами смежности. На этапе 402 компонент извлекает веса и для взаимоотношений между типами и внутри типа. На этапе 403 компонент инициализирует вектор w для каждого типа, чтобы иметь одинаковое значение для каждого объекта этого типа. Компонент может задать каждое значение равным 1/m, где m - количество объектов этого типа. Например, если пользователей 10, то компонент задает первоначальные значения атрибутов для типа экспертной оценки равными 1/10. Компонент также инициализирует переменную разностей для каждого типа с большим значением, так что компонент сначала передаст тест этапа принятия решения 405. Компонент рассчитывает новое значение каждой переменной разностей в конце каждой итерации для определения того, сошлись ли вычисления в решение. На этапах 404-409 компонент выполняет вычисления уравнения 3, пока вычисления не сойдутся в решение. На этапе 404 компонент начинает следующую итерацию. На этапе принятия решения 405, если сумма разностей, вычисленная в ходе последней итерации, меньше, чем порог разностей, то вычисления сошлись в решение, и компонент осуществляет возврат, иначе компонент переходит к этапу 406. На этапе 406 компонент выбирает следующий тип. На этапе 407 принятия решения, если все типы уже были выбраны, то компонент циклически переходит к этапу 404, чтобы начать следующую итерацию, иначе компонент переходит к этапу 408. На этапе 408 компонент вычисляет значения выбранного типа на основе значений, вычисленных на предыдущей итерации. На этапе 409 компонент вычисляет разность между значениями этой итерации и значениями предыдущей итерации для выбранного типа. Затем компонент циклически переходит к этапу 406, чтобы выбрать следующий тип.
Специалист в данной области техники примет во внимание, что хотя конкретные варианты осуществления системы ранжирования были описаны в данном описании с целью иллюстрации, различные модификации могут быть выполнены без отступления от духа и области применения изобретения. Например, специалист в данной области техники примет во внимание, что могут быть использованы нелинейные уравнения, чтобы представить значение атрибута. Кроме того, система ранжирования может быть использована для объектов всех типов, которые имеют определенное взаимоотношение друг с другом. Например, система ранжирования может быть использована для того, чтобы ранжировать университеты на основе "важности", используя взаимоотношения со студентами или кандидатами и профессорами, где университеты, студенты и профессора представляют объекты различных типов. Следовательно, изобретение ограничено только прилагаемой формулой изобретения.
Класс G06F17/30 информационный поиск; структуры баз данных для этой цели