[發明專利]網頁搜索結果排序方法及裝置有效
| 申請號: | 201210075938.0 | 申請日: | 2012-03-21 |
| 公開(公告)號: | CN102737090A | 公開(公告)日: | 2012-10-17 |
| 發明(設計)人: | 袁行遠;龔穎坤 | 申請(專利權)人: | 袁行遠 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 王申 |
| 地址: | 100024 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁 搜索 結果 排序 方法 裝置 | ||
1.一種網頁搜索結果排序方法,其特征在于,包括:
搜索引擎根據用戶輸入的查詢詞搜索出多個相關的網頁;
獲取所述網頁的發布者的全網統一的用戶標識P及所述網頁的網頁信息I;
計算所述P及所述I的信息量和相關度;
根據所述信息量和相關度計算得到所述I的信息質量得分;
按照所述信息質量得分從大到小的順序排列相應的網頁。
2.根據權利要求1所述的方法,其特征在于,計算所述P及所述I的信息量包括:
第i個用戶標識Pi的信息量E(Pi)=0;
第i個網頁信息Ii的信息量E(Ii)=log(Ii的字節數)。
3.根據權利要求2所述的方法,其特征在于,計算所述P及所述I的相關度包括:
計算每兩個網頁信息I之間的互相關信息量
計算每兩個用戶標識P之間的互相關信息量
計算每個用戶標識P與各個網頁信息I之間的互相關信息量
計算每個網頁信息I與各個用戶標識P之間的互相關信息量
其中,m表示所述發布者的數量,n表示所述網頁的數量,S’表示任意兩個P、I之間的臨時相關度,其中,
。
4.根據權利要求3所述的方法,其特征在于,根據所述信息量和相關度計算得到所述I的信息質量得分包括:
根據所述信息量和相關度構建以所述P的標識質量得分r(Pi)為元素的標識質量得分向量rp=(1-α)PP·rp+(1-α)IP·ri以及以所述I的信息質量得分r(Ii)為元素的信息質量得分;ri=α·ri0+(1-α)PI·rp+(1-α)II·ri
求解由所述第一表達式和第二表達式聯立而成的向量方程組得到所述標識質量得分;
其中,ri0表示初始信息量,PP表示P與P之間的相關度矩陣;IP表示I與P之間的相關度矩陣;PI表示P與I之間的相關度矩陣;II表示I與I之間的相關度矩陣;α為比例參數。
5.一種網頁搜索結果排序裝置,其特征在于,包括:
搜索引擎,用于根據用戶輸入的查詢詞搜索出多個相關的網頁;
獲取模塊,用于獲取由搜索引擎搜索出的所述網頁的發布者的全網統一的用戶標識P及所述網頁的網頁信息I;
第一計算模塊,用于計算由獲取模塊得到的所述P及所述I的信息量和相關度;
第二計算模塊,用于根據由第一計算模塊得到的所述信息量和相關度計算得到所述I的信息質量得分;
排序模塊,用于按照由第二計算模塊得到的所述信息質量得分從大到小的順序排列相應的網頁。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于袁行遠,未經袁行遠許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210075938.0/1.html,轉載請聲明來源鉆瓜專利網。





