[發明專利]使用文檔使用統計量的排位函數有效
| 申請號: | 200680034531.6 | 申請日: | 2006-09-20 |
| 公開(公告)號: | CN101268464A | 公開(公告)日: | 2008-09-17 |
| 發明(設計)人: | D·梅耶澤;H·扎拉格扎;K·佩頓納;A·德伯魯納 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海專利商標事務所有限公司 | 代理人: | 陳斌 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 文檔 統計 函數 | ||
1.一種用以確定網絡上文檔的文檔相關性分數的方法,包括:
利用由文檔的用戶查詢所調用的包含一或多個查詢無關分量的排位函數來對網絡上文檔進行排位,其中至少一個查詢無關分量包括考慮到網絡上一或多個文檔的、服務器生成的、服務器存儲的使用數據的使用參數,所述使用數據由網絡存儲系統生成和存儲,所述網絡存儲系統管理和向用戶提供對所述文檔的網絡訪問,所述使用數據包括對實際用戶經由網絡存儲系統與網絡上一個或多個文檔交互的計量,使得文檔的所述使用數據反映了所述文檔被多個用戶通過所述網絡存儲系統的查詢無關交互使用,指派由所述排位函數生成的分數以排位所述網絡上的文檔,所述分數用于按順序排位文檔,
接受用戶輸入的包括搜索串的搜索詢問,進行對所述網絡上的文檔的搜索以生成包括多個文檔的搜索結果,使用所述排位函數排位所述搜索結果的多個文檔以生成經排位的搜索結果,使得所述文檔既根據它們各自的使用數據也根據它們與搜索串的相關性進行排位,并向所述用戶提供所述經排位的搜索結果。
2.如權利要求1所述的方法,其特征在于,文檔的使用值包括(i)基于服務器維護的實際使用數據的實際使用值或者(ii)不是基于實際使用數據的默認使用值。
3.如權利要求1所述的方法,其特征在于,所述至少一個查詢無關分量由下列公式表示:
其中:
U表示實際使用值或默認使用值;以及
wu和ku表示所述使用值的調整參數。
4.如權利要求1所述的方法,其特征在于,所述至少一個查詢無關分?量包括以下兩者:(i)所述使用參數以及(ii)點擊距離或者經偏移的點擊距離參數。
5.如權利要求1所述的方法,其特征在于,所述至少一個查詢無關分量包括所述使用參數和URL深度參數兩者。
6.如權利要求1所述的方法,其特征在于,所述每一文檔的分數是使用以下公式生成的:
其中:
wtf′表示加權的項頻率,
N表示所述網絡上文檔的數量,
n表示包含查詢項的文檔數量,
wcd表示查詢無關分量的權重,
bcd表示點擊距離的權重,
bud表示URL深度的權重,
CD表示文檔的計算出的點擊距離或者被指派的經偏移的點擊距離,
kew表示與邊界權重相關的調整常數,
UD表示URL深度,
U表示實際使用值或默認使用值,
wu和ku表示所述使用值的調整常數,以及
kcd和kl是常數。
7.如權利要求1所述的方法,其特征在于,還包括使管理員能夠手動調整由所述排位函數生成的排位結果。
8.一種用以確定網絡上文檔的文檔相關性分數的方法,包括:
利用包含一或多個查詢無關分量的排位函數來對網絡上文檔進行排位,其中至少一個查詢無關分量包括考慮到網絡上一或多個文檔的、服務?器生成的、服務器存儲的使用數據的使用參數,所述使用數據包括對實際用戶與網絡上一個或多個文檔交互的計量,指派由所述排位函數生成的分數以排位所述網絡上的文檔,所述分數用于按順序排位文檔,其中,所述使用數據包括各文檔的使用值,一個文檔的所述使用值依賴于文檔或包含文檔集合的文件夾的一或多個使用相關性質,所述一或多個使用相關性質包括在給定時間段內用戶的文檔或文件夾查看總數、在給定時間段內每用戶的文檔或文件夾查看平均數、在給定時間段內在特定文檔或文件夾上花費的總時間、在給定時間段內在特定文檔或文件夾上花費的平均時間,其中所述給定時間段包括上個星期內、上個月、去年一年內、所述文檔或文件夾的生存期內或者任何其它時間段。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680034531.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:應用于電子設備的信號電纜
- 下一篇:聯合收割機





