[發(fā)明專利]使用文檔使用統(tǒng)計量的排位函數(shù)有效
| 申請?zhí)枺?/td> | 200680034531.6 | 申請日: | 2006-09-20 |
| 公開(公告)號: | CN101268464A | 公開(公告)日: | 2008-09-17 |
| 發(fā)明(設(shè)計)人: | D·梅耶澤;H·扎拉格扎;K·佩頓納;A·德伯魯納 | 申請(專利權(quán))人: | 微軟公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 | 代理人: | 陳斌 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 使用 文檔 統(tǒng)計 函數(shù) | ||
背景技術(shù)
按照文檔與給定搜索查詢的相關(guān)性排列文檔的排位函數(shù)是已知的。在本領(lǐng)域中仍在努力開發(fā)針對給定搜索查詢提供優(yōu)于由使用已知排位函數(shù)的搜索引擎產(chǎn)生的搜索結(jié)果的搜索結(jié)果的排位函數(shù)。
發(fā)明內(nèi)容
在此主要描述用于在網(wǎng)絡(luò)上確定給定文檔的文檔相關(guān)性分?jǐn)?shù)的各種技術(shù)。文檔相關(guān)性分?jǐn)?shù)是通過排位函數(shù)產(chǎn)生的,該排位函數(shù)包括一或多個查詢無關(guān)分量,其中至少一個查詢無關(guān)分量包括使用參數(shù),該參數(shù)考慮在web服務(wù)器上維護與存儲的、用于網(wǎng)絡(luò)上一或多個文檔的實際文檔使用數(shù)據(jù)。排位函數(shù)可由搜索引擎使用,以基于多個文檔的文檔相關(guān)性分?jǐn)?shù)按序(通常按降序)排列多個文檔。
提供本發(fā)明內(nèi)容,它以簡化的形式向讀者一般地介紹在下面“具體實施方式”中描述的一或多個選擇的概念。本發(fā)明內(nèi)容不是要標(biāo)識要求保護主題的關(guān)鍵和/或必要特征。
附圖說明
圖1表示示出一方法的示例性步驟的示例性邏輯流程圖,該方法響應(yīng)于用戶輸入的搜索查詢產(chǎn)生經(jīng)排列的搜索結(jié)果;
圖2是一些用于實現(xiàn)在此揭示的方法和過程的示例性操作環(huán)境的主要組件的框圖;
圖3表示示出一示例性方法的示例性步驟的邏輯流程圖,該方法用于確定網(wǎng)絡(luò)上文檔的文檔相關(guān)性分?jǐn)?shù);以及
圖4表示示出一方法的示例性步驟的邏輯流程圖,該方法使用包含文檔使用參數(shù)的排位函數(shù)排列生成的搜索結(jié)果。
具體實施方式
為加強對在此揭示的方法和過程的原理的理解,使用下面的特定實施例的描述和特定語言來描述這些特定實施例。然而將會理解,使用特定語言不是要限制所揭示方法和過程的范圍。對所討論的揭示方法和過程的原理的改變、進一步修改以及這類進一步應(yīng)用,對于被揭示方法和過程所屬領(lǐng)域的技術(shù)人員而言,都是在正常的預(yù)期范圍內(nèi)的。
揭示了確定網(wǎng)絡(luò)上文檔的文檔相關(guān)性分?jǐn)?shù)的方法。每一文檔相關(guān)性分?jǐn)?shù)是使用排位函數(shù)計算的,希望該排位函數(shù)包含一或多個查詢無關(guān)分量(例如,不依賴于給定搜索查詢或搜索查詢項的函數(shù)分量),一或多個查詢相關(guān)分量(例如,依賴于給定搜索查詢或搜索查詢項的細(xì)節(jié)的函數(shù)分量),或者兩者的組合。由排位函數(shù)確定的文檔相關(guān)性分?jǐn)?shù)可用于按照每一文檔相關(guān)性分?jǐn)?shù)排列網(wǎng)絡(luò)空間(例如公司內(nèi)聯(lián)網(wǎng)空間)內(nèi)的文檔。可使用揭示方法的示例性搜索過程示出作為在圖1中的示例性過程10。
圖1描繪示例性搜索過程10,它從過程步驟80開始,其中用戶輸入搜索查詢。從步驟80,示例性搜索過程10進行至步驟200,其中搜索引擎為一或多個搜索查詢項搜索網(wǎng)絡(luò)空間內(nèi)的所有文檔。從步驟200,示例性搜索過程10進行至步驟300,其中搜索引擎的排位函數(shù)基于每一文檔的相關(guān)性分?jǐn)?shù)排列網(wǎng)絡(luò)空間內(nèi)的文檔,而文檔相關(guān)性分?jǐn)?shù)則基于一或多個查詢無關(guān)分量、一或多個查詢相關(guān)分量或兩者的組合。從步驟300,示例性搜索過程10進行至步驟400,其中向用戶呈現(xiàn)經(jīng)排列的搜索結(jié)果,這一呈現(xiàn)通常按照降序以標(biāo)識網(wǎng)絡(luò)空間內(nèi)與搜索查詢最相關(guān)的文檔。
如下面更詳細(xì)地討論的,在確定文檔相關(guān)性分?jǐn)?shù)的一些示例性方法中,用于確定文檔相關(guān)性分?jǐn)?shù)的排位函數(shù)的至少一個查詢無關(guān)分量考慮與網(wǎng)絡(luò)空間內(nèi)一或多個用戶對一或多個文檔實際使用相關(guān)的“文檔使用數(shù)據(jù)”或“文檔使用統(tǒng)計量”。文檔使用數(shù)據(jù)和/或統(tǒng)計量是由獨立于給定搜索引擎的web服務(wù)器上的應(yīng)用程序代碼生成和存儲的。例如,文檔使用數(shù)據(jù)可由網(wǎng)站維護,使得每當(dāng)用戶請求URL時,服務(wù)器就更新使用計數(shù)。使用計數(shù)器可以維護在給定時間間隔獲得的文檔相關(guān)數(shù)據(jù),這一給定時間間隔諸如可以是上個星期內(nèi)、上個月、去年一年內(nèi)、或者給定文檔或文檔集合的生存期內(nèi)。應(yīng)用程序代碼可用于通過(i)特殊的應(yīng)用編程接口(API),(ii)web服務(wù)請求,或者(iii)請求返回網(wǎng)站上每一URL的使用數(shù)據(jù)的管理網(wǎng)頁來從網(wǎng)站獲得使用數(shù)據(jù)。
特定的網(wǎng)站可用于生成和維護網(wǎng)絡(luò)空間內(nèi)的使用數(shù)據(jù),并且在本地或遠程存儲系統(tǒng)中存儲使用數(shù)據(jù)。用于生成、維護和存儲網(wǎng)絡(luò)空間內(nèi)文檔的使用數(shù)據(jù)的合適網(wǎng)站包括但不限于WINDOWSSHAREPOINTServices(服務(wù))站點。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟公司,未經(jīng)微軟公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680034531.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 統(tǒng)計系統(tǒng)、統(tǒng)計裝置和統(tǒng)計方法
- 人數(shù)統(tǒng)計方法和人數(shù)統(tǒng)計系統(tǒng)
- 統(tǒng)計物體數(shù)量的統(tǒng)計系統(tǒng)
- 網(wǎng)絡(luò)處理器的統(tǒng)計計數(shù)方法
- 統(tǒng)計信息上報方法及裝置
- 稿件統(tǒng)計方法和稿件統(tǒng)計系統(tǒng)
- 數(shù)據(jù)統(tǒng)計方法及裝置
- 獲取數(shù)據(jù)的統(tǒng)計狀態(tài)的方法及裝置
- 信息統(tǒng)計方法和信息統(tǒng)計裝置
- 電量統(tǒng)計系統(tǒng)及電量統(tǒng)計方法





