[發(fā)明專利]基于網(wǎng)絡相關度的查詢分類有效
| 申請?zhí)枺?/td> | 201110408165.9 | 申請日: | 2011-12-09 |
| 公開(公告)號: | CN102521341A | 公開(公告)日: | 2012-06-27 |
| 發(fā)明(設計)人: | S.蘇雷什;R.D.伯格 | 申請(專利權(quán))人: | 微軟公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 劉鵬;劉鵬 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 網(wǎng)絡 相關 查詢 分類 | ||
背景技術(shù)
為了向用戶提供更加相關的搜索結(jié)果,將查詢和隨后要對其進行點擊的統(tǒng)一資源定位符(URL)分類到分類索引中。查詢和URL被分配到特定的類別中,這一類別也稱為知識域(knowledge?domain)。知識域一般來說定義了當查詢被送到搜索引擎時用戶正在尋找的主題。
大多數(shù)通用隨機饋入(CRF)分類器使用基于機器的學習,利用否定和肯定查詢來訓練分類器。這一過程使用反復循環(huán)來填充缺少的空隙,并且可能還會花費數(shù)個月來進行發(fā)展。此外,分類器需要頻繁改變或更新,這使得總體處理資源非常昂貴。
發(fā)明內(nèi)容
下面,本發(fā)明的實施方式由權(quán)利要求限定。提供了各種實施方式的高級概述,以介紹將會在下面的具體實施方式部分中進一步詳細介紹的系統(tǒng)、方法、算法和介質(zhì)的概要。本發(fā)明內(nèi)容部分并既不打算用來認定所要求保護的主題的關鍵特征或者基本特征,也不打算用來在確定所要求保護的主題的范圍的時候用作孤立的輔助。
介紹了基于網(wǎng)絡相關度的查詢分類的系統(tǒng)、方法、算法和計算機可讀存儲介質(zhì)。可以是使用現(xiàn)有的網(wǎng)絡結(jié)果來對搜索查詢進行分類。搜索應用程序擁有者可以將他們的應用程序預訂到一個或多個可用的具體知識域。知識域的例子包括,但不局限于,電影、音樂、旅行、新聞、食品和健康。可以將給定的用戶查詢分類到具體的知識域中,例如,基于這個知識域,搜索應用可以最好地完成搜索。
網(wǎng)絡索引相關度受到一組基準點網(wǎng)域的影響,以針對搜索應用觸發(fā)對查詢進行分類。可以針對給定的查詢,對強烈映射到知識域的現(xiàn)有網(wǎng)域進行分析。基于相關結(jié)果的數(shù)量,確定查詢是否很好的映射到網(wǎng)域,并且因此對應于知識域。
針對各個知識域,選擇反映該知識域的至少兩個網(wǎng)站(也稱為種子網(wǎng)域)。針對這些種子網(wǎng)域運行查詢。為每次運行返回頁面計數(shù)。在知識域之間比較這些頁面計數(shù),以確定相對于所有的域,該查詢最有可能與哪個知識域相關。基于這一比較,與知識域相關聯(lián)地對查詢進行分類。每個域的各組分類之后的查詢可以用作輸入到分類器的訓練數(shù)據(jù)。
附圖說明
下面將參照附圖詳細介紹本發(fā)明的說明性實施方式,這些附圖整體地以引用方式并入本文,并且其中:
圖1是圖解說明按照本發(fā)明的實施方式使用的示范性計算機操作系統(tǒng)的框圖;
圖2是圖解說明按照本發(fā)明的實施方式使用的查詢分類系統(tǒng)的框圖;
圖3是按照本發(fā)明的實施方式使用的文檔計數(shù)的矩陣;
圖4是按照本發(fā)明的實施方式使用的應用了文檔縮放系數(shù)(scalar)的矩陣;
圖5是按照本發(fā)明的實施方式使用的對查詢進行分類的方法的流程圖;
圖6是按照本發(fā)明的實施方式使用的過濾搜索結(jié)果的示意圖;
圖7是按照本發(fā)明的實施方式使用的確定查詢分類的方法的流程圖;
圖8是按照本發(fā)明的實施方式使用的覆蓋率(coverage)計算的示意圖;
圖9是按照本發(fā)明的實施方式使用的確定查詢分類的方法的流程圖;和
圖10是按照本發(fā)明的實施方式使用的對查詢進行分類的方法的流程圖。
具體實施方式
本發(fā)明的實施方式提供基于網(wǎng)絡相關度的查詢分類的系統(tǒng)、方法、算法和計算機可讀存儲介質(zhì)。這一具體實施方式部分以及后附的權(quán)利要求滿足適當?shù)姆梢蟆?/p>
術(shù)語步驟、塊等可能在本文中用于暗示所采用方法的不同動作,但是這些術(shù)語不應被理解為表達任何特定的順序,除非明確說明了各個步驟、塊的順序。類似地,術(shù)語模塊等可能在本文中用于暗示所采用系統(tǒng)的不同部件,但是這些術(shù)語不應被理解為表達任何特定的順序,除非明確說明了各個模塊等的順序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟公司,未經(jīng)微軟公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110408165.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡和網(wǎng)絡終端
- 網(wǎng)絡DNA
- 網(wǎng)絡地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡系統(tǒng)及網(wǎng)絡至網(wǎng)絡橋接器
- 一種電力線網(wǎng)絡中根節(jié)點網(wǎng)絡協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡裝置、網(wǎng)絡系統(tǒng)、網(wǎng)絡方法以及網(wǎng)絡程序
- 從重復網(wǎng)絡地址自動恢復的方法、網(wǎng)絡設備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡的訓練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡管理方法和裝置





