[發(fā)明專利]實體卡的實體檢測和提取在審
| 申請?zhí)枺?/td> | 201610943349.8 | 申請日: | 2011-06-09 |
| 公開(公告)號: | CN107103018A | 公開(公告)日: | 2017-08-29 |
| 發(fā)明(設(shè)計)人: | F·拉德林斯基;N·克拉斯韋爾;B·比勒貝克;M·紹庫希;S·阿哈里;N·阿格拉沃爾;T·霍德;S·周;M·A·阿萬 | 申請(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 永新專利商標(biāo)代理有限公司72002 | 代理人: | 張立達(dá),王英 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 實體 檢測 提取 | ||
本申請是申請日為2011/06/09、申請?zhí)枮?01110164789.0、發(fā)明名稱為“實體卡的實體檢測和提取”的中國專利申請的分案申請。
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及網(wǎng)絡(luò)技術(shù)中搜索查詢技術(shù)。
背景技術(shù)
搜索引擎被用于查找各種類型的信息。盡管將鏈接列表返回給相關(guān)文檔如今是一種熟悉的格式,但這并不一定是方便的格式。為了找到特定的某條信息,用戶通常必需點進(jìn)鏈接來查看對應(yīng)的文檔。如果所需信息不在用戶所訪問的第一篇文檔中,則用戶可能需要多次重復(fù)這一過程。
發(fā)明內(nèi)容
在各實施例中,提供了用于檢測包含在搜索結(jié)果內(nèi)的實體信息的系統(tǒng)和方法。可使用所檢測的實體信息來確定搜索結(jié)果內(nèi)的實體類別以及具體實體。可從與搜索結(jié)果相關(guān)聯(lián)的文檔中提取實體信息。這一信息可被用作實體卡的信息的一部分,可向用戶顯示該信息結(jié)合搜索結(jié)果和/或代替搜索結(jié)果。
提供本發(fā)明內(nèi)容以便以簡化形式介紹將在以下的具體實施方式中進(jìn)一步描述的一些概念。該發(fā)明內(nèi)容不旨在標(biāo)識所要求保護(hù)的主題的關(guān)鍵特征或本質(zhì)特征,也不旨在獨立地用于幫助確定所要求保護(hù)的主題的范圍。
附圖說明
下面將參考附圖詳細(xì)描述本發(fā)明,其中:
圖1是適用于實現(xiàn)本發(fā)明的各實施例的示例性計算環(huán)境的框圖。
圖2示意性地示出適用于執(zhí)行本發(fā)明的實施例的系統(tǒng)的示例。
圖3描繪了根據(jù)本發(fā)明的實施例的方法的流程圖。
圖4描繪了根據(jù)本發(fā)明的實施例的方法的流程圖。
圖5描繪了根據(jù)本發(fā)明的實施例的方法的流程圖。
具體實施方式
概覽
在各實施例中,當(dāng)接收到搜索查詢,搜索引擎可生成多個搜索結(jié)果。隨后可分析由搜索引擎生成的結(jié)果,以標(biāo)識由該結(jié)果指示的實體類別。這一標(biāo)識可部分地基于該結(jié)果中一個或多個面向類別的站點的標(biāo)識。可進(jìn)一步分析該結(jié)果,以確定意圖實體。基于意圖實體,可準(zhǔn)備對應(yīng)于該實體的實體卡并與搜索結(jié)果一起顯示。可任選地,可基于期望實體來排除對所生成的搜索結(jié)果中的一個或多個的顯示、或?qū)⑵浜喜⒌綄嶓w卡中。
在以下討論中,實體卡是指增強(qiáng)的實體專用的信息呈現(xiàn)。實體卡可包括關(guān)于實體的各種類型的信息。實體卡可允許響應(yīng)于搜索查詢來向用戶呈現(xiàn)這些信息,使得用戶不需要篩選文檔鏈接來獲得該信息。
類別模板
確定與搜索查詢相關(guān)聯(lián)的用戶意圖可引起各種問題。一種用于標(biāo)識用戶意圖的方法可以是確定搜索查詢是否與實體相關(guān)。實體可以指代諸如作者、政治家或運動員等類型的個人;諸如電影、書、或消費品等類型的產(chǎn)品;或諸如餐廳、旅館、娛樂區(qū)或零售商店等類型的地方。然而,標(biāo)識與搜索查詢相關(guān)的實體也造成了困難。許多常規(guī)方法試圖建立可與搜索查詢中的項進(jìn)行匹配的實體列表。將這些列表保持最新可能是困難的且耗時的。另外,與搜索查詢相關(guān)的實體可能沒有被包括在搜索項中。
在各實施例中,實體信息可基于響應(yīng)于搜索查詢的搜索結(jié)果來動態(tài)地確定。可部分地基于標(biāo)識來自已知與特定類別對應(yīng)的文檔的搜索結(jié)果來標(biāo)識實體。存在試圖跟蹤各種實體的當(dāng)前狀態(tài)的許多網(wǎng)站。例如,跟蹤電影、旅館、消費電子產(chǎn)品或書的多個web位置是可用的。這些站點可被稱為面向類別的站點。面向類別的站點通常跟蹤感興趣的具體類別中的當(dāng)前發(fā)展,并可由此提供關(guān)于類別內(nèi)的實體的當(dāng)前信息。面向類別的站點的數(shù)量和/或身份通常隨時間緩慢改變,因此將適當(dāng)?shù)恼军c標(biāo)識為與類別相關(guān)可能是可管理的任務(wù)。與統(tǒng)一資源定位符(URL)相關(guān)聯(lián)且來自這些站點中的一個站點的文檔與類別相關(guān)聯(lián)的可能性可能增加。
對于來自面向類別的站點的文檔,可構(gòu)造一個或多個類別模板。位于面向類別的站點的文檔結(jié)構(gòu)在站點上所描述的實體之間常常是一致的。可使用呈現(xiàn)的一致性來構(gòu)造用于從站點提取信息的模板。例如,提供關(guān)于電影的信息的面向類別的站點通常將具有一致的呈現(xiàn)格式。電影導(dǎo)演將按特定方式來標(biāo)注,諸如標(biāo)注在文檔中的特定地方、或使用與導(dǎo)演姓名相鄰的和/或在其上面的標(biāo)題“導(dǎo)演”來標(biāo)注。可使用期望的呈現(xiàn)格式來構(gòu)造用于從文檔提取信息的模板。注意,站點可被認(rèn)為是超過一個類別的面向類型的站點。例如,在線零售商可出售包括消費電子產(chǎn)品、DVD以及計算機(jī)游戲等產(chǎn)品。該在線零售商可具有與這些領(lǐng)域中的每一領(lǐng)域?qū)?yīng)的一個或多個URL組件。由此,取決于搜索查詢,來自在線零售商的文檔的外觀可與電影類別、游戲類別或消費品類別對應(yīng)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610943349.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





