[發明專利]基于實體的搜索和解析有效
| 申請號: | 201210585004.1 | 申請日: | 2012-12-28 |
| 公開(公告)號: | CN103064954B | 公開(公告)日: | 2016-11-30 |
| 發明(設計)人: | A.K.錢德拉;O.J.達布羅夫斯基;D.J.格梅爾;B.魯賓斯坦 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 王英 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 實體 搜索 解析 | ||
背景技術
給定搜索查詢字符串,Web搜索引擎傳統上返回超鏈接的列表,所述超鏈接在選擇之后鏈接到被認為與輸入搜索查詢相關的Web上的頁面。最近,搜索引擎結果頁面通常經由垂直信息域名而常常還包括更豐富的內容。隨著這個趨勢繼續,搜索將會聚到一點,其中,信息的索引和檢索不僅相對于Web頁面被執行,而且還相對于諸如(例如,來自應用市場的)應用、電影、電視節目、人、名人、事件、城市、飯店、劇場、公司等而被執行。為了浮現實體,搜索引擎必須爬取(crawl)多個非結構化Web頁面和/或訂閱關于特定實體類型的結構化提要,解析橫跨這個多源數據的實體的實例,以及在用戶的意圖指的是所述實體和/或它的實體類型時浮現所述(歸并的)實體的表示。執行如下操作的需要使得與索引和搜索實體相關聯的并發癥更加復雜,所述操作為:基于近似描述來檢索實體;檢索實體的廣泛集合——其中的一些可能不通過查詢字符串直接地描述;基于不流行的源中的實體的描述從流行的源中檢索關于其的元數據;一般地組合橫跨多個源的被索引的實體的特征和排名;對實體執行分面搜索;以及一般地通過將來自多個網頁的信息整合成復合整體來執行整合搜索。
對實體搜索問題的現有技術解決方法都可以被歸類成兩個方法中的一個,每個方法都遭受著各自的缺點。最初,專用于單一信息垂直的垂直引擎結果頁面(VERP)常常根據包含基本實體屬性的索引對單一類型的實體(例如,電影實體)的集進行搜索。這樣的解決方法在提供了未出現在索引中的語義上相關的文本或模糊不清的描述的查詢上會失效(例如,查詢“movie?with?a?sinking?boat?starring?DiCaprio?(?DiCaprio主演的沉船的電影)”可能不返回電影“Titanic(泰坦尼克)”,或者查詢“Batman(蝙蝠俠)”可能不返回電影“The?Dark?Knight(黑暗騎士)”)。第二種通用的方法使用Web搜索,Web搜索具有利用了Web鏈接結構和錨文本的相關術語的大型索引的優點,其包括強大的意圖分析,以及使用了自動拼寫校正。此方法的缺點是如果被索引的頁面未用實體進行解析,則由VERP提供的豐富的內容可能根本不會被浮現。而且,因為被索引的頁面未針對彼此被解析,即使豐富的內容被檢索,鏈接到相同基本實體的實例的大量結果可能被一起檢索,消弱了結果的多樣性。
發明內容
本發明內容被提供來以簡化的形式介紹概念的選擇,這些概念在下面的具體實施方式中被進一步描述。本發明內容既不打算識別所要求保護的主題的關鍵特征或必要特征,也不打算被用來幫助確定所要求保護的主題的范圍。
本發明的實施例涉及尤其用于整合垂直搜索的優點和Web搜索的優點以便利用實體類型表征來提供豐富的搜索體驗的系統、方法以及計算機可讀存儲媒體。搜索查詢被接收并且實體類型針對所述查詢被確定。針對所述查詢的Web搜索然后針對確定為對于已確定的實體類型是權威的源的預定列表被執行。雖然某個源對所述實體類型可能是權威的,但是它還可以包括針對其它實體類型的信息,以及同樣地,識別與多個實體類型相關的結果。因此,源特定搜索的結果基于所述實體類型而被過濾,提供了結果的經過濾的列表,所述結果各與確定為與所述查詢相關聯的實體類型的實體有關。所述經過濾的列表然后被與解析的實體的列表相比較以確定由不同的搜索到的源所識別的等同實體,所述等同實體被組合成單個潛在的搜索結果。所述合并的搜索結果然后基于排名值被排序。被分配給合并的實體的所述排名值是從針對來自不同源的實體而提供的單獨的排名值所計算的合計排名值。所述結果的至少一部分然后被呈現給用戶。
附圖說明
本發明作為例子被示出并且不限于附圖,其中,相同的附圖標記指示相似的單元,以及其中:
圖1是適合于在實施本發明的實施例中使用的示范性計算環境的方塊圖;
圖2是其中本發明的實施例可以被利用的示范性計算系統的方塊圖;
圖3是示出了根據本發明的實施例的、源特定搜索的結果的示范性屏幕顯示的示意圖;
圖4是示出了當實體搜索根據本發明的實施例被實施時,演示了為什么過濾有時被認為是必要的示范性屏幕顯示的示意圖;
圖5是示出了根據本發明的實施例所實施的實體搜索的示范性屏幕顯示的示意圖;
圖6是示出了根據本發明的實施例所實施的另一實體搜索的示范性屏幕顯示的示意圖;
圖7是圖示了根據本發明的實施例所實施的整合搜索的結果的示范性呈現的屏幕顯示的示意圖;
圖8A和圖8B是圖示了根據本發明的實施例的、分面實體搜索的示范性呈現的屏幕顯示的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210585004.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:無線交通工具
- 下一篇:可固化的含氟彈性體組合物





