[發明專利]實體名稱匹配有效
| 申請號: | 201110329092.4 | 申請日: | 2011-10-26 |
| 公開(公告)號: | CN102385625A | 公開(公告)日: | 2012-03-21 |
| 發明(設計)人: | C.約翰斯頓 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 謝建云;劉鵬 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 名稱 匹配 | ||
背景技術
諸如商業企業清單(例如黃頁)、基于搜索引擎的目錄等在線目錄允許在線用戶搜尋和標識期望的實體(例如要光顧的本地企業)。另外,受雇專家、客戶或者其他各方可以提交在線評論,其中評論者可以提及實體并且描述他們對實體的體驗或者意見(例如飯店或者產品評論)。此外,博客者、記者或者其它編輯人士可以提交關于實體的在線信息、報道等,其中提到實體的名稱。然而實體名稱(比如企業)經??赡茉趦蓚€或者更多目錄、博客、評論或者報道之間無統一標識。例如當目錄可以將圖書館標識為Depot?Street?Library?Branch?in?Medina(Depot街圖書館中部分館)時,在線博客可以僅將它稱為Medina?Branch?Library(圖書館中部分館)。另外可能有相似但是混淆名稱的不同類型的另一實體(比如Library?Street?Depot(圖書館街Depot)(例如酒吧))。
發明內容
提供這一發明內容以簡化形式介紹下文在具體實施方式中進一步描述的所選概念。這一發明內容并非目的在于標識所要求主題的關鍵因素或者基本特征、也并非目的在于用來限制要求主題的范圍。
匹配實體名稱(比如在目錄中或者來自多個目錄/位置的企業名稱)對于涉及到實體名稱的記錄鏈接系統而言可能頗為重要。實體名稱匹配可能是未對僅基于字符或者基于標記的方式有良好響應的困難問題。當前或者現有技術嘗試通過在經歷匹配的兩個(或者更多)名稱之間匹配字符或者標記來匹配名稱。也就是說,例如將串匹配算法通常應用于兩個名稱(比如“Matt’s?Restaurant(Matt的飯店)”和“Matt’s?Bar?and?Grill(Matts酒吧和烤肉店)”)以確定它們是否可能是相同實體。
另外,當前或者現有技術嘗試使用完全基于知識的方式來匹配實體名稱。這一技術通常由于各類文字中的企業名稱表述的大量自然變化而未良好地起作用。也就是說,例如相對于包括多個企業名稱和關聯的企業類型的數據庫來匹配實體的名稱。然而僅使用這一方式可能需要巨型數據庫,并且由于名稱使用方式的變化而可能未提供充分的結果。
因而公開一種或者多種使用小型知識庫從實體名稱表述(例如在目錄、博客、評論等中)中提取可以表明實體類型(例如企業類型、比如服務、零售、食品等)的實體類別信號的技術和/或系統。另外可以對實體名稱的其余部分(例如非類別信號的部分)使用基于串或者標記的匹配方式。利用這一方式,可以匹配廣泛多種類型的實體名稱表述、從例如在線目錄清單數據庫中的正規表述到例如博客或者評論文字中的隨意企業表述。
在用于匹配實體名稱的一個實施例中,在第一實體名稱(比如目錄中的企業名稱)與第二實體名稱(比如來自在線評論的另一企業名稱)之間執行匹配分析。該匹配分析可以包括比較已經修改到第一實體名稱中的第一實體類別描述符與已經修改到第二實體名稱中的第二實體類別描述符。
為了實現前述和有關目的,下文描述和附圖闡述某些示例方面和實現。這些僅僅是其中可以采用一個或者多個方面的各種方式中的僅少數方式的指示。本公開內容的其它方面、優點和新穎特征將根據在與附圖結合考慮時的下文具體實施方式而變得清楚。
附圖說明
圖1是用于匹配實體名稱的示例方法的流程圖。
圖2是圖示了這里描述的一種或者多種方法的一個或者多個部分的一個實施例的流程圖。
圖3是這里描述的一種或者多種技術的一個實施例的流程圖。
圖4圖示了其中可以利用一種或者多種技術和/或系統的一個或者多個示例實施例。
圖5圖示了其中可以利用一種或者多種技術和/或系統的一個或者多個示例實施例。
圖6是用于匹配實體名稱的示例系統的部件圖。
圖7圖示了這里描述的一種或者多種系統的一個示例實施例的部件圖。
圖8是示例計算機可讀介質的圖示,該計算機可讀介質包括被配置成具體實施這里闡述的一種或者多種規定的處理器可執行指令。
圖9圖示了其中可以實現這里闡述的一種或者多種規定的示例計算環境。
具體實施例
現在參照其中相似標號用來通篇指代相似單元的附圖來描述所要求的主題。在下文描述中,出于說明的目的而闡述諸多具體細節以便提供對要求主題的透徹理解。然而可以清楚的是,可實現所要求的主題而無需這些具體細節。在其它實例中,以框圖形式示出了結構和設備以便有助于描述所要求的主題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110329092.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息顯示設備
- 下一篇:過濾器完整性監測系統





