[發(fā)明專利]實(shí)體名稱匹配有效
| 申請?zhí)枺?/td> | 201110329092.4 | 申請日: | 2011-10-26 |
| 公開(公告)號: | CN102385625A | 公開(公告)日: | 2012-03-21 |
| 發(fā)明(設(shè)計(jì))人: | C.約翰斯頓 | 申請(專利權(quán))人: | 微軟公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 謝建云;劉鵬 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 實(shí)體 名稱 匹配 | ||
1.一種用于匹配實(shí)體名稱的基于計(jì)算機(jī)的方法(100),包括:
在第一實(shí)體名稱與第二實(shí)體名稱之間執(zhí)行匹配分析包括將修改到所述第一實(shí)體名稱的第一實(shí)體類別描述符與修改到所述第二實(shí)體名稱的第二實(shí)體類別描述符進(jìn)行比較(106)。
2.根據(jù)權(quán)利要求1所述的方法,包括以下中的一個(gè)或者多個(gè):
將所述第一實(shí)體類別描述符修改到所述第一實(shí)體名稱中;以及
將所述第二實(shí)體類別描述符修改到所述第二實(shí)體名稱中。
3.根據(jù)權(quán)利要求1所述的方法,包括:針對相應(yīng)實(shí)體名稱,
將所述實(shí)體名稱分解成一個(gè)或者多個(gè)潛在類別信號;以及
相對于已知類別信號的知識庫來比較相應(yīng)類別信號以標(biāo)識用于所述類別信號的對應(yīng)類別描述符。
4.根據(jù)權(quán)利要求3所述的方法,包括以下中的一個(gè)或者多個(gè):
將所述第一實(shí)體類別描述符修改到所述第一實(shí)體名稱中包括將所述第一實(shí)體名稱中的所述類別信號替換為所標(biāo)識的對應(yīng)類別描述符;以及
將所述第二實(shí)體類別描述符修改到所述第二實(shí)體名稱中包括將所述第二實(shí)體名稱中的所述類別信號替換為所標(biāo)識的對應(yīng)類別描述符。
5.根據(jù)權(quán)利要求3所述的方法,
所述實(shí)體名稱包括企業(yè)實(shí)體名稱;
所述類別描述符包括企業(yè)類型類別;以及
所述類別信號包括描述所述企業(yè)類型類別中的企業(yè)的串。
6.根據(jù)權(quán)利要求1所述的方法,將修改到所述第一實(shí)體名稱的第一實(shí)體類別描述符與修改到所述第二實(shí)體名稱的第二實(shí)體類別描述符進(jìn)行比較包括確定在類別樹中在所述第一實(shí)體類別描述符與所述第二實(shí)體類別描述符之間的距離。
7.根據(jù)權(quán)利要求1所述的方法,將修改到所述第一實(shí)體名稱的第一實(shí)體類別描述符與修改到所述第二實(shí)體名稱的第二實(shí)體類別描述符進(jìn)行比較包括確定實(shí)體類型是否可以均包括在所述第一實(shí)體類別描述符的第一實(shí)體類別和所述第二實(shí)體類別描述符的第二實(shí)體類別中。
8.根據(jù)權(quán)利要求1所述的方法,在第一實(shí)體名稱與第二實(shí)體名稱之間執(zhí)行匹配分析包括將所述第一實(shí)體名稱的串元素與所述第二實(shí)體名稱的串元素進(jìn)行比較。
9.根據(jù)權(quán)利要求8所述的方法,包括如果在修改到所述第一實(shí)體名稱的所述第一實(shí)體類別描述符與修改到所述第二實(shí)體名稱的所述第二實(shí)體類別描述符之間標(biāo)識到匹配,則比較串元素。
10.根據(jù)權(quán)利要求1所述的方法,包括通過添加無類別描述符來修改所述第一和第二實(shí)體名稱中的一個(gè)或者多個(gè),其中所述無類別描述符包括通配符。
11.根據(jù)權(quán)利要求1所述的方法,包括通過向所述實(shí)體名稱添加所述實(shí)體類別描述符來將所述實(shí)體類別描述符修改到所述實(shí)體名稱中,其中所述實(shí)體類別描述符對應(yīng)于知識庫中的所述實(shí)體名稱。
12.一種用于匹配實(shí)體名稱的系統(tǒng)(600),包括:
存儲器部件(602),配置成存儲包括實(shí)體類別描述符和相關(guān)聯(lián)的類別信號的知識庫;
名稱修改部件(604),可與所述存儲器部件操作耦合并且配置成用來自所述知識庫的實(shí)體類別描述符來修改實(shí)體名稱;以及
類別匹配部件(606),可與所述名稱修改部件操作耦合并且配置成通過將第一修改的實(shí)體名稱中的第一實(shí)體類別描述符與第二修改的實(shí)體名稱中的第二實(shí)體類別描述符進(jìn)行比較來確定第一實(shí)體名稱是否匹配第二實(shí)體名稱。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),包括:串匹配部件,配置成如果所述類別匹配部件標(biāo)識匹配,則通過比較所述第一實(shí)體名稱的串元素與所述第二實(shí)體名稱的串元素來確定所述第一實(shí)體名稱是否匹配所述第二實(shí)體名稱。
14.根據(jù)權(quán)利要求12所述的系統(tǒng),所述知識庫包括多個(gè)實(shí)體類別描述符,其中相應(yīng)的實(shí)體類別描述符對應(yīng)于一個(gè)或者多個(gè)類別信號。
15.根據(jù)權(quán)利要求12所述的系統(tǒng),所述名稱修改部件包括:
分解部件,配置成將所述實(shí)體名稱分解成一個(gè)或者多個(gè)潛在類別信號;以及
信號比較部件,配置成相對于包括已知類別信號的所述知識庫來比較相應(yīng)類別信號以標(biāo)識用于所述類別信號的對應(yīng)類別描述符。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟公司,未經(jīng)微軟公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110329092.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種實(shí)體關(guān)系識別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲介質(zhì)
- 基于實(shí)體對齊的屬性融合方法、裝置、設(shè)備及存儲介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲介質(zhì)





