[發明專利]一種名稱匹配方法及裝置有效
| 申請號: | 201611055619.8 | 申請日: | 2016-11-25 |
| 公開(公告)號: | CN108108373B | 公開(公告)日: | 2020-09-25 |
| 發明(設計)人: | 孫清清 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 北京晉德允升知識產權代理有限公司 11623 | 代理人: | 楊移 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 名稱 匹配 方法 裝置 | ||
1.一種名稱匹配方法,其特征在于,包括:
獲得待匹配名稱;
確定用于與所述待匹配名稱匹配的標準名稱集合;
對所述待匹配名稱進行檢測,以判定所述待匹配名稱是否與所述標準名稱集合中至少一個名稱同義而字符不全相同;
根據檢測結果,確定所述待匹配名稱的匹配結果;
其中,所述確定用于與所述待匹配名稱匹配的標準名稱集合,具體包括:
確定可用于與所述待匹配名稱匹配的第一名稱集合;
通過將所述待匹配名稱包含的各詞與所述第一名稱集合中名稱包含的各詞進行相似性匹配,確定用于與所述待匹配名稱匹配的標準名稱集合;
進一步地,所述通過將所述待匹配名稱包含的各詞與所述第一名稱集合中名稱包含的各詞進行相似性匹配,確定用于與所述待匹配名稱匹配的標準名稱集合,具體包括:
獲得所述第一名稱集合包含的各名稱的索引,所述名稱的索引為該名稱包含的任一詞;以及
對所述待匹配名稱進行分詞,獲得所述待匹配名稱包含的各詞;
分別將對所述待匹配名稱包含的各詞,與各所述索引進行相似性匹配,獲得由匹配成功的各索引所索引的名稱構成的所述第一名稱集合的子集;
根據各所述子集,確定用于與所述待匹配名稱匹配的標準名稱集合;
所述對所述待匹配名稱進行檢測,具體包括:
對所述待匹配名稱進行縮寫檢測、稱謂詞檢測、多語言檢測、別稱檢測中的至少一種,以判定所述待匹配名稱是否與所述標準名稱集合中至少一個名稱同義而字符不全相同。
2.如權利要求1所述的方法,其特征在于,所述確定用于與所述待匹配名稱匹配的標準名稱集合前,所述方法還包括:
獲得預定的無需匹配名稱集合;
確定所述待匹配名稱未包含在所述無需匹配名稱集合中。
3.如權利要求1所述的方法,其特征在于,所述分別將對所述待匹配名稱包含的各詞,與各所述索引進行相似性匹配,具體包括:
采用字符串匹配算法,分別將對所述待匹配名稱包含的各詞,與各所述索引進行相似性匹配;
所述字符串匹配算法包括以下至少一種:前綴樹匹配算法、字典樹匹配算法、字符串相似度匹配算法、發音相似匹配算法。
4.如權利要求1所述的方法,其特征在于,所述對所述待匹配名稱進行檢測前,所述方法還包括:
根據所述標準名稱集合中名稱包含的各詞與所述待匹配名稱包含的各詞的相似度,對所述標準名稱集合中名稱包含的各詞與所述待匹配名稱包含的各詞進行對齊處理;
所述對所述待匹配名稱進行檢測,具體包括:
根據對齊后的所述標準名稱集合,對所述待匹配名稱進行檢測,以判定所述待匹配名稱是否與所述標準名稱集合中至少一個名稱同義而字符不全相同。
5.如權利要求1所述的方法,其特征在于,所述對所述待匹配名稱進行縮寫檢測,具體包括:
獲得預定的縮寫對照組合數據,每個縮寫對照組合反映至少一個詞與其縮寫詞的縮寫對應關系;
根據所述縮寫對照組合數據,檢測所述待匹配名稱包含的詞與所述標準名稱集合中的名稱包含的詞是否具有所述縮寫對應關系;
根據檢測結果,判定所述待匹配名稱是否與所述標準名稱集合中至少一個名稱同義而字符不全相同。
6.如權利要求1所述的方法,其特征在于,所述對所述待匹配名稱進行稱謂詞檢測,具體包括:
獲得預定的稱謂詞數據;
根據所述稱謂詞數據,檢測所述待匹配名稱是否包含所述稱謂詞,所述稱謂詞被認為不影響包含該稱謂詞的名稱之義;
根據檢測結果,判定所述待匹配名稱是否與所述標準名稱集合中至少一個名稱同義而字符不全相同。
7.如權利要求1所述的方法,其特征在于,所述別稱包括其對應的名稱的昵稱、或其對應的名稱在不同領域下的同義名稱;
所述對所述待匹配名稱進行別稱檢測,具體包括:
對所述待匹配名稱進行昵稱檢測,和/或,對所述待匹配名稱進行不同領域下的同義名稱檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611055619.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據沖突自動校正處理方法及裝置
- 下一篇:一種數據倉庫的存儲方法及裝置





