[發(fā)明專利]一種解析組織機構名的方法和裝置有效
| 申請?zhí)枺?/td> | 201410079740.9 | 申請日: | 2014-03-06 |
| 公開(公告)號: | CN104899213B | 公開(公告)日: | 2018-06-05 |
| 發(fā)明(設計)人: | 高陽 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權代理事務所(普通合伙) 11412 | 代理人: | 倪志華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 組織機構 匹配 方法和裝置 解析 名稱提取 預先建立 地址庫 正整數(shù) 字符串 預設 記錄 刪除 | ||
1.一種解析組織機構名的方法,其特征在于,針對組織機構名執(zhí)行:
S1、提取前N1個字符,所述N1為預設的正整數(shù);
S2、將當前提取的字符與預先建立的地址MAP中的key進行匹配,如果存在匹配的key,則執(zhí)行S3;如果不存在匹配的key,則執(zhí)行S4;
S3、記錄所述MAP中匹配到的key所對應的value中的地區(qū)名稱,將該地區(qū)名稱從所述組織機構名中刪除后,針對剩余的字符串轉至執(zhí)行所述S1;
S4、將當前已記錄的所述組織機構名中的地區(qū)名稱構成所述組織機構名的地區(qū)部分,所述組織機構名的其他部分作為機構名部分;
其中,所述MAP中的key是從地址庫中地區(qū)名稱提取的前N1個字符,value包含對應key所來源的地區(qū)名稱。
2.根據(jù)權利要求1所述的方法,其特征在于,預先建立所述MAP的過程包括對地址庫中的各地區(qū)名稱分別執(zhí)行:
清除地區(qū)名稱中的地區(qū)公共關鍵詞;
提取剩余的字符的前N1個字符作為key,將該地區(qū)名稱包含在該key對應的value中。
3.根據(jù)權利要求1所述的方法,其特征在于,預先建立所述MAP的過程包括對地址庫中的各地區(qū)名稱分別執(zhí)行:
清除地區(qū)名稱中的地區(qū)公共關鍵詞;
若該地區(qū)名稱中剩余的字符個數(shù)小于或等于所述N1,則直接將該剩余的字符作為key,將該地區(qū)名稱包含在該key對應的value中;
若該地區(qū)名稱中剩余的字符個數(shù)大于所述N1,則提取該剩余的字符的前N2個字符作為key,將該地區(qū)名稱包含在該key對應的value中,所述N2為預設的正整數(shù)且大于所述N1。
4.根據(jù)權利要求3所述的方法,其特征在于,在所述S1中提取前N1個字符之前還包括:
提取前N2個字符,將當前提取的字符與所述MAP中的key進行匹配,如果存在匹配的key,則轉至執(zhí)行所述S3,如果不存在匹配的key,則繼續(xù)執(zhí)行所述提取前N1個字符。
5.根據(jù)權利要求3或4所述的方法,其特征在于,所述N1為2,所述N2為3。
6.根據(jù)權利要求1至4任一權項所述的方法,其特征在于,在所述S4中還包括:若所述地區(qū)部分中包含兩個以上的地區(qū)名稱,則按照記錄順序依次判斷相鄰兩個地區(qū)名稱是否符合正確的上下級關系,如果是,則確定所述地區(qū)部分正確。
7.根據(jù)權利要求6所述的方法,其特征在于,所述MAP的value中還包含對應key所來源的地區(qū)ID和上一級地區(qū)ID;
所述按照記錄順序依次判斷相鄰兩個地區(qū)名稱是否符合正確的上下級關系包括:若所述相鄰兩個地區(qū)名稱中后記錄的地區(qū)名稱在value中的上一級地區(qū)ID與先記錄的地區(qū)名稱在value中的地區(qū)ID一致,則確定符合正確的上下級關系。
8.根據(jù)權利要求6所述的方法,其特征在于,如果所述相鄰兩個地區(qū)名稱不符合正確的上下級關系,則若所述相鄰兩個地區(qū)名稱中后記錄的地區(qū)名稱不包含地區(qū)公共關鍵詞,則確定該后記錄的地區(qū)名稱不屬于地區(qū)部分,而屬于機構名部分。
9.根據(jù)權利要求1所述的方法,其特征在于,該方法進一步包括:
將機構名部分末尾的字符串與組織形式庫匹配,將匹配的字符串確定為組織形式部分,將機構名部分中的其他字符串確定為商號經(jīng)營范圍部分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410079740.9/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





