[發(fā)明專利]一種客戶地址信息的分詞處理方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201510769798.0 | 申請(qǐng)日: | 2015-11-11 |
| 公開(kāi)(公告)號(hào): | CN105426351B | 公開(kāi)(公告)日: | 2019-01-25 |
| 發(fā)明(設(shè)計(jì))人: | 馮瑞飛;熊瀟;陳帆;胡汝敖 | 申請(qǐng)(專利權(quán))人: | 中國(guó)建設(shè)銀行股份有限公司 |
| 主分類號(hào): | G06F17/22 | 分類號(hào): | G06F17/22;G06F17/27 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100033 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 客戶 地址 信息 分詞 處理 方法 系統(tǒng) | ||
1.一種客戶地址信息的分詞處理方法,其特征在于,預(yù)先存儲(chǔ)有用于定義所有行政區(qū)域的代碼的行政區(qū)域匹配清單,所述方法包括:
確定當(dāng)前待處理的客戶地址信息;
將所述當(dāng)前待處理的客戶地址信息進(jìn)行處理,以獲取到符合處理標(biāo)準(zhǔn)的客戶地址信息;
按照最長(zhǎng)匹配原則,將所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的各個(gè)子地址信息分別與所述行政區(qū)域匹配清單進(jìn)行匹配;
當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第一子地址信息與所述行政區(qū)域匹配清單中的第一行政區(qū)域匹配,且匹配結(jié)果唯一時(shí),確定所述第一子地址信息的第一代碼;其中所述第一代碼與所述第一行政區(qū)域?qū)?yīng);
獲取所述符合處理標(biāo)準(zhǔn)的客戶地址信息中所有子地址信息的代碼,生成規(guī)范化的客戶地址信息;
所述方法還包括:
當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第二子地址信息與所述行政區(qū)域匹配清單中的至少兩個(gè)行政區(qū)域匹配,匹配結(jié)果不唯一時(shí),確定所述第二子地址信息的國(guó)家代碼;
當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第三子地址信息與所述行政區(qū)域匹配清單中的任意一個(gè)行政區(qū)域均不匹配時(shí),不處理所述第三子地址信息,將所述第三子地址信息中之前包括的分隔符還原;
所述方法還包括:
當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第四子地址信息滿足不處理規(guī)則時(shí),不處理所述第四子地址信息;
所述不處理規(guī)則包括:
地址信息以大學(xué)、小區(qū)、展覽館、苑、園、花園、大道、弄、里、堡、巷、道、中心、廣場(chǎng)、街道、街、路、大廈、樓、博物館、局、分局、鐵路局、中學(xué)、小學(xué)、分行、政府、公安局、廠、公司開(kāi)頭;
或,地址信息以中國(guó)開(kāi)頭,且后續(xù)字符串不滿足省市縣規(guī)則。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述當(dāng)前待處理的客戶地址信息進(jìn)行處理,以獲取到符合處理標(biāo)準(zhǔn)的客戶地址信息包括:
將所述當(dāng)前待處理的客戶地址信息中的全角字符轉(zhuǎn)換為半角字符;
將所述當(dāng)前待處理的客戶地址信息中的分隔符去掉。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述規(guī)范化的客戶地址信息包括符合預(yù)設(shè)規(guī)則的客戶地址信息;
所述預(yù)設(shè)規(guī)則包括國(guó)家、省、市、區(qū)縣。
4.一種客戶地址信息的分詞處理系統(tǒng),其特征在于,預(yù)先存儲(chǔ)有用于定義所有行政區(qū)域的代碼的行政區(qū)域匹配清單,所述系統(tǒng)包括:
確定模塊,用于確定當(dāng)前待處理的客戶地址信息;
信息處理模塊,用于將所述當(dāng)前待處理的客戶地址信息進(jìn)行處理,以獲取到符合處理標(biāo)準(zhǔn)的客戶地址信息;
匹配模塊,用于按照最長(zhǎng)匹配原則,將所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的各個(gè)子地址信息分別與所述行政區(qū)域匹配清單進(jìn)行匹配;
第一確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第一子地址信息與所述行政區(qū)域匹配清單中的第一行政區(qū)域匹配,且匹配結(jié)果唯一時(shí),確定所述第一子地址信息的第一代碼;其中所述第一代碼與所述第一行政區(qū)域?qū)?yīng);
獲取模塊,用于獲取所述符合處理標(biāo)準(zhǔn)的客戶地址信息中所有子地址信息的代碼;
生成模塊,用于生成規(guī)范化的客戶地址信息;
所述系統(tǒng)包括:
第二確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第二子地址信息與所述行政區(qū)域匹配清單中的至少兩個(gè)行政區(qū)域匹配,匹配結(jié)果不唯一時(shí),確定所述第二子地址信息的國(guó)家代碼;
第三確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第三子地址信息與所述行政區(qū)域匹配清單中的任意一個(gè)行政區(qū)域均不匹配時(shí),確定不處理所述第三子地址信息;
還原模塊,用于將所述第三子地址信息中之前包括的分隔符還原;
其中所述系統(tǒng)包括:
第四確定模塊,用于當(dāng)所述符合處理標(biāo)準(zhǔn)的客戶地址信息中的第四子地址信息滿足不處理規(guī)則時(shí),確定不處理所述第四子地址信息;
所述不處理規(guī)則包括:
地址信息以大學(xué)、小區(qū)、展覽館、苑、園、花園、大道、弄、里、堡、巷、道、中心、廣場(chǎng)、街道、街、路、大廈、樓、博物館、局、分局、鐵路局、中學(xué)、小學(xué)、分行、政府、公安局、廠、公司開(kāi)頭;
或,地址信息以中國(guó)開(kāi)頭,且后續(xù)字符串不滿足省市縣規(guī)則。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)建設(shè)銀行股份有限公司,未經(jīng)中國(guó)建設(shè)銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510769798.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





