[發(fā)明專利]一種地址信息標(biāo)準(zhǔn)化方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910121905.7 | 申請(qǐng)日: | 2019-02-18 |
| 公開(公告)號(hào): | CN109960795A | 公開(公告)日: | 2019-07-02 |
| 發(fā)明(設(shè)計(jì))人: | 吳壯偉 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06F16/29 |
| 代理公司: | 深圳市世聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 44385 | 代理人: | 谷惠英 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 地址信息 標(biāo)準(zhǔn)地址 標(biāo)準(zhǔn)化 生成模型 預(yù)設(shè) 計(jì)算機(jī)設(shè)備 存儲(chǔ)介質(zhì) 地址分詞 候選地址 分詞 人工智能技術(shù) 輸入地址信息 表達(dá)方式 輸出 地址庫(kù) 預(yù)期的 匹配 轉(zhuǎn)化 | ||
本發(fā)明實(shí)施例公開了一種地址信息標(biāo)準(zhǔn)化的方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),其中方法包括下述步驟:獲取待標(biāo)準(zhǔn)化的地址信息;將所述地址信息輸入到預(yù)設(shè)的分詞模型中,得到所述分詞模型輸出的地址分詞;將所述地址分詞與預(yù)設(shè)的地址庫(kù)匹配,得到與所述地址信息對(duì)應(yīng)的候選地址;將所述候選地址輸入到預(yù)設(shè)的標(biāo)準(zhǔn)地址生成模型中,得到所述標(biāo)準(zhǔn)地址生成模型輸出的標(biāo)準(zhǔn)地址,其中,所述標(biāo)準(zhǔn)地址生成模型基于Seq2Seq模型。本發(fā)明基于人工智能技術(shù),先識(shí)別待標(biāo)準(zhǔn)化的地址信息對(duì)應(yīng)的具體地址,再將其轉(zhuǎn)化為預(yù)期的標(biāo)準(zhǔn)化的地址,解決了用戶輸入地址信息時(shí)存在多種表達(dá)方式,導(dǎo)致無法識(shí)別或識(shí)別不準(zhǔn)確的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)領(lǐng)域,尤其涉及一種地址信息標(biāo)準(zhǔn)化方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
現(xiàn)在,隨著電子商務(wù)、電子導(dǎo)航、定位等技術(shù)的發(fā)展,在很多場(chǎng)合很多應(yīng)用程序涉及到地址信息的獲取、識(shí)別、處理和應(yīng)用。如電子商務(wù)領(lǐng)域,往來的郵件需要對(duì)通訊地址進(jìn)行識(shí)別和處理,電子地圖需要對(duì)用戶輸入的地址進(jìn)行識(shí)別、定位或路線規(guī)劃。
由于人們對(duì)地址表達(dá)的多樣化,這種多樣化的表達(dá)給地址識(shí)別帶來了諸多不便,導(dǎo)致一些系統(tǒng)無法自動(dòng)化運(yùn)行,例如物流系統(tǒng),需要投入大量的人力去做地址識(shí)別,通過人工對(duì)郵件進(jìn)行分揀處理,隨著電子商務(wù)的發(fā)展,業(yè)務(wù)增長(zhǎng)巨大,人工的處理顯然不夠高效和準(zhǔn)確。所以,對(duì)地址信息進(jìn)行標(biāo)準(zhǔn)化處理,使應(yīng)用系統(tǒng)可以準(zhǔn)確識(shí)別多樣化的地址表達(dá),提高工作效率,是一項(xiàng)急需解決的問題。
發(fā)明內(nèi)容
為解決地址信息表達(dá)多樣化,計(jì)算機(jī)系統(tǒng)無法識(shí)別的問題,本發(fā)明提供一種地址信息標(biāo)準(zhǔn)化方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
為解決上述技術(shù)問題,本發(fā)明提出一種地址信息標(biāo)準(zhǔn)化方法,包括如下步驟:
獲取待標(biāo)準(zhǔn)化的地址信息;
將所述地址信息輸入到預(yù)設(shè)的分詞模型中,得到所述分詞模型輸出的地址分詞;
將所述地址分詞與預(yù)設(shè)的地址庫(kù)匹配,得到與所述地址信息對(duì)應(yīng)的候選地址;
將所述候選地址輸入到預(yù)設(shè)的標(biāo)準(zhǔn)地址生成模型中,得到所述標(biāo)準(zhǔn)地址生成模型輸出的標(biāo)準(zhǔn)地址,其中,所述標(biāo)準(zhǔn)地址生成模型基于Seq2Seq模型。
可選地,在所述將所述地址信息輸入到預(yù)設(shè)的分詞模型中,得到所述分詞模型輸出的地址分詞的步驟中,所述分詞模型基于雙向最大匹配法。
可選地,在所述將所述地址信息輸入到預(yù)設(shè)的分詞模型中,得到所述分詞模型輸出的地址分詞的步驟之后,還包括下述步驟:
將所述地址分詞與預(yù)設(shè)的停用詞表進(jìn)行比對(duì),并刪除所述地址分詞中與所述停用詞表中重疊的詞,得到過濾后的所述地址分詞的過濾結(jié)果;
得到與所述地址信息對(duì)應(yīng)的候選地址將所述過濾后的地址分詞結(jié)果與預(yù)設(shè)的地址庫(kù)匹配,得到與所述地址信息對(duì)應(yīng)的候選地址。
可選地,在所述將所述地址信息輸入到預(yù)設(shè)的分詞模型中,得到所述分詞模型輸出的地址分詞的步驟之后,還包括下述步驟:
根據(jù)所述地址分詞檢索預(yù)設(shè)的同義詞表,并在同義詞表中提取所述地址分詞中各分詞的同義詞,得到所述地址分詞的擴(kuò)展結(jié)果,其中,所述擴(kuò)展結(jié)果中包含所述地址分詞及各地址分詞的同義詞;
將所述擴(kuò)展結(jié)果與預(yù)設(shè)的地址庫(kù)匹配,得到與所述地址信息對(duì)應(yīng)的候選地址。
可選地,在所述將所述擴(kuò)展結(jié)果與預(yù)設(shè)的地址庫(kù)匹配,得到與所述地址信息對(duì)應(yīng)的候選地址的步驟中,包括下述步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910121905.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 標(biāo)準(zhǔn)地名地址庫(kù)建立方法及系統(tǒng)
- 地址標(biāo)準(zhǔn)化方法和裝置
- 快件地址處理系統(tǒng)和方法
- 分布式地址比對(duì)方法和裝置
- 一種地址數(shù)據(jù)匹配方法及裝置
- 地址庫(kù)的信息處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 地址標(biāo)準(zhǔn)化方法、地址標(biāo)準(zhǔn)化裝置和電子設(shè)備
- 地址信息的標(biāo)準(zhǔn)化方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種一標(biāo)三實(shí)數(shù)據(jù)的管理方法及系統(tǒng)
- 一種基于標(biāo)準(zhǔn)地址矩陣加權(quán)映射比對(duì)地址匹配的方法
- 標(biāo)準(zhǔn)化單杠
- 標(biāo)準(zhǔn)化天線
- 通信系統(tǒng)、通信裝置
- 快速參數(shù)匹配電源濾波器組合體
- 數(shù)據(jù)需求標(biāo)準(zhǔn)化方法及標(biāo)準(zhǔn)化系統(tǒng)
- 一種測(cè)井曲線標(biāo)準(zhǔn)化方法及系統(tǒng)
- 一種警情標(biāo)準(zhǔn)化錄入系統(tǒng)
- 數(shù)據(jù)標(biāo)準(zhǔn)化方法、裝置以及電子設(shè)備
- 標(biāo)準(zhǔn)化設(shè)計(jì)平臺(tái)及標(biāo)準(zhǔn)化設(shè)計(jì)方法
- 標(biāo)準(zhǔn)化泵房





