[發明專利]基于人工智能的地址識別方法、裝置、設備及存儲介質在審
| 申請號: | 202210817087.6 | 申請日: | 2022-07-12 |
| 公開(公告)號: | CN115099359A | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 李志韜;王健宗;程寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 姚章國 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 地址 識別 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能領域,公開了基于人工智能的地址識別方法、裝置、設備及存儲介質,方法包括:獲取多個地址樣本和預設識別模型,預設識別模型為序列到序列模型;基于多個地址樣本對預設識別模型進行模型訓練,并在訓練過程中對預設識別模型進行解碼樹約束,訓練得到待測試模型;對待測試模型進行測試,直至待測試模型的性能滿足預設性能條件后,將滿足預設性能條件的待測試模型輸出為目標識別模型;在接收到地址識別指令時,調用目標識別模型對待識別數據進行地址識別;本發明中,提高了目標識別模型的魯棒性,降低了傳統seq2seq模型文本識別錯誤的概率,提高了目標識別模型對地址識別的準確性,從而提高了目標識別模型的性能。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種基于人工智能的地址識別方法、裝置、設備及存儲介質。
背景技術
隨著電子商務、電子導航、定位等技術的發展,許多場合涉及到地址信息的獲取、識別和應用。如電子商務領域,需要對往來的客戶的通訊地址進行識別和處理,或者物流系統需要對用戶輸入的地址進行識別、定位或路線規劃。
現有的地址識別方式一般是基于深度學習模型的識別模型,通過深度學習訓練得到地址識別模型并存儲在相關設備中,當用戶輸入地址相關數據時即采用地址識別模型對用戶輸入的地址相關數據進行識別,提高系統的人工智能化。但發明人發現,由于人們對地址表達的多樣化,這個種多樣化的表達給地址識別模型的識別造成干擾,導致現有地址識別模型的地址識別性能不高。
發明內容
本發明提供一種基于人工智能的地址識別方法、裝置、設備及存儲介質,以解決因人們對地址表達的多樣化,導致現有地址識別模型的地址識別性能不高的問題。
提供一種基于人工智能的地址識別方法,包括:
獲取多個地址樣本和預設識別模型,預設識別模型為序列到序列模型;
基于多個地址樣本對預設識別模型進行模型訓練,并在訓練過程中對預設識別模型進行解碼樹約束,訓練得到待測試模型;
對待測試模型進行測試,直至待測試模型的性能滿足預設性能條件后,將滿足預設性能條件的待測試模型輸出為目標識別模型;
在接收到地址識別指令時,調用目標識別模型對待識別數據進行地址識別。
進一步地,基于多個地址樣本對預設識別模型進行訓練,并在訓練過程中對預設識別模型進行解碼樹約束,訓練得到待測試模型,包括:
對多個地址樣本進行數據增強處理,得到每一地址樣本對應的正例地址樣本對;
將地址樣本對應的正例地址樣本對輸入預設識別模型中進行對比學習訓練,并在訓練過程中對預設識別模型進行解碼樹約束,得到正例地址樣本對的對比學習損失值;
根據對比學習損失值確定總損失值;
在總損失值未達到預設收斂條件時,迭代更新預設識別模型的初始參數,直至總損失值達到預設收斂條件,將收斂后的預設識別模型記錄為待測試模型。
進一步地,將地址樣本對應的正例地址樣本對輸入預設識別模型中進行對比學習訓練,并在訓練過程中對預設識別模型進行解碼樹約束,得到正例地址樣本對的對比學習損失值,包括:
獲取對地址樣本進行數據增強處理得到的正例地址樣本對,正例地址樣本對包括第一增強地址樣本和第二增強地址樣本;
將第一增強地址樣本輸入預設識別模型,以編碼得到的第一編碼向量,并在解碼第一編碼向量時進行解碼樹約束,得到第一預測地址;
將第二增強地址樣本輸入預設識別模型,以編碼得到的第二編碼向量,并在解碼第二編碼向量時進行解碼樹約束,得到第二預測地址;
確定第一預測地址和第二預測地址之間的對比學習損失,得到對比學習損失值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210817087.6/2.html,轉載請聲明來源鉆瓜專利網。





