[發明專利]地址參數處理方法及相關設備有效
| 申請號: | 202011188722.6 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112257413B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 鄒倩霞 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/289;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 孫芬 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址 參數 處理 方法 相關 設備 | ||
1.一種地址參數處理方法,其特征在于,所述地址參數處理方法包括:
接收輸入的地址信息;
將所述地址信息輸入至基于Transformer的雙向編碼器表征BERT的地址解析模型中,獲得輸出概率,其中,所述基于BERT的地址解析模型包括BERT輸入層、雙向長短時記憶循環神經網絡Bilstm層、全連接層FC以及條件隨機場CRF層;
若所述輸出概率大于預設閾值,獲取所述地址解析模型輸出的非規范地址參數;
根據所述非規范地址參數,對所述地址信息進行清理,獲得清理后的地址信息;
根據地址知識模板庫,對所述清理后的地址信息進行切分,獲得規范地址參數;
將所述非規范地址參數和所述規范地址參數進行合并,獲得所述地址信息的地址解析結果。
2.根據權利要求1所述的地址參數處理方法,其特征在于,所述接收輸入的地址信息之后,所述地址參數處理方法包括:
對所述地址信息進行語義識別,獲得識別結果;
根據所述識別結果,判斷所述地址信息中是否存在非規范信息;
若所述地址信息中存在非規范信息,執行所述的將所述地址信息輸入至基于Transformer的雙向編碼器表征BERT的地址解析模型中,獲得輸出概率的步驟。
3.根據權利要求1所述的地址參數處理方法,其特征在于,所述將所述地址信息輸入至基于Transformer的雙向編碼器表征BERT的地址解析模型中,獲得輸出概率包括:
將所述地址信息輸入至所述基于BERT的地址解析模型中的BERT輸入層;
通過所述Bilstm層提取所述地址信息的非規范地址參數;
使用所述FC層對所述非規范地址參數進行分類識別,獲得識別結果;
使用所述CRF層對所述識別結果進行預測,獲得輸出概率。
4.根據權利要求1所述的地址參數處理方法,其特征在于,所述將所述地址信息輸入至基于Transformer的雙向編碼器表征BERT的地址解析模型中,獲得輸出概率之后,以及所述若所述輸出概率大于預設閾值,獲取所述地址解析模型輸出的非規范地址參數之前,所述地址參數處理方法還包括:
通過所述地址解析模型,輸出非規范信息在所述地址信息中的位置及類型;
根據所述位置、所述類型以及所述非規范信息,生成所述非規范地址參數。
5.根據權利要求1所述的地址參數處理方法,其特征在于,所述地址參數處理方法還包括:
獲取基準地址參數;
計算所述地址解析結果與所述基準地址參數的相似度;
根據所述相似度,對所述地址信息的準確性進行校驗。
6.根據權利要求5所述的地址參數處理方法,其特征在于,所述計算所述地址解析結果與所述基準地址參數的相似度包括:
采用詞頻-逆文本頻率指數TF-IDF算法計算所述地址解析結果的第一詞頻向量,以及采用所述TF-IDF算法計算所述基準地址參數的第二詞頻向量;
計算所述第一詞頻向量與所述第二詞頻向量的余弦值;
將所述余弦值確定為所述地址解析結果與所述基準地址參數的相似度。
7.根據權利要求5所述的地址參數處理方法,其特征在于,所述地址參數處理方法還包括:
若校驗的結果表明所述地址信息有誤,從所述地址解析結果中提取出有誤的目標地址參數;
獲取所述目標地址參數所屬的地址類型以及所述地址信息的應用場景;
根據所述地址類型,確定所述目標地址參數在所述應用場景下的風險級別;
若所述風險級別高于預設風險級別閾值,輸出風險提示信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011188722.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種納米材料及其應用
- 下一篇:一種多行業模板量產化的方法





