[發明專利]模型訓練方法、數據處理方法及其裝置有效
| 申請號: | 202210321041.5 | 申請日: | 2022-03-30 |
| 公開(公告)號: | CN114417022B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 王瀟斌;黃申;劉楚;丁瑞雪;謝朋峻 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/387 | 分類號: | G06F16/387;G06F40/295 |
| 代理公司: | 北京同鈞律師事務所 16037 | 代理人: | 李小波;許懷遠 |
| 地址: | 310056 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 數據處理 及其 裝置 | ||
本申請提供一種模型訓練方法、數據處理方法及其裝置。該模型訓練方法包括:獲取第一行政區劃文本,第一行政區劃文本按照行政區域的層級順序表示實際的行政區劃;對第一行政區劃文本進行更改,得到第二行政區劃文本,第二行政區劃文本和第一行政區劃文本表示相同的行政區劃;根據第一行政區劃文本和第二行政區劃文本,訓練地址識別模型,得到訓練完成的地址識別模型。本申請通過對第一行政區劃文本,得到第二行政區劃文本。采用第一行政區劃文本和第二行政區劃文本這些具有地址特點的文本訓練得到地址識別模型,能夠對地址文本具有更好的表征能力,進而能夠準確的分析地址文本。
技術領域
本申請涉及計算機技術領域,尤其涉及模型訓練方法、數據處理方法及其裝置。
背景技術
地址文本是各種場景中非常常見的數據,例如,快遞的收貨地址、外賣的配送地址、生活繳費登記地址以及其他場景中的登記地址,因此,地址文本分析實際需求較高。
目前,通常使用比如LSTM(Long Short-Term Memory,長短期記憶人工神經網絡)等通用的文本編碼器進行地址文本分析,其中,該文本編碼器是基于通用的自然語言文本、基于通用的任務目標訓練得到的,但通過通用的文本編碼器無法對地址文本進行準確的分析。
發明內容
本申請的多個方面提供了一種模型訓練方法、數據處理方法及其裝置,以提高地址識別模型的對地址文本的分析準確度。
本申請實施例第一方面提供一種模型訓練方法,包括:獲取第一行政區劃文本,第一行政區劃文本按照行政區域的層級順序表示實際的行政區劃;對第一行政區劃文本進行更改,得到第二行政區劃文本,第二行政區劃文本和第一行政區劃文本表示相同的行政區劃;根據第一行政區劃文本和第二行政區劃文本,訓練地址識別模型,得到訓練完成的地址識別模型。
本申請實施例第二方面提供一種數據處理方法,包括:獲取第一行政區劃文本;將第一行政區劃文本輸入地址識別模型進行數據處理,得到第一行政區劃文本對應的實際行政區劃文本,地址識別模型是根據第一方面模型訓練方法訓練得到的。
本申請實施例第三方面提供一種數據處理裝置,包括:
獲取模塊,用于獲取第一行政區劃文本;
處理模塊,用于將第一行政區劃文本輸入地址識別模型進行數據處理,得到第一行政區劃文本對應的實際行政區劃文本,地址識別模型是根據第一方面模型訓練方法訓練得到的。
本申請實施例第四方面提供一種電子設備,包括:處理器、存儲器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執行計算機程序時實現第一方面的模型訓練方法,或實現第二方面的數據處理方法。
本申請實施例應用于地址文本的分析場景中,提供的模型訓練方法包括:獲取第一行政區劃文本,第一行政區劃文本按照行政區域的層級順序表示實際的行政區劃;對第一行政區劃文本進行更改,得到第二行政區劃文本,第二行政區劃文本和第一行政區劃文本表示相同的行政區劃;根據第一行政區劃文本和第二行政區劃文本,訓練地址識別模型,得到訓練完成的地址識別模型。本申請實施例通過對第一行政區劃文本,得到第二行政區劃文本。采用第一行政區劃文本和第二行政區劃文本這些具有地址特點的文本訓練得到地址識別模型,能夠對地址文本具有更好的表征能力,進而能夠準確的分析地址文本。
附圖說明
此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
圖1為本申請示例性實施例提供的一種模型訓練方法的步驟流程圖;
圖2為本申請示例性實施例提供的一種模型訓練方法的示意圖;
圖3為本申請示例性實施例提供的一種訓練地址識別模型的步驟流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210321041.5/2.html,轉載請聲明來源鉆瓜專利網。





