[發明專利]模型訓練方法、模型訓練裝置及終端設備在審
| 申請號: | 202011504757.6 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112579774A | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 梁宸;馬龍;周元笙;蔣佳惟;陳思姣;李炫 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N20/00 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 牟蓓佳 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 終端設備 | ||
1.一種模型訓練方法,其特征在于,包括:
對第一待訓練語句進行掩碼處理,其中,所述掩碼處理指將第一待訓練語句中的指定文字進行遮蓋,以將所述指定文字作為待預測文字,若所述指定文字涉及第一產品名,則將涉及的每一個第一產品名作為一組待預測文字;
根據進行掩碼處理后的第一待訓練語句對文本分類模型進行第一訓練,獲得第一訓練完成的文本分類模型,其中,第一訓練中,所述文本分類模型用于對進行掩碼處理后的第一待訓練語句中的待預測文字進行預測;
根據第二待訓練語句對所述第一訓練完成的文本分類模型進行第二訓練,獲得第二訓練完成的文本分類模型,其中,各個所述第二待訓練語句中分別包括至少一個第一產品名,并且,每個所述第二訓練語句對應有業務標簽,第二訓練中,所述文本分類模型用于確定所述第二待訓練語句所對應的業務類別;
基于待預測語句,對所述第二訓練完成的文本分類模型進行第三訓練,獲得第三訓練完成的文本分類模型,其中,所述待預測語句與所述第一待訓練語句以及所述第二訓練語句不同,第三訓練中,基于所述文本分類模型中的至少兩個指定層的輸出確定所述第三訓練是否完成。
2.如權利要求1所述的模型訓練方法,其特征在于,所述基于待預測語句,對所述第二訓練完成的文本分類模型進行第三訓練,獲得第三訓練完成的文本分類模型,包括:
在所述第三訓練的每一次迭代過程中,針對一個待預測語句,將所述待預測語句輸入第二訓練完成的預設模型,獲得第二訓練完成的預設模型的至少兩個指定層針對所述待預測語句所分別輸出的第一詞向量;
針對第二訓練完成的預設模型所輸出的關于所述待預測語句的輸出向量,獲取與所述輸出向量相關聯的第二詞向量,其中,所述輸出向量所指示的業務類別與所述第二詞向量所指示的業務類別相同;
根據所述待預測語句中除所述第一詞向量相關聯的文字以外的其他部分,獲得第三詞向量;
根據所述第一詞向量、第二詞向量、第三詞向量和預設分類網絡,進行業務分類;
根據業務分類結果,確定所述第三訓練是否完成。
3.如權利要求2所述的模型訓練方法,其特征在于,所述根據所述第一詞向量、第二詞向量、第三詞向量和預設分類網絡,進行業務分類,包括:
對至少兩個所述第一詞向量進行池化處理,獲得第一向量;
對所述第二詞向量進行池化處理,獲得第二向量;
對所述第三詞向量進行池化處理,獲得第三向量;
根據所述第一向量、第二向量、第三向量和預設分類網絡,進行業務分類。
4.如權利要求1所述的模型訓練方法,其特征在于,各個所述第一產品名和所述業務標簽為根據產品圖譜而得到,所述產品圖譜中的每一個節點包括至少一個第一產品名,一個所述節點中的第一產品名對應同一個產品,并且,每一個節點所對應的屬性信息包含所述節點所對應的產品的業務信息。
5.如權利要求4所述的模型訓練方法,其特征在于,在對第一待訓練語句進行掩碼處理之前,還包括:
從預設語料中獲取待識別產品名;
針對每一個待識別產品名,確定所述待識別產品名分別相對于各個標準產品名的相似度信息;
根據各個所述相似度信息,生成產品名關聯列表,所述產品名關聯列表中包括至少兩個第一產品名和各個第一產品名之間的關聯關系,任一所述第一產品名為標準產品名或者待識別產品名;
根據預設業務信息和所述產品名關聯列表,生成產品圖譜。
6.如權利要求5所述的模型訓練方法,其特征在于,所述針對每一個待識別產品名,確定所述待識別產品名分別相對于各個標準產品名的相似度信息,包括:
將所述待識別產品名與預設的標準產品名輸入第一自然語言處理模型,獲得所述第一自然語言處理模型的輸出結果,所述輸出結果包括每一個所述待識別產品名分別相對于各個標準產品名的相似度信息。
7.如權利要求1至6任意一項所述的模型訓練方法,其特征在于,在獲得第三訓練完成的文本分類模型之后,還包括:
通過所述第三訓練完成的文本分類模型,對待檢測文本進行文本分類,以確定所述待檢測文本的業務類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011504757.6/1.html,轉載請聲明來源鉆瓜專利網。





