[發明專利]一種訓練問題識別模型的方法和系統有效
| 申請號: | 202010113810.3 | 申請日: | 2020-02-24 |
| 公開(公告)號: | CN111340218B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 楊明暉;崔恒斌;陳曉軍;陳顯玲 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06F16/35 |
| 代理公司: | 成都七星天知識產權代理有限公司 51253 | 代理人: | 楊永梅 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 訓練 問題 識別 模型 方法 系統 | ||
1.一種訓練問題識別模型的方法,包括:
獲取多個第一文本和多個第二文本,所述第一文本和所述第二文本分別為問題類文本和非問題類文本;
將文本對輸入初始問題識別模型,輸出所述文本對中所述第一文本和所述第二文本的分類結果;
當所述文本對中第一文本或/和第二文本的真實標記與所述分類結果不一致時,將所述文本對作為初始生成模型的正樣本輸入初始生成模型進行訓練,訓練得到生成模型;
通過所述生成模型,基于所述第一文本與所述第二文本之間的相似度,為所述第一文本選擇滿足第一預設條件的至少一個所述第二文本,生成至少一個文本對;
將所述文本對輸入所述初始問題識別模型進行訓練,訓練得到目標問題識別模型。
2.如權利要求1所述的方法,所述將所述文本對輸入初始問題識別模型進行訓練,訓練得到目標問題識別模型包括:
當訓練得到的中間問題識別模型的識別準確率滿足第二預設條件時,將所述中間問題識別模型確定為所述目標問題識別模型。
3.如權利要求1所述的方法,所述初始問題識別模型包括第一文本編碼模型和用于分類的神經網絡;
所述第一文本編碼模型用于對輸入的文本進行向量表示,得到所述輸入的文本的向量;
所述用于分類的神經網絡用于基于所述輸入的文本的向量確定所述輸入的文本的類別。
4.如權利要求3所述的方法,所述生成模型包括第二文本編碼模型和相似度計算模型;
所述第二文本編碼模型用于對輸入的文本對進行向量表示,得到所述輸入的文本對中不同文本的向量;
所述相似度計算模型基于所述不同文本的向量計算所述不同文本之間相似度。
5.如權利要求4所述的方法,所述第一文本編碼模型和所述第二文本編碼模型共用同一個編碼模型。
6.如權利要求4所述的方法,所述第一文本編碼模型或/和所述第二文本編碼模由wordembedding和BiLSTM組成,所述輸入的文本或所述輸入的文本對依次經過Word Embedding和BiLSTM生成對應的向量。
7.如權利要求4所述的方法,所述相似度計算模型為ESIM模型。
8.如權利要求1所述的方法,所述方法還包括:
獲取實體對象輸入的內容;
將所述實體對象輸入的內容輸入所述目標問題識別模型,識別所述實體對象輸入的內容是否為問題;
是則執行回答所述輸入的內容的提醒操作。
9.一種訓練問題識別模型的系統,包括:
文本獲取模塊,用于獲取多個第一文本和多個第二文本,所述第一文本和所述第二文本分別為問題類文本和非問題類文本;
模型訓練模塊,用于將文本對輸入初始問題識別模型,輸出所述文本對中第一文本和第二文本的分類結果;當所述文本對中第一文本或/和第二文本的真實標記與所述分類結果不一致時,將所述文本對作為初始生成模型的正樣本輸入初始生成模型進行訓練,訓練得到生成模型;
文本對生成模塊,用于通過所述生成模型,基于所述第一文本與所述第二文本之間的相似度,為所述第一文本選擇滿足第一預設條件的至少一個所述第二文本,生成至少一個文本對;
所述模型訓練模塊進一步用于將所述文本對輸入所述初始問題識別模型進行訓練,訓練得到目標問題識別模型。
10.如權利要求9所述的系統,所述模型訓練模塊用于:
當訓練得到的中間問題識別模型的識別準確率滿足第二預設條件時,將所述中間問題識別模型確定為所述目標問題識別模型。
11.如權利要求9所述的系統,所述初始問題識別模型包括第一文本編碼模型和用于分類的神經網絡;
所述第一文本編碼模型用于對輸入的文本進行向量表示,得到所述輸入的文本的向量;
所述用于分類的神經網絡用于基于所述輸入的文本的向量確定所述輸入的文本的類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010113810.3/1.html,轉載請聲明來源鉆瓜專利網。





