[發明專利]意圖識別模型訓練方法、意圖識別方法以及相關裝置在審
| 申請號: | 201911421460.0 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111161740A | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 付博;顧遠;袁晟君;李宸;王雪;張晨;謝隆飛;李亞雄 | 申請(專利權)人: | 中國建設銀行股份有限公司;建信金融科技有限責任公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/16;G10L15/06;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 孫乳筍;董驍毅 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 模型 訓練 方法 以及 相關 裝置 | ||
1.一種意圖識別模型訓練方法,其特征在于,包括:
利用帶標簽的訓練樣本數據對卷積神經網絡進行初步訓練;
采用條件變分自編碼器對所述帶標簽的訓練樣本數據進行數據增強得到帶標簽的擴充樣本數據;
利用所述帶標簽的擴充樣本數據對經過初步訓練的卷積神經網絡進行再訓練,得到意圖識別模型。
2.根據權利要求1所述的意圖識別模型訓練方法,所述條件變分自編碼器包括:用于將語句向量壓縮為隱變量的編碼器以及用于將隱變量解壓縮重構為擴充語句向量的解碼器;
所述采用條件變分自編碼器對所述帶標簽的訓練樣本數據進行數據增強得到帶標簽的擴充樣本數據包括:
將一訓練樣本轉換為語句向量;
將所述語句向量以及預設約束條件輸入所述編碼器得到所述隱變量;
將所述隱變量以及所述預設約束條件輸入所述解碼器得到所述擴充句子向量;
將所述擴充句子向量轉換為一擴充樣本;
其中,所述擴充樣本的標簽與所述訓練樣本的標簽相同。
3.根據權利要求2所述的意圖識別模型訓練方法,所述編碼器采用RNN實現。
4.根據權利要求2所述的意圖識別模型訓練方法,所述解碼器采用神經網絡實現。
5.根據權利要求1所述的意圖識別模型訓練方法,其特征在于,還包括:
獲取條件變分自編碼器訓練數據;
利用所述條件變分自編碼器訓練數據對所述條件變分自編碼器進行訓練。
6.一種意圖識別方法,其特征在于,包括:
獲取待識別意圖數據;
將所述待識別意圖數據輸入如權利要求1至5任一項所述的意圖識別模型訓練方法訓練后的意圖識別模型,并將所述意圖識別模型的輸出作為所述待識別意圖數據的意圖。
7.一種意圖識別模型訓練裝置,其特征在于,包括:
初步訓練模塊,利用帶標簽的訓練樣本數據對卷積神經網絡進行初步訓練;
數據增強模塊,采用條件變分自編碼器對所述帶標簽的訓練樣本數據進行數據增強得到帶標簽的擴充樣本數據;
再訓練模塊,利用所述帶標簽的擴充樣本數據對經過初步訓練的卷積神經網絡進行再訓練,得到意圖識別模型。
8.一種意圖識別裝置,其特征在于,包括:
待識別數據獲取模塊,獲取待識別意圖數據;
意圖識別模塊,將所述待識別意圖數據輸入如權利要求1至5任一項所述的意圖識別模型訓練方法訓練后的意圖識別模型,并將所述意圖識別模型的輸出作為所述待識別意圖數據的意圖。
9.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現權利要求1至5任一項所述的意圖識別模型訓練方法或者權利要求6所述的意圖識別方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1至5任一項所述的意圖識別模型訓練方法或者權利要求6所述的意圖識別方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司;建信金融科技有限責任公司,未經中國建設銀行股份有限公司;建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911421460.0/1.html,轉載請聲明來源鉆瓜專利網。





