[發明專利]特征編碼方法、裝置、電子設備及可讀存儲介質在審
| 申請號: | 201911419048.5 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111160043A | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 戴瑾;胡加學;趙乾;宋時德 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 鄭朝然 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 編碼 方法 裝置 電子設備 可讀 存儲 介質 | ||
1.一種特征編碼方法,其特征在于,包括:
獲取待分析語句;
將所述待分析語句輸入至預先訓練好的特征編碼模型中,獲得所述特征編碼模型輸出的特征編碼結果;
所述特征編碼模型為注意力模塊和訓練好的生成對抗網絡模型中的編碼模塊共同訓練所得到。
2.根據權利要求1所述的語義理解處理方法,其特征在于,所述生成對抗網絡模型為以語句樣本對為訓練樣本,以與所述語句樣本對對應的用于表征加噪類型的加噪向量為樣本標簽訓練得到;所述特征編碼模型為以所述語句樣本對為訓練樣本訓練得到;所述語句樣本對包括原始語句和加噪語句,所述加噪語句為對所述原始語句進行加噪得到。
3.根據權利要求2所述的語義理解處理方法,其特征在于,所述生成對抗網絡模型包括編碼模塊和判別模塊,所述生成對抗網絡模型通過如下方式訓練得到:
將語句樣本對中的原始語句和加噪語句分別進行向量化處理,得到原始語句向量和加噪語句向量;
將原始語句向量和加噪語句向量分別輸入編碼模塊,得到所述編碼模塊輸出的與原始語句向量和加噪語句向量分別對應的原始第一特征和加噪第一特征;
將所述原始第一特征和所述加噪第一特征分別輸入判別模塊,得到所述判別模塊輸出的所述原始第一特征對應的預測標簽和所述加噪第一特征對應的預測標簽;
以所述加噪第一特征對應的預測標簽以及所述原始第一特征對應的預測標簽均趨近于原始語句的樣本標簽為目標,對所述生成對抗網絡模型的參數進行更新。
4.根據權利要求2所述的語義理解處理方法,其特征在于,所述特征編碼模型通過以下方式訓練得到:
將所述生成對抗網絡模型訓練完成后,將語句樣本對中的原始語句和加噪語句分別進行向量化處理,得到原始語句向量和加噪語句向量;
將原始語句向量和加噪語句向量分別輸入訓練好的生成對抗網絡模型中的編碼模塊,得到該編碼模塊輸出的與原始語句向量和加噪語句向量分別對應的原始第二特征和加噪第二特征;
將原始第二特征和加噪第二特征分別輸入注意力模塊,得到所述注意力模塊輸出的與所述原始第二特征和所述加噪第二特征分別對應的原始關鍵特征和加噪關鍵特征;
以所述加噪關鍵特征趨近于原始關鍵特征為目標,對所述注意力模塊和所述編碼模塊的參數進行更新,直到滿足預設收斂條件,將所得的編碼模塊作為訓練好的特征編碼模型。
5.根據權利要求2-4任一項所述的語義理解處理方法,其特征在于,所述對所述原始語句進行加噪的方法包括:
對原始語句中的詞進行隨機調換順序、對原始語句中的詞進行隨機刪除、向原始語句中隨機插入詞、對原始語句中的字進行隨機重復或者基于回譯的加噪方法對原始語句進行加噪。
6.根據權利要求1所述的語義理解處理方法,其特征在于,所述方法還包括:
根據所述特征編碼結果確定所述待分析語句的語義。
7.一種特征編碼裝置,其特征在于,包括:
語句獲取單元,用于獲取待分析語句;
特征編碼單元,用于將所述待分析語句輸入至預先訓練好的特征編碼模型中,獲得所述特征編碼模型輸出的特征編碼結果;
所述特征編碼模型為注意力模塊和訓練好的生成對抗網絡模型中的編碼模塊共同訓練所得到。
8.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至6任一項所述語義理解處理方法的步驟。
9.一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現如權利要求1至6任一項所述語義理解處理方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911419048.5/1.html,轉載請聲明來源鉆瓜專利網。





