[發明專利]一種模型訓練和識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010615855.0 | 申請日: | 2020-06-29 |
| 公開(公告)號: | CN111753519A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 秦海寧;單培;張瑞飛 | 申請(專利權)人: | 鼎富智能科技有限公司 |
| 主分類號: | G06F40/20 | 分類號: | G06F40/20;G06N3/08;G06N3/04 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
| 地址: | 230000 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種模型訓練方法,其特征在于,包括:
獲得文本數據和文本數據對應的文本類別;
以所述文本數據為訓練數據,以所述文本類別為訓練標簽,對生成對抗網絡進行訓練,獲得生成對抗網絡模型,所述生成對抗網絡模型包括:生成器和判別器;
其中,所述對生成對抗網絡進行訓練,包括:
獲得狀態推測矩陣,所述狀態推測矩陣表征所述判別器的重要程度;
對狀態觀測矩陣和所述狀態推測矩陣進行卡爾曼濾波運算,獲得所述生成對抗網絡模型的損失值,所述狀態觀測矩陣表征所述生成器的重要程度;
根據所述生成對抗網絡模型的準確率調整所述生成對抗網絡模型的損失值。
2.根據權利要求1所述的方法,其特征在于,所述根據所述生成對抗網絡模型的準確率調整所述生成對抗網絡模型的損失值,包括:
判斷所述生成對抗網絡模型的準確率是否逐漸收斂;
若是,則將所述生成對抗網絡模型的損失值向第一方向重置;
若否,則將所述生成對抗網絡模型的損失值向第二方向重置,所述第一方向與所述第二方向相反。
3.根據權利要求1所述的方法,其特征在于,所述獲得狀態推測矩陣,包括:
獲得所述生成對抗網絡模型的準確率;
根據所述生成對抗網絡模型的準確率計算所述狀態推測矩陣。
4.根據權利要求3所述的方法,其特征在于,所述獲得所述生成對抗網絡模型的準確率,包括:
使用所述生成對抗網絡模型對所述文本數據進行預測,獲得預測標簽;
根據所述預測標簽和所述訓練標簽計算所述生成對抗網絡模型的準確率。
5.根據權利要求1-4任一所述的方法,其特征在于,所述生成對抗網絡模型為WGAN-GP模型。
6.一種識別方法,其特征在于,包括:
獲得文本內容;
使用如權利要求1-5任一所述生成對抗網絡模型對所述文本內容的類別進行識別,獲得所述文本內容對應的類別。
7.一種模型訓練裝置,其特征在于,包括:
數據類別獲得模塊,用于獲得文本數據和文本數據對應的文本類別;
網絡模型訓練模塊,用于以所述文本數據為訓練數據,以所述文本類別為訓練標簽,對生成對抗網絡進行訓練,獲得生成對抗網絡模型,所述生成對抗網絡模型包括:生成器和判別器;
其中,所述網絡模型訓練模塊,包括:
推測矩陣獲得模塊,用于獲得狀態推測矩陣,所述狀態推測矩陣表征所述判別器的重要程度;
卡爾曼濾波模塊,用于對狀態觀測矩陣和所述狀態推測矩陣進行卡爾曼濾波運算,獲得所述生成對抗網絡模型的損失值,所述狀態觀測矩陣表征所述生成器的重要程度;
損失值調整模塊,用于根據所述生成對抗網絡模型的準確率調整所述生成對抗網絡模型的損失值。
8.根據權利要求7所述的裝置,其特征在于,所述損失值調整模塊,包括:
逐漸收斂判斷模塊,用于判斷所述生成對抗網絡模型的準確率是否逐漸收斂;
第一方向重置模塊,用于若所述生成對抗網絡模型的準確率逐漸收斂,則將所述生成對抗網絡模型的損失值向第一方向重置;
第二方向重置模塊,用于若所述生成對抗網絡模型的準確率不逐漸收斂,則將所述生成對抗網絡模型的損失值向第二方向重置,所述第一方向與所述第二方向相反。
9.一種電子設備,其特征在于,包括:處理器和存儲器,所述存儲器存儲有所述處理器可執行的機器可讀指令,所述機器可讀指令被所述處理器執行時執行如權利要求1-6任一所述的方法。
10.一種存儲介質,其特征在于,該存儲介質上存儲有計算機程序,該計算機程序被處理器運行時執行如權利要求1-6任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鼎富智能科技有限公司,未經鼎富智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010615855.0/1.html,轉載請聲明來源鉆瓜專利網。





