[發明專利]優化語言語義理解模型方法、裝置、設備及存儲介質在審

申請號：	202010970954.0	申請日：	2020-09-15
公開（公告）號：	CN112199479A	公開（公告）日：	2021-01-08
發明（設計）人：	李健;李天陽;武衛東;陳明	申請（專利權）人：	北京捷通華聲科技股份有限公司
主分類號：	G06F16/332	分類號：	G06F16/332;G06F16/35;G06F40/211;G06F40/30
代理公司：	北京潤澤恒知識產權代理有限公司 11319	代理人：	莎日娜
地址：	100193 北京市海淀區東北***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	優化語言語義理解模型方法裝置設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種優化語言語義理解模型的方法，其特征在于，所述方法包括：

獲得語言語義理解模型在目標訓練中的第一損失值；所述目標訓練是利用目標領域的問句樣本數據精調所述語言語義理解模型的訓練；

根據所述第一損失值，對所述語言語義理解模型的輸入層添加擾動；

獲得添加擾動后的語言語義理解模型在所述目標訓練中的第二損失值；

根據所述第二損失值，更新所述語言語義理解模型的參數，得到優化后的語言語義理解模型。

2.根據權利要求1所述的方法，其特征在于，所述方法還包括：

獲得多個所述問句樣本數據；所述問句樣本數據包括問句文本樣本和所述問句文本樣本對應的分類標記；

獲得語言語義理解模型在目標訓練中的第一損失值，包括：

將所述問句文本樣本輸入所述語言語義理解模型，得到第一預測分類；

計算所述第一預測分類和所述問句文本樣本對應的分類標記的交叉熵損失，得到所述第一損失值。

3.根據權利要求1所述的方法，其特征在于，根據所述第一損失值，對所述語言語義理解模型的輸入層添加擾動，包括：

根據所述第一損失值，計算對所述語言語義理解模型進行參數更新的第一梯度；

根據所述第一梯度，對所述語言語義理解模型的輸入層添加擾動；

根據所述第二損失值，更新所述語言語義理解模型的參數，得到優化后的語言語義理解模型，包括：

根據所述第二損失值，計算對所述添加擾動后語言語義理解模型進行參數更新的第二梯度；

根據所述第二梯度，更新所述語言語義理解模型的參數，得到優化后的語言語義理解模型。

4.根據權利要求1或3所述的方法，其特征在于，獲得添加擾動后的語言語義理解模型在所述目標訓練中的第二損失值，包括：

將所述問句文本樣本作為添加擾動后的輸入層的輸入，得到所述添加擾動后的輸入層輸出的對抗樣本向量；

將所述對抗樣本向量輸入所述語言語義理解模型的分類層，得到第二預測分類；

計算所述第二預測分類和所述問句文本樣本對應的分類標記的交叉熵損失，得到所述第二損失值。

5.根據權利要求3所述的方法，其特征在于，在根據所述第二損失值，計算對所述語言語義理解模型進行參數更新的第二梯度后，所述方法還包括；

累加所述第一梯度和所述第二梯度，得到累加梯度；

根據所述第二梯度，更新所述添加擾動后的語言語義理解模型的參數，得到優化后的語言語義理解模型，包括：

根據所述累加梯度，更新所述添加擾動后的語言語義理解模型的參數，得到優化后的語言語義理解模型。

6.根據權利要求3所述的方法，其特征在于，根據所述第一梯度，對所述語言語義理解模型的輸入層添加擾動，包括：

根據所述第一梯度，確定擾動系統；

對所述輸入層的原始梯度進行標準化；

將標準化后的輸入層乘以所述擾動系統，得到擾動梯度；

對所述輸入層的參數疊加所述擾動梯度。

7.一種優化語言語義理解模型裝置，其特征在于，所述裝置包括：

第一損失值獲得模塊，用于獲得語言語義理解模型在目標訓練中的第一損失值；所述目標訓練是利用目標領域的問句樣本數據精調所述語言語義理解模型的訓練；

擾動添加模塊，用于根據所述第一損失值，對所述語言語義理解模型的輸入層添加擾動；

第二損失值獲得模塊，用于獲得添加擾動后的語言語義理解模型在所述目標訓練中的第二損失值；

參數更新模塊，用于根據所述第二損失值，更新所述語言語義理解模型的參數，得到優化后的語言語義理解模型。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京捷通華聲科技股份有限公司，未經北京捷通華聲科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010970954.0/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】

[發明專利]優化語言語義理解模型方法、裝置、設備及存儲介質在審

專利文獻下載

[發明專利]優化語言語義理解模型方法、裝置、設備及存儲介質在審