[發明專利]語義槽填充模型訓練方法及系統有效

申請號：	202010248117.7	申請日：	2020-03-31
公開（公告）號：	CN111462734B	公開（公告）日：	2022-07-26
發明（設計）人：	俞凱;劉辰;朱蘇;陳露;曹瑞升	申請（專利權）人：	思必馳科技股份有限公司
主分類號：	G10L15/06	分類號：	G10L15/06;G10L15/18
代理公司：	北京商專永信知識產權代理事務所(普通合伙) 11400	代理人：	黃謙;車江華
地址：	215123 江蘇省蘇州市蘇***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語義填充模型訓練方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語義槽填充模型訓練方法，包括：

對帶有標注的第一訓練數據集進行訓練，生成第一語義槽填充模型；

將自動語音識別的第二訓練數據集，輸入至所述第一語義槽填充模型，確定第一語義槽值對；

基于規則的錯誤糾正模型對所述第一語義槽值對進行糾正，確定第二語義槽值對，其中，所述錯誤糾正模型基于預設規則對所述第一語義槽值對進行糾正；

基于所述第二語義槽值對，對所述第一語義槽填充模型進行策略梯度訓練，確定訓練后的第二語義槽填充模型。

2.根據權利要求1所述的方法，其中，在確定訓練后的第二語義槽填充模型之后，所述方法還包括：

接收測試數據集；

將所述測試數據集輸入至所述第二語義槽填充模型，確定糾正前的槽值對；

將所述糾正前的槽值對輸入至所述錯誤糾正模型中，得到最終的槽值對。

3.根據權利要求1所述的方法，其中，所述對帶有標注的第一訓練數據集進行訓練包括：

通過雙向長短時記憶網絡對帶有標注的第一訓練數據集進行訓練。

4.根據權利要求1所述的方法，其中，所述語義槽值對包括語義三元組。

5.根據權利要求1所述的方法，其中，所述策略梯度訓練包括：Pre-training預訓練以及RL-training強化學習訓練。

6.一種語義槽填充模型訓練系統，包括：

數據訓練程序模塊，用于對帶有標注的第一訓練數據集進行訓練，生成第一語義槽填充模型；

語義槽值對確定程序模塊，用于將自動語音識別的第二訓練數據集，輸入至所述第一語義槽填充模型，確定第一語義槽值對；

糾正程序模塊，用于基于規則的錯誤糾正模型對所述第一語義槽值對進行糾正，確定第二語義槽值對，其中，所述錯誤糾正模型基于預設規則對所述第一語義槽值對進行糾正；

語義槽填充模型訓練程序模塊，用于基于所述第二語義槽值對，對所述第一語義槽填充模型進行策略梯度訓練，確定訓練后的第二語義槽填充模型。

7.根據權利要求6所述的系統，其中，所述系統還包括測試程序模塊，用于：

接收測試數據集；

將所述測試數據集輸入至所述第二語義槽填充模型，確定糾正前的槽值對；

將所述糾正前的槽值對輸入至所述錯誤糾正模型中，得到最終的槽值對。

8.根據權利要求6所述的系統，其中，所述數據訓練程序模塊用于：

通過雙向長短時記憶網絡對帶有標注的第一訓練數據集進行訓練。

9.根據權利要求6所述的系統，其中，所述語義槽值對包括語義三元組。

10.根據權利要求6所述的系統，其中，所述策略梯度訓練包括：Pre-training預訓練以及RL-training強化學習訓練。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司，未經思必馳科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010248117.7/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】