[發明專利]多輪對話的情緒識別模型訓練方法、裝置、設備及介質有效
| 申請號: | 202110694285.3 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113297366B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 陸凱 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/35;G06F40/30;G06F18/214 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 吳英銘 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輪對 情緒 識別 模型 訓練 方法 裝置 設備 介質 | ||
1.一種多輪對話的情緒識別模型訓練方法,其特征在于,包括:
獲取包含多個情緒標注的預設對話訓練文本;所述預設對話訓練文本為多輪對話中生成的具有上下文關系的對話句;
按照預設分組規則將所述預設對話訓練文本分成第一訓練組和第二訓練組;
對所述第一訓練組中的文本劃分序列得到語義符號序列、說話人序列和token?type序列;所述第一訓練組包括待預測句子、待預測句子的說話人信息、上下文和上下文的說話人列表;
所述對所述第一訓練組中的文本劃分序列得到語義符號序列和說話人序列,包括:
根據預設開頭語義符號和預設結尾語義符號分別對所述待預測句子開頭位置和結尾位置進行分割;
根據所述預設結尾語義符號對所述上下文的開頭位置和結尾位置進行分割;
將所述待預測句子和所述上下文的對話句中除開頭位置和結尾位置之外的位置作為詞語位置,將所述詞語位置對應的詞語確定為語義符號;
根據所述預設開頭語義符號、預設結尾語義符號和確定的語義符號生成語義符號序列;
獲取所述待預測句子的說話人信息和所述上下文的說話人列表,根據所述說話人信息和所述上下文的說話人列表在所述待預測句子和所述上下文的對話句中的每一個詞語位置、開頭位置和結尾位置標記說話人符號,并將所述說話人符號構成的序列作為所述說話人序列;
將所述第一訓練組的語義符號序列、說話人序列和token?type序列全部輸入至Bert模型后,得到所述第一訓練組的整體語義向量和位置語義向量;
根據所述第二訓練組、所述第一訓練組的整體語義向量和位置語義向量計算總損失值,根據總損失值與目標總損失值之間的差值關系更新所述Bert模型的參數,若更新參數后的Bert模型對應的總損失值小于或等于所述目標總損失值,將更新參數后的Bert模型記錄為已訓練成功的情緒識別模型。
2.根據權利要求1所述的多輪對話的情緒識別模型訓練方法,其特征在于,所述對所述第一訓練組中的文本劃分序列得到token?type序列,包括:
隨機選取一個所述第一訓練組中的待預測句子作為目標待預測句子,將所述目標待預測句子中所有詞語位置、開頭位置和結束位置對應的語義符號作為待預測部分,并將所述待預測部分對應的token?type設置為第一序列值;
選取所述上下文中的對話句,并將所述對話句中所有詞語位置、開頭位置和結尾位置的語義符號作為參考部分,并將所述參考部分對應的token?type設置為第二序列值;
將所述第一序列值和第二序列值構成的序列作為所述token?type序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110694285.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多屏拼接的集成成像3D圖像配準方法
- 下一篇:一種剝線工具





