[發明專利]語義分析模型訓練方法、裝置、終端設備及存儲介質有效
| 申請號: | 202110449663.1 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN112906403B | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 譚維 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/35 | 分類號: | G06F40/35;G06F40/284;G06F40/211 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 甘瑩 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 分析 模型 訓練 方法 裝置 終端設備 存儲 介質 | ||
本申請適用于人工智能技術領域,提供了一種語義分析模型訓練方法、裝置、終端設備及存儲介質,該方法包括:對樣本語句進行分詞得到分詞詞匯,對分詞詞匯進行切分標和向量轉換得到詞向量,根據詞匯順序對詞向量進行排序得到詞向量序列,對詞向量序列進行向量編碼得到上下文編碼向量;根據標記信息和上下文編碼向量構建特征訓練集;根據特征訓練集對語義分析模型進行模型訓練。本申請通過根據詞匯順序對詞向量進行排序得到詞向量序列,對詞向量序列進行向量編碼,使得上下文編碼向量中能攜帶不同分詞詞匯之間的順序特征,保障了特征訓練集中攜帶有不同樣本語句之間的關聯特征,提高了語義分析模型訓練的準確性。此外,本申請還涉及區塊鏈技術。
技術領域
本申請涉及人工智能領域,尤其涉及一種語義分析模型訓練方法、裝置、終端設備及存儲介質。
背景技術
語義分析模型是人機交互中的重要一環,語義分析模型可以用于識別用戶語音中的語義信息,并基于識別到的語音信息進行自動的語音對話,語義分析模型可用于客服機器人、語音操作界面或有聲書播報等場景。
現有的語義分析模型訓練過程中,均是直接對樣本對話信息中的語句進行領域分析和意圖理解,并未考慮樣本對話信息中上下文之間的關聯特征,使得語義分析模型的訓練準確性低下。
發明內容
有鑒于此,本申請實施例提供了一種語義分析模型訓練方法、裝置、終端設備及存儲介質,以解決現有技術的語義分析模型訓練過程中,由于直接對樣本對話信息中的語句進行領域分析和意圖理解,所導致的語義分析模型準確性確率低下的問題。
本申請實施例的第一方面提供了一種語義分析模型訓練方法,包括:
對樣本對話信息中的樣本語句進行分詞,得到分詞詞匯,并對所述分詞詞匯進行切分標記,所述切分標記用于標記對應所述分詞詞匯被切分為指定詞匯的次數;
對切分標記后的所述分詞詞匯進行向量轉換,得到詞向量,并獲取不同所述分詞詞匯之間的詞匯順序,所述詞匯順序用于表征所述分詞詞匯在所述樣本語句中的順序;
根據所述詞匯順序對所述詞向量進行排序,得到詞向量序列,所述詞向量序列包括至少兩個所述詞向量,并對所述詞向量序列進行向量編碼,得到上下文編碼向量;
獲取所述樣本語句對應的標記信息,并根據同一所述樣本語句對應的所述標記信息和所述上下文編碼向量構建特征訓練集;
根據所述特征訓練集對語義分析模型進行模型訓練,直至所述語義分析模型收斂。
進一步地,所述對所述詞向量序列進行向量編碼,得到上下文編碼向量,包括:
對所述詞向量序列進行向量轉換,得到句向量數據,所述句向量數據包括不同所述樣本語句與對應句向量之間的對應關系;
將所述句向量與所述句向量數據中其他的句向量進行組合,得到句向量組,并對所述句向量組進行向量編碼,得到所述上下文編碼向量。
進一步地,所述對切分標記后的所述分詞詞匯進行向量轉換,得到詞向量,包括:
將切分標記后的所述分詞詞匯輸入預訓練后的詞匯相關模型進行向量轉換,得到所述詞向量;
所述對所述句向量組進行向量編碼,得到所述上下文編碼向量,包括:
將所述句向量組輸入預訓練后的RNN網絡進行編碼,得到所述上下文編碼向量。
進一步地,所述對所述分詞詞匯進行切分標記,包括:
獲取所述分詞詞匯與詞匯列表之間的被匹配次數,得到詞匯切分次數,所述詞匯列表中存儲有不同預先設置的所述指定詞匯;
將所述詞匯切分次數與預設的標記信息查詢表進行匹配,得到切分標記信息,并根據所述切分標記信息對所述分詞詞匯進行標記。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110449663.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種面向復雜軟件的質量評估預測方法
- 下一篇:一種自行車T輪傳動和變速系統





