[發明專利]意圖識別模型訓練方法、識別方法、裝置、設備及介質在審
| 申請號: | 202111159845.1 | 申請日: | 2021-09-30 |
| 公開(公告)號: | CN113886548A | 公開(公告)日: | 2022-01-04 |
| 發明(設計)人: | 胡超文 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06K9/62 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 模型 訓練 方法 裝置 設備 介質 | ||
本發明用于人工智能領域,涉及區塊鏈領域,公開了一種意圖識別模型訓練方法、識別方法、裝置、設備及介質,其中,方法部分包括:獲取預設對話樣本數據集,預設對話樣本數據集中對話樣本對應有意圖級別依次細化的多個標準意圖標簽;將對話樣本輸入含有初始參數的預設識別模型中,得到意圖級別依次細化的多個意圖預測標簽;根據多個意圖預測標簽和多個標準意圖標簽,確定預設識別模型的總損失值;在總損失值未達到預設收斂條件時,迭代更新預設識別模型的初始參數,直至總損失值達到預設收斂條件時得到意圖識別模型;本發明提高了每一級意圖識別任務的準確率,提高了意圖識別模型的算法精度,進而提高了對客戶意圖識別的準確性。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種意圖識別模型訓練方法、識別方法、裝置、設備及介質。
背景技術
對話系統是自然語言處理中的一項非常具有挑戰的任務,對話系統包括閑聊、問答和任務多種系統類型,能夠在不同場景為客戶提供不同的信息。在對話系統中,需要對客戶的意圖進行識別,以根據識別到的客戶意圖為用戶提供服務,意圖識別準確率影響對話系統的整體質量。
目前,意圖識別方法主要采用機器學習的方法,訓練獲得意圖識別模型,然后利用訓練好的意圖識別模型,對系統中客戶輸入文本的意圖進行識別。但在實際應用中,對客戶輸入文本的意圖識別可以細分為依次細化的多層級的意圖識別任務,例如在催收場景對話下,需要依次識別客戶本人-咨詢類-賬戶信息-還款時間等四個意圖標簽,下級意圖標簽是上級標簽的細分標簽,對具有不同層級的四個意圖標簽進行識別,能夠準確識別客戶輸入的意圖。
但現有的意圖識別模型,一般是根據客戶輸入文本在多個同級標簽中,匹配一個標簽作為客戶意圖識別結果,意圖識別模型的算法較為簡單,精度不高,導致意圖識別結果不夠準確。
發明內容
本發明提供一種意圖識別模型訓練方法、識別方法、裝置、設備及介質,以解決意圖識別模型的算法較為簡單,導致意圖識別結果不夠準確的問題。
提供一種意圖識別模型訓練方法,包括:
獲取預設對話樣本數據集,預設對話樣本數據集中的對話樣本對應一個意圖標簽鏈,意圖標簽鏈包括意圖級別依次細化的多個標準意圖標簽;
將對話樣本輸入含有初始參數的預設識別模型中,以通過預設識別模型對對話樣本進行意圖預測,得到意圖級別依次細化的多個意圖預測標簽;
根據多個意圖預測標簽和多個標準意圖標簽,確定預設識別模型的總損失值;
在總損失值未達到預設收斂條件時,迭代更新預設識別模型的初始參數,直至總損失值達到預設收斂條件時,將收斂之后的預設識別模型記錄為意圖識別模型。
提供一種意圖識別方法,包括:
獲取坐席文本和客戶文本組成的對話文本;
將對話文本輸入意圖識別模型,以使意圖識別模型對對話文本進行意圖識別,得到意圖級別依次細化的多個意圖識別標簽,意圖識別模型為根據上述意圖識別模型訓練方法得到的模型;
將多個意圖識別標簽進行拼接,以作為對話文本的意圖。
提供一種意圖識別模型訓練裝置,包括:
獲取模塊,用于獲取預設對話樣本數據集,預設對話樣本數據集中的對話樣本對應一個意圖標簽鏈,意圖標簽鏈包括意圖級別依次細化的多個標準意圖標簽;
預測模塊,用于將對話樣本輸入含有初始參數的預設識別模型中,以通過預設識別模型對對話樣本進行意圖預測,得到意圖級別依次細化的多個意圖預測標簽;
確定模塊,用于根據多個意圖預測標簽和多個標準意圖標簽,確定預設識別模型的總損失值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111159845.1/2.html,轉載請聲明來源鉆瓜專利網。





