[發明專利]多意圖識別方法、裝置、設備及存儲介質有效
| 申請號: | 202011481328.1 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112507704B | 公開(公告)日: | 2023-10-03 |
| 發明(設計)人: | 桑海巖;孫雅琳;李苗苗 | 申請(專利權)人: | 中國聯合網絡通信集團有限公司;聯通大數據有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/30;G06F40/194;G06F16/332;G06F16/35 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;黃健 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 方法 裝置 設備 存儲 介質 | ||
本申請提供一種多意圖識別方法、裝置、設備及存儲介質。首先根據預設意圖分類模型確定待識別文本的掩碼向量,預設意圖分類模型通過預設數據格式表征不同的意圖類別。然后根據預設相似度模型確定每個句子對中的目標向量與參考向量之間的相似度,基于相似度得到包括候選參考文本的掩碼向量。再對候選參考文本的掩碼向量與待識別文本的掩碼向量進行預設與運算,根據運算結果確定待識別文本對應的目標意圖。從而在實際應用場景中對待識別文本可能包含的多個意圖進行有效識別,克服了現有技術中無法對多個意圖進行識別的技術缺陷,且無需單獨訓練分類器,節約了計算資源和時間,有利于被廣泛使用。
技術領域
本申請涉及語言處理技術領域,尤其涉及一種多意圖識別方法、裝置、設備及存儲介質。
背景技術
隨著人工智能技術的快速發展及廣泛應用,越來越多的行業領域涉及人機對話系統,因而需要對用戶的語言需求信息進行有效的意圖識別,以為用戶提供準確的相應服務。目前,意圖識別的相關解決方案通常有基于多分類的意圖識別方法、基于one-vs-all多標簽分類的意圖識別方法以及基于few shot learning的意圖識別方法等。
對于多分類的意圖識別方法,其思想為將多標簽轉換為多個分類器進行意圖識別。首先訓練多個分類模型,然后針對每個分類模型單獨采用傳統分類算法進行意圖識別。其中,分類模型的單獨訓練會省略待識別語言中的相關性含義。并且,不同的分類模型會預測出完全不匹配的意圖組合。另外,此解決方案需訓練多個分類模型,會占用較多的計算資源,浪費預測時間。而基于one-vs-all多標簽分類的意圖識別方法,通過標簽的多種組合形成唯一的類別標簽,可以解決相關聯一個意圖識別,無法適用于多個聯合意圖識別的應用場景,比如對于“我想充值話費,但是想先查一下余額”中的“充值-話費”和“查詢-余額”兩個聯合意圖無法進行識別。另外,基于few shot learning的意圖識別方法主要用于解決標注數據太少時意圖識別準確率較低的應用場景,但也只能用于單個意圖的識別。
可見,上述的解決方案用于對單個意圖進行識別,對于多個聯合意圖識別存在一定的技術缺陷。但是在實際應用中,用戶的一句話當中往往會包含多個聯合意圖,因而,亟需一種解決方案以解決上述技術缺陷。
發明內容
本申請提供一種多意圖識別方法、裝置、設備及存儲介質,用于解決現有的意圖識別解決方案無法或者不利于對多個聯合意圖進行有效識別的技術問題。
第一方面,本申請提供一種多意圖識別方法,包括:
根據預設意圖分類模型確定待識別文本的掩碼向量,預設意圖分類模型用于通過預設數據格式表征不同的意圖類別;
根據預設相似度模型確定每個句子對中的目標向量與參考向量之間的相似度,并根據所述相似度確定候選參考文本,以得到候選掩碼向量集合,所述候選掩碼向量集合包括所述候選參考文本的掩碼向量;
對所述候選參考文本的掩碼向量與所述待識別文本的掩碼向量進行預設與運算,以根據運算結果確定所述待識別文本對應的目標意圖。
在一種可能的設計中,所述根據預設相似度模型確定每個句子對中的目標向量與參考向量之間的相似度之前,還包括:
根據訓練文本和參考文本對預設語句向量編碼器進行訓練,以得到目標語句向量編碼器,所述參考文本為每個意圖類別對應的標準文本;
通過所述目標語句向量編碼器對所述待識別文本和各參考文本進行句子編碼,以得到所述目標向量和各參考向量;
將所述目標向量與各參考向量進行拼接,以得到拼接組合后的各句子對。
在一種可能的設計中,所述根據所述相似度確定為候選參考文本,以得到候選掩碼向量集合,包括:
將所述相似度大于預設閾值的所述參考向量對應的所述參考文本確定為所述候選參考文本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國聯合網絡通信集團有限公司;聯通大數據有限公司,未經中國聯合網絡通信集團有限公司;聯通大數據有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011481328.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:盤形剃齒刀研孔裝置
- 下一篇:一種碳負載鉑釔催化劑及其制備方法和應用





