[發明專利]意圖識別方法、系統、計算機及可讀存儲介質有效
| 申請號: | 202211040262.1 | 申請日: | 2022-08-29 |
| 公開(公告)號: | CN115099242B | 公開(公告)日: | 2022-11-15 |
| 發明(設計)人: | 羅序俊;陶俊;張琳;朱嘉欣;堯德鵬 | 申請(專利權)人: | 江西電信信息產業有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06K9/62;G10L15/22;G06F40/126;G06F16/35 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 何世磊 |
| 地址: | 330000 江西省南昌市南*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 方法 系統 計算機 可讀 存儲 介質 | ||
1.一種意圖識別方法,其特征在于,所述方法包括:
當接收到用戶發出的語音指令時,對所述語音指令進行預處理,以拆分出所述語音指令攜帶的若干文字,并獲取到與若干所述文字分別對應的初始字向量;
獲取若干預設類別的意圖分別對應的正樣本以及負樣本,并初始化意圖向量;
對所述正樣本以及所述負樣本進行切字處理,并索引出所述初始字向量,以獲取到所述正樣本以及所述負樣本中的各個文字分別對應的目標字向量;
基于所述目標字向量在所述正樣本以及所述負樣本中的位置,獲取所述正樣本以及所述負樣本中的各個所述文字對應的位置向量,并將各個所述文字對應的目標字向量和位置向量合并輸入至第一預設模型中,以獲取到對應的高維文本語義向量;
根據所述高維文本語義向量獲取到對應的文本意圖向量,并將所述文本意圖向量與所述意圖向量相乘,以獲取到所述正樣本以及所述負樣本分別對應的評分;
基于所述正樣本以及所述負樣本的評分獲取到對應的意圖距離向量,并將所述意圖距離向量輸入至預設BPR損失函數中進行訓練,以獲取到含有意圖信息的意圖向量。
2.根據權利要求1所述的意圖識別方法,其特征在于:所述當接收到用戶發出的語音指令時,對所述語音指令進行預處理,以拆分出所述語音指令攜帶的若干文字的步驟包括:
當接收到所述用戶發出的語音指令時,通過ASR將所述語音指令轉換成對應的文本,并對所述文本標注意圖標簽;
對所述文本進行切字處理,以獲取到對應的若干文字。
3.根據權利要求1所述的意圖識別方法,其特征在于:所述獲取到與若干所述文字分別對應的初始字向量的步驟包括:
對若干所述文字逐一進行one-hot編碼處理,以獲取到每一所述文字分別對應的one-hot編碼xk,并分別獲取到每一所述文字的上下相鄰文字所對應的one-hot編碼yij;
將所述one-hot編碼xk和所述one-hot編碼yij均輸入至預設Word2Vector算法模型中,以分別獲取到對應的初始字向量。
4.根據權利要求1所述的意圖識別方法,其特征在于:所述將各個所述文字對應的目標字向量和位置向量合并輸入至第一預設模型中,以獲取到對應的高維文本語義向量的步驟包括:
將各個所述文字對應的目標字向量和位置向量進行相加處理,并同時輸入至預設的bert-base-chinese模型中;
在所述bert-base-chinese模型中對所述目標字向量和所述位置向量進行特征提取,以獲取到對應的高維文本語義向量。
5.根據權利要求4所述的意圖識別方法,其特征在于:所述將所述意圖距離向量輸入至預設BPR損失函數中進行訓練,以獲取到含有意圖信息的意圖向量的步驟之后,所述方法還包括:
當獲取到實際正樣本或者實際負樣本時,將所述實際正樣本或者所述實際負樣本中的各個實際文字所分別對應的實際目標字向量和實際位置向量,并將所述實際目標字向量和所述實際位置向量合并輸入至所述bert-base-chinese模型中,以獲取到對應的實際高維文本語義向量;
將所述實際高維文本語義向量與所述含有意圖信息的意圖向量相乘,以獲取到所述實際正樣本或者所述實際負樣本對應的實際評分,并判斷所述實際評分的高低;
若判斷到所述實際評分較高時,則判定所述實際正樣本或者所述實際負樣本中不包含新的意圖;
若判斷到所述實際評分較低時,則判定所述實際正樣本或者所述實際負樣本中包含新的意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西電信信息產業有限公司,未經江西電信信息產業有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211040262.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:大功率二極管模塊測試專用工裝
- 下一篇:一種環境治理用河道清污設備





