[發明專利]多意圖識別方法、裝置、設備及介質在審
| 申請號: | 202111389106.1 | 申請日: | 2021-11-22 |
| 公開(公告)號: | CN114153956A | 公開(公告)日: | 2022-03-08 |
| 發明(設計)人: | 劉軼;黃石磊;程剛;汪雪 | 申請(專利權)人: | 深圳市北科瑞聲科技股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/284;G06F40/289;G10L15/26 |
| 代理公司: | 深圳智匯遠見知識產權代理有限公司 44481 | 代理人: | 劉潔 |
| 地址: | 518036 廣東省深圳市福田區梅林街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 方法 裝置 設備 介質 | ||
本申請涉及一種多意圖識別方法,包括:獲取用戶語音,提取所述用戶語音的音頻特征,以及獲取所述用戶語音對應的語音文本;根據所述語音文本和所述音頻特征構建所述用戶語音的意圖矩陣;對所述意圖矩陣中的元素進行多次隨機采樣,得到所述意圖矩陣的多個子集矩陣;將所述多個子集矩陣中每個子集矩陣與預設多種意圖標簽進行匹配,根據匹配結果確定所述用戶語音的多種意圖。此外,本申請還涉及一種多意圖識別裝置、設備及介質。本申請可解決進行意圖識別時,難以識別出多個意圖的問題。
技術領域
本申請涉及音頻分析領域,尤其涉及一種多意圖識別方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
隨著人工智能技術的不斷發展,越來越多的智能產品應用到日常生活中,例如智能音箱、智能客服、智能電話銷售、私人手機助理Siri等。為了讓智能產品更好地理解用戶的表達,進而對用戶的問題作出正確應答,自然語言理解(Natural LanguageUnderstanding,NLU)起到了重要的作用,而意圖識別是自然語言理解的子模塊,也是智能對話系統構成的關鍵。
現有的意圖識別主要為單意圖識別,即根據用戶語料識別出單一的用戶意圖,但很多時候用戶表達的一句話中不僅含有一個意圖,而是多種意圖,若僅進行單意圖識別,會導致識別結果的不精確,例如,用戶說:“我不喜歡吃街角的那家甜品店的糕點,它太甜了”。這句話同時表達了用戶的不喜歡街角的甜品店和對甜品店糕點的甜度不滿意的意圖。因此,如何實現對用戶語料中多意圖的識別,成為了亟待解決的問題。
發明內容
本申請提供了一種多意圖識別方法、裝置、電子設備及存儲介質,以解決進行意圖識別時,難以識別出多個意圖的問題。
第一方面,本申請提供了一種多意圖識別方法,所述方法包括:
獲取用戶語音,提取所述用戶語音的音頻特征,以及獲取所述用戶語音對應的語音文本;
根據所述語音文本和所述音頻特征構建所述用戶語音的意圖矩陣;
對所述意圖矩陣中的元素進行多次隨機采樣,得到所述意圖矩陣的多個子集矩陣;
將所述多個子集矩陣中每個子集矩陣與預設多種意圖標簽進行匹配,根據匹配結果確定所述用戶語音的多種意圖。
詳細地,所述提取所述用戶語音的音頻特征,包括:
對所述用戶語音進行分幀加窗,得到多個語音幀,并從所述多個語音幀中逐個選取其中一個語音幀為目標語音幀;
將所述目標語音幀映射為語音時域圖,統計所述語音時域圖的峰值、幅值、均值和過零率,根據所述幅值計算幀能量,并將所述峰值、所述幅值、所述均值、所述幀能量及所述過零率匯集為時域特征;
利用預設濾波器將所述用戶語音轉換為譜域圖,統計所述譜域圖的譜域密度、譜熵和共振峰參數,得倒譜域特征;
通過傅里葉逆變換將所述譜域圖轉換為倒譜域圖,統計所述倒譜域圖的倒譜域密度、倒譜熵和倒譜周期,得到所述倒譜域特征;
將所述時域特征、所述譜域特征和所述倒譜域特征匯集為語音特征。
詳細地,所述根據所述語音文本和所述音頻特征構建所述用戶語音的意圖矩陣,包括:
將所述語音文本拆分為文本分詞,并將所述文本分詞轉換為詞向量;
根據所述音頻特征和所述詞向量構建所述用戶語音的意圖矩陣。
詳細地,所述將所述語音文本拆分為文本分詞,并將所述文本分詞轉換為詞向量,包括:
刪除所述語音文本中的無義詞,得到標準文本;
將所述標準文本按照不同的長度在預設的標準詞典中進行檢索,并將可在所述標準詞典中檢索到的內容匯集為文本分詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市北科瑞聲科技股份有限公司,未經深圳市北科瑞聲科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111389106.1/2.html,轉載請聲明來源鉆瓜專利網。





