[發明專利]多意圖識別方法、裝置、設備及介質在審

申請號：	202111389106.1	申請日：	2021-11-22
公開（公告）號：	CN114153956A	公開（公告）日：	2022-03-08
發明（設計）人：	劉軼;黃石磊;程剛;汪雪	申請（專利權）人：	深圳市北科瑞聲科技股份有限公司
主分類號：	G06F16/332	分類號：	G06F16/332;G06F16/33;G06F40/284;G06F40/289;G10L15/26
代理公司：	深圳智匯遠見知識產權代理有限公司 44481	代理人：	劉潔
地址：	518036 廣東省深圳市福田區梅林街道***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	意圖識別方法裝置設備介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請涉及一種多意圖識別方法，包括：獲取用戶語音，提取所述用戶語音的音頻特征，以及獲取所述用戶語音對應的語音文本；根據所述語音文本和所述音頻特征構建所述用戶語音的意圖矩陣；對所述意圖矩陣中的元素進行多次隨機采樣，得到所述意圖矩陣的多個子集矩陣；將所述多個子集矩陣中每個子集矩陣與預設多種意圖標簽進行匹配，根據匹配結果確定所述用戶語音的多種意圖。此外，本申請還涉及一種多意圖識別裝置、設備及介質。本申請可解決進行意圖識別時，難以識別出多個意圖的問題。

技術領域

本申請涉及音頻分析領域，尤其涉及一種多意圖識別方法、裝置、電子設備及計算機可讀存儲介質。

背景技術

隨著人工智能技術的不斷發展，越來越多的智能產品應用到日常生活中，例如智能音箱、智能客服、智能電話銷售、私人手機助理Siri等。為了讓智能產品更好地理解用戶的表達，進而對用戶的問題作出正確應答，自然語言理解(Natural LanguageUnderstanding,NLU)起到了重要的作用，而意圖識別是自然語言理解的子模塊，也是智能對話系統構成的關鍵。

現有的意圖識別主要為單意圖識別，即根據用戶語料識別出單一的用戶意圖，但很多時候用戶表達的一句話中不僅含有一個意圖，而是多種意圖，若僅進行單意圖識別，會導致識別結果的不精確，例如，用戶說：“我不喜歡吃街角的那家甜品店的糕點，它太甜了”。這句話同時表達了用戶的不喜歡街角的甜品店和對甜品店糕點的甜度不滿意的意圖。因此，如何實現對用戶語料中多意圖的識別，成為了亟待解決的問題。

發明內容

本申請提供了一種多意圖識別方法、裝置、電子設備及存儲介質，以解決進行意圖識別時，難以識別出多個意圖的問題。

第一方面，本申請提供了一種多意圖識別方法，所述方法包括：

獲取用戶語音，提取所述用戶語音的音頻特征，以及獲取所述用戶語音對應的語音文本；

根據所述語音文本和所述音頻特征構建所述用戶語音的意圖矩陣；

對所述意圖矩陣中的元素進行多次隨機采樣，得到所述意圖矩陣的多個子集矩陣；

將所述多個子集矩陣中每個子集矩陣與預設多種意圖標簽進行匹配，根據匹配結果確定所述用戶語音的多種意圖。

詳細地，所述提取所述用戶語音的音頻特征，包括：

對所述用戶語音進行分幀加窗，得到多個語音幀，并從所述多個語音幀中逐個選取其中一個語音幀為目標語音幀；

將所述目標語音幀映射為語音時域圖，統計所述語音時域圖的峰值、幅值、均值和過零率，根據所述幅值計算幀能量，并將所述峰值、所述幅值、所述均值、所述幀能量及所述過零率匯集為時域特征；

利用預設濾波器將所述用戶語音轉換為譜域圖，統計所述譜域圖的譜域密度、譜熵和共振峰參數，得倒譜域特征；

通過傅里葉逆變換將所述譜域圖轉換為倒譜域圖，統計所述倒譜域圖的倒譜域密度、倒譜熵和倒譜周期，得到所述倒譜域特征；