[發明專利]語音情緒識別方法、裝置及存儲介質有效
| 申請號: | 202010155947.5 | 申請日: | 2020-03-09 |
| 公開(公告)號: | CN111445899B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 徐健 | 申請(專利權)人: | 咪咕文化科技有限公司;中國移動通信集團有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/26;G10L25/63 |
| 代理公司: | 上海晨皓知識產權代理事務所(普通合伙) 31260 | 代理人: | 成麗杰 |
| 地址: | 100088 北京市西城區德*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 情緒 識別 方法 裝置 存儲 介質 | ||
本發明涉及語音識別領域,特別涉及一種語音情緒識別方法、裝置及存儲介質。語音情緒識別方法,包括:比較原始語音的幀數和預設語音幀數;如果所述原始語音的幀數小于所述預設語音幀數,則復制所述原始語音的幀并插入所述原始語音中,得到符合所述預設語音幀數的標準語音;根據所述標準語音和預設語音情緒識別模型,對所述原始語音對應的情緒進行識別。采用本發明的實施例,能夠在保持原始語音的語音特征下進行語音情緒的識別,以保障識別結果的準確度。
技術領域
本發明涉及語音識別領域,特別涉及一種語音情緒識別方法、裝置及存儲介質。
背景技術
隨著科技的迅速發展,自動語音識別服務已經逐漸滲入日常生活的各個方面。通常人們所說的自動語音識別,大多是把語音內容轉換成對應含義的文本內容;但人們所說的話除了包括文本內容,還有其他例如音量、語調和說話情緒等重要內容,這些其他內容都會對文本內容的理解產生較大的影響,有時候說話的情緒不同可能導致對同一句話理解出完全相反的意思;因此,識別語音對應的情緒是語音識別服務中較為重要的一部分,相關技術中通常基于深度學習網絡進行語音情緒的識別。然而發明人發現相關技術中存在如下問題:在進行語音情緒的識別時,輸入的語音幀數不盡相同,因此為了滿足輸入長度要求,通常在提取到語音的特征后,將不等長的特征補零至相同長度,再進行語音情緒的識別,這樣會丟失掉原始語音中包含的部分內容,導致后續對于語音情緒識別的準確性不高。
發明內容
本發明實施例的目的在于提供一種語音情緒識別方法、裝置及存儲介質,能夠在保持原始語音的語音特征下進行語音情緒的識別,以保障識別結果的準確度。
為解決上述技術問題,本發明的實施例提供了一種語音情緒識別方法,包括:比較原始語音的幀數和預設語音幀數;如果所述原始語音的幀數小于所述預設語音幀數,則復制所述原始語音的幀并插入所述原始語音中,得到符合所述預設語音幀數的標準語音;根據所述標準語音和預設語音情緒識別模型,對所述原始語音對應的情緒進行識別。
本發明的實施例還提供了一種語音情緒識別裝置,包括:至少一個處理器;以及,與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述的語音情緒識別方法。
本發明的實施例還提供了一種計算機可讀存儲介質,存儲有計算機程序,所述計算機程序被處理器執行時實現上述的語音情緒識別方法。
本發明實施例相對于現有技術而言,比較原始語音的幀數和預設語音幀數;如果所述原始語音的幀數小于所述預設語音幀數,則復制所述原始語音的幀并插入所述原始語音中,得到符合所述預設語音幀數的標準語音;根據所述標準語音和預設語音情緒識別模型,對所述原始語音對應的情緒進行識別;也就是說,當原始語音的長度較短,即幀數較少時,直接對原始語音進行變長處理,因此保留了原始語音中包括的內容;在對原始語音進行變長處理時,是采用原始語音中的幀來擴充原始語音的幀數,因此得到的符合預設語音幀數的標準語音,也是由原始語音中的幀組成的,因此保留了原始語音的語音特征,避免了采用插入與原始語音無關的幀來擴充幀數時可能導致原始語音的語音特征發生改變的情況;在后續對標準語音進行語音情緒識別時,原始語音的語音特征有效保障了識別結果的準確度。
另外,所述復制所述原始語音的幀并插入所述原始語音中,包括:計算所述原始語音的指標值,并與預設閾值比較;如果所述指標值小于所述預設閾值,則依次復制所述原始語音的每一幀,并將復制的幀插入被復制的幀之后;如果所述指標值大于所述預設閾值,則復制所述原始語音的所有幀,并將復制的所述所有幀插入至所述原始語音的結束幀之后。上述提供了復制原始語音中的幀來擴充原始語音的幀數的方式,目的在于保持原始語音的語音特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于咪咕文化科技有限公司;中國移動通信集團有限公司,未經咪咕文化科技有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010155947.5/2.html,轉載請聲明來源鉆瓜專利網。





