[發明專利]音頻檢測方法、裝置、存儲介質及電子裝置在審
| 申請號: | 202010617430.3 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111883181A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 張曉萌;馬路;趙培;蘇騰榮 | 申請(專利權)人: | 海爾優家智能科技(北京)有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L25/84;G10L25/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 趙靜 |
| 地址: | 100086 北京市海淀區知春*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 檢測 方法 裝置 存儲 介質 電子 | ||
本發明實施例提供了一種音頻檢測方法、裝置、存儲介質及電子裝置,其中,該方法包括:獲取目標音頻的信號特征;使用第一模型對所述信號特征進行檢測,以確定所述目標音頻中是否包括語音,其中,所述第一模型為使用多組數據對初始模型進行機器學習訓練后得到的模型,所述多組數據中的每組數據均包括:音頻和用于標識音頻中是否包括語音的標識信息,所述初始模型包括第一全連接層和第二全連接層。通過本發明,解決了相關技術中存在的對音頻中是否存在語音檢測不準確的問題,達到準確檢測語音的效果。
技術領域
本發明實施例涉及通信領域,具體而言,涉及一種音頻檢測方法、裝置、存儲介質及電子裝置。
背景技術
語音信號處理技術是當今人機交互領域的一項關鍵技術,例如,其中包括的語音端點檢測就是從連續的語音流中檢測出有效的語音段。它包括兩個方面:檢測出有效語音的起始點,即前端點;檢測出有效語音的結束點,即后端點。在語音應用中進行語音的端點檢測是很必要的。在存儲或傳輸語音的場景下,從連續的語音流中分離出有效語音,可以降低存儲或傳輸的數據量,簡化人機交互。因此,語音端點檢測是語音通信、語音識別、語音編碼技術中前端處理的必要環節,對后續的語音處理性能表現起著至關重要的作用。
在相關技術中,語音端點檢測方法主要采用的是開源工具WebRTC中的端點檢測方法。其主要原理是將信號在頻譜上進行子帶劃分為80Hz~250Hz,250Hz~500Hz,500Hz~1K,1K~2K,2K~3K,3K~4K六個頻帶,分別將計算得到的每個頻帶能量作為特征;通過假設檢驗,構建了噪聲和語音兩個假設,從而對每個子帶構建由2個高斯分布組合的噪聲和語音的混合高斯分布模型。通過極大似然估計對模型進行自適應學習優化,并通過概率比判決推斷。由于常規的基于混合高斯模型的語音端點檢測方法,采用混合高斯模型分別語音和噪聲進行建模,對于每一幀輸入的音頻,分別計算語音的概率和噪聲的概率,之后計算兩種概率的似然比;結果與閾值進行比較,大于閾值判定為語音,小于閾值判定為靜音。然而,由于混合高斯模型的建模能力有限,無法實現對語音的精確的建模,特別是復雜的語音環境下,基于混合高斯模型的語音端點檢測性能嚴重下降。
由此可知,在相關技術中存在對音頻中是否存在語音檢測不準確的問題。
針對相關技術中存在的上述問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種音頻檢測方法、裝置、存儲介質及電子裝置,以至少解決相關技術中存在的對音頻中是否存在語音檢測不準確的問題。
根據本發明的一個實施例,提供了一種音頻檢測方法,包括:獲取目標音頻的信號特征;使用第一模型對所述信號特征進行檢測,以確定所述目標音頻中是否包括語音,其中,所述第一模型為使用多組數據對初始模型進行機器學習訓練后得到的模型,所述多組數據中的每組數據均包括:音頻和用于標識音頻中是否包括語音的標識信息,所述初始模型包括第一全連接層和第二全連接層。
根據本發明的另一個實施例,提供了一種音頻檢測裝置,包括:獲取模塊,用于獲取目標音頻的信號特征;檢測模塊,用于使用第一模型對所述信號特征進行檢測,以確定所述目標音頻中是否包括語音,其中,所述第一模型為使用多組數據對初始模型進行機器學習訓練后得到的模型,所述多組數據中的每組數據均包括:音頻和用于標識音頻中是否包括語音的標識信息,所述初始模型包括第一全連接層和第二全連接層。
根據本發明的又一個實施例,還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有計算機程序,其中,所述計算機程序被設置為運行時執行上述方法實施例中的步驟。
根據本發明的又一個實施例,還提供了一種電子裝置,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器被設置為運行所述計算機程序以執行上述方法實施例中的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海爾優家智能科技(北京)有限公司,未經海爾優家智能科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010617430.3/2.html,轉載請聲明來源鉆瓜專利網。





