[發明專利]一種基于幀分類的語音端點檢測方法及裝置在審
| 申請號: | 202111208674.7 | 申請日: | 2021-10-18 |
| 公開(公告)號: | CN114141234A | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 王亞東 | 申請(專利權)人: | 浙江大搜車軟件技術有限公司 |
| 主分類號: | G10L15/05 | 分類號: | G10L15/05 |
| 代理公司: | 杭州華進聯浙知識產權代理有限公司 33250 | 代理人: | 賀才杰 |
| 地址: | 310000 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分類 語音 端點 檢測 方法 裝置 | ||
本申請涉及一種基于幀分類的語音端點檢測方法及裝置,該方法包括,獲取待檢測的第一語音數據;對第一語音數據進行分幀處理,得到多個第一語音數據幀,每個第一語音數據幀的時間長度相同;對多個第一語音數據幀進行特征提取,得到每個第一語音數據幀的第一特征;將第一特征輸入預先訓練好的分類模型中,得到每個第一語音數據幀對應的第一標簽;分類模型用于對第一語音數據幀進行分類,第一標簽用來表示第一語音數據幀中是否包含有效語音;根據第一語音數據幀及對應的第一標簽,確定第一語音數據的語音端點。通過本申請,解決了現有技術中的VAD檢測不準確的問題,提高了VAD檢測的準確率。
技術領域
本申請涉及語音檢測領域,特別是涉及一種基于幀分類的語音端點檢測方法及裝置。
背景技術
VAD(Voice Activity Detection,語音端點檢測)的目的是從語音信號中識別和消除靜音。VAD作為ASR(Automatic Speech Recognition,自動語音識別)的前處理手段,一方面負責檢測靜音,只有檢測到人聲時才將語音信號送到ASR系統進行識別,節省計算資源;另一方面,通過VAD可以將長音頻切分為多個短音頻,可以為ASR結果實現斷句,方便在后處理工作中添加標點。
VAD的難點在于語音信號往往不是純凈的人聲和靜音,麥克風在采音過程中,會將人聲和說話人所處環境的噪聲同時采集,這在很大程度上影響了VAD的準確性。通常定義靜音和純噪聲為無效語音,人聲和帶噪人聲為有效語音。
現有的基于閾值的VAD,通過提取時域(短時能量、短期過零率等)或頻域(MFCC、譜熵等)特征,通過合理的設置門限,達到區分語音和非語音的目的。
現有的基于閾值的VAD,會產生VAD誤檢和漏檢。VAD誤檢,指將無效語音識別為有效語音,會導致ASR計算資源的浪費。VAD漏檢,指將有效語音識別為無效語音,會導致ASR結果的缺失。VAD的準確率將直接影響到ASR的性能和準確率。
針對相關技術中存在VAD檢測不準確的情況,目前還沒有提出有效的解決方案。
發明內容
在本實施例中提供了一種基于幀分類的語音端點檢測方法及裝置,以解決相關技術中VAD檢測不準確的問題。
第一個方面,在本實施例中提供了一種基于幀分類的語音端點檢測方法,所述方法包括,
獲取待檢測的第一語音數據;
對所述第一語音數據進行分幀處理,得到多個第一語音數據幀,每個第一語音數據幀的時間長度相同;
對所述多個第一語音數據幀進行特征提取,得到每個第一語音數據幀的第一特征;
將所述第一特征輸入預先訓練好的分類模型中,得到每個第一語音數據幀對應的第一標簽;所述分類模型用于對所述第一語音數據幀進行分類,所述第一標簽用來表示所述第一語音數據幀中是否包含有效語音;
根據所述第一語音數據幀及對應的第一標簽,確定所述第一語音數據的語音端點。
在其中的一些實施例中,所述根據所述第一語音數據幀及對應的第一標簽,確定所述第一語音數據的語音端點,包括,
若連續M個第一語音數據幀中包含有效語音信息,則確定第一個包含有效語音信息的第一語音數據幀為所述第一語音數據的一段語音開始幀;其中,M為大于或等于5的自然數;
若連續N個第一語音數據幀中不包含有效語音信息,則確定第一個不包含有效語音信息的第一語音數據幀為所述第一語音數據的一段語音結束幀;其中,N為大于或等于5的自然數;
所述語音開始幀和所述語音結束幀為所述第一語音數據的語音端點。
在其中的一些實施例中,所述獲取待檢測的第一語音數據之前,包括,構建用于所述分類模型訓練的第二語音數據幀;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大搜車軟件技術有限公司,未經浙江大搜車軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111208674.7/2.html,轉載請聲明來源鉆瓜專利網。





