[發明專利]一種語音端點檢測模型的構建方法和裝置在審
| 申請號: | 202211278320.4 | 申請日: | 2022-10-19 |
| 公開(公告)號: | CN115691562A | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 馮汝毅;曾熙璘;方輝 | 申請(專利權)人: | 廣州廣哈通信股份有限公司 |
| 主分類號: | G10L25/87 | 分類號: | G10L25/87;G10L25/30;G10L25/24 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 江嘉玲 |
| 地址: | 510663 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 端點 檢測 模型 構建 方法 裝置 | ||
本發明公開了一種語音端點檢測模型的構建方法和裝置,該方法包括:獲取初始語音信號數據集;通過第一語音端點檢測模型,對每個音頻數據樣本的語音幀進行語音段和非語音段的標注,并整合成一個語音信號合成樣本;將語音信號合成樣本隨機分割成不同時長的語音段,并在每個語音段的末端添加任意時長的靜音段,以及,在每個語音段中添加噪聲,得到若干語音信號樣本;通過若干語音信號樣本對深度學習模型進行訓練和超參數調整,得到第二語音端點檢測模型;通過模型壓縮方法對第二語音端點檢測模型進行壓縮,得到最終的語音端點檢測模型。本發明能夠解決低信噪比的環境下,混合著噪聲的語音會破壞語音的特征,對語音端點檢測的準確率造成影響的問題。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種語音端點檢測模型的構建方法和裝置。
背景技術
VAD(Voice Activity Detection),又稱語音端點檢測,是指從復雜的環境中區分出語音部分和非語音部分,并判斷出語音部分的起點和終點。傳統的VAD算法主要分為以下兩種:第一種是基于特征的閾值比較法,該方法通過提取輸入信號的特征,然后將該特征與預先設定的閾值相比較,從而區分出語音與非語音。第一種方法是模型匹配法,該方法分別為語音和非語音建立不同的模型,之后將輸入信號與相應的模型進行匹配,從而區分出語音與非語音。但是,這兩種語音端點檢測算法在低信噪比的環境下,由于混合著噪聲的語音會破壞語音的特征,使得上述兩種方法的檢測結果錯誤,對語音端點檢測的準確率造成影響。
發明內容
本發明提供一種語音端點檢測模型的構建方法和裝置,能夠解決低信噪比的環境下,混合著噪聲的語音會破壞語音的特征,對語音端點檢測的準確率造成影響的問題,以提高語音端點檢測的準確率。
本發明實施例提供了一種語音端點檢測模型的構建方法,包括:
獲取初始語音信號數據集;其中,所述初始語音信號數據集中包含若干音頻數據樣本;
通過預先構建的第一語音端點檢測模型,對每個所述音頻數據樣本的語音幀進行標注,并將所有標注好的語音幀整合成一個語音信號合成樣本;
將所述語音信號合成樣本隨機分割成不同時長的語音段,并在每個所述語音段的末端添加任意時長的靜音段,以及,在每個所述語音段中添加不同分貝和不同類型的噪聲,得到若干語音信號樣本;
通過若干所述語音信號樣本對預先構建的深度學習模型進行訓練和超參數調整,得到第二語音端點檢測模型;其中,所述深度學習模型由GRU層、Linear層和Sigmoid層組成;
通過模型壓縮方法對所述第二語音端點檢測模型進行壓縮,得到最終的語音端點檢測模型。
作為上述方案的改進,所述通過若干所述語音信號樣本對預先構建的深度學習模型進行訓練和超參數調整,得到第二語音端點檢測模型,包括:
從若干所述語音信號樣本中劃分預設比例的語音訓練數據集和語音驗證數據集;
對所述語音訓練數據集中的每個語音信號樣本進行MFCC特征提取,得到所述語音訓練數據集中每個語音信號樣本的MFCC特征數據,以構成MFCC特征數據集;
對每個所述MFCC特征數據進行一階差分運算,得到每個所述MFCC特征數據的動態特征向量,以構成動態特征向量數據集;
將所述MFCC特征數據集和所述動態特征向量數據集輸入至預先構建的深度學習模型中,并通過Adam優化器對所述深度學習模型和參數調整,得到訓練后的深度學習模型;
通過所述語音驗證數據集和網絡搜素算法,對所述訓練后的深度學習模型進行超參數調整,得到第二語音端點檢測模型。
作為上述方案的改進,所述對所述語音訓練數據集中的每個語音信號樣本進行MFCC特征提取,得到所述語音訓練數據集中每個語音信號樣本的MFCC特征數據,以構成MFCC特征數據集,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州廣哈通信股份有限公司,未經廣州廣哈通信股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211278320.4/2.html,轉載請聲明來源鉆瓜專利網。





