[發明專利]基于深度神經網絡模型的帶噪語音端點檢測方法及裝置在審
| 申請號: | 202110478661.5 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113327633A | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 詹瑾;趙慧民;黃科喬 | 申請(專利權)人: | 廣東技術師范大學 |
| 主分類號: | G10L25/87 | 分類號: | G10L25/87;G10L25/30;G10L15/16;G10L15/04 |
| 代理公司: | 廣東廣盈專利商標事務所(普通合伙) 44339 | 代理人: | 李俊 |
| 地址: | 510630 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 神經網絡 模型 語音 端點 檢測 方法 裝置 | ||
1.一種基于深度神經網絡模型的帶噪語音端點檢測方法,其特征在于,所述方法包括:
獲得帶噪語音信息數據;
對于所述帶噪語音信息數據進行預處理,獲得預處理后的帶噪語音信息數據;
對所述預處理后的帶噪語音信息數據進行小波變換處理,獲得小波變換后的帶噪語音信息數據;
基于所述小波變換后的帶噪語音信息數據進行能量熵計算,獲得能量熵計算結果;
基于所述能量熵計算結果進行能量熵特征矩陣的構建,獲得能量熵特征矩陣;
將所述能量熵特征矩陣輸入預設的深度神經網絡模型中進行端點檢測識別處理,輸出端點檢測識別結果。
2.根據權利要求1所述的帶噪語音端點檢測方法,其特征在于,所述獲得帶噪語音信息數據,包括:
基于預設的麥克風設備進行語音信息采集處理,獲得帶噪語音信息數據;或,接收用戶輸入的方式獲得帶噪語音信息數據。
3.根據權利要求1所述的帶噪語音端點檢測方法,其特征在于,所述對于所述帶噪語音信息數據進行預處理,獲得預處理后的帶噪語音信息數據,包括:
基于漢明窗函數對所述帶噪語音信息數據進行加窗處理,獲得加窗處理結果;
對所述加窗處理結果進行按照預設分幀規則進行分幀處理,獲得預處理后的帶噪語音信息數據。
4.根據權利要求1所述的帶噪語音端點檢測方法,其特征在于,所述對所述預處理后的帶噪語音信息數據進行小波變換處理,獲得小波變換后的帶噪語音信息數據,包括:
獲得用于小波變換的分解過程中的分解層數;
基于所述分解層數對所述預處理后的帶噪語音信息數據進行小波變換處理,獲得小波變換后的帶噪語音信息數據。
5.根據權利要求4所述的帶噪語音端點檢測方法,其特征在于,所述獲得用于小波變換的分解過程中的分解層數,包括:
基于所述預處理后的帶噪語音信息數據的語音信噪比;
基于所述語音信噪比獲得用于小波變換的分解過程中的分解層數。
6.根據權利要求1所述的帶噪語音端點檢測方法,其特征在于,所述基于所述小波變換后的帶噪語音信息數據進行能量熵計算,獲得能量熵計算結果,包括:
對所述小波變換后的帶噪語音信息數據的每層重構信號的每幀進行能量熵計算,獲得能量熵計算結果。
7.根據權利要求1所述的帶噪語音端點檢測方法,其特征在于,所述基于所述能量熵計算結果進行能量熵特征矩陣的構建,獲得能量熵特征矩陣,包括:
基于所述能量熵計算結果的高頻系數能量熵進行能量熵特征矩陣的構建,獲得高頻能量熵特征矩陣;
基于所述能量熵計算結果的低頻系數能量熵進行能量熵特征矩陣的構建,獲得低頻能量熵特征矩陣;
將所述高頻能量熵特征矩陣和所述低頻能量熵特征矩陣按照預設比例系數進行矩陣融合,獲得能量熵特征矩陣。
8.根據權利要求7所述的帶噪語音端點檢測方法,其特征在于,所述比例系數之和為1。
9.根據權利要求1所述的帶噪語音端點檢測方法,其特征在于,所述預設的深度神經網絡模型為利用帶噪的訓練語音信息數據所構建的訓練能量熵特征矩陣進行訓練后,并利用帶噪的測試語音信息數據所構建的訓練能量熵特征矩陣進行測試,測試結果達到預設閾值的收斂深度神經網絡模型。
10.一種基于深度神經網絡模型的帶噪語音端點檢測裝置,其特征在于,所述裝置包括:
獲得模塊:用于獲得帶噪語音信息數據;
預處理模塊:用于對于所述帶噪語音信息數據進行預處理,獲得預處理后的帶噪語音信息數據;
小波變換模塊:用于對所述預處理后的帶噪語音信息數據進行小波變換處理,獲得小波變換后的帶噪語音信息數據;
計算模塊:用于基于所述小波變換后的帶噪語音信息數據進行能量熵計算,獲得能量熵計算結果;
矩陣構建模塊:用于基于所述能量熵計算結果進行能量熵特征矩陣的構建,獲得能量熵特征矩陣;
檢測識別模塊:用于將所述能量熵特征矩陣輸入預設的深度神經網絡模型中進行端點檢測識別處理,輸出端點檢測識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東技術師范大學,未經廣東技術師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110478661.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光連接設備及局域網路系統
- 下一篇:一種自組網與多路傳輸結合的勤務系統





