[發明專利]基于時域和頻域的語音活性檢測方法和設備有效

申請號：	201410641920.1	申請日：	2014-11-13
公開（公告）號：	CN104464722B	公開（公告）日：	2018-05-25
發明（設計）人：	關海欣	申請（專利權）人：	北京云知聲信息技術有限公司
主分類號：	G10L15/04	分類號：	G10L15/04
代理公司：	北京英創嘉友知識產權代理事務所(普通合伙) 11447	代理人：	南毅寧;桑傳標
地址：	100191 北京市海***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	方法和設備活性檢測語音信號短時能量語音白噪聲和頻時域諧波背景噪聲頻域分析時域分析語音片段語音系統噪聲能量語音幀分幀嵌入表現
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于時域和頻域的語音活性檢測方法，其特征在于，該方法包括：

在向輸入的語音信號中加入白噪聲之前，估計所述語音信號的噪聲能量；

根據所估計的噪聲能量確定要加入的白噪聲的比例；

按照所確定的比例向所述輸入的語音信號中加入白噪聲；

對加入白噪聲后的語音信號進行分幀處理；

確定每幀的短時能量值，所述短時能量反映所述語音信號的時域特性；

確定每幀的諧波乘積譜值；以及

針對每一幀，根據該幀的短時能量值和該幀的諧波乘積譜值來共同確定該幀是否為語音幀，并得出所述語音信號中所包含的語音片段。

2.根據權利要求1所述的方法，其特征在于，對所述語音信號的噪聲能量的所述估計是動態進行的。

3.根據權利要求1所述的方法，其特征在于，所述白噪聲為高斯白噪聲。

4.根據權利要求1所述的方法，其特征在于，確定所述每幀的諧波乘積譜值的步驟包括：

對所述加入白噪聲后的語音信號進行規范化；

獲取每幀的頻域信息；以及

根據所述每幀的頻域信息來確定所述每幀的諧波乘積譜值。

5.根據權利要求1-4中任一權利要求所述的方法，其特征在于，通過以下方式來確定所述幀是否為語音幀：

在所述幀的短時能量值大于或等于第一閾值、并且所述幀的諧波乘積譜值大于或等于第二閾值的情況下，確定所述幀為所述語音幀。

6.根據權利要求1-4中任一權利要求所述的方法，其特征在于，通過以下方式來確定所述幀是否為語音幀：

利用預先建立的分類模型、根據所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類，以確定所述幀是否為所述語音幀。

7.一種基于時域和頻域的語音活性檢測設備，其特征在于，該設備包括：

用于在向輸入的語音信號中加入白噪聲之前，估計所述語音信號的噪聲能量的裝置；

用于根據所估計的噪聲能量確定要加入的白噪聲的比例的裝置；

用于按照所確定的比例向所述輸入的語音信號中加入白噪聲的裝置；

用于對加入白噪聲后的語音信號進行分幀處理的裝置；

用于確定每幀的短時能量值的裝置，所述短時能量值反映所述語音信號的時域特性；

用于確定每幀的諧波乘積譜值的裝置；以及

用于針對每一幀，根據該幀的短時能量值和該幀的諧波乘積譜值來共同確定該幀是否為語音幀，并得出所述語音信號中所包含的語音片段的裝置。

8.根據權利要求7所述的設備，其特征在于，對所述語音信號的噪聲能量的所述估計是動態進行的。

9.根據權利要求7所述的設備，其特征在于，所述白噪聲為高斯白噪聲。

10.根據權利要求7所述的設備，其特征在于，用于確定所述每幀的諧波乘積譜值的裝置包括：

用于對所述加入白噪聲后的語音信號進行規范化的裝置；

用于獲取每幀的頻域信息的裝置；以及

用于根據所述每幀的頻域信息來確定所述每幀的諧波乘積譜值的裝置。

11.根據權利要求7-10中任一權利要求所述的設備，其特征在于，通過以下方式來確定所述幀是否為語音幀：

在所述幀的短時能量值大于或等于第一閾值、并且所述幀的諧波乘積譜值大于或等于第二閾值的情況下，確定所述幀為所述語音幀。

12.根據權利要求7-10中任一權利要求所述的設備，其特征在于，通過以下方式來確定所述幀是否為語音幀：

利用預先建立的分類模型、根據所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類，以確定所述幀是否為所述語音幀。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京云知聲信息技術有限公司，未經北京云知聲信息技術有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410641920.1/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】