[發明專利]一種用于語音質量客觀評價的準干凈語音構造方法在審

申請號：	201410515374.7	申請日：	2014-09-29
公開（公告）號：	CN104269180A	公開（公告）日：	2015-01-07
發明（設計）人：	賀前華;周偉力;李洪韜	申請（專利權）人：	華南理工大學
主分類號：	G10L25/60	分類號：	G10L25/60;G10L21/0216
代理公司：	廣州市華學知識產權代理有限公司 44245	代理人：	蔡茂略
地址：	510640 廣***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種用于語音質量客觀評價干凈構造方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種用于語音質量客觀評價的準干凈語音構造方法，其特征在于，包括以下步驟：

步驟1、改進的最小值控制遞歸平均算法在失真語音的噪聲譜估計中區分非語音段與語音段，根據非語音段的特性更新非語音段的噪聲譜估計值；

步驟2、對語音幀進行噪聲估計時，改進的最小值控制遞歸平均算法在確定語音幀頻帶語音存在概率時，采用新的頻率相關閾值；

步驟3、改進的最小值控制遞歸平均算法根據非語音段和語音段的噪聲功率譜估計確定最終帶噪語音的噪聲功率譜估計值；

步驟4、改進的最小值控制遞歸平均算法采用語音活動檢測方式劃分非語音段與語音段，利用過零率和短時能量時域特征，sohn算法分別確定失真語音的語音段以及語音段中的話間非語音段；

步驟5、多帶譜減法根據非語音段與語音段的劃分和對應的噪聲譜估計值，分別計算準干凈語音的非語音段與語音段的準干凈功率譜，從而獲得失真語音的準干凈語音功率譜。

2.根據權利要求1所述的用于語音質量客觀評價的準干凈語音構造方法，其特征在于，在步驟1中，所述改進的最小值控制遞歸平均算法基于非語音段與語音段的劃分；把非語音段認定為噪聲，噪聲譜估計值D(λ_uv,k)＝|Y(λ_uv,k)|²，其中，|Y(λ_uv,k)|²為非語音幀短時功率譜，λ_uv為非語音段的幀數索引，k為頻帶索引。

3.根據權利要求1所述的用于語音質量客觀評價的準干凈語音構造方法，其特征在于，在步驟2中，所述改進的最小值控制遞歸平均算法對語音幀進行噪聲估計時，采用的頻率相關閾值δ(k)的定義為：

δ(k)=1.5,1≤k≤LF,2.5,LF≤k≤MF,6.5,MF≤k≤Fs/2,]]>

其中，LF和MF分別對應1kHZ和3kHZ的頻點，Fs為采樣頻率，k為頻帶索引。

4.根據權利要求1所述的用于語音質量客觀評價的準干凈語音構造方法，其特征在于，在步驟3中，所述改進的最小值控制遞歸平均算法估計確定帶噪語音的噪聲功率譜估計值D(λ,k)分為非語音段和語音段兩部分，所述噪聲功率譜估計值D(λ,k)定義為：

其中，α_s(λ_v,k)為時頻相關的平滑因子，|Y(λ_v,k)|²為語音幀短時功率譜，D(λ_v-1,k)為當前語音幀的前一幀噪聲譜估計值。

5.根據權利要求2所述的用于語音質量客觀評價的準干凈語音構造方法，其特征在于，所述非語音段與語音段的劃分通過語音活動檢測的方式實現，即：利用過零率和短時能量等時域特征對失真語音進行粗估計，找出失真語音的語音段的開始時刻與結束時刻，排除背景噪聲，確定失真語音的整體語音段，采用sohn語音活動檢測算法對上述定位的整體語音段進行細估計，確定語音段中的語音部分和話間非語音部分。

6.根據權利要求1所述的用于語音質量客觀評價的準干凈語音構造方法，其特征在于，在步驟5中，所述的多帶譜減法計算的準干凈語音功率譜S(λ,k)分為非語音段和語音段兩部分，所述準干凈語音功率譜S(λ,k)的估計值定義為：

S(λ,k)＝(Y(λ_v,k)-D(λ_v,k))+(Y(λ_uv,k)-D(λ_uv,k))，

其中，|Y(λ_v,k)|²為語音幀短時功率譜，|Y(λ_uv,k)|²為非語音幀短時功率譜，D(λ_v,k)為語音幀噪聲功率譜估計值，D(λ_uv,k)為非語音幀噪聲功率譜估計值。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于華南理工大學，未經華南理工大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410515374.7/1.html，轉載請聲明來源鉆瓜專利網。