[發明專利]一種用于語音質量客觀評價的準干凈語音構造方法在審

申請號：	201410515374.7	申請日：	2014-09-29
公開（公告）號：	CN104269180A	公開（公告）日：	2015-01-07
發明（設計）人：	賀前華;周偉力;李洪韜	申請（專利權）人：	華南理工大學
主分類號：	G10L25/60	分類號：	G10L25/60;G10L21/0216
代理公司：	廣州市華學知識產權代理有限公司 44245	代理人：	蔡茂略
地址：	510640 廣***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種用于語音質量客觀評價干凈構造方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種語音質量客觀評價技術，特別涉及一種用于語音質量客觀評價的準干凈語音構造方法，該語音構造方法屬于無參考源(Non-intrusive)的語音質量客觀評價領域。

背景技術

語音質量好壞是評價語音通信系統優劣的重要標準之一。語音質量評價一般分為主觀評價方法和客觀評價方法。主觀評價方法依靠評聽者意見對語音質量做出判決，是直接反映用戶對系統好壞的觀點，其中ITU-T建議P.830提出的MOS(Mean?Opinion?Score)是一種廣泛使用的主觀評價方法。但是，主觀評價方法重復性差，難以組織實施不夠靈活，容易受人的主觀因素影響，不利于在生產過程和現場實驗中應用。

客觀評價方法杜絕了人為因素可能產生的影響，針對語音信號的特定特征，采用信號處理的方式實現語音質量的評價過程?？陀^評價方法根據是否需要參考源信號(干凈語音)分為有參考源(Intrusive)客觀評價方法和無參考源(Non-Intrusive)客觀評價方法。有參考源客觀評價方法以語音系統的輸入信號和輸出信號之間的誤差大小判別語音質量的好壞，是一種誤差度量，其中ITU-T建議P.862提出的PESQ感知語音質量評價是目前性能較好的有參考源客觀評價方法，能夠較好的識別通信時延，環境噪聲和錯誤。然而，PESQ以及其他有參考源客觀評價方法需要使用輸入語音(干凈語音)作為參考，不能在只有失真信號的應用領域中使用。

ITU-T建議P.563是目前無參考源客觀評價方法的標準，能夠應用于無參考信號的VoIP和電信網絡性能的監測，但其運算復雜度高，不利于實時評價語音質量，且評價性能不及PESQ。目前主流的基于統計模型的客觀評價方法主要基于高斯混合模型(GMM)和矢量量化(Vector?Quantization)，該類方法在模型訓練過程中將干凈語音訓練為參考模型和參考碼本，測試時將失真語音與參考模型與參考碼本進行失真計算，誤差結果映射為最終的客觀質量評分?；诮y計模型在模型訓練過程中不僅需要大量的干凈語音數據，而且其評價性能與PESQ相差較大。

準干凈語音構造技術通過噪聲跟蹤算法估計失真語音的噪聲譜，消除失真語音的噪聲部分，獲得失真語音的準干凈語音。不同于語音活動檢測(Voice?Activity?Detection)只在非語音段更新噪聲功率譜，噪聲跟蹤算法能夠在話音活動期間持續進行較好的噪聲估計，更加適合噪聲非平穩場景。最小值控制遞歸平均算法相對于其他噪聲跟蹤算法(Martin,2001；Doblinger,1995；Hirsch?and?Ehrlicher,1995；Cohen,2003)能夠更快地在非平穩噪聲環境下估計噪聲功率譜。但是，最小值控制遞歸平均算法在估計與更新噪聲譜時統一對失真語音進行估計，并沒有對失真語音進行語音段和非語音段的區分，因此估計結果與實際的噪聲功率譜相比存在一定的誤差，并且對失真語音噪聲譜的統一估計增加了計算復雜度，降低了算法的效率，不利于實時估計。

發明內容

本發明的目的在于克服現有技術中無參考源客觀評價方法的缺陷的缺點與不足，提供一種用于語音質量客觀評價的準干凈語音構造方法，該語音構造方法，可以將噪聲跟蹤與消除方法引入失真語音的準干凈語音構造。

本發明的目的通過下述技術方案實現：一種用于語音質量客觀評價的準干凈語音構造方法，包括以下步驟：

步驟1、改進的最小值控制遞歸平均算法在失真語音的噪聲譜估計中區分非語音段與語音段，根據非語音段的特性更新非語音段的噪聲譜估計值；

步驟2、對語音幀進行噪聲估計時，改進的最小值控制遞歸平均算法在確定語音幀頻帶語音存在概率時，采用新的頻率相關閾值；

步驟3、改進的最小值控制遞歸平均算法根據非語音段和語音段的噪聲功率譜估計確定最終帶噪語音的噪聲功率譜估計值；

步驟4、改進的最小值控制遞歸平均算法采用語音活動檢測方式劃分非語音段與語音段，利用過零率和短時能量時域特征，sohn算法分別確定失真語音的語音段以及語音段中的話間非語音段；

步驟5、多帶譜減法根據非語音段與語音段的劃分和對應的噪聲譜估計值，分別計算準干凈語音的非語音段與語音段準干凈功率譜，從而獲得失真語音的準干凈語音功率譜。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于華南理工大學，未經華南理工大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410515374.7/2.html，轉載請聲明來源鉆瓜專利網。