[發(fā)明專利]一種應(yīng)用于語音數(shù)字信號的實時自動增益控制方法有效
| 申請?zhí)枺?/td> | 202011030786.3 | 申請日: | 2020-09-27 |
| 公開(公告)號: | CN112151047B | 公開(公告)日: | 2022-08-05 |
| 發(fā)明(設(shè)計)人: | 曾慶寧;王師琦;王紅麗;張碩 | 申請(專利權(quán))人: | 桂林電子科技大學 |
| 主分類號: | G10L19/083 | 分類號: | G10L19/083;G10L21/02;G10L21/0208 |
| 代理公司: | 桂林市華杰專利商標事務(wù)所有限責任公司 45112 | 代理人: | 覃永峰 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 應(yīng)用于 語音 數(shù)字信號 實時 自動增益控制 方法 | ||
本發(fā)明公開了一種應(yīng)用于語音數(shù)字信號的實時自動增益控制方法,該方法包括:使用平滑濾波器求語音數(shù)字信號的近似上包絡(luò);將包絡(luò)作為NLMS自適應(yīng)濾波器的輸入,NLMS的目標參考值根據(jù)輸入信號為語音或非語音分別設(shè)置,將NLMS的自適應(yīng)權(quán)重作為快速增益輸出;若輸入信號長時間非語音且時間超過預(yù)設(shè)的閥值,系統(tǒng)將切換為靜默模式,快速增益設(shè)為1;若快速增益超過預(yù)設(shè)的最大增益值,則將快速增益設(shè)置為最大增益值;通過平滑濾波器將快速增益處理成平滑增益;使用平滑增益乘以輸出語音信號得到輸出語音信號。該方法具有快速、有效、實時的特點,可應(yīng)用在實時語音通話,網(wǎng)絡(luò)視頻會議等場景,能有效解決語音忽大忽小的問題,改善用戶的使用體驗。
技術(shù)領(lǐng)域
本發(fā)明涉及語音信號處理領(lǐng)域,具體是一種應(yīng)用于語音數(shù)字信號的實時自動增益控制方法。
背景技術(shù)
隨著計算機和互聯(lián)網(wǎng)技術(shù)的發(fā)展,實時語音通話和視頻通話的應(yīng)用越來越廣泛,音視頻技術(shù)也越來越得到重視。語音自動增益控制(Automatic Gain Control簡稱AGC)是音視頻技術(shù)中音頻處理的重要環(huán)節(jié),語音自動增益控制主要目標是解決語音通話時聲音忽大忽小的情況,語音自動增益控制處理效果將直接影響著用戶的體驗。近些年來,出現(xiàn)了許多實用的語音實時自動增益控制方法,他們大多都是基于語音的峰值比較和門限比較的方法,這類方法的增益響應(yīng)速度往往不夠快,對音量極小的語音信號往往增益不夠明顯。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)的不足,而提供一種應(yīng)用于語音數(shù)字信號的實時自動增益控制方法。這種方法能自適應(yīng)調(diào)整語音的增益、增益小音量的語音、減小語音音量的動態(tài)范圍,使得語音的音量變得相對統(tǒng)一,從而提高用戶的聽感體驗。
實現(xiàn)本發(fā)明目的的技術(shù)方案是:
一種應(yīng)用于語音數(shù)字信號的實時自動增益控制方法,與現(xiàn)有技術(shù)不同處在于,所述方法是采用歸一化最小均方(Normalized Least Mean Square簡稱NLMS)自適應(yīng)濾波器為核心控制單元,通過增益控制信息、包絡(luò)提取和增益平滑濾波器控制整個增益過程,包括如下步驟:
1)在語音流的處理過程中,接收到經(jīng)過降噪、消回聲和去混響處理過后的數(shù)字語音信號x(n)和語音活動檢測VAD(Voice Activity Detection簡稱VAD)的結(jié)果v(n),每次處理的語音流以采樣點為單位或以幀為單位,若語音流處理單位為樣點,則系統(tǒng)的輸入語音為x(n)=x(t)、VAD信息為v(n)=v(t),n代表當前時刻,t代表當前采樣點;若語音流處理單位為幀,則輸入語音和VAD信息分別為:
x(n)=max[X(l)],
v(n)=v(l),
其中,l代表當前幀,X(l)表示當前幀的采樣點向量,max表示取向量的最大值;
2)對步驟1)接受到的語音信號x(n)做絕對值處理,并求得語音信號x(n)近似包絡(luò)xenv(n);
3)將步驟2)中近似包絡(luò)xenv(n)作為NLMS自適應(yīng)濾波器的輸入,根據(jù)步驟1)得到的VAD結(jié)果v(n)選擇NLMS的目標參考值,將NLMS的自適應(yīng)權(quán)重作為系統(tǒng)的快速增益gf(n),包括如下過程:
3-1)將步驟2)中得到的近似包絡(luò)作為NLMS自適應(yīng)濾波器的輸入,根據(jù)步驟1)中接收到的VAD結(jié)果v(n)選取NLMS的參考值Ref,假設(shè)語音采樣點的值為-1到1之間,當語音活動時,參考值Ref取0.001;當非語音時,參考值Ref取0.5;
3-2)所述NLMS自適應(yīng)濾波器為一階自適應(yīng)濾波器,濾波器權(quán)重gf(n)即為系統(tǒng)的快速增益,快速增益的迭代公式為:
gf(n)=gf(n-1){1+μxenv(n)[Ref-yf(n-1)]},
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于桂林電子科技大學,未經(jīng)桂林電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011030786.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)字信號發(fā)送方法、發(fā)送系統(tǒng)和發(fā)送設(shè)備
- 從脈碼調(diào)制到脈寬調(diào)制的轉(zhuǎn)換方法及裝置
- 單一線路傳輸數(shù)字資料的編碼裝置及方法
- 一種信號處理設(shè)備以及影音播放系統(tǒng)
- MIMO通信方法、MIMO發(fā)送裝置和MIMO接收裝置
- 一種高清數(shù)字信號數(shù)據(jù)處理芯片及數(shù)據(jù)處理方法
- 一種數(shù)字信號處理器、發(fā)送器和系統(tǒng)
- 音頻處理編碼鎖定方法與收音裝置
- 一種數(shù)字信號加密處理方法
- 一種實現(xiàn)數(shù)字信號加密傳輸?shù)南到y(tǒng)





