[發(fā)明專利]一種語音降噪方法及均衡濾波器在審
| 申請?zhí)枺?/td> | 202010847765.4 | 申請日: | 2020-08-21 |
| 公開(公告)號: | CN111968664A | 公開(公告)日: | 2020-11-20 |
| 發(fā)明(設(shè)計)人: | 周靖軒;張華軍;鄧小濤;湯申亮;王征華 | 申請(專利權(quán))人: | 武漢大晟極科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0232;G10L25/27 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 王丹 |
| 地址: | 430223 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)光*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 方法 均衡 濾波器 | ||
本發(fā)明提供一種語音降噪方法及均衡濾波器,對輸入的語音信號進行快速傅里葉變換,使得各個頻段的信號分開;對所需要變換的各個頻段進行均衡處理;各個頻段中,設(shè)一個頻段為一幀信號,每一幀信號的幀長為N,幀移為M,相鄰兩幀之間的重疊部分為N?M;截掉每一幀信號的前面一部分a和后面一部分b,且a+b=N?M,保留中間長度為M的信號;將截取后的每一幀信號代替截取前的對應(yīng)信號,拼接在對應(yīng)的位置,得到新的頻域信號;對新的頻域信號進行快速傅里葉反變換,得到處理后的語音信號。本發(fā)明通過分幀截取和拼接,能有效避免均衡濾波器降噪處理語音信號后相鄰語音頻帶疊加的干擾問題,而且算法容易實現(xiàn),數(shù)據(jù)計算需求不大,有很廣闊的應(yīng)用范圍。
技術(shù)領(lǐng)域
本發(fā)明屬于語音信號處理技術(shù)領(lǐng)域,具體涉及一種語音降噪方法及均衡濾波器。
背景技術(shù)
語音信號是人類生活中常見的數(shù)字信號,是人類相互交流的信息載體,包含了眾多的信息,其特點是典型的非平穩(wěn)時變信號。人聲音頻率一般在60~500Hz,不同人的發(fā)音頻率與年齡、性別有關(guān)。而在初始語音信號采集的過程中,通常是在真實環(huán)境下的語音采集,包含有各種噪聲,這給后續(xù)語音分析帶來了很大的干擾,所以對原始語音進行降噪處理的研究非常重要。降噪的主要目的在于從帶噪語音中盡可能提取出原始語音信號,過濾掉噪聲信號的影響,為后續(xù)語音分析提供更可靠的語音信號。
目前有許多錄音設(shè)備都有降噪的模塊,主要原理是使語音信號通過濾波器處理。數(shù)字圖形均衡器是濾波器的一種,其作用是對聲音信號頻率響應(yīng)反應(yīng)及振幅進行調(diào)整,從而達到特定的聲音處理效果,比如降噪或語音增強。但是傳統(tǒng)的基于傅里葉變換算法設(shè)計的均衡器,在語音分幀對每幀信號處理之后,再將處理后的分幀信號拼接起來的時候存在相鄰頻帶重疊的情況,頻帶間的真實幅度值為相鄰頻帶在該位置幅度之和,從而導(dǎo)致處理后的信號存在類似周期性的脈沖干擾,降低了語音質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是:提供一種語音降噪方法及均衡濾波器,消除相鄰頻帶的重疊問題,提升語音質(zhì)量。
本發(fā)明為解決上述技術(shù)問題所采取的技術(shù)方案為:一種語音降噪方法,本方法包括以下步驟:
S1、對輸入的語音信號進行快速傅里葉變換,使得各個頻段的信號分開;
S2、對所需要變換的各個頻段進行均衡處理;
S3、音頻截取和拼接處理:
所述的各個頻段中,設(shè)一個頻段為一幀信號,每一幀信號的幀長為N,幀移為M,相鄰兩幀之間的重疊部分為N-M;
截取:截掉每一幀信號的前面一部分a和后面一部分b,且a+b=N-M,保留中間長度為M的信號;
拼接:將截取后的每一幀信號代替截取前的對應(yīng)信號,拼接在對應(yīng)的位置,得到新的頻域信號;
S4、快速傅里葉反變換:
對新的頻域信號進行快速傅里葉反變換,得到處理后的語音信號。
按上述方法,所述的a=b=(N-M)/2。
按上述方法,所述的S1還包括:繪制原始語音的波形圖和語譜圖,作為后續(xù)的調(diào)節(jié)參考。
一種語音降噪系統(tǒng),本系統(tǒng)包括:
快速傅里葉變換模塊,用于對輸入的語音信號進行快速傅里葉變換,使得各個頻段的信號分開;
均衡處理模塊,用于對所需要變換的各個頻段進行均衡處理;
音頻截取和拼接處理模塊,用于截掉每一幀信號的前面一部分a和后面一部分b,且a+b=N-M,保留中間長度為M的信號;以及將截取后的每一幀信號代替截取前的對應(yīng)信號,拼接在對應(yīng)的位置,得到新的頻域信號;所述的各個頻段中,設(shè)一個頻段為一幀信號,每一幀信號的幀長為N,幀移為M,相鄰兩幀之間的重疊部分為N-M;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大晟極科技有限公司,未經(jīng)武漢大晟極科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010847765.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





