[發(fā)明專利]確定聲學(xué)回聲消除中系統(tǒng)延時(shí)的方法及聲學(xué)回聲消除方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310728989.3 | 申請(qǐng)日: | 2013-12-25 |
| 公開(公告)號(hào): | CN103700374A | 公開(公告)日: | 2014-04-02 |
| 發(fā)明(設(shè)計(jì))人: | 錢曉炯;呂銳;劉謙;董澤 | 申請(qǐng)(專利權(quán))人: | 寧波菊風(fēng)系統(tǒng)軟件有限公司 |
| 主分類號(hào): | G10L21/0232 | 分類號(hào): | G10L21/0232 |
| 代理公司: | 寧波誠源專利事務(wù)所有限公司 33102 | 代理人: | 劉鳳欽;鄧青玲 |
| 地址: | 315040 浙江省寧波市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 確定 聲學(xué) 回聲 消除 系統(tǒng) 延時(shí) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種確定聲學(xué)回聲消除中系統(tǒng)延時(shí)的方法及利用該方法進(jìn)行聲學(xué)回聲消除方法。
背景技術(shù)
聲學(xué)回聲是指麥克風(fēng)1’將揚(yáng)聲器2’的聲音信號(hào)采集進(jìn)去的聲音,語音通訊和現(xiàn)場會(huì)議中的聲學(xué)回聲是有害的,需要通過技術(shù)手段進(jìn)行消除,我們將聲學(xué)回聲消除器(Acoustic?Echo?Canceler)簡記為AEC?,F(xiàn)有的AEC能夠在特定系統(tǒng)下實(shí)現(xiàn)很好的消除效果,然而對(duì)于某些特定的設(shè)備其系統(tǒng)延時(shí)較大,或者系統(tǒng)延時(shí)存在動(dòng)態(tài)變化的情況下,許多現(xiàn)有的AEC就會(huì)失效。
如附圖1所示,AEC的工作原理是將遠(yuǎn)端原始信號(hào)(Far-end?speech)作為參考信號(hào),利用回聲信號(hào)和參考信號(hào)的相關(guān)性,將近端輸入信號(hào)和回聲信號(hào)進(jìn)行分離,目標(biāo)是只剩下盡可能純凈的近端輸入信號(hào)。
因?yàn)檎Z音信號(hào)是時(shí)變的,參考信號(hào)和麥克風(fēng)采集的近端輸入信號(hào)和回聲信號(hào)在計(jì)算過程前需要進(jìn)行同步,而這兩組信號(hào)存在相對(duì)延時(shí),延時(shí)包括聲音傳播的延時(shí)、播放和采集的延時(shí)、計(jì)算機(jī)處理調(diào)度的延時(shí),我們將這些延時(shí)統(tǒng)稱為系統(tǒng)延時(shí),因此對(duì)聲學(xué)回聲消除,需要首先確定系統(tǒng)延時(shí)。而對(duì)于不同的系統(tǒng)環(huán)境,其系統(tǒng)延時(shí)差異性非常大,范圍大概從10ms~800ms之間,而且有的系統(tǒng)延時(shí)會(huì)在這個(gè)范圍內(nèi)波動(dòng)。判斷回聲消除器的一個(gè)重要指標(biāo)就是支持多大范圍的系統(tǒng)延時(shí),然后支持系統(tǒng)延時(shí)的范圍太大會(huì)大大增加實(shí)時(shí)系統(tǒng)的運(yùn)算量,通常300ms以上的動(dòng)態(tài)系統(tǒng)延時(shí)就是比較好的指標(biāo)。
現(xiàn)有的AEC消除回聲的方法包括,通過最小均方誤差(LMS-least?mean?square?error?algorithm)方法實(shí)現(xiàn)回聲延時(shí)的自適應(yīng)和消除,通過讀取操作系統(tǒng)的緩沖區(qū)大小來估計(jì)系統(tǒng)延時(shí)然后在頻域使用增益減法進(jìn)行消除,還有的僅僅是通過對(duì)一方信號(hào)的抑制實(shí)現(xiàn)半雙工的回聲消除。LMS方法計(jì)算量比較大,不能適應(yīng)系統(tǒng)延時(shí)過大的情況,且不適用于具有非線性失真的聲學(xué)回聲;讀取緩沖區(qū)大小來估計(jì)系統(tǒng)延時(shí)的方法對(duì)系統(tǒng)依賴性太大,對(duì)于非實(shí)時(shí)的操作系統(tǒng),延時(shí)估計(jì)非常不準(zhǔn)確;半雙工回聲消除方法用戶體驗(yàn)差,只適用于在低端的設(shè)備上應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明所要解決的首要技術(shù)問題是針對(duì)上述現(xiàn)有技術(shù)提供一種準(zhǔn)確性高、運(yùn)算量低的確定聲學(xué)回聲消除中系統(tǒng)延時(shí)的方法。
本發(fā)明進(jìn)一步所要解決的首要技術(shù)問題是針對(duì)上述現(xiàn)有技術(shù)提供一種聲學(xué)回聲消除,該聲學(xué)回聲消除中確定聲學(xué)回聲消除中系統(tǒng)延時(shí)準(zhǔn)確性高、運(yùn)算量低,能較好的準(zhǔn)確的快速將聲學(xué)回聲進(jìn)行有效消除。
本發(fā)明解決上述首要技術(shù)問題所采用的技術(shù)方案為:一種確定聲學(xué)回聲消除中系統(tǒng)延時(shí)的方法,其特征在于:包括如下步驟
步驟一、分別將采集的原始信號(hào)和參考信號(hào)進(jìn)行交疊分段、加窗和快速傅里葉變換轉(zhuǎn)換為頻域信號(hào),從而得到原始頻域信號(hào)和參考頻域信號(hào),具體轉(zhuǎn)換過程為:
1、分別對(duì)采集的原始信號(hào)和參考信號(hào)進(jìn)行交疊分段處理,每一分段時(shí)間為t1,交疊時(shí)間為t2,t2小于t1大于零,交疊分段處理的處理方式為常規(guī)技術(shù),比如,t1為10ms,t2為5ms,第一分段的數(shù)據(jù)為0~10ms的數(shù)據(jù),第二分段的數(shù)據(jù)為5ms~15ms的數(shù)據(jù),第三分段的數(shù)據(jù)為15m~25ms的數(shù)據(jù),第四分段的數(shù)據(jù)為20ms~30ms的數(shù)據(jù)……,即后一分段數(shù)據(jù)和前一分段的數(shù)據(jù)會(huì)有t2時(shí)間的交疊部分;
2、分別對(duì)交疊分段處理后的分段原始信號(hào)和分段參考信號(hào)分別進(jìn)行加窗處理,去除分段造成的譜泄露;對(duì)信號(hào)進(jìn)行加窗處理也為常規(guī)技術(shù),可以采用Hamming窗或其他矩形窗,本方案中,采用Hamming窗效果較好;
3、分別對(duì)加窗處理后的分段原始信號(hào)和分段參考信號(hào)進(jìn)行快速傅里葉變換轉(zhuǎn)換,快速傅里葉變換轉(zhuǎn)換也是常規(guī)技術(shù),得到由多個(gè)分段原始頻域信號(hào)組成的一組原始頻域信號(hào)和多個(gè)分段參考頻域信號(hào)組成的一組參考頻域信號(hào);
步驟二、找出所有分段的原始頻域信號(hào)中能量最高的n個(gè)峰值所對(duì)應(yīng)的頻率值,n為大于等于2的自然數(shù),并將這些頻率值按照分段的先后順序依次記錄下來形成一個(gè)原始頻域信號(hào)共振峰頻率序列數(shù)組,記為fs;相同方法,找出所有分段的參考頻域信號(hào)中能量最高的至少兩個(gè)峰值所對(duì)應(yīng)的頻率值,并將這些頻率值按照分段的先后順序依次記錄下來形成一個(gè)參考頻域信號(hào)共振峰頻率序列數(shù)組,記為fc;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于寧波菊風(fēng)系統(tǒng)軟件有限公司,未經(jīng)寧波菊風(fēng)系統(tǒng)軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310728989.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用于語音識(shí)別的聲學(xué)模型訓(xùn)練方法及裝置
- 具有集成聲學(xué)發(fā)生器的聲學(xué)發(fā)射傳感器
- 聲學(xué)發(fā)射傳感器裝置
- 一種基于空間折疊聲學(xué)超材料的單傳感器聲學(xué)相機(jī)
- 聲學(xué)環(huán)境中的聲學(xué)信號(hào)的基于上下文的消除和放大
- 聲學(xué)結(jié)構(gòu)和聲學(xué)系統(tǒng)
- 具有外放和私密操作模式的可穿戴個(gè)人聲學(xué)設(shè)備
- 聲換能器系統(tǒng)
- 一種聲學(xué)模型的訓(xùn)練方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于聲學(xué)暗室的聲學(xué)相位中心校準(zhǔn)方法及系統(tǒng)





