[發(fā)明專利]數(shù)字音頻信號(hào)中的前回聲的有效衰減在審
| 申請(qǐng)?zhí)枺?/td> | 201380067327.4 | 申請(qǐng)日: | 2013-12-20 |
| 公開(kāi)(公告)號(hào): | CN104981981A | 公開(kāi)(公告)日: | 2015-10-14 |
| 發(fā)明(設(shè)計(jì))人: | B.科維西;S.拉戈特 | 申請(qǐng)(專利權(quán))人: | 奧林奇公司 |
| 主分類號(hào): | H04B3/21 | 分類號(hào): | H04B3/21 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 李芳華 |
| 地址: | 法國(guó)*** | 國(guó)省代碼: | 法國(guó);FR |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)字音頻 信號(hào) 中的 回聲 有效 衰減 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及用于當(dāng)解碼數(shù)字音頻信號(hào)時(shí)處理前回聲的衰減的方法和設(shè)備。
背景技術(shù)
針對(duì)在電信網(wǎng)絡(luò)上的數(shù)字音頻信號(hào)的傳輸,不管它們例如是固定網(wǎng)絡(luò)還是移動(dòng)網(wǎng)絡(luò),或者針對(duì)信號(hào)的存儲(chǔ),涉及實(shí)現(xiàn)編碼系統(tǒng)的壓縮(或源編碼)過(guò)程,這些系統(tǒng)通常具有通過(guò)線性預(yù)測(cè)類型的時(shí)間編碼或通過(guò)變換類型的頻率編碼。
本發(fā)明的方法和設(shè)備、主題因此位于聲音信號(hào)、特別是通過(guò)頻率變換而被編碼的數(shù)字音頻信號(hào)的壓縮的范圍內(nèi)。
通過(guò)展示的方式,圖1表示根據(jù)現(xiàn)有技術(shù)通過(guò)重疊相加包括分析-合成的變換的數(shù)字音頻信號(hào)的編碼和解碼的示意圖。
特定的音樂(lè)序列諸如打擊樂(lè)和特定的語(yǔ)音片段如爆破音(/k/、/t/等)特征在于非常突然的開(kāi)始,這些開(kāi)始反映在幾個(gè)樣本的空間中的信號(hào)的動(dòng)態(tài)范圍的非常迅速的過(guò)渡和非常強(qiáng)的變化中。示例性過(guò)渡從樣本410在圖1中給出。
針對(duì)編碼/解碼處理,輸入信號(hào)被細(xì)分為長(zhǎng)度為L(zhǎng)的樣本塊,這些塊的邊界在圖1中由豎直的點(diǎn)線表示。輸入信號(hào)表示為x(n),其中n是樣本的索引。分解為連續(xù)塊(或幀)導(dǎo)致了塊XN(n)=[x(N.L)…x(N.L+L-1)]=[xN(0)…xN(L-1)]的定義,其中N是塊(或幀)的索引,L是幀的長(zhǎng)度。在圖1中,L=160個(gè)樣本。在修正離散余弦變換MDCT的情況下,兩個(gè)塊XN(n)和XN+1(n)被聯(lián)合分析以給出一批與索引為N的幀相關(guān)聯(lián)的變換系數(shù),并且分析窗口是正弦的。
通過(guò)變換編碼應(yīng)用的劃分成塊(也稱為幀)完全獨(dú)立于聲音信號(hào)并且過(guò)渡能夠因此出現(xiàn)在分析窗口的任一點(diǎn)?,F(xiàn)在,在變換解碼之后,重構(gòu)信號(hào)被由量化(Q)-逆量化(Q-1)操作導(dǎo)致的“噪聲”(或失真)影響。此編碼噪聲在變換塊的全部時(shí)間媒介上(也就是說(shuō),在長(zhǎng)度為2L個(gè)樣本(與L個(gè)樣本重疊)的窗口的全部長(zhǎng)度上)以相對(duì)統(tǒng)一的方式在時(shí)間上分布。編碼噪聲的能量總體上與塊的能量成比例并且是編碼/解碼比特率的函數(shù)。
針對(duì)包括開(kāi)始的塊(如圖1中的塊320-480),信號(hào)的能量較高,噪聲也因此具有高電平。
在變換編碼中,針對(duì)立即跟隨過(guò)渡的高能量片段,編碼噪聲的電平典型地低于信號(hào)的電平,但是針對(duì)低能量片段,顯著地是在過(guò)渡之前的部分上(圖1的樣本160-410),該電平高于信號(hào)的電平。針對(duì)上述部分,信噪比是負(fù)的并且所導(dǎo)致的退化在傾聽(tīng)時(shí)會(huì)變得非常惱人。前回聲是給過(guò)渡之前的編碼噪聲的名稱,并且后回聲是給過(guò)渡之后的噪聲的名稱。
在圖1中可以看出前回聲影響過(guò)渡之前的幀以及過(guò)渡發(fā)生處的幀。
心理聲學(xué)實(shí)驗(yàn)已經(jīng)示出人耳執(zhí)行幾毫秒級(jí)的相當(dāng)有限的聲音的時(shí)間前掩蔽。當(dāng)前回聲的時(shí)長(zhǎng)大于前掩蔽時(shí)長(zhǎng)時(shí),開(kāi)始之前的噪聲或前回聲是可聽(tīng)見(jiàn)的。
在從高能量序列到低能量序列的過(guò)渡中,人耳也執(zhí)行從5至60毫秒的更長(zhǎng)時(shí)長(zhǎng)的后掩蔽。因此針對(duì)后回聲比針對(duì)前回聲可接受的不舒適的比率或水平較高。
當(dāng)塊的長(zhǎng)度就樣本的數(shù)量而言是顯著的時(shí),前回聲的現(xiàn)象更關(guān)鍵地是格外惱人的?,F(xiàn)在,在變換編碼中,眾所周知的是針對(duì)靜態(tài)信號(hào),變換的長(zhǎng)度增加的越多,編碼增益變得越大。在具有固定采樣頻率和固定比特率的情況下,如果窗口的點(diǎn)數(shù)(因此變換的長(zhǎng)度)增加,每幀將會(huì)有更多比特編碼被心理聲學(xué)模型認(rèn)為有用的頻率射線,因此會(huì)有利用大長(zhǎng)度的塊的益處。例如,MPEG?AAC(高級(jí)音頻編碼)編碼使用包含固定數(shù)目2048的樣本的大長(zhǎng)度的窗口,即,如果采樣頻率是32kHz,大于64ms的時(shí)長(zhǎng);前回聲的問(wèn)題通過(guò)使其能夠通過(guò)中間窗口(被稱為過(guò)渡窗口)從這些長(zhǎng)窗口切換到8個(gè)短窗口而被管理,這要求在編碼中的特定延遲以檢測(cè)過(guò)渡的出現(xiàn)并且適配窗口。這些短窗口的長(zhǎng)度因此是256個(gè)樣本(在32kHz處的8ms)。在低比特率處,具有幾毫秒的可聽(tīng)見(jiàn)的前回聲仍然是可能的。窗口的切換使得衰減前回聲而不是消除前回聲成為可能。用于對(duì)話式的應(yīng)用如ITU-T?G.722.1、G.722.1C或G.719的變換編碼器經(jīng)常在16、32或48kHz處(分別地)使用20ms的幀長(zhǎng)度和40ms時(shí)長(zhǎng)的窗口??梢宰⒁獾剑琁TU-T?G.719編碼器結(jié)合具有瞬態(tài)檢測(cè)的窗口切換機(jī)制,但是前回聲并不以低比特率(典型地以32kbit/s)完全地減少。
為了減少前回聲現(xiàn)象的上述惱人的影響,在編碼器和/或解碼器水平已經(jīng)提出了不同的解決方案。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于奧林奇公司,未經(jīng)奧林奇公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380067327.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種鉆井液用塑料小球回收裝置
- 下一篇:一種新型折疊梯子
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 亮度信號(hào)/色信號(hào)分離裝置和亮度信號(hào)/色信號(hào)分離方法
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 雙耳信號(hào)的信號(hào)生成
- 雙耳信號(hào)的信號(hào)生成
- 信號(hào)處理裝置、信號(hào)處理方法、信號(hào)處理程序
- USBTYPEC信號(hào)轉(zhuǎn)HDMI信號(hào)的信號(hào)轉(zhuǎn)換線
- 信號(hào)盒(信號(hào)轉(zhuǎn)換)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置





