[發(fā)明專利]用于對音頻幀丟失隱藏進行控制的方法和設(shè)備有效
| 申請?zhí)枺?/td> | 201810694625.0 | 申請日: | 2014-01-22 |
| 公開(公告)號: | CN108831490B | 公開(公告)日: | 2023-05-02 |
| 發(fā)明(設(shè)計)人: | 斯蒂芬·布魯恩;喬納斯·斯韋德貝里 | 申請(專利權(quán))人: | 瑞典愛立信有限公司 |
| 主分類號: | G10L19/005 | 分類號: | G10L19/005 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 余婧娜 |
| 地址: | 瑞典斯*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 音頻 丟失 隱藏 進行 控制 方法 設(shè)備 | ||
根據(jù)本發(fā)明的實施例,所公開的是用于對接收音頻信號的丟失音頻幀的隱藏方法進行控制的方法和設(shè)備。解碼器隱藏丟失音頻幀的方法包括:在先前接收的和重構(gòu)的音頻信號的屬性中或在所觀察到的幀丟失的統(tǒng)計屬性中檢測丟失幀的替代提供相對降低的質(zhì)量的條件。在檢測到這種條件的情況下,通過選擇性地調(diào)整替代幀譜的相位或譜幅度來修改所述隱藏方法。
本申請是2014年1月22日提交的中國專利申請No.201480007552.3的發(fā)明名稱為“用于對音頻幀丟失隱藏進行控制的方法和設(shè)備”的分案申請。
技術(shù)領(lǐng)域
本申請涉及對用于接收音頻信號的丟失音頻幀的隱藏方法進行控制的方法和設(shè)備。
背景技術(shù)
傳統(tǒng)音頻通信系統(tǒng)用幀來傳輸語音和音頻信號,意味著發(fā)送側(cè)首先將信號設(shè)置為例如20=40ms的短的段,該段隨后被編碼并作為例如邏輯單元在傳輸分組中傳輸。接收機對這些單元中的每個單元進行解碼,并且重構(gòu)相應(yīng)的信號幀,該信號幀進而最后輸出為重構(gòu)信號采樣的連續(xù)序列。在編碼之前,通常存在將來自麥克風(fēng)的模擬語音或音頻信號轉(zhuǎn)換成音頻采樣序列的模數(shù)(A/D)轉(zhuǎn)換步驟。相反地,在接收端,通常存在將重構(gòu)的數(shù)字信號采樣序列轉(zhuǎn)換成用于揚聲器重放的時間連續(xù)模擬信號的最終D/A轉(zhuǎn)換步驟。
然而,針對語音和音頻信號的這種傳輸系統(tǒng)會受到傳輸錯誤的影響,這會導(dǎo)致傳輸幀中的一個或若干個在接收機處不可用于重構(gòu)的情況。在那種情況下,解碼器必須生成針對每個擦除的(即不可用的)幀的替代信號。這在接收機側(cè)信號解碼器的所謂的幀丟失或錯誤隱藏單元中完成。幀丟失隱藏的目的是使得盡可能聽不到幀丟失,并且因此盡可能減輕幀丟失對重構(gòu)信號質(zhì)量造成的影響。
傳統(tǒng)的幀丟失隱藏方法可以取決于編解碼器的構(gòu)造或結(jié)構(gòu),例如通過應(yīng)用之前接收的編解碼器參數(shù)的重復(fù)的形式。這種參數(shù)重復(fù)技術(shù)顯然取決于使用的編解碼器的具體參數(shù),并且因此不容易適用于具有不同構(gòu)造的其它編解碼器。當(dāng)前的幀丟失隱藏方法可以(例如)應(yīng)用對先前接收幀的參數(shù)進行凍結(jié)和外插(extrapolate)的概念,以生成丟失幀的替代幀。
這些現(xiàn)有技術(shù)幀丟失隱藏方法包含一些突發(fā)丟失處理方案。通常,在接連多個幀丟失之后,合成的信號被衰減,直至在長的錯誤突發(fā)之后完全靜音。此外,修改必須重復(fù)和推算的編碼參數(shù),以使衰減完成并使譜峰平滑掉。
當(dāng)前現(xiàn)有幀丟失隱藏技術(shù)通常應(yīng)用凍結(jié)和外插之前接收的幀的參數(shù),以生成丟失幀的替代幀。許多參變的(parametric)語音編解碼器(如像是AMR或AMR-WB的線性預(yù)測編解碼器)通常凍結(jié)早先接收的參數(shù)或使用其某一外插,并一起使用解碼器。本質(zhì)上,該原理是取得用于編碼/解碼的給定模型,并且將凍結(jié)或外插后的參數(shù)應(yīng)用到同一模塊上。AMR和AMR-WB的幀丟失隱藏技術(shù)可以被認(rèn)為是代表性的。在相應(yīng)標(biāo)準(zhǔn)規(guī)范中對它們進行了詳細(xì)說明。
音頻編解碼器類別中的很多編解碼器用于編碼頻域技術(shù)。這意味著在一些頻域變換之后,對譜參數(shù)應(yīng)用編碼模型。解碼器根據(jù)接收參數(shù)來重構(gòu)信號譜,并且最終將譜變換回時間信號。典型地,時間信號是逐幀重構(gòu)的。這些幀通過重疊相加技術(shù)組合為最終的重構(gòu)信號。甚至在音頻編解碼器的情況下,現(xiàn)有的錯誤隱藏針對丟失幀通常應(yīng)用相同或至少部分類似的解碼模型。來自之前接收的幀的頻域參數(shù)被凍結(jié)或者適當(dāng)?shù)乇煌獠澹缓笤陬l率到時間域轉(zhuǎn)換中使用。這種技術(shù)的示例具備根據(jù)3GPP標(biāo)準(zhǔn)的3GPP音頻編解碼器。
發(fā)明內(nèi)容
幀丟失隱藏的當(dāng)前現(xiàn)有技術(shù)解決方案通常經(jīng)受質(zhì)量減損。主要問題在于:參數(shù)凍結(jié)和外插技術(shù)和甚至對于丟失幀的同一解碼器模型的再應(yīng)用并不能總是保證從之前解碼后的信號幀到丟失幀的平滑和可靠的信號演變。這通常導(dǎo)致具有相應(yīng)質(zhì)量影響的可聽信號中斷。
描述了用于語音和音頻傳輸系統(tǒng)的幀丟失隱藏的新方案。新的方案提高了幀丟失情況下的質(zhì)量,高于用現(xiàn)有的幀丟失隱藏技術(shù)可以獲得的質(zhì)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于瑞典愛立信有限公司,未經(jīng)瑞典愛立信有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810694625.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





