[發明專利]用于通過使用頻譜模式有效合成正弦曲線和掃描的設備及方法有效
| 申請號: | 201380064128.8 | 申請日: | 2013-09-20 |
| 公開(公告)號: | CN104903956B | 公開(公告)日: | 2018-11-16 |
| 發明(設計)人: | 薩沙·迪施;本亞明·舒伯特;拉爾夫·熱日爾;貝恩德·埃德勒;馬丁·迪策爾 | 申請(專利權)人: | 弗勞恩霍夫應用研究促進協會 |
| 主分類號: | G10L19/032 | 分類號: | G10L19/032 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 唐京橋;陳煒 |
| 地址: | 德國*** | 國省代碼: | 德國;DE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 通過 使用 頻譜 模式 有效 合成 正弦曲線 掃描 設備 方法 | ||
提供了一種基于編碼音頻信號頻譜生成音頻輸出信號的設備。該設備包括處理單元(115),其用于對編碼音頻信號頻譜進行處理,以獲得包括多個頻譜系數的解碼音頻信號頻譜,其中,每個頻譜系數具有頻譜值和在編碼音頻信號頻譜內的頻譜位置,其中,頻譜系數根據其在編碼音頻信號頻譜內的頻譜位置被依次排序,使得頻譜系數形成頻譜系數序列。此外,該設備包括偽系數確定器(125),其用于確定解碼音頻信號頻譜的一個或更多個偽系數,每個偽系數具有頻譜值。此外,該設備包括替換單元(135),其用于用確定的頻譜模式替換至少一個或更多個偽系數,以獲得修改的音頻信號頻譜,其中,確定的頻譜模式包括至少兩個模式系數,其中,該至少兩個模式系數中的每一個具有頻譜值。此外,該設備包括頻譜時間轉換單元(145),其用于將修改的音頻信號頻譜轉換至時域,以獲得音頻輸出信號。
本發明涉及音頻信號編碼、解碼和處理,并且具體地涉及通過使用頻譜模式有效合成正弦曲線和掃描。
音頻信號處理變得越來越重要。由于現代感知音頻編解碼器被要求以越來越低的比特率來傳送滿意的音頻質量,所以出現了挑戰。另外,例如對于雙向通信應用或分布式游戲等而言,可允許的延遲通常也很低。
現代波形保留變換音頻編碼器通常伴隨著參數化編碼增強如噪聲替換或帶寬擴展。除了這些熟知的參數化工具以外,可能還期望在這樣的解碼器中根據參數化邊信息來合成正弦音調。計算復雜度始終是編解碼器發展中的重要標準,原因在于:對于編解碼器的廣泛接受和部署而言,低復雜度是必要的。因此,需要的是生成這些音調的有效方式。
例如,雖然MPEG-D USAC(MPEG-D=運動圖像專家組-D;USAC=統一語音和音頻編碼)音頻編解碼器通常在時域預測編碼和變換域編碼之間進行切換,然而音樂內容仍然主要在變換域中進行編碼。在低比特率如<14kbit/s時,音樂項目中的音調成分在通過變換編碼器進行編碼時通常不好聽,這使得以足夠的質量對音頻進行編碼的任務甚至更具有挑戰性。
另外,低延遲約束一般引起變換編碼器的濾波器組的次優頻率響應(原因是低延遲優化窗口形狀和/或變換長度),并且因此進一步損害這樣的編解碼器的感知質量。
根據傳統心理聲學模型,對關于量化噪聲的透明度的先決條件進行了定義。在高比特率的情況下,這與遵守人類聽覺掩蔽等級的量化噪聲的感知適配最佳時間/頻率分布有關。然而,在低比特率的情況下,無法實現透明度。因此,在低比特率的情況下,可以使用掩蔽等級要求降低策略。
已經針對音樂內容提供了一流的編解碼器,具體地為基于改進的離散余弦變換(MDCT)的變換編碼器,其在頻域中量化并傳輸頻譜系數。然而,在數據速率非常低的情況下,每個時間幀中的僅很少的頻譜線可以通過該幀的可用的比特進行編碼。因此,時間調制偽聲和所謂的顫音偽聲不可避免地被引入編碼信號中。
最顯著地,在擬穩態音調成分中可以感知到這些類型的偽聲。如果由于延遲約束而必須選擇由于公知的泄露效應會在相鄰頻譜系數(頻譜展寬)之間引入顯著串擾的變換窗口形狀,則尤其出現該情形。然而,盡管如此,通常這些相鄰頻譜系數中的僅一個或幾個在由低比特率編碼器進行粗量化之后,仍然保持為非零。
如上所述,根據現有技術中的一種方法,使用變換編碼器。非常適合于對音樂內容進行編碼的現代高壓縮率音頻編解碼器全部依靠于變換編碼。最突出的示例是MPEG2/4高級音頻編碼(AAC)和MPEG-D統一語音和音頻編碼(USAC)。USAC具有切換式核心,該切換式核心與主要意圖用于語音編碼的代數碼激發線性預測(ACELP)模塊加上變換編碼激勵(TCX)模塊(參見[5])一致,并且替代地,與主要意圖用于對音樂進行編碼的AAC一致。如同AAC一樣,TCX也是基于變換的編碼方法。在低比特率設置的情況下,這些編碼方案容易展現出顫音偽聲,尤其在基本編碼方案基于改進的離散余弦變換(MDCT)(參見[1])的情況下。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于弗勞恩霍夫應用研究促進協會,未經弗勞恩霍夫應用研究促進協會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380064128.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電容器級鉭鈮合金絲及其制造方法
- 下一篇:文件共享系統和方法





