[發明專利]一種基于棧式稀疏自編碼器的面向對象編碼方法有效
| 申請號: | 202011102043.2 | 申請日: | 2020-10-15 |
| 公開(公告)號: | CN112365896B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 胡瑞敏;吳玉林;王曉晨;胡晨昊;李罡;陳瑋;柯善發;張靈鯤;劉文可 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/02 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 彭艷君 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稀疏 編碼器 面向 對象 編碼 方法 | ||
本發明涉及數字音頻信號處理技術,具體涉及一種基于棧式稀疏自編碼器的面向對象編碼方法,包括利用棧式稀疏自編碼器的編碼模塊對音頻對象邊信息進行降維表達,然后利用稀疏自編碼器中的解碼模塊從音頻對象邊信息的低維結構中重構原始高維的邊信息數據。該方法利用棧式稀疏自動編碼器(Stacked Sparse Autoencoder,SSAE)中的級聯模塊,每個模塊都從其前一個模塊中提取了邊信息的有效特征。可以減少邊信息參數的維數以節省比特率,并很好地重建音頻對象。因此,能在相同的比特率下獲得最佳的音頻對象信號音質,以滿足用戶對音頻對象個性化控制的需求。同時全面提升了音頻對象信號的編碼質量,提高編碼效率。
技術領域
本發明屬于數字音頻信號處理技術領域,尤其涉及一種基于棧式稀疏自編碼器的面向對象編碼方法。
背景技術
三維(3D)音頻表示具有3個自由度(例如方位角,仰角和距離)的音頻對象。它可以在3D空間中的任何位置形成聲音圖像。隨著3D音頻和視頻的發展,對交互式和個性化收聽體驗的需求迅速增長。常規的基于通道的音頻編碼技術受到通道數量的限制,并且不能滿足用戶的個性化重建需求,尤其是在沉浸式場景中,例如數字互動劇院和虛擬現實游戲。基于對象的編碼方法作為沉浸式音頻的重要表示,結合個性化的渲染系統,可以在各種回放配置中實現生動的內容創建和最佳再現。而且基于對象的編碼框架已成功用于商業案例。
國際上許多學者和科研機構都已開展音頻對象編碼的研究工作,并提出了多種音頻對象編碼方法。其中最具有代表性的兩種方法是德國知名研究機構Fraunhofer提出的空間音頻對象編碼技術(Spatial Audio Object Coding,SAOC)[文獻1]-[文獻3]以及由武漢大學提出的基于最佳參數頻率分辨率的音頻對象編碼方法(Audio object coding basedon optimal parameter frequency resolution,SVD-based SAOC)[文獻4]。
空間音頻對象編碼(SAOC)起源于空間音頻編碼(Spatial Audio Coding,SAC)[文獻5]。SAOC的核心思想是對多個音頻對象進行下混,并僅傳輸每個對象提取的邊信息以壓縮信號,因此可以實現以低比特率編碼多個音頻對象。與單獨傳輸所有對象相比,SAOC框架的比特率要低得多。但是,當音頻對象的數量增加且代碼比特率受到限制時,SAOC重建的音頻對象將帶來頻譜混疊。
SVD-based SAOC方法針對SAOC所存在的問題進行了進一步研究。該方法不僅根據信號失真確定最佳子帶數量,而且使用奇異值分解(singular value decomposition,SVD)來減小細分的子帶下傳輸參數的維數,并且可以減少混疊。然而重構的音頻對象的質量會受到SVD算法的限制,在較低碼率時重建的音頻對象質量不佳。
發明內容
針對背景技術存在的問題,本發明提供一種基于棧式稀疏自編碼器的面向對象編碼方法,
為解決上述技術問題,本發明采用如下技術方案:一種基于棧式稀疏自編碼器的面向對象編碼方法,包括利用棧式稀疏自編碼器的編碼模塊對音頻對象邊信息進行降維表達,利用稀疏自編碼器中的解碼模塊從音頻對象邊信息的低維結構中重構原始高維的邊信息數據;
其中,對音頻對象邊信息進行降維表達具體步驟如下:
步驟11、對輸入的J個獨立音頻信號S1,S2,…,SJ通過改進離散余弦變換MDCT進行時域-頻域變換,得到對象信號的頻譜O1,O2,…,OJ;
步驟12、對步驟11得到的頻譜O1,O2,…,OJ每幀數據進行精細的子帶劃分;
步驟13、對步驟12中的子帶,計算所有對象的下混信號,獲得下混信號碼流;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011102043.2/2.html,轉載請聲明來源鉆瓜專利網。





