[發明專利]一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法無效
| 申請號: | 201010144567.8 | 申請日: | 2010-04-09 |
| 公開(公告)號: | CN101847413A | 公開(公告)日: | 2010-09-29 |
| 發明(設計)人: | 毛峽;邵偉國 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L19/14 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 新型 心理聲學 模型 快速 比特 分配 實現 數字音頻 編碼 方法 | ||
技術領域
本發明涉及一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法,其中新型心理聲學模型在不損失音質的前提下降低了編碼的復雜度,快速比特分配極大地降低了編碼的計算量。
背景技術
先進音頻編碼(Advanced?Audio?Coding,簡稱AAC)是在MP3基礎上發展起來的新一代感知音頻壓縮編碼技術,該技術綜合了多種主流音頻編碼技術的優點,具有信號壓縮比高,重建音質好,編解碼過程高度模塊化和聲道配置靈活等特點。
AAC依然遵從了MP3的基本編碼規范,如使用ISO推薦的心理聲學模型二、非均勻量化、哈夫曼編碼等,但在許多細節上進行了改進,并使用了許多新的編碼模塊,從而提高了編碼效率。AAC的基本編碼流程是:首先將輸入的時域音頻信號進行分幀,幀長為1024個時域采樣點;然后通過濾波器組將每幀時域信號變換成頻域系數,并劃分成若干頻域子帶;接著通過心理聲學模型二對當前幀的時域信號進行分析,得到各個頻域子帶的最大允許失真度;之后進行比特分配和量化過程,對每個子帶的系數使用同一量化步長進行量化,每個子帶的量化步長由各子帶的比例因子來表示,此時,比特分配是通過一種隱性的方式實現,即當需要為某個子帶追加或減少比特時,就將該子帶的比例因子加1或減1,然后根據此時的比例因子對該子帶進行量化、熵編碼和計算編碼所需要的比特數,最后進行比特拼裝,形成碼流。
為了實現更高的壓縮比,AAC使用心理聲學模型二,模型二比模型一復雜,它把整個頻譜劃分成同臨界帶寬大致成線性關系的很多個分區。分區后,模型二不是簡單的把信號分為諧音和非諧音,而是通過計算頻譜隨時間的不可預測性,來確定每個分區信號的弦度,又稱純音近似因子。這個弦度是度量信號介于諧音和噪聲兩者之間的程度,諧音分量的弦度要高于非諧音分量。模型二的算法更精細,計算量更大,比模型一更加準確。在比特分配和量化過程中,AAC使用了傳統的兩層嵌套循環來進行率失真控制。內層循環通過調節全局比例因子來限制量化編碼頻域系數所需要的比特數不超過當前可用的比特數,外層循環通過調節各段比例因子來控制各個子帶的量化噪聲不超過掩蔽閾值。內層與外層循環是一種相互制約的關系,內層如果增大全局比例因子減少比特數,會造成某一子帶的失真超過掩蔽閾值,外層又需要增大這個子帶的比例因子來達到噪聲不可聞的目的,造成可用比特數超過最大值。所以兩層嵌套循環一般需要十幾次的循環才能找到合適的全局比例因子和各段比例因子的值;有時會進入一種死鎖的狀態,需要強制退出循環。
AAC有著比MP3更高的壓縮率,更純真的音質,但是在便攜電子設備領域卻是MP3獨占鰲頭,究其原因是AAC編碼計算復雜度高,大約是AAC解碼的10倍。造成AAC編碼復雜度高的原因是AAC使用了復雜的心理聲學模型二和兩層嵌套循環比特分配和量化模塊,AAC在44.1Khz采樣率和64Kbps碼率時,心理聲學模型的計算量占整個編碼的22%,量化模塊占整個編碼的64%。
發明內容
為了克服AAC編碼高復雜度的不足,本發明提出的新型心理聲學模型和快速比特分配能夠快速的達到最優感知量化結果,克服了AAC計算量大的缺點,而音質沒有明顯的降低,為實現AAC編碼專用芯片奠定了基礎。
本發明的一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法主要包括:新型心理聲學模型:根據輸入音頻信號的方差來確定窗口類型;根據確定的窗口類型及輸入音頻信號的能量來分配量化噪聲,即閾值計算;快速比特分配:舍棄傳統兩層嵌套循環來進行率失真控制的方法,依據音頻信號的短時平穩特性,對全局比例因子使用上一幀的全局比例因子作為初值,對各段比例因子通過模型推導獲得精確的初值,最后通過微調就可以獲得最終的全局比例因子及各段比例因子的值。具體步驟如下:
步驟一根據輸入音頻信號的方差來確定窗口的類型;
步驟二根據確定的窗口類型及輸入音頻信號的能量來分配量化噪聲,即最大允許失真,也稱掩蔽閾值;
步驟三使用上一幀音頻信號全局比例因子的值作為本幀音頻信號全局比例因子的初值;
步驟四通過模型推導,獲得各段比例因子的精確初值;
步驟五通過改進折半查找的方法對全局比例因子進行調整;
步驟六根據量化前后能量守恒原則對各段比例因子進行微調。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010144567.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能磁性對接高安全無隙電源NS極接頭
- 下一篇:一種可演奏三種音頻聲波的胡琴





