[發明專利]一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法無效
| 申請號: | 201010144567.8 | 申請日: | 2010-04-09 |
| 公開(公告)號: | CN101847413A | 公開(公告)日: | 2010-09-29 |
| 發明(設計)人: | 毛峽;邵偉國 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L19/14 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 新型 心理聲學 模型 快速 比特 分配 實現 數字音頻 編碼 方法 | ||
1.一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法,其特征在于:該方法具體包括以下步驟:
(1)根據輸入音頻信號的方差來確定窗口的類型;
(2)根據確定的窗口類型及輸入音頻信號的能量來分配量化噪聲,即最大允許失真,也稱掩蔽閾值;
(3)使用上一幀音頻信號全局比例因子的值作為本幀音頻信號全局比例因子的初值;
(4)通過模型推導,獲得各段比例因子的精確初值;
(5)通過改進折半查找的方法對全局比例因子進行調整;
(6)根據量化前后能量守恒原則對各段比例因子進行微調。
2.根據權利要求1所述的一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法,其特征在于:所述的步驟(1)根據輸入音頻信號的方差來確定窗口的類型,包括如下步驟:
(a)把輸入的音頻信號在時域上劃分為8個等長的子塊;
(b)計算每個子塊的方差,求出最大值;
(c)通過子塊方差的最大值或與前一幀子塊方差的最大值的差值來確定窗口類型。
3.根據權利要求1所述的一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法,其特征在于:所述的步驟(2)中量化噪聲的分配采用非線性函數根據子帶能量的相對大小來計算允許的量化噪聲,同時考慮壓縮比越大,允許噪聲越大;音質越高,允許噪聲越小的要求,公式如下:
其中,Xmin代表最大允許失真,engr代表比例因子帶內的平均能量,engravr代表全頻帶的平均能量,sfb是比例因子帶序號,lastsb是最后一個含非零譜值的比例因子帶的序號,start是比例因子帶的起始譜線序號,last是最后一根非零譜線的序號,c是加權常數,在本發明中,對于短窗其值為0.858,對于長窗其值為1.4784。
4.根據權利要求1所述的一種使用新型心理聲學模型和快速比特分配實現數字音頻編碼的方法,其特征在于:所述的步驟(3)利用了音頻信號的短時平穩特性,使用上一幀音頻信號全局比例因子的值作為本幀音頻信號全局比例因子的初值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010144567.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能磁性對接高安全無隙電源NS極接頭
- 下一篇:一種可演奏三種音頻聲波的胡琴





