[發明專利]用于音頻信號編碼的分析窗切換方法和裝置有效
| 申請號: | 201310202032.5 | 申請日: | 2013-05-27 |
| 公開(公告)號: | CN103295577A | 公開(公告)日: | 2013-09-11 |
| 發明(設計)人: | 王磊;閆建新 | 申請(專利權)人: | 深圳廣晟信源技術有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L19/002 |
| 代理公司: | 深圳市順天達專利商標代理有限公司 44217 | 代理人: | 李琴 |
| 地址: | 518057 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 音頻 信號 編碼 分析 切換 方法 裝置 | ||
技術領域
本發明涉及音頻信號編解碼技術,更具體地說,涉及一種用于音頻信號編碼的分析窗切換方法和裝置。
背景技術
目前的音頻編解碼技術中,一般用感知編碼器對音頻信息進行編碼壓縮。傳統的感知編碼器中通常有一個心理聲學模塊,該心理聲學模塊的作用是分析音頻信號中的“不相關成分”,在獲得這些“不相關成分”后,再通過量化模塊去處理這些“不相關成分”,從而使音頻信號達到“感知透明”,即對人的感覺沒有影響或影響在可接受的范圍內。在分析“不相關成分”時,主要利用人耳具有的掩蔽現象。所謂“掩蔽現象”,如圖1所示,就是在一個聲音存在的情況下,另一個聲音在人耳中不能被感知的現象,這種聲音就是遮蔽信號3。掩蔽又分為同時掩蔽1(simultaneous?masking)、向前掩蔽2(pre-masking)和向后掩蔽4(post-masking)。其中,向前掩蔽2和向后掩蔽4是表現在時域上的,因此對感知編碼器時域特性有額外的要求,即:要做到感知透明的編碼質量,量化噪聲也必須具有一個與時域相關的掩蔽閾值。但這個要求對實際的感知編碼器來說并不容易實現。由時頻的測不準原理可知,用塊變換方法將音頻時域信號變換到頻域,然后對變換后的譜系數做量化和編碼引起的量化誤差,在用合成濾波器重構后,會在時域發生擴散。對常用的濾波器設計,如用窗長為2048個樣本點的修正離散余弦變換(簡稱MDCT)濾波器對采樣頻率為48000赫茲的信號做變換,在用合成濾波器重構后,所引起的量化誤差的擴散約為42.7ms。如果在分析窗內信號較強的能量主要只集中在很小一部分,那么量化噪聲就會擴散到信號出現之前。在極端情況下,在某些時間段中,量化噪聲甚至會高于原始信號的能量級,這就是所謂的“前回聲(pre-echo)”現象,如圖2和圖3所示。其中,圖2為未編碼的音頻信號,圖3為編碼重構后的信號,圖3中用橢圓圈出的部分就是前回聲5。根據人耳的特性,如果編碼噪聲在信號突變點前持續時間較短的話,可以利用向前掩蔽將前回聲掩蔽掉,否則編碼噪聲會被人耳感知到。為了避免這種現象,設計編碼器時就要考慮量化噪聲的時域特性,以保證滿足時域掩蔽條件,而前回聲現象一直是快變類型信號(如響板信號)等無法做到較低碼率的一個主要困難。
在編解碼音頻信號中,為解決前回聲現象,當前主流編碼器,比如AAC、MP3等都采用自適應窗切換技術。這種方法能根據輸入信號的特性,自適應地調整濾波器組窗的大小,穩態部分或緩變部分采用長分析窗,快變信號部分采用短分析窗進行編碼。在長分析窗和短分析窗過渡時使用長到短轉換的長過渡窗(開始窗)和短到長轉換的長過渡窗(結束窗)。其中AAC所使用的長分析窗11、短分析窗12、開始窗13和結束窗14分別如圖4a、4b、4c和4d所示。
為了解決前回聲現象而使用短分析窗是一把雙刃劍。如果是很強的快變信號(比如響板信號),使用短分析窗是很好的選擇;如果是語音信號,在清音和濁音之間用短分析窗,則會帶來使時間分辨率降低而編碼效率大大下降的缺點。
發明內容
本發明要解決的技術問題在于,針對現有技術的上述缺陷,提供一種用于音頻信號編碼的分析窗切換方法和裝置,能夠在使編碼效率略微下降的同時防止前回聲的產生。
本發明解決其技術問題所采用的技術方案是:提出一種用于音頻信號編碼的分析窗切換方法,包括如下步驟:
S1、判斷輸入的幀信號是語音信號還是非語音信號;
S2、在該幀信號為非語音信號時,進一步判斷該幀信號是穩態信號還是暫態信號,對于穩態信號,采用長分析窗進行處理,對于暫態信號,采用短分析窗進行處理;
S3、在該幀信號為語音信號時,進一步對該幀信號進行清濁音分析,并基于該幀信號的清濁音情況以及前幀信號的清濁音情況選擇相應的不同分析窗來進行處理。
一個實施例中,所述步驟S3進一步包括:
S31、將該幀信號分成多個大小相等的塊;
S32、判斷該多個大小相等的塊中每一塊的清濁音情況;
S33、根據該幀信號中清音塊的位置、濁音塊的位置以及前幀信號的清濁音情況選擇相應的分析窗。
一個實施例中,所述步驟S33進一步包括:
如果前幀信號為濁音幀而該幀信號的所有塊都為濁音塊,對前幀信號采用長分析窗,對該幀信號采用長分析窗;
如果前幀信號為濁音幀而該幀信號的前面為濁音塊后面為清音塊,對前幀信號采用長到短轉換的長過渡窗,則對該幀信號的每一塊采用短分析窗;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳廣晟信源技術有限公司,未經深圳廣晟信源技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310202032.5/2.html,轉載請聲明來源鉆瓜專利網。





