[發(fā)明專利]一種基于字典分類的音頻匹配追蹤裝置及其追蹤方法在審
| 申請?zhí)枺?/td> | 201610967738.4 | 申請日: | 2016-11-01 |
| 公開(公告)號: | CN106653061A | 公開(公告)日: | 2017-05-10 |
| 發(fā)明(設計)人: | 胡瑞敏;姜林;胡霞;王曉晨;江游 | 申請(專利權)人: | 武漢大學深圳研究院 |
| 主分類號: | G10L25/54 | 分類號: | G10L25/54 |
| 代理公司: | 廣州高炬知識產(chǎn)權代理有限公司44376 | 代理人: | 孫明科 |
| 地址: | 518000 廣東省深圳市南山區(qū)高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 字典 分類 音頻 匹配 追蹤 裝置 及其 方法 | ||
技術領域
本發(fā)明涉及音頻編碼領域,具體是一種基于字典分類的音頻匹配追蹤裝置。
背景技術
稀疏表示一般指用盡量少的基函數(shù)來準確地表示原始信號,從而抓住信號的主要特征,進而從本質上降低信號處理成本。匹配追蹤(MP:Matching pursuit)作為使用較廣的稀疏表示算法之一,其基本思路是在迭代過程中依次從過完備字典中選擇最優(yōu)原子,使得信號的逼近更為優(yōu)化。由于MP算法用來表示信號的過完備字典基可以自適應根據(jù)信號本身的特點來靈活地選取;并且其在原子選擇過程中采取的是一種重復迭代逼近的貪婪算法,保證了最終得到的原子系數(shù)個數(shù)較少,MP算法被廣泛應用于信號分析的各個領域,如圖像處理、生物醫(yī)學信號處理、音頻處理等。
隨著人們對流媒體質量要求的提高以及移動終端用戶數(shù)量的不斷增加,音視頻編碼效率的要求也日漸提高。傳統(tǒng)匹配追蹤算法因其計算復雜度較高,不適應于實時處理。目前已提出多種快速匹配追蹤算法,但大都涉及耗時的優(yōu)化,或是犧牲稀疏表示效率為補償,計算速度也難以滿足大規(guī)模問題的需要。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于字典分類的音頻匹配追蹤裝置,以解決上述背景技術中提出的問題。
為實現(xiàn)上述目的,本發(fā)明提供如下技術方案:
一種基于字典分類的音頻匹配追蹤裝置,包括信號分解單元和信號重構單元,信號分解單元包括字典建立模塊、信號分類模塊、權值比較模塊、殘差計算模塊和閾值控制模塊,信號重構單元包括重構系數(shù)提取模塊和信號合成模塊。
所述基于字典分類的音頻匹配追蹤裝置的追蹤方法,包括信號分解方法和信號重構方法;所述信號分解方法的具體步驟如下:
步驟一,根據(jù)不同處理信號類型選擇對應的稀疏字典;
步驟二,判斷待處理信號的類型,根據(jù)其類型選擇與之相適應的稀疏字典,對原始信號進行分類預處理,計算其與步驟一中所建立的稀疏字典的匹配度;
步驟三,將步驟二中得出的稀疏字典記為D,為求各字典中各原子在待處理信號上的權重系數(shù),將稀疏字典中的原子依次與待處理信號做內(nèi)積,計算內(nèi)積絕對值的最大值;
步驟四,由步驟三可得待處理信號在字典中最大原子處的分量,則此次迭代后信號殘差為信號與該分量的矢量差值,同時在稀疏系數(shù)矢量中記錄更新的稀疏系數(shù);
步驟五,匹配追蹤算法處理信號是通過累計迭代,將原始信號表示成權重與對應原子相乘的疊加與殘差之和,當信號殘差減少至一定值時可以終止迭代,該一定值可由迭代次數(shù)和信噪比共同決定;
所述信號重構方法的具體步驟如下:
步驟一,從稀疏系數(shù)碼流中提取重構信號要使用到的原子權重、原子標號和所用字典類型標號;
步驟二,根據(jù)字典類型標號確定編碼時采用稀疏字典類型,將步驟一中所得原子權重與其對應稀疏字典中的原子做乘積,并依次累加,得輸出信號為此次匹配追蹤算法最終對原始信號的擬合信號。
作為本發(fā)明進一步的方案:信號分解方法中步驟二計算待處理信號與步驟一中所建立的稀疏字典的匹配度的具體計算步驟如下:計算待處理信號對應的頻域值,將待處理信號的時域值與頻域值分別歸一化后劃分成j個長度為a的小段(a≤N/2),再計算各小段的能量值,a個連續(xù)樣本的能量值可近似計算式如下:分別計算時頻域能量的和的兩倍,并比較其大小,
作為本發(fā)明進一步的方案:信號分解方法中步驟三所述的內(nèi)積絕對值最大值的計算公式為:iopt∈[1,M]為字典中原子標號,為各原子與S的內(nèi)積值,為字典中原子在S上的最大權重系數(shù)。
作為本發(fā)明進一步的方案:信號分解方法中步驟五中所述的信噪比簡化計算公式為:S為稀疏表示處理前的原始信號幅度值,S′為此次稀疏表示恢復后的信號幅度值。
與現(xiàn)有技術相比,本發(fā)明的有益效果是:本發(fā)明通過對信號進行分類,對不同類型的信號采取不同的稀疏字典進行MP算法,減少了無關遍歷次數(shù),降低了計算復雜度;在分類預處理過程中,通過計算原始信號的能量分布區(qū)間判斷其適應的稀疏字典;本方法縮小了所需字典的維度,提高了編碼速率,使用效果好。
附圖說明
圖1為基于字典分類的音頻匹配追蹤裝置中信號分解方法的流程圖。
圖2為基于字典分類的音頻匹配追蹤裝置中信號重構方法的流程圖。
圖3為基于字典分類的音頻匹配追蹤裝置中信號分解單元的結構示意圖。
圖4為基于字典分類的音頻匹配追蹤裝置中信號重構單元的結構示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學深圳研究院,未經(jīng)武漢大學深圳研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610967738.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:覆盆子酒酒瓶(FFSM)
- 下一篇:飲料瓶





