[發明專利]一種選擇編碼模式的方法及裝置有效
| 申請號: | 201310135975.0 | 申請日: | 2013-04-18 |
| 公開(公告)號: | CN104112451B | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 肖瑋;王月明;陸楨騏;蔣三新;劉佩林;應忍冬 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L25/27 |
| 代理公司: | 深圳中一專利商標事務所44237 | 代理人: | 張全文 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 選擇 編碼 模式 方法 裝置 | ||
技術領域
本發明屬于數據處理領域,尤其涉及一種選擇編碼模式的方法及裝置。
背景技術
語音信號和樂音信號在編碼壓縮中通常采用不同的建模方式,語音信號通常基于人的發聲模型,采用線性預測的方式進行編碼;與此相對,樂音信號則通常利用人耳的聽覺遮掩效應,采用變換域編碼的方式。實際使用過程中通常存在語音信號和樂音信號交替出現或同時出現的場合,這樣單一的編碼方式必將對編碼后的音質產生巨大影響。針對這種不足,動態圖像專家組(Moving Pictures Experts Group,MPEG)提出了聯合語音樂音編碼(Unified Speech Audio Coding,USAC)標準。USAC編碼標準聯合了當前最佳的語音編碼標準AMR-WB+及當前最佳的樂音編碼標準AAC+作為其核心編碼器,同時,對輸入信號的高頻部分采用頻段復制編碼技術(Coding Thechnology Spectral Band Replication,CT-SBR)或諧和頻段復制(Harmonic Spectral Band Replication,hSBR)的高頻重建方式。在USAC編碼標準中,其首先對輸入信號的類型進行判斷,然后根據判斷的結果分別采用不同的壓縮編碼方式,當輸入信號為語音信號時,將采用AMR-WB+方式,當輸入信號為音樂信號時,則采用AAC+的方式。因此,準確的語音/音樂分類算法將對USAC的編碼音質產生至關重要的影響。
通常CT-SBR高頻重建方式適合于語音信號,而hSBR更適合于樂音信號。樂音信號的諧波結構明顯比語音信號的好,對于諧波結構比較好的樂音信號來說,若用CT-SBR算法進行高頻重建的話,會在分頻頻率處產生噪聲,從而影響音質。為此,USAC編碼標準中針對諧波結構比較好的樂音信號信號引入了另一種頻帶擴展方法-hSBR。此方法很好的解決了上述存在的問題。然而,研究中我們發現:并不是所有類型的樂音信號都具有良好的諧波結構,例如:以管或弦等發聲的樂音信號通常具有豐富的諧波結構,但以打擊或敲擊發聲的樂音信號其頻譜類似于噪聲,則通常沒有明顯的諧波結構。而USAC編碼標準卻根據輸入信號的分類算法來選擇信號的高頻重建方式。若輸入信號被判斷為樂音信號,則統一采用hSBR。這將導致樂音信號中諧波結構不明顯的打擊樂信號也選擇hSBR方式來進行高頻重建,從而影響到重建樂音信號的質量。為此,需要對樂音信號進行打擊樂和管弦樂的進一步分類。
打擊樂/管弦樂的分類通常包括兩部分:樂音信號特征值提取部分和分類算法部分。總體上,樂音信號特征可分為兩大類:時域特征和頻域特征。同時,為了更加符合人耳的聽覺特性,又提出了Bark域、Mel倒譜等第三類特征值。具體來說,當前已知的特征提取方法有:上升沿檢測、MPEG-7特征、基于小波變換的特征值提取、基于Bark域的模糊表、Mel倒譜系數(MFCC)等。
分類算法部分現有技術有:決策樹,貝葉斯,神經網絡,支持向量機,k-臨近法,遺傳算法,模糊邏輯技術等。雖然現今技術有多種,但是由于各有其特點,某些技術并不適用于USAC平臺。支持向量機(Support Vector Machine,SVM)是一種監督式學習的方法,它廣泛的應用于統計分類以及回歸分析中。支持向量機屬于一般化線性分類器。他們也可以認為是提克洛夫規范化(Tikhonov Regularization)方法的一個特例。這族分類器的特點是他們能夠同時最小化經驗誤差與最大化幾何邊緣區。因此支持向量機也被稱為最大邊緣區分類器。
現有的特征值提取方法主要存在如下缺點:
1.MPEG-7的諧波特征值都是基于之前算出的基樂音信號率算出的,一旦基樂音信號率算錯或者誤差太大,會造成特征值誤差過大;
2.MPEG-7特征值對于混合的樂音判決效果不好;
3.基于Bark域的模糊表經過測試,正確率低于70%,效果不理想。
現有的分類算法主要存在如下缺點:
1.k-臨近每次分類需要讀入訓練集的所有特征值,不滿足系統的實時性要求;
2.SVM算法當樣本數目很大時,存儲和計算耗費資源過多,可能造成較大的處理時間消耗;
3.SVM算法的核函數選擇需要經過測試,核函數選擇不合適會造成維數過大,存儲和計算耗時過大。
發明內容
本發明實施例的目的在于提供一種選擇編碼模式的方法,旨在解決如何優化特征值的選取、減少特征值的數量、優化判決樹的生成、減少在分類結果中的頻繁切換。
第一方面,一種選擇編碼模式的方法,所述方法包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310135975.0/2.html,轉載請聲明來源鉆瓜專利網。





