[發明專利]從音頻信號提取重要頻譜分量的方法和設備以及使用其的低比特率音頻信號編碼和/或解碼方法和設備有效
| 申請號: | 200680025920.2 | 申請日: | 2006-07-14 |
| 公開(公告)號: | CN101223576A | 公開(公告)日: | 2008-07-16 |
| 發明(設計)人: | 金重會;吳殷美;康斯坦丁·奧斯波夫;波利斯·庫德里亞索夫 | 申請(專利權)人: | 三星電子株式會社 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00 |
| 代理公司: | 北京銘碩知識產權代理有限公司 | 代理人: | 郭鴻禧;韓素云 |
| 地址: | 韓國*** | 國省代碼: | 韓國;KR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 信號 提取 重要 頻譜 分量 方法 設備 以及 使用 比特率 編碼 解碼 | ||
本申請要求于2005年7月15日提交到韓國知識產權局的第10-2005-0064507號韓國專利申請的利益,該申請公開于此以資參考。
????????????????????????技術領域
本發明總體發明構思涉及一種音頻信號編碼和/或解碼系統,更具體地講,涉及一種提取音頻信號的重要頻譜分量的方法和設備以及使用其的對低比特率音頻信號編碼和解碼的方法和設備。
????????????????????????背景技術
“MPEG(運動圖像專家組)音頻”是用于高質量高性能立體聲編碼的ISO/IEC標準。MPEG音頻與運動圖像編碼根據MPEG的ISO/IEC?SC29/WG11一起被標準化。對于MPEG音頻,基于32個頻帶的子帶編碼(頻帶分解編碼)和改進離散余弦變換(MDCT)用于壓縮,具體地講,通過使用心理特征執行高性能壓縮。與傳統壓縮編碼方案相比,MPEG音頻可實現高質量的聲音。
為了高性能地壓縮音頻信號,MPEG音頻利用“感知編碼”壓縮方案以減小音頻信號的壓縮量,在該“感知編碼”壓縮方案中,通過使用感測音頻信號的人類的敏感特性來去除詳細的低敏感信息。
此外,在MPEG音頻中,無聲階段的最小可聽限制和掩蔽特性主要用于使用聽覺心理特征的感知編碼。無聲階段的最小可聽限制是聽覺可感知的聲音的最小級別。最小可聽限制與在無聲階段聽覺可感知的噪聲的限制有關。最小可聽限制根據聲音的頻率改變。在一些頻率,可聽到比最小可聽限制高的聲音,但是在另一些頻率,可能不會聽到比最小可聽限制低的聲音。此外,特定聲音的感測限制可根據與該特定聲音一起聽到的其他聲音大大改變。這被稱為“掩蔽效應”。發生掩蔽效應的頻率的寬度被稱為臨界帶。為了有效地利用聽覺心理特征(例如,臨界帶),將聲音信號分解為頻譜分量很重要。為此,頻帶被分為32個子帶,隨后執行子帶編碼。另外,在MPEG音頻中,濾波器組用于消除32個子帶的混疊噪聲。
????????????????????發明內容
????????????????????技術問題
MPEG音頻包括使用濾波器組和心理模型的比特分配和量化。通過MDCT產生的系數分配有最佳量化比特,并且通過使用心理模型2被壓縮。用于分配最佳比特的心理模型2通過使用擴散函數基于FFT來估計掩蔽效應。因此,需要相對大量的復雜度。
通常,對于低比特率(32kbps或更少)音頻信號的壓縮,可分配給信號的比特數不足以量化音頻信號的所有頻譜分量及其無損編碼。因此,需要提取感知的重要頻譜分量(ISC)和量化及其無損編碼。
????????????????????技術方案
本發明總體發明構思提供一種從音頻信號提取重要頻譜分量以低比特率壓縮音頻信號的方法和設備。
本發明總體發明構思還提供一種使用從音頻信號提取重要頻譜分量的方法和設備的低比特率音頻信號編碼方法和設備。
本發明總體發明構思還提供一種對通過低比特率音頻信號編碼方法和設備編碼的低比特率音頻信號解碼的低比特音頻信號解碼方法和設備。
將在接下來的描述中部分闡述本發明另外的方面和優點,還有一部分通過描述將是清楚的,或者可以經過本發明總體發明構思的實施而得知。
可通過提供一種提取音頻信號的重要頻譜分量(ISC)的方法來實現本發明總體發明構思的前述和/或其他方面和優點,該方法包括:通過使用心理模型計算包括變換的頻譜音頻信號的信號掩蔽比(SMR)值的感知重要性,使用SMR值將掩蔽閾值小于所述頻譜音頻信號的掩蔽閾值的頻譜音頻信號選作為第一ISC;根據預定權重因數從選作為第一ISC的頻譜音頻信號提取頻譜峰值以選擇第二ISC。可通過使用權重因數將被獲得的當前信號的頻率附近的預定數量的頻譜值獲得權重因數。
該方法還可包括獲得頻帶的SNR(信噪比);和將具有低SNR的頻帶中峰值大于預定值的頻譜分量選作為ISC。
還可通過提供一種提取音頻信號的重要頻譜分量(ISC)的方法來實現本發明總體發明構思的前述和/或其他方面和優點,該方法包括:通過使用心理模型計算包括變換的頻譜音頻信號的SMR(信號掩蔽比)值的感知重要性;使用SMR將掩蔽閾值小于所述頻譜音頻信號的掩蔽閾值的頻譜音頻信號選作為第一ISC;和獲得選作為第一ISC的頻譜音頻信號中的頻帶的SNR以將具有低SNR的頻帶中峰值大于預定值的頻譜分量的頻譜音頻信號選作為另一ISC。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社,未經三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680025920.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于通訊設備的空調系統
- 下一篇:將儲存庫還原到先前狀態的方法





