[發明專利]音頻處理單元、音頻解碼方法和存儲介質在審
| 申請號: | 201910832004.9 | 申請日: | 2013-07-31 |
| 公開(公告)號: | CN110473559A | 公開(公告)日: | 2019-11-19 |
| 發明(設計)人: | 杰弗里·里德米勒;邁克爾·沃德 | 申請(專利權)人: | 杜比實驗室特許公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/16 |
| 代理公司: | 11227 北京集佳知識產權代理有限公司 | 代理人: | 唐京橋;楊林森<國際申請>=<國際公布> |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 比特流 音頻處理單元 解碼器 緩沖存儲器 音頻比特流 解碼 編碼音頻 存儲介質 后處理器 節目信息 音頻解碼 音頻數據 編碼器 結構元 元數據 子流 編程 存儲 配置 | ||
本公開涉及音頻處理單元、音頻解碼方法和存儲介質。一種用于包括通過將子流結構元數據(SSM)和/或節目信息元數據(PIM)以及音頻數據包括在比特流中來生成編碼音頻比特流的設備和方法。其他方面是用于對這樣的比特流進行解碼的設備和方法,以及被配置成(例如,被編程成)執行該方法的任意實施方式或包括存儲根據該方法的任意實施方式而生成的音頻比特流的至少一個幀的緩沖存儲器的音頻處理單元(例如,編碼器、解碼器或后處理器)。
本申請是申請日為2013年7月31日、申請號為“201310329128.8”、發明名稱為“使用節目信息或子流結構元數據的音頻編碼器和解碼器”的發明專利申請的分案申請。
技術領域
本發明涉及音頻信號處理,以及更具體地,涉及具有指示與由比特流所指示的音頻內容有關的子流結構和/或節目信息的元數據的音頻數據比特流的編碼和解碼。本發明的一些實施方式以被稱為杜比數字(AC-3)、杜比數字+(增強的AC-3或E-AC-3)或杜比E的格式中的一種格式生成或解碼音頻數據。
背景技術
杜比、杜比數字、杜比數字+、和杜比E是杜比實驗室特許公司的商標。杜比實驗室提供分別被稱為杜比數字和杜比數字+的AC-3和E-AC-3的專有實現。
音頻數據處理單元通常以盲方式(blind fashion)操作并且不關注在數據被接收之前發生的音頻數據的處理歷史。這可以在這樣的處理框架中工作:其中單個實體進行各種目標媒體渲染裝置的所有的音頻數據處理和編碼而目標媒體渲染裝置進行編碼音頻數據的所有的解碼和渲染。然而,該盲處理在多個音頻處理單元跨多樣化的網絡被散布(scatter)或串聯(即,鏈)放置并且期望它們最佳地執行其相應類型的音頻處理的情形下不能很好地(或完全不)工作。例如,一些音頻數據可能針對高性能媒體系統被編碼,并且可能需要被轉換成適合于沿著媒體處理鏈的移動設備的簡化形式。因此,音頻處理單元可能不必要地對音頻數據執行已經被執行過的類型的處理。例如,音量校平(leveling)單元可能對輸入音頻片斷執行處理,不管以前是否已經對輸入音頻片斷執行了相同的或相似的音量校平。因此,即使當不必要時,音量校平單元也可能執行校平。該不必要的處理還可能導致當渲染音頻數據的內容時具體特征的退化和/或消除。
發明內容
本發明公開了一種音頻處理單元,包括:作為非暫態介質的緩沖存儲器,其被配置成存儲編碼音頻比特流的至少一個幀,其中編碼音頻比特流包括音頻數據和元數據容器,其中元數據容器包括報頭以及在報頭之后的一個或更多個元數據有效載荷,一個或更多個元數據有效載荷包括動態范圍壓縮DRC元數據,并且DRC元數據是或包括指示DRC元數據是否包括動態范圍壓縮DRC控制值的配置文件元數據,DRC控制值用于根據至少一個壓縮配置文件對由音頻數據的至少一個塊指示的音頻內容執行動態范圍壓縮,并且其中,如果配置文件元數據指示DRC元數據包括用于根據一個壓縮配置文件執行動態范圍壓縮的DRC控制值,則DRC元數據還包括根據壓縮配置文件生成的一組DRC控制值;分析器,其耦接至緩沖存儲器并且被配置成對編碼音頻比特流進行分析;以及子系統,其耦接至分析器并且被配置成使用DRC元數據的至少一部分對音頻數據的至少一部分或者對通過解碼音頻數據的至少一部分而生成的解碼音頻數據執行動態范圍壓縮。
本發明還公開了一種音頻解碼方法,包括以下步驟:接收編碼音頻比特流,其中,編碼音頻比特流被分段成一個或更多個幀;從編碼音頻比特流中提取音頻數據和元數據容器,其中元數據容器包括報頭以及在報頭之后的一個或更多個元數據有效載荷,并且其中,一個或更多個元數據有效載荷包括動態范圍壓縮DRC元數據,并且DRC元數據是或包括指示DRC元數據是否包括動態范圍壓縮DRC控制值的配置文件元數據,DRC控制值用于根據至少一個壓縮配置文件對由音頻數據的至少一個塊指示的音頻內容執行動態范圍壓縮,并且其中如果配置文件元數據指示DRC元數據包括用于根據一個壓縮配置文件執行動態范圍壓縮的DRC控制值,則DRC元數據還包括根據壓縮配置文件生成的一組DRC控制值;以及使用DRC元數據的至少一部分對音頻數據的至少一部分或者對通過解碼音頻數據的至少一部分而生成的解碼音頻數據執行動態范圍壓縮。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比實驗室特許公司,未經杜比實驗室特許公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910832004.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種450M機車電臺單元的實時多功能編解碼器
- 下一篇:多聲道音頻內容的編碼





