[發(fā)明專利]利用節(jié)目響度和邊界元數(shù)據(jù)的音頻編碼器和解碼器有效
| 申請?zhí)枺?/td> | 201480002687.0 | 申請日: | 2014-01-15 |
| 公開(公告)號: | CN104737228B | 公開(公告)日: | 2017-12-29 |
| 發(fā)明(設(shè)計)人: | 邁克爾·格蘭特;斯科特·格雷戈里·諾克羅斯;杰弗里·里德米勒;邁克爾·沃德 | 申請(專利權(quán))人: | 杜比實驗室特許公司 |
| 主分類號: | G10L19/16 | 分類號: | G10L19/16 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 康建峰,吳瓊 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 利用 節(jié)目 響度 邊界 數(shù)據(jù) 音頻 編碼器 解碼器 | ||
相關(guān)申請的交叉引用
本申請要求于2013年1月21日提交的美國臨時專利申請No.61/754,882和于2013年5月16日提交的美國臨時專利申請No.61/824,010的優(yōu)先權(quán),上述每個申請的全部內(nèi)容由此通過引用被合并于此。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號處理,更具體地,本發(fā)明涉及使用表示音頻內(nèi)容的響度處理狀態(tài)的元數(shù)據(jù)以及比特流所標示的音頻節(jié)目邊界的位置對音頻數(shù)據(jù)比特流進行編碼和解碼。本發(fā)明的一些實施例生成或解碼作為AC-3、增強型AC-3或E-AC-3或者Dolby E(杜比E)已知的格式之一的音頻數(shù)據(jù)。
背景技術(shù)
“杜比”、“杜比數(shù)字”、“杜比數(shù)字+”和“杜比E”是杜比實驗室特許公司的商標。杜比實驗室提供分別作為“杜比數(shù)字”和“杜比數(shù)字+”已知的AC-3和E-AC-3的專有實施。
音頻數(shù)據(jù)處理單元通常以盲目的方式來操作,并且不注意在數(shù)據(jù)被接收之前出現(xiàn)的音頻數(shù)據(jù)的處理歷史。這可能在以下處理框架內(nèi)起作用:其中,單個實體進行各種各樣的目標媒體渲染裝置的所有的音頻數(shù)據(jù)處理和編碼,同時,目標媒體渲染裝置進行對編碼音頻數(shù)據(jù)的所有的解碼和渲染。然而,該盲目的處理在以下情況下不能很好地起作用(或者一點都不起作用):其中,多個音頻處理單元散布在多種多樣的網(wǎng)絡(luò)上或者串聯(lián)放置(即,鏈式放置)并被期望最優(yōu)地執(zhí)行它們各自類型的音頻處理。例如,某些音頻數(shù)據(jù)可以被編碼以用于高性能的媒體系統(tǒng)并且可能必須沿著媒體處理鏈被轉(zhuǎn)換成適合移動裝置的縮減形式。因而,音頻處理單元可能不必對已經(jīng)被執(zhí)行了某種類型的處理的音頻數(shù)據(jù)執(zhí)行該類型的音頻處理。例如,音量調(diào)節(jié)(volume leveling)單元可以對輸入音頻剪輯執(zhí)行處理,而不管是否之前已經(jīng)對輸入音頻剪輯執(zhí)行了相同的或類似的音量調(diào)節(jié)。因此,音量調(diào)節(jié)單元可能在不需要時執(zhí)行調(diào)節(jié)。該非必要的處理還可能引起在對音頻數(shù)據(jù)的內(nèi)容進行渲染時的特定特征的去除和/或降級。
音頻數(shù)據(jù)的典型的流包括音頻內(nèi)容(如,音頻內(nèi)容的一個或更多個通道)和表示音頻內(nèi)容的至少一個特征的元數(shù)據(jù)二者。例如,在AC-3比特流中,存在若干音頻元數(shù)據(jù)參數(shù),這些音頻元數(shù)據(jù)參數(shù)具體地意在用于改變被遞送到傾聽環(huán)境的節(jié)目的聲音。元數(shù)據(jù)參數(shù)之一是“DIALNORM”參數(shù),其意在表示出現(xiàn)音頻節(jié)目的會話的平均電平,并且用于確定音頻回放信號電平。
在包括不同的音頻節(jié)目分段(每個音頻節(jié)目分段具有不同的DIALNORM參數(shù))序列的比特流的回放期間,AC-3解碼器使用每個分段的DIALNORM參數(shù)來執(zhí)行某種類型的響度處理,其中,其修改回放電平或響度,使得分段序列的會話的感知響度處于恒定的電平。編碼音頻項的序列中的每個編碼音頻分段(項)會(通常)具有不同的DIALNORM參數(shù),并且解碼器可以對其中每個項的電平進行縮放,使得每個項的會話的回放電平或響度相同或者非常類似,雖然這可能需要在回放期間將不同量的增益應(yīng)用于不同的項。
DIALNORM通常由用戶來設(shè)置,并且不是自動生成的,雖然如果用戶沒有設(shè)置任何值時則存在默認的DIALNORM值。例如,內(nèi)容產(chǎn)生器可以用AC-3編碼器外部的裝置來進行響度測量,并且接著將(表示音頻節(jié)目的口語會話的響度的)結(jié)果傳輸給編碼器以設(shè)置DIALNORM值。因此,存在為了正確地設(shè)置DIALNORM參數(shù)而對內(nèi)容產(chǎn)生器的依賴。
AC-3比特流中的DIALNORM參數(shù)可能不正確的原因有若干不同的原因。首先,如果內(nèi)容產(chǎn)生器沒有設(shè)置DIALNORM值,則每個AC-3編碼器具有在比特流的生成期間使用的默認的DIALNORM值。該默認值可能與音頻的實際會話響度電平相當不同。第二,即使內(nèi)容產(chǎn)生器測量響度并且相應(yīng)地設(shè)置DIALNORM值,也可能使用不遵守推薦的AC-3響度測量方法的響度測量算法或儀表,從而導(dǎo)致錯誤的DIALNORM值。第三,即使已經(jīng)利用內(nèi)容產(chǎn)生器正確地測量的并且設(shè)置的DIALNORM值產(chǎn)生了AC-3比特流,其可能在比特流的傳輸和/或存儲期間已經(jīng)被改為錯誤的值。例如,在電視廣播應(yīng)用中,使用錯誤的DIALNORM元數(shù)據(jù)信息來對AC-3比特流進行解碼、修改和接著重新編碼不是不常見。因此,AC-3比特流中所包括的DIALNORM值可能是不正確的或者不準確的,因此可能對于傾聽體驗的質(zhì)量有負面影響。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杜比實驗室特許公司,未經(jīng)杜比實驗室特許公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480002687.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種適用于文件播出系統(tǒng)的音頻響度一致性控制方法
- 用于選通響度測量恢復(fù)的響度記錄及關(guān)聯(lián)的分析儀
- 具有噪聲檢測和響度下降檢測的響度控制
- 響度顯示裝置及顯示方法
- 用于廣電播出系統(tǒng)的音頻響度一致性控制方法及系統(tǒng)
- 一種音量調(diào)節(jié)方法、終端設(shè)備及計算機可讀存儲介質(zhì)
- 數(shù)字廣播電視的音頻響度測量系統(tǒng)和方法
- 一種基于音頻編碼器的響度均衡方法、編碼器及藍牙設(shè)備
- 一種基于音頻解碼器的響度均衡方法、解碼器及藍牙設(shè)備
- 一種響度均衡方法、裝置、存儲介質(zhì)及設(shè)備





