[發(fā)明專利]可擴(kuò)展的數(shù)字音頻編碼框架及其擴(kuò)展方法無效
| 申請?zhí)枺?/td> | 200610165864.4 | 申請日: | 2006-12-14 |
| 公開(公告)號: | CN101202042A | 公開(公告)日: | 2008-06-18 |
| 發(fā)明(設(shè)計(jì))人: | 陳睿 | 申請(專利權(quán))人: | 中興通訊股份有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L19/14;G10L21/02;G10L11/02;H03M7/30;H04N7/24 |
| 代理公司: | 北京安信方達(dá)知識產(chǎn)權(quán)代理有限公司 | 代理人: | 許志勇;顏濤 |
| 地址: | 518057廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 擴(kuò)展 數(shù)字音頻 編碼 框架 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種音視頻編碼技術(shù),具體說,涉及一種可擴(kuò)展的數(shù)字音頻編碼框架及其擴(kuò)展方法。
背景技術(shù)
AVS標(biāo)準(zhǔn)是“信息技術(shù)先進(jìn)音視頻編碼”(Audio?and?Video?codingStandard?Workgroup?of?China)系列標(biāo)準(zhǔn)的簡稱,其核心是把數(shù)字視頻和音頻數(shù)據(jù)壓縮為原來的幾十分之一甚至百分之一以下,AVS包括系統(tǒng)、視頻、音頻等三個主要標(biāo)準(zhǔn)和一致性測試等支撐標(biāo)準(zhǔn),這是基于我國創(chuàng)新技術(shù)和公開技術(shù)制定的開放標(biāo)準(zhǔn),旨在為中國的音視頻產(chǎn)業(yè)提供完整的信源編碼技術(shù)方案。無論AVS標(biāo)準(zhǔn)還是其它標(biāo)準(zhǔn),其物理實(shí)現(xiàn)都是一塊解碼芯片或者編碼芯片。
在很多的通用數(shù)字音頻編碼框架中,只定義了單獨(dú)的音頻編碼方法,不具備可擴(kuò)展性,存在通用部分和擴(kuò)展部分兼容性、統(tǒng)一性不夠的問題,特別是在需要進(jìn)行音頻編碼框架擴(kuò)展時,例如從通用音頻應(yīng)用擴(kuò)展到移動音頻應(yīng)用時,需要定義特定的數(shù)字音頻編碼框架。
發(fā)明內(nèi)容
本發(fā)明所解決的技術(shù)問題是提供一種可擴(kuò)展的數(shù)字音頻編碼框架,解決了通用部分和擴(kuò)展部分兼容性和統(tǒng)一性不夠的問題,使得語音和音樂得到較好的編碼質(zhì)量。
技術(shù)方案如下:
可擴(kuò)展的數(shù)字音頻編碼框架包括:
核心編碼器,接收PCM流,對所述PCM流中的音頻信號或者語音信號進(jìn)行單聲道和編碼,并發(fā)送;
帶寬擴(kuò)展模塊,接收PCM流中的噪聲信號,所述帶寬擴(kuò)展模塊利用噪聲信號中的低頻分量來重建高頻分量,將引導(dǎo)信息加載到編碼后的碼流中,發(fā)送到碼流格式器;
立體聲模塊,接收PCM流中的立體聲信號,從所述立體聲信號中提取立體聲參數(shù),形成輔助的比特流,發(fā)送到碼流格式器;
碼流格式器,接收核心編碼器、帶寬擴(kuò)展模塊、立體聲模塊的信號,形成輸出碼流。
優(yōu)選的,所述核心編碼器包括:
語音非語音鑒別模塊,接收PCM流,鑒別和區(qū)分PCM流中的語音信號、音頻信號,并將語音信號或者音頻信號選擇發(fā)送;
通用音頻編碼器,接收所述音頻信號,對所述音頻信號進(jìn)行編碼并發(fā)送;
語音編碼器,接收所述語音信號,對所述語音信號進(jìn)行編碼并發(fā)送;
第一開關(guān)元件,選擇導(dǎo)通語音非語音鑒別模塊和通用音頻編碼器,或者選擇導(dǎo)通語音非語音鑒別模塊和語音編碼器;
第二開關(guān)元件,選擇導(dǎo)通碼流格式器和通用音頻編碼器,或者選擇導(dǎo)通碼流格式器和語音編碼器。
優(yōu)選的,立體聲模塊在編碼時,立體聲信號經(jīng)左右聲道混合得到的單聲道信號。
本發(fā)明所解決的另一個技術(shù)問題是提供一種數(shù)字音頻編碼的擴(kuò)展方法,使得語音和音樂得到較好的編碼質(zhì)量。
技術(shù)方案如下:
數(shù)字音頻編碼的擴(kuò)展方法包括如下步驟:
(1)在帶寬擴(kuò)展模塊中,利用接收到的PCM流中的噪聲信號進(jìn)行帶寬擴(kuò)展,并發(fā)送;
(2)在立體聲模塊中,利用接收到的PCM流中的立體聲信號,從所述立體聲信號中提取立體聲參數(shù),形成輔助的比特流,并發(fā)送;
(3)在核心編碼器中,將接收到的PCM流中的音頻信號或者語音信號進(jìn)行編碼,并發(fā)送;
(4)碼流格式器接收帶寬擴(kuò)展模塊、立體聲模塊、核心編碼器的輸入信號,進(jìn)行組合編碼形成輸出流。
進(jìn)一步,步驟(3)具體為:
(31)語音非語音鑒別模塊接收PCM流,鑒別和區(qū)分PCM流中的語音信號、音頻信號,并將語音信號或者音樂信號選擇發(fā)送;
(32)當(dāng)語音非語音鑒別模塊發(fā)送音頻信號時,第一開關(guān)元件選擇導(dǎo)通語音非語音鑒別模塊和通用音頻編碼器;當(dāng)語音非語音鑒別模塊發(fā)送語音信號時,第一開關(guān)元件選擇導(dǎo)通語音非語音鑒別模塊和語音編碼器;
(33)通用音頻編碼器對接收到的音頻信號進(jìn)行編碼,經(jīng)第二開關(guān)元件發(fā)送到所述碼流格式器;或者,語音編碼器對接收到的語音信號進(jìn)行編碼,經(jīng)第二開關(guān)元件發(fā)送到所述碼流格式器。
本發(fā)明解決了通用部分和擴(kuò)展部分兼容性和統(tǒng)一性不夠的問題,,帶寬擴(kuò)展和立體聲技術(shù)可以方便的與核心編碼器融合,使得語音和音頻得到較好的編碼質(zhì)量。同時,繼承了通用音頻的優(yōu)點(diǎn),使得碼流的兼容性和統(tǒng)一性得到保證。
附圖說明
圖1是可擴(kuò)展的數(shù)字音頻編碼框架的結(jié)構(gòu)框圖;
圖2是通過復(fù)制產(chǎn)生高頻的頻率-能量曲線圖;
圖3是對高頻部分進(jìn)行包絡(luò)調(diào)整的頻率-能量曲線圖;
圖4是立體聲信號的輸入生產(chǎn)波形圖。
具體實(shí)施方式
下面參照附圖,對本發(fā)明的優(yōu)選實(shí)施例作詳細(xì)描述。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司,未經(jīng)中興通訊股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610165864.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





