[發(fā)明專利]可擴(kuò)展的數(shù)字音頻編碼框架及其擴(kuò)展方法無效

申請?zhí)枺?/td>	200610165864.4	申請日：	2006-12-14
公開（公告）號：	CN101202042A	公開（公告）日：	2008-06-18
發(fā)明（設(shè)計(jì)）人：	陳睿	申請（專利權(quán)）人：	中興通訊股份有限公司
主分類號：	G10L19/00	分類號：	G10L19/00;G10L19/14;G10L21/02;G10L11/02;H03M7/30;H04N7/24
代理公司：	北京安信方達(dá)知識產(chǎn)權(quán)代理有限公司	代理人：	許志勇;顏濤
地址：	518057廣東省深圳市南山***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	擴(kuò)展數(shù)字音頻編碼框架及其方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及一種音視頻編碼技術(shù)，具體說，涉及一種可擴(kuò)展的數(shù)字音頻編碼框架及其擴(kuò)展方法。

背景技術(shù)

AVS標(biāo)準(zhǔn)是“信息技術(shù)先進(jìn)音視頻編碼”(Audio?and?Video?codingStandard?Workgroup?of?China)系列標(biāo)準(zhǔn)的簡稱，其核心是把數(shù)字視頻和音頻數(shù)據(jù)壓縮為原來的幾十分之一甚至百分之一以下，AVS包括系統(tǒng)、視頻、音頻等三個主要標(biāo)準(zhǔn)和一致性測試等支撐標(biāo)準(zhǔn)，這是基于我國創(chuàng)新技術(shù)和公開技術(shù)制定的開放標(biāo)準(zhǔn)，旨在為中國的音視頻產(chǎn)業(yè)提供完整的信源編碼技術(shù)方案。無論AVS標(biāo)準(zhǔn)還是其它標(biāo)準(zhǔn)，其物理實(shí)現(xiàn)都是一塊解碼芯片或者編碼芯片。

在很多的通用數(shù)字音頻編碼框架中，只定義了單獨(dú)的音頻編碼方法，不具備可擴(kuò)展性，存在通用部分和擴(kuò)展部分兼容性、統(tǒng)一性不夠的問題，特別是在需要進(jìn)行音頻編碼框架擴(kuò)展時，例如從通用音頻應(yīng)用擴(kuò)展到移動音頻應(yīng)用時，需要定義特定的數(shù)字音頻編碼框架。

發(fā)明內(nèi)容

本發(fā)明所解決的技術(shù)問題是提供一種可擴(kuò)展的數(shù)字音頻編碼框架，解決了通用部分和擴(kuò)展部分兼容性和統(tǒng)一性不夠的問題，使得語音和音樂得到較好的編碼質(zhì)量。

技術(shù)方案如下：

可擴(kuò)展的數(shù)字音頻編碼框架包括：

核心編碼器，接收PCM流，對所述PCM流中的音頻信號或者語音信號進(jìn)行單聲道和編碼，并發(fā)送；

帶寬擴(kuò)展模塊，接收PCM流中的噪聲信號，所述帶寬擴(kuò)展模塊利用噪聲信號中的低頻分量來重建高頻分量，將引導(dǎo)信息加載到編碼后的碼流中，發(fā)送到碼流格式器；

立體聲模塊，接收PCM流中的立體聲信號，從所述立體聲信號中提取立體聲參數(shù)，形成輔助的比特流，發(fā)送到碼流格式器；

碼流格式器，接收核心編碼器、帶寬擴(kuò)展模塊、立體聲模塊的信號，形成輸出碼流。

優(yōu)選的，所述核心編碼器包括：

語音非語音鑒別模塊，接收PCM流，鑒別和區(qū)分PCM流中的語音信號、音頻信號，并將語音信號或者音頻信號選擇發(fā)送；

通用音頻編碼器，接收所述音頻信號，對所述音頻信號進(jìn)行編碼并發(fā)送；

語音編碼器，接收所述語音信號，對所述語音信號進(jìn)行編碼并發(fā)送；

第一開關(guān)元件，選擇導(dǎo)通語音非語音鑒別模塊和通用音頻編碼器，或者選擇導(dǎo)通語音非語音鑒別模塊和語音編碼器；

第二開關(guān)元件，選擇導(dǎo)通碼流格式器和通用音頻編碼器，或者選擇導(dǎo)通碼流格式器和語音編碼器。

優(yōu)選的，立體聲模塊在編碼時，立體聲信號經(jīng)左右聲道混合得到的單聲道信號。

本發(fā)明所解決的另一個技術(shù)問題是提供一種數(shù)字音頻編碼的擴(kuò)展方法，使得語音和音樂得到較好的編碼質(zhì)量。

技術(shù)方案如下：

數(shù)字音頻編碼的擴(kuò)展方法包括如下步驟：

(1)在帶寬擴(kuò)展模塊中，利用接收到的PCM流中的噪聲信號進(jìn)行帶寬擴(kuò)展，并發(fā)送；

(2)在立體聲模塊中，利用接收到的PCM流中的立體聲信號，從所述立體聲信號中提取立體聲參數(shù)，形成輔助的比特流，并發(fā)送；

(3)在核心編碼器中，將接收到的PCM流中的音頻信號或者語音信號進(jìn)行編碼，并發(fā)送；

(4)碼流格式器接收帶寬擴(kuò)展模塊、立體聲模塊、核心編碼器的輸入信號，進(jìn)行組合編碼形成輸出流。

進(jìn)一步，步驟(3)具體為：

(31)語音非語音鑒別模塊接收PCM流，鑒別和區(qū)分PCM流中的語音信號、音頻信號，并將語音信號或者音樂信號選擇發(fā)送；

(32)當(dāng)語音非語音鑒別模塊發(fā)送音頻信號時，第一開關(guān)元件選擇導(dǎo)通語音非語音鑒別模塊和通用音頻編碼器；當(dāng)語音非語音鑒別模塊發(fā)送語音信號時，第一開關(guān)元件選擇導(dǎo)通語音非語音鑒別模塊和語音編碼器；

(33)通用音頻編碼器對接收到的音頻信號進(jìn)行編碼，經(jīng)第二開關(guān)元件發(fā)送到所述碼流格式器；或者，語音編碼器對接收到的語音信號進(jìn)行編碼，經(jīng)第二開關(guān)元件發(fā)送到所述碼流格式器。

本發(fā)明解決了通用部分和擴(kuò)展部分兼容性和統(tǒng)一性不夠的問題，，帶寬擴(kuò)展和立體聲技術(shù)可以方便的與核心編碼器融合，使得語音和音頻得到較好的編碼質(zhì)量。同時，繼承了通用音頻的優(yōu)點(diǎn)，使得碼流的兼容性和統(tǒng)一性得到保證。

附圖說明

圖1是可擴(kuò)展的數(shù)字音頻編碼框架的結(jié)構(gòu)框圖；

圖2是通過復(fù)制產(chǎn)生高頻的頻率-能量曲線圖；

圖3是對高頻部分進(jìn)行包絡(luò)調(diào)整的頻率-能量曲線圖；

圖4是立體聲信號的輸入生產(chǎn)波形圖。

具體實(shí)施方式

下面參照附圖，對本發(fā)明的優(yōu)選實(shí)施例作詳細(xì)描述。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司，未經(jīng)中興通訊股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/200610165864.4/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：甲狀腺囊性增生藥膏及其生產(chǎn)方法
下一篇：騷擾電話判斷系統(tǒng)及方法

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析，例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測技術(shù)
G10L19-06 ..例如短期預(yù)測系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵函數(shù)的確定或編碼；長期預(yù)測參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件，例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】