[發(fā)明專利]音頻處理方法、裝置及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201310031782.0 | 申請(qǐng)日: | 2013-01-28 |
| 公開(公告)號(hào): | CN103971692A | 公開(公告)日: | 2014-08-06 |
| 發(fā)明(設(shè)計(jì))人: | 楊磊;王立眾;洪準(zhǔn)晟 | 申請(qǐng)(專利權(quán))人: | 北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社 |
| 主分類號(hào): | G10L19/008 | 分類號(hào): | G10L19/008 |
| 代理公司: | 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 11018 | 代理人: | 鄭紅娟;宋志強(qiáng) |
| 地址: | 100125 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 處理 方法 裝置 系統(tǒng) | ||
技術(shù)領(lǐng)域
本申請(qǐng)涉及音頻處理技術(shù)領(lǐng)域,特別涉及一種音頻處理方法、裝置及系統(tǒng)。
背景技術(shù)
在立體聲音頻技術(shù)中,編碼端(具體可以是立體聲編碼器)可以采用立體聲編碼標(biāo)準(zhǔn)將模擬的立體聲信號(hào)進(jìn)行編碼處理得到數(shù)字碼流,以及解碼端(具體可以是立體聲解碼器)可以采用相應(yīng)的立體聲解碼標(biāo)準(zhǔn)將數(shù)字碼流進(jìn)行相應(yīng)的解碼處理,從而將該數(shù)字碼流還原為模擬的立體聲信號(hào)。與單聲道相比,立體聲在改善聲音質(zhì)量和加強(qiáng)臨場(chǎng)效果,以及如實(shí)地再現(xiàn)出實(shí)際聲場(chǎng)中各個(gè)聲源的方位和空間分布等方面均具有更好的優(yōu)勢(shì),因此,立體聲音頻技術(shù)廣泛地應(yīng)用于各種音視頻通信業(yè)務(wù)中,例如,應(yīng)用于視頻會(huì)議中。立體聲音頻技術(shù)能夠使得視頻會(huì)議中的用戶更好地進(jìn)行溝通,讓用戶的交流更加自然,提高了會(huì)議效率。并且,立體聲音頻技術(shù)的較低的復(fù)雜度與較小的帶寬占用的優(yōu)點(diǎn)也可以允許用戶使用各種便攜式設(shè)備,如手機(jī)和平板電腦等接入視頻會(huì)議,從而保證用戶可以隨時(shí)隨地通過(guò)視頻會(huì)議進(jìn)行交流,大大提高了工作效率,具有廣闊的市場(chǎng)前景。
目前,現(xiàn)有的立體聲編/解碼標(biāo)準(zhǔn)(或算法)主要有AMR-WB+(AdaptiveMulti-rate-Wideband,自適應(yīng)多速率寬帶編碼)和HEAAC v2(High-Efficiency AdvancedAudio Coding version2,高性能高級(jí)音頻編碼第二版),但是,這兩種標(biāo)準(zhǔn)在使用立體聲方式進(jìn)行編碼時(shí)均會(huì)產(chǎn)生較大的延時(shí),其中,AMR-WB+標(biāo)準(zhǔn)的延時(shí)可以達(dá)到108~325ms,而HEAAC v2的延時(shí)甚至可以達(dá)到386~513ms之長(zhǎng)。因此,在應(yīng)用于對(duì)實(shí)時(shí)性要求較高的音視頻通信業(yè)務(wù),例如,視頻會(huì)議中時(shí),現(xiàn)有的上述立體聲編/解碼標(biāo)準(zhǔn)的高延時(shí)已經(jīng)無(wú)法滿足這些實(shí)時(shí)性要求較高的音視頻通信業(yè)務(wù)的要求,會(huì)對(duì)視頻會(huì)議等音視頻通信業(yè)務(wù)的語(yǔ)音交互帶來(lái)較大的不利影響。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┝艘环N音頻處理方法、裝置及系統(tǒng),以解決現(xiàn)有的AMR-WB+和HEAAC v2這樣的立體聲編/解碼標(biāo)準(zhǔn)的時(shí)延較大的問(wèn)題。
本申請(qǐng)的技術(shù)方案如下:
一方面,提供了一種音頻處理方法,包括:
獲取輸入的待編碼的立體聲信號(hào)的左聲道信號(hào)和右聲道信號(hào)的平均值得到下混合信號(hào),對(duì)下混合信號(hào)進(jìn)行編碼得到主碼流;
對(duì)左聲道信號(hào)和右聲道信號(hào)分別進(jìn)行調(diào)制重疊變換MLT得到左聲道MLT系數(shù)序列和右聲道MLT系數(shù)序列,將左聲道MLT系數(shù)序列和右聲道MLT系數(shù)序列分別劃分為低頻序列和高頻序列,其中,低頻序列的頻率小于或等于預(yù)設(shè)的第一頻率值,高頻序列的頻率大于第一頻率值;
根據(jù)左聲道MLT系數(shù)序列的低頻序列與右聲道MLT系數(shù)序列的低頻序列之差獲取低頻邊帶信號(hào),對(duì)低頻邊帶信號(hào)的幅度和位置進(jìn)行量化編碼得到低頻碼流;
根據(jù)左聲道MLT系數(shù)序列的高頻序列和右聲道MLT系數(shù)序列的高頻序列獲取強(qiáng)度立體聲系數(shù),對(duì)強(qiáng)度立體聲系數(shù)的幅度進(jìn)行量化編碼得到高頻碼流,其中,強(qiáng)度立體聲系數(shù)用于表示左聲道信號(hào)的能量與立體聲信號(hào)的能量的比值的均方根、以及右聲道信號(hào)的能量與立體聲信號(hào)的能量的比值的均方根;
將主碼流和輔助碼流進(jìn)行混合得到立體聲碼流,輸出立體聲碼流,其中,輔助碼流由低頻碼流和高頻碼流組成。
另一方面,還提供了一種音頻處理方法,包括:
將輸入的待解碼的立體聲碼流進(jìn)行分離得到主碼流和輔助碼流,對(duì)分離得到的主碼流進(jìn)行解碼得到解碼的下混合信號(hào),其中,待解碼的立體聲碼流是上述輸出的立體聲碼流;
對(duì)分離得到的輔助碼流進(jìn)行解碼和反量化得到邊帶低頻系數(shù)和強(qiáng)度立體聲系數(shù)的幅度,對(duì)邊帶低頻系數(shù)進(jìn)行反調(diào)制重疊變換IMLT得到解碼的低頻邊帶信號(hào);
根據(jù)解碼的低頻邊帶信號(hào)和解碼的下混合信號(hào)的低頻部分,獲取左聲道低頻段的解碼信號(hào)和右聲道低頻段的解碼信號(hào);
根據(jù)強(qiáng)度立體聲系數(shù)的幅度和解碼的下混合信號(hào)的高頻部分,獲取左聲道高頻段的解碼信號(hào)和右聲道高頻段的解碼信號(hào);
獲取左聲道低頻段的解碼信號(hào)與左聲道高頻段的解碼信號(hào)之和得到解碼的左聲道信號(hào),獲取右聲道低頻段的解碼信號(hào)與右聲道高頻段的解碼信號(hào)之和得到解碼的右聲道信號(hào),輸出解碼的左聲道信號(hào)和解碼的右聲道信號(hào)。
又一方面,還提供了一種音頻處理裝置,包括:
下混合模塊,用于獲取輸入的待編碼的立體聲信號(hào)的左聲道信號(hào)和右聲道信號(hào)的平均值得到下混合信號(hào);
主編碼模塊,用于對(duì)下混合模塊輸入的下混合信號(hào)進(jìn)行編碼得到主碼流;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社,未經(jīng)北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310031782.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





