[發(fā)明專(zhuān)利]一種改進(jìn)的源分量及環(huán)境分量提取方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110480313.1 | 申請(qǐng)日: | 2021-04-30 |
| 公開(kāi)(公告)號(hào): | CN113518299B | 公開(kāi)(公告)日: | 2022-06-03 |
| 發(fā)明(設(shè)計(jì))人: | 史創(chuàng);王蘋(píng)潔;楊浩聰;劉英子 | 申請(qǐng)(專(zhuān)利權(quán))人: | 電子科技大學(xué) |
| 主分類(lèi)號(hào): | H04S7/00 | 分類(lèi)號(hào): | H04S7/00;G10L21/0308 |
| 代理公司: | 電子科技大學(xué)專(zhuān)利中心 51203 | 代理人: | 周劉英 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 改進(jìn) 分量 環(huán)境 提取 方法 設(shè)備 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開(kāi)了一種改進(jìn)的源分量及環(huán)境分量提取方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),屬于音視頻處理技術(shù)領(lǐng)域。本發(fā)明的提取方法為:對(duì)兩個(gè)聲道的源分量能量之比進(jìn)行估計(jì),并求解音頻在每幀的各正頻率點(diǎn)分量值;然后獲取環(huán)境分量相位角的最優(yōu)估計(jì);最后,通過(guò)共軛對(duì)稱關(guān)系構(gòu)建對(duì)應(yīng)的負(fù)頻率點(diǎn)分量值,并對(duì)每幀的各頻率點(diǎn)分量值進(jìn)行頻域到時(shí)域的轉(zhuǎn)換處理,得到待進(jìn)行提取的雙聲道音頻信號(hào)的左右升到的環(huán)境分量信號(hào)與源分量信號(hào)。本發(fā)明可用于立體聲擴(kuò)展,使得通道格式立體聲音頻可以與任意通道數(shù)的再現(xiàn)系統(tǒng)兼容。在音頻質(zhì)量方面,經(jīng)本發(fā)明提取方法所提取出源分量、環(huán)境分量的時(shí)域波形與原始語(yǔ)音的左聲道源分量、環(huán)境分量的波形具有高度一致性。
技術(shù)領(lǐng)域
本發(fā)明屬于音頻技術(shù)領(lǐng)域,具體涉及一種改進(jìn)的源分量及環(huán)境分量提取方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
如今基于通道的音頻格式得到了廣泛應(yīng)用,但基于通道的音頻往往具有特定的播放配置,即它無(wú)法與不同的播放系統(tǒng)兼容。因此考慮到當(dāng)今播放系統(tǒng)的多樣性,需要對(duì)不同通道數(shù)的音頻信號(hào)進(jìn)行分解和重構(gòu)以滿足不同配置的播放系統(tǒng),并獲得更好的空間質(zhì)量(spatial quality)。
傳統(tǒng)的音頻重構(gòu)技術(shù)根據(jù)播放系統(tǒng)分為兩類(lèi),一種是揚(yáng)聲器播放,常見(jiàn)技術(shù)有混音(audio remixing),另一種是耳機(jī)播放,常見(jiàn)技術(shù)有虛擬化(virtulization)等。基于文獻(xiàn)《Spatial sound reproduction using conventional and parametric loudspeakers》和《Spatial audio processing:MPEG surround and other applications》可知,揚(yáng)聲器播放的音頻重構(gòu)需要額外的組件,導(dǎo)致相應(yīng)的設(shè)備成本更加昂貴。另一方面耳機(jī)播放重構(gòu)出的聲音,其空間質(zhì)量相對(duì)實(shí)錄立體聲還存在差距。
針對(duì)以上問(wèn)題,一種改進(jìn)的思路是通過(guò)前端算法處理的手段,建立立體聲信號(hào)模型,使用音頻的相位信息來(lái)營(yíng)造更真實(shí)的空間聽(tīng)感。將雙聲道音頻分解為源分量(primarycomponent)和環(huán)境分量(ambient component)的線性組合,其中音頻左右通道分別表示為xL和xR,并滿足:xL=pL+aL,xR=pL+aR,其中pL、pR分別代表左右通道的源分量,aL和aR分別代表左右通道的環(huán)境分量。在文獻(xiàn)《Primary-Ambient Extraction Using Ambient SpectrumEstimation for Immersive Spatial Audio Reproduction》中,提出了一種通過(guò)對(duì)每幀每個(gè)頻點(diǎn)的環(huán)境分量相位做最優(yōu)估計(jì)來(lái)實(shí)現(xiàn)源分量及環(huán)境分量提取的技術(shù),但該方法的優(yōu)化目標(biāo)為每幀每頻點(diǎn)的環(huán)境分量相位,在本發(fā)明的技術(shù)方案的實(shí)現(xiàn)過(guò)程中,發(fā)明人發(fā)現(xiàn):實(shí)際生活中一種更常見(jiàn)的情況是不同幀相同頻點(diǎn)處的環(huán)境分量相位差相同,因此沒(méi)有必要對(duì)左、右聲道每幀、每頻點(diǎn)處的環(huán)境分量相位均做最優(yōu)估計(jì)。
發(fā)明內(nèi)容
本發(fā)明公開(kāi)了一種改進(jìn)的源分量及環(huán)境分量提取方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),以減小對(duì)雙聲道音頻的進(jìn)行源分量及環(huán)境分量提取時(shí)的計(jì)算量,提升運(yùn)算速度。
一方面,本發(fā)明提供了一種基于雙聲道音頻的一種改進(jìn)的源分量及環(huán)境分量提取方法,包括下列步驟:
步驟1:估算左、右通道源分量之比k;
其中,r00、r11分別表示左右通道源分量的自相關(guān)系數(shù),r01表示左右通道源分量的互相關(guān)系數(shù);
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110480313.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)終端和環(huán)境檢測(cè)系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車(chē)輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動(dòng)力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)儀(環(huán)境貓)





