[發(fā)明專利]一種改進(jìn)的稀疏約束下環(huán)境分量相位角估計(jì)方法、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110661604.0 | 申請日: | 2021-06-15 |
| 公開(公告)號: | CN113449255B | 公開(公告)日: | 2022-11-11 |
| 發(fā)明(設(shè)計(jì))人: | 史創(chuàng);楊浩聰;劉英子;梁江楠 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號: | G06F17/14 | 分類號: | G06F17/14 |
| 代理公司: | 電子科技大學(xué)專利中心 51203 | 代理人: | 周劉英 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 改進(jìn) 稀疏 約束 環(huán)境 分量 相位角 估計(jì) 方法 設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開了一種改進(jìn)的稀疏約束下環(huán)境分量相位角估計(jì)方法、設(shè)備及存儲介質(zhì),屬于音頻處理技術(shù)領(lǐng)域。本發(fā)明包括:對待處理的雙聲道音頻信號進(jìn)行短時(shí)傅里葉變換,將待處理的雙聲道音頻信號變換到時(shí)頻域,得到時(shí)頻域的左、右聲道信號;對頻率小于1.5kHz的頻帶,采用第一相位角估計(jì)法獲取環(huán)境分量相位角估計(jì)值;對于頻率大于或等于1.5kHz的頻帶,采用第二相位角估計(jì)法獲取環(huán)境分量相位角估計(jì)值。本發(fā)明從人耳的聽覺特性,對不同的頻帶區(qū)域進(jìn)行了不同的搜索策略,相比于現(xiàn)有的環(huán)境分量相位角估計(jì)方法,在保障一定的提取精度的前提下,顯著降低了運(yùn)算量,有助于在立體聲擴(kuò)展中保留聲音原始的感知特性,以構(gòu)建更具沉浸感的聲場景。
技術(shù)領(lǐng)域
本發(fā)明屬于音頻處理技術(shù)領(lǐng)域,具體涉及一種改進(jìn)的稀疏約束下環(huán)境分量相位角估計(jì)方法、設(shè)備及存儲介質(zhì)。
背景技術(shù)
日益火熱的游戲、電影、音樂等市場追求提供更加完美的用戶體驗(yàn)。音頻作為信息傳遞的重要媒介之一越發(fā)受到關(guān)注。構(gòu)造一個(gè)更具沉浸感的聲場景能夠?yàn)橛脩魩砀又庇^、更有帶入感的聽覺體驗(yàn)。
通過對音頻回放方式及回放內(nèi)容進(jìn)行設(shè)計(jì)有助于構(gòu)建出一個(gè)更具沉浸感的聲場景。現(xiàn)有的音頻回放方式有基于HRTF頭相關(guān)傳輸函數(shù)的虛擬聽覺重放系統(tǒng)以及多通道音頻回放系統(tǒng)。前者是在雙耳聲信號的重放中合成或模擬出相應(yīng)的聲音空間聽覺,后者則是希望重放一個(gè)和理想聲場盡可能相同或接近的聲場。音頻格式有基于通道的音頻格式以及基于對象的音頻格式。基于對象的音頻格式由于在技術(shù)以及存儲上的復(fù)雜性還沒有得到廣泛的應(yīng)用。常見的音頻信號大部分是基于通道的格式。對于針對特定的回放系統(tǒng)制作的通道音頻信號,在該回放系統(tǒng)內(nèi)能夠得到有效的回放,而當(dāng)音頻信號格式與回放系統(tǒng)不匹配時(shí),如何實(shí)現(xiàn)音頻信號的有效回放是需要考慮的問題。例如將多通道音頻信號在耳機(jī)中進(jìn)行回放,或是將通道信號在更多通道的回放系統(tǒng)中進(jìn)行回放,此時(shí)需對音頻信號進(jìn)行處理使之滿足特定的回放系統(tǒng)。傳統(tǒng)的處理方法有音頻的上混及下混、虛擬化技術(shù),它們可以解決音頻回放系統(tǒng)的適應(yīng)性問題,但重構(gòu)的聲場景的空間質(zhì)量有待提高。在這一過程中,希望保留音頻信號的空間信息以及感知上的特征。
具有提示意義的源分量以及烘托氛圍的散射的環(huán)境分量描述了聲場景的全部內(nèi)容。在聲場景的感知上,源分量提供了線索,環(huán)境分量則渲染了情境。在音頻回放系統(tǒng)的信號處理過程中如果能夠最大限度地保留源分量和環(huán)境分量在感知上的差異,則重構(gòu)出的聲場景便具有更強(qiáng)的帶入感。并且通過對提取出的源分量和環(huán)境分量分別進(jìn)行渲染重構(gòu)能夠設(shè)計(jì)出任何通道數(shù)目下的輸入信號,使之滿足任何回放系統(tǒng)。
對于音頻信號的源分量和環(huán)境分量提取目前已存在一些研究,如線性估計(jì)框架下的基于主成分分析的(Principal Component analysis,PCA)源分量和環(huán)境分量提取算法,時(shí)頻掩蔽算法(Time-frequency Masking,masking)、最小二乘算法(Least Square,LS)、最小泄漏誤差下的最小二乘算法(Minimum Leakage Least Squares,MLLS)、最小失真誤差下的最小二乘算法(Minimum Distortion Least Squares,MDLS)以及可調(diào)節(jié)的最小二乘算法(Adjustable Least Squares,ALS)算法。環(huán)境頻譜估計(jì)框架下的算法如稀疏約束下環(huán)境分量相位角估計(jì)算法(Ambient Phase Estimation with a Sparsity Constraint,APES)及其簡化算法APEX。其中環(huán)境頻譜估計(jì)框架下的APES算法具有最佳的性能,然而APES算法作為在相位空間中逐點(diǎn)搜索的算法存在計(jì)算量大的問題。APEX算法作為APES算法的簡化大大提高了計(jì)算速度,但在一定程度上損失了計(jì)算的準(zhǔn)確度。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種改進(jìn)的稀疏約束下環(huán)境分量相位角估計(jì)方法、設(shè)備及存儲介質(zhì),以在保障提取精度的同時(shí)降低運(yùn)算量。
一方面,本發(fā)明實(shí)施例提供了一種改進(jìn)的稀疏約束下環(huán)境分量相位角估計(jì)方法,所述方法包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110661604.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測終端和環(huán)境檢測系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測儀(環(huán)境貓)





