[發(fā)明專利]音頻上混方法、裝置、電子設備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011580000.5 | 申請日: | 2020-12-28 |
| 公開(公告)號: | CN112566008A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設計)人: | 胡明清;衛(wèi)慧慧;馬桂林;陸恒良 | 申請(專利權(quán))人: | 科大訊飛(蘇州)科技有限公司 |
| 主分類號: | H04S7/00 | 分類號: | H04S7/00;G10L21/0232 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 215021 江蘇省蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 方法 裝置 電子設備 存儲 介質(zhì) | ||
本發(fā)明提供一種音頻上混方法、裝置、電子設備和存儲介質(zhì),其中方法包括:確定待上混的原始音頻信號;對所述原始音頻信號的待平移頻段進行針對各個上混通道的幅值隨機化處理,得到各個上混通道對應的上混頻域信號;將每一上混通道對應的上混頻域信號轉(zhuǎn)換到時域,得到每一上混通道對應的上混音頻信號。本發(fā)明提供的音頻上混方法、裝置、電子設備和存儲介質(zhì),將原始音頻信號上混為多個通道對應的上混音頻信號,能給聽音者帶來更具空間包圍感和沉浸感的聽音感受,優(yōu)化了音頻上混的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及信號處理技術(shù)領(lǐng)域,尤其涉及一種音頻上混方法、裝置、電子設備和存儲介質(zhì)。
背景技術(shù)
實際的音頻信號多為單通道信號或者雙通道立體聲信號,利用信號去相關(guān)技術(shù)將單通道信號或者雙通道信號上混成更多通道的立體聲,能夠合成環(huán)境聲學信息的聽覺感知,產(chǎn)生環(huán)繞感和空間包圍感。
然而,現(xiàn)有的音頻上混方法信號去相關(guān)效果有限,聲場中的空間感和沉浸感不足,還可能導致信號失真,上混效果欠佳。
發(fā)明內(nèi)容
本發(fā)明提供一種音頻上混方法、裝置、電子設備和存儲介質(zhì),用以解決現(xiàn)有技術(shù)中上混效果欠佳的缺陷。
本發(fā)明提供一種音頻上混方法,包括:
確定待上混的原始音頻信號;
對所述原始音頻信號的待平移頻段進行針對各個上混通道的幅值隨機化處理,得到各個上混通道對應的上混頻域信號;
將每一上混通道對應的上混頻域信號轉(zhuǎn)換到時域,得到每一上混通道對應的上混音頻信號。
根據(jù)本發(fā)明提供的一種音頻上混方法,所述對所述原始音頻信號的待平移頻段進行針對各個上混通道的幅值隨機化處理,具體包括:
分別基于各個上混通道對應的去相關(guān)濾波器對所述原始音頻信號進行頻域濾波;
所述去相關(guān)濾波器用于對所述待平移頻段中的每一平移頻點進行幅值隨機化處理,使得各個上混通道對應的上混頻域信號之間去相關(guān)。
根據(jù)本發(fā)明提供的一種音頻上混方法,所述原始音頻信號包括若干個原始通道的原始通道信號,每一原始通道信號對應若干個上混通道;
所述分別基于各個上混通道對應的去相關(guān)濾波器對所述原始音頻信號進行頻域濾波,具體包括:
基于對應上混通道的去相關(guān)濾波器對各個原始通道信號進行幅值隨機化處理。
根據(jù)本發(fā)明提供的一種音頻上混方法,所述原始音頻信號中任一頻點對應的各個上混通道的濾波器系數(shù)之和為1,或平方和為1。
根據(jù)本發(fā)明提供的一種音頻上混方法,任一上混通道的濾波器系數(shù)包括對應平移頻點的隨機化系數(shù);
任一上混通道對應平移頻點的隨機化系數(shù)是基于如下步驟確定的:
確定對應原始通道信號的待平移頻段內(nèi)每一平移頻點的隨機幅值和相位;
基于每一平移頻點的隨機幅值和相位,以及對應每一平移頻點的調(diào)整系數(shù),確定所述任一上混通道對應每一平移頻點的隨機化系數(shù);所述調(diào)整系數(shù)使得平移頻點對應的各個上混通道的隨機化系數(shù)之和為1,或平方和為1。
根據(jù)本發(fā)明提供的一種音頻上混方法,每一平移頻點的隨機幅值滿足高斯分布,所述高斯分布的方差用于調(diào)整聲場的寬度。
根據(jù)本發(fā)明提供的一種音頻上混方法,所述基于每一平移頻點的隨機幅值和相位,以及對應每一平移頻點的調(diào)整系數(shù),確定所述任一上混通道對應每一平移頻點的隨機化系數(shù),之后還包括:
基于預設群延遲頻段和預設壓制頻段,計算系統(tǒng)最小群延遲和所述預設壓制頻段對應的最大延遲;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛(蘇州)科技有限公司,未經(jīng)科大訊飛(蘇州)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011580000.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





