[發(fā)明專(zhuān)利]一種聲道間相位差參數(shù)的提取方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201610377800.4 | 申請(qǐng)日: | 2016-05-31 |
| 公開(kāi)(公告)號(hào): | CN107452387B | 公開(kāi)(公告)日: | 2019-11-12 |
| 發(fā)明(設(shè)計(jì))人: | 張興濤;李海婷;劉澤新;苗磊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G10L19/008 | 分類(lèi)號(hào): | G10L19/008 |
| 代理公司: | 廣州三環(huán)專(zhuān)利商標(biāo)代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強(qiáng) |
| 地址: | 518129 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 聲道 相位差 參數(shù) 提取 方法 裝置 | ||
本發(fā)明實(shí)施例公開(kāi)了一種聲道間相位差參數(shù)的提取方法,包括:獲取用于確定多聲道信號(hào)的當(dāng)前幀的信息提取方式的參數(shù);根據(jù)所述用于確定多聲道信號(hào)的當(dāng)前幀的信息提取方式的參數(shù)確定當(dāng)前幀的多聲道信號(hào)的聲道間相位差I(lǐng)PD參數(shù)的提取方式,所述確定的當(dāng)前幀的多聲道信號(hào)的IPD參數(shù)的提取方式為預(yù)設(shè)的至少兩種IPD參數(shù)提取方式中的一種;根據(jù)所述確定的當(dāng)前幀的多聲道信號(hào)的IPD參數(shù)的提取方式提取所述當(dāng)前幀的多聲道信號(hào)的IPD參數(shù)。本發(fā)明實(shí)施例還公開(kāi)了一種聲道間相位差參數(shù)的提取裝置。采用本發(fā)明實(shí)施例,具體可提高IPD參數(shù)的提取方式的選擇多樣性,更好地保持相位信息,提升音頻的編碼質(zhì)量的優(yōu)點(diǎn)。
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種聲道間相位差參數(shù)的提取方法及裝置。
背景技術(shù)
隨著生活質(zhì)量的提高,人們對(duì)高質(zhì)量的音頻的需求不斷增大。相對(duì)于單聲道音頻,立體聲音頻具有各聲源的方位感和分布感,能夠提高音頻信息的清晰度和可懂度,增強(qiáng)音頻播放的臨場(chǎng)感,因而備受人們的青睞。
參數(shù)立體聲(Parametric Stereo,PS)編碼是常用的立體聲處理技術(shù)的編碼方式之一。PS編碼根據(jù)空間感知特性對(duì)立體聲信號(hào)(即多聲道信號(hào))進(jìn)行編解碼處理,將多聲道信號(hào)的編解碼轉(zhuǎn)換為單聲道音頻信號(hào)的編解碼和空間感知參數(shù)的編解碼。PS編碼中的空間感知參數(shù)包括聲道間相關(guān)性(Inter-channel Coherence,IC)、聲道間電平差(Inter-channel Level Difference,ILD)、聲道間時(shí)間差(Inter-channel Time Difference,ITD)和聲道間相位差(Inter-channel Phase Difference,IPD)等。其中,ITD和IPD為表示聲源水平方位的空間感知參數(shù)。ILD、ITD和IPD決定人耳對(duì)聲源位置的感知,可以有效確定聲場(chǎng)位置,對(duì)立體聲信號(hào)的恢復(fù)具有重大作用,因此,IPD等參數(shù)的確定對(duì)立體聲信號(hào)的恢復(fù)具有重要作用。
現(xiàn)有技術(shù)一中,立體聲信號(hào)的每一幀的IPD參數(shù)是將時(shí)域信號(hào)變換為頻域信號(hào),將頻域信號(hào)劃分為多個(gè)子帶,逐個(gè)子帶計(jì)算IPD參數(shù),通過(guò)對(duì)每個(gè)子帶的IPD參數(shù)進(jìn)行量化編碼之后用于立體聲信號(hào)的編碼。現(xiàn)有技術(shù)一的IPD參數(shù)計(jì)算需要對(duì)多個(gè)子帶的頻域信號(hào)進(jìn)行逐個(gè)子帶計(jì)算,占用資源多,編碼速率低。
現(xiàn)有技術(shù)二中,立體聲信號(hào)的每一幀的IPD參數(shù)是將時(shí)頻信號(hào)變換為頻域信號(hào),再基于頻域信號(hào)計(jì)算一幀的IPD參數(shù),稱(chēng)為全局聲道間相位差(即Group IPD)參數(shù),最后通過(guò)對(duì)Group IPD參數(shù)進(jìn)行量化編碼之后用于立體聲信號(hào)的編碼。現(xiàn)有技術(shù)二只提取了一個(gè)IPD參數(shù)(即Group IPD參數(shù))進(jìn)而僅能對(duì)一個(gè)IPD參數(shù)進(jìn)行量化編碼,雖然占用資源少,但是提取的相位信息精度低,編碼質(zhì)量差。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┮环N聲道間相位差參數(shù)的提取方法及裝置,可提高IPD參數(shù)的提取方式的選擇多樣性,更好地保持相位信息,提升音頻的編碼質(zhì)量。
第一方面,提供了一種聲道間相位差參數(shù)的提取方法,其可包括:
獲取用于確定多聲道信號(hào)的當(dāng)前幀的信息提取方式的參數(shù);
根據(jù)所述用于確定多聲道信號(hào)的當(dāng)前幀的信息提取方式的參數(shù)確定當(dāng)前幀的多聲道信號(hào)的聲道間相位差I(lǐng)PD參數(shù)的提取方式,所述確定的當(dāng)前幀的多聲道信號(hào)的IPD參數(shù)的提取方式為預(yù)設(shè)的至少兩種IPD參數(shù)提取方式中的一種;
根據(jù)所述確定的當(dāng)前幀的多聲道信號(hào)的IPD參數(shù)的提取方式提取所述當(dāng)前幀的多聲道信號(hào)的IPD參數(shù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610377800.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 將輸入聲道配置的多個(gè)輸入聲道映射至輸出聲道配置的輸出聲道的方法和信號(hào)處理單元
- 一種雙單聲道耳機(jī)放大器
- 音箱音頻播放方法
- 音箱和音箱組合
- 將輸入聲道配置的多個(gè)輸入聲道映射至輸出聲道配置的輸出聲道的方法和信號(hào)處理單元
- 增益動(dòng)態(tài)調(diào)節(jié)的音效控制方法及音效輸出裝置
- 一種耳機(jī)和一種耳機(jī)串?dāng)_消除方法
- 多功能耳機(jī)放大器
- 音頻信號(hào)的下混方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種5.1聲道信號(hào)生成方法、設(shè)備及介質(zhì)





