[發明專利]多聲道信號的編碼方法和編碼器有效
| 申請號: | 201610305243.5 | 申請日: | 2016-05-10 |
| 公開(公告)號: | CN107358961B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 張興濤;劉澤新;苗磊 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008 |
| 代理公司: | 北京龍雙利達知識產權代理有限公司 11329 | 代理人: | 王君;張欣 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多聲道 信號 編碼 方法 編碼器 | ||
本發明實施例提供一種多聲道信號的編碼方法和編碼器,該方法包括:根據多聲道信號構建目標頻域信號,使得該目標頻域信號的相位與第一聲道和第二聲道的IPD線性相關,再將目標頻域信號變換為目標時域信號,并基于目標時域信號提取ITD參數。
技術領域
本發明實施例涉及音頻編碼領域,并且更為具體地,涉及一種多聲道信號的編碼方法和編碼器。
背景技術
隨著生活質量的提高,人們對高質量音頻的需求不斷增大。相對于單聲道音頻,立體聲音頻具有各聲源的方位感和分布感,能夠提高聲音的清晰度、可懂度及臨場感,因而備受人們青睞。
立體聲處理技術主要有和差(Mid/Sid,MS)編碼、強度立體聲(Intensity Stereo,IS)編碼以及參數立體聲(Parametric Stereo,PS)編碼。
MS編碼基于聲道間相關性將兩路信號作和、差變換,各聲道能量主要集中在和聲道,使聲道間冗余得以去除。在MS編碼技術中,碼率的節省依賴于輸入信號的相關性,當左右聲道信號的相關性差時,需分別傳輸左聲道信號和右聲道信號。IS編碼基于人耳聽覺系統對聲道的高頻成分(例如,大于2kHz的成分)的相位差異精細結果不敏感的特性,將左右兩路信號的高頻分量進行簡化處理。但該IS編碼技術僅對高頻成分有效,如將IS編碼處理擴展到低頻,將會引起嚴重的人為噪聲。PS編碼基于雙耳聽覺模型,在編碼端將立體聲轉換成單聲道信號和少量描述空間聲場的空間參數(或空間感知參數),如圖1所示(圖1中的xL為左聲道時域信號,xR為右聲道時域信號)。解碼端得到單聲道信號后進一步結合空間參數恢復立體聲,如圖2所示。相對于MS編碼,PS編碼壓縮比高,在保持較好音質的前提下,能夠獲得更高的編碼增益,且可以工作在全音頻帶寬中,能夠很好地還原立體聲的空間感知效果。
PS編碼中,空間參數包括聲道間相關性(Inter-channel Coherent,IC)、聲道間電平差(Inter-channel Level Difference,ILD)、聲道間時間差(Inter-channel TimeDifference,ITD)以及聲道間相位差(Inter-channel Phase Difference,IPD)。IC描述了聲道間的互相關或相干性,該參數決定了聲場范圍的感知,可以提高音頻信號空間感和聲響穩定性。ILD用于分辨立體聲源的水平方向角度,描述了聲道間的強度差別,該參數將影響整個頻譜的頻率成分。ITD和IPD為表示聲源水平方位的空間參數,描述了聲道間的時間和相位的差別,該參數主要影響2kHz以下的頻率成分。ILD、ITD和IPD能夠決定人耳對聲源位置的感知,可以有效確定聲場位置,對立體聲信號的恢復具有重要作用。
ITD參數的編碼流程如圖3所示。從圖3可以看出,在現有技術中,ITD參數的提取是基于頻域信號實現的。ITD參數的編碼的主要步驟包括:
步驟1、對左右聲道時域信號分別進行時頻變換,得到左右聲道的頻域信號。
具體地,可以采用如下公式進行時頻變換:
其中,xL(n)和xR(n)分別為左右聲道的時域信號,Length為幀長或子幀長,L為時頻變換的長度。
步驟2、基于左右聲道的頻域信號提取ITD參數。
具體地,可以將步驟2細分為如下步驟:
步驟2.1、基于公式(3),在預設的范圍[k1,k2]內逐頻點計算IPD參數:
IPD(k)=∠L(k)*R*(k),k1≤k≤k2 (3)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610305243.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多聲道信號的編碼方法和編碼器
- 下一篇:音頻處理方法及音頻處理裝置





