[發(fā)明專利]使用奇異值分解進(jìn)行HOA編碼和解碼的方法和裝置在審
| 申請?zhí)枺?/td> | 201711438504.1 | 申請日: | 2014-11-18 |
| 公開(公告)號: | CN107995582A | 公開(公告)日: | 2018-05-04 |
| 發(fā)明(設(shè)計(jì))人: | H·克羅普;S·埃伯林格 | 申請(專利權(quán))人: | 杜比國際公司 |
| 主分類號: | H04S3/02 | 分類號: | H04S3/02;H04S3/00;G10L19/008;H04S7/00 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所11038 | 代理人: | 歐陽帆 |
| 地址: | 荷蘭阿*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 使用 奇異 分解 進(jìn)行 hoa 編碼 解碼 方法 裝置 | ||
本申請是申請?zhí)枮?01480074092.6、申請日為2014年11月18日、發(fā)明名稱為“使用奇異值分解進(jìn)行高階高保真立體聲編碼和解碼的方法和裝置”的發(fā)明專利申請的分案申請。
技術(shù)領(lǐng)域
本發(fā)明涉及用于使用奇異值分解進(jìn)行高階高保真立體聲(Ambisonics)編碼和解碼的方法和裝置。
背景技術(shù)
高階高保真立體聲(Higher Order Ambisonics,HOA)表示三維聲音。其他技術(shù)是波場合成(WFS)或基于聲道的方法(比如,22.2)。然而,與基于聲道的方法相反,HOA表示提供獨(dú)立于特定揚(yáng)聲器設(shè)置的優(yōu)點(diǎn)。但是,這種靈活性是以HOA表示在特定揚(yáng)聲器設(shè)置上的回放所需的解碼處理為代價的。與所需揚(yáng)聲器的數(shù)量通常非常大的WFS方法相比,HOA也可以被渲染到僅由幾個揚(yáng)聲器組成的設(shè)置。HOA的其他優(yōu)點(diǎn)是,同一表示也可以無任何修改地用于對耳機(jī)的雙耳渲染。
HOA基于復(fù)諧波平面波振幅的空間密度的通過截斷球諧(SH)擴(kuò)展的表示。每個擴(kuò)展系數(shù)是角頻率的函數(shù),其可以等效地由時域函數(shù)表示。因此,不失一般性地,整個HOA聲場表示實(shí)際上可被假定為由O個時域函數(shù)組成,其中O表示擴(kuò)展系數(shù)的數(shù)量。這些時域函數(shù)在下面將被等效地稱為HOA系數(shù)序列或HOA聲道。HOA表示可以被表達(dá)為包含HOA系數(shù)的HOA數(shù)據(jù)幀的時間序列。HOA表示的空間分辨率隨著擴(kuò)展的最大階次N增長而提高。對于3D情況,擴(kuò)展系數(shù)的數(shù)量O隨著階次N呈二次方地增長,特別地為O=(N+1)2。
復(fù)矢量空間
高保真立體聲必須處理復(fù)函數(shù)。因此引入了基于復(fù)矢量空間的符號。該符號隨抽象的復(fù)矢量操作,所述復(fù)矢量不表示從三維“xyz”坐標(biāo)系知道的真實(shí)的幾何矢量。相反,每個復(fù)矢量描述物理系統(tǒng)的可能的狀態(tài),并且在d維空間中由具有d個分量xi的列矢量形成,并且根據(jù)Dirac,這些面向列的矢量被稱為右矢量(ket vector),被表示為|x>。在d維空間中,任意的|x>由其分量xi和d個正交基矢量|ei>形成:
這里,d維空間不是通常的“xyz”3D空間。
右矢量的共軛復(fù)數(shù)被稱為左矢量(bra vector)|x>*=<x|。左矢量表示基于行的描述,并且形成原始右矢量空間的對偶空間——左矢量空間。
該Dirac符號將被用在對高保真立體聲相關(guān)音頻系統(tǒng)的以下描述中。
內(nèi)積可以根據(jù)同一維度的左矢量和右矢量來構(gòu)建,得到復(fù)數(shù)標(biāo)量值。如果隨機(jī)矢量|x>由其在正交矢量基中的分量描述,則對于特定基的特定分量,即,|x>到|ei>上的投影,由內(nèi)積給出:
xi=<x||ei>=<x|ei> (2)
在左矢量和右矢量之間,僅考慮一個條、而非兩個條。
對于同一基中的不同矢量|x>和|y>,內(nèi)積通過將左矢量<x|乘以右矢量|y>而得到,使得:
如果維度mx1的右矢量和維度1xn的左矢量被乘以外積,則具有m行n列的矩陣A被導(dǎo)出:
A=|x><y| (4)
高保真立體聲矩陣
基于高保真立體聲的描述考慮了用于將整個聲場映射到時變矩陣中所需的相關(guān)性(dependency)。在高階高保真立體聲(HOA)編碼或解碼矩陣中,行(列)的數(shù)量與從聲源或聲宿(sound sink)起的特定方向相關(guān)。在編碼器側(cè),變化數(shù)量的S個聲源被考慮,其中,s=1,...,S。每個聲源s可以具有離原點(diǎn)的個體距離rs、個體方向Ωs=(Θs,Φs),其中,Θs描述從z軸開始的傾斜角,Φs描述從x軸開始的方位角。對應(yīng)的時間相關(guān)信號Xs=(t)具有個體時間行為。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杜比國際公司,未經(jīng)杜比國際公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711438504.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





