[發(fā)明專利]音頻處理裝置和方法以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110611258.5 | 申請(qǐng)日: | 2016-06-09 |
| 公開(kāi)(公告)號(hào): | CN113473353B | 公開(kāi)(公告)日: | 2023-03-07 |
| 發(fā)明(設(shè)計(jì))人: | 山本優(yōu)樹(shù);知念徹;辻實(shí) | 申請(qǐng)(專利權(quán))人: | 索尼公司 |
| 主分類號(hào): | G10L19/008 | 分類號(hào): | G10L19/008;H04S5/02 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王萍;王鵬 |
| 地址: | 日本*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 處理 裝置 方法 以及 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
1.一種音頻處理裝置,包括:
獲取單元,被配置成獲取包括指示音頻對(duì)象的位置的位置信息以及由二維或更多維的向量構(gòu)成并且表示聲像距所述位置的擴(kuò)散的聲像信息的元數(shù)據(jù);
向量計(jì)算單元,被配置成基于表示由所述聲像信息確定的聲像的擴(kuò)散的區(qū)域的水平方向角和豎直方向角來(lái)計(jì)算指示所述區(qū)域中的位置的擴(kuò)展向量;以及
增益計(jì)算單元,被配置成基于所述擴(kuò)展向量來(lái)計(jì)算提供給位于所述位置信息指示的位置附近的兩個(gè)或更多個(gè)聲音輸出單元的音頻信號(hào)中的每個(gè)音頻信號(hào)的增益,
其中,所述增益計(jì)算單元:
計(jì)算關(guān)于所述聲音輸出單元中的每個(gè)聲音輸出單元的每個(gè)擴(kuò)展向量的增益,
計(jì)算針對(duì)所述聲音輸出單元中的每個(gè)聲音輸出單元的擴(kuò)展向量所計(jì)算的增益的相加值,
將所述相加值歸一化,以及
基于歸一化的相加值來(lái)計(jì)算關(guān)于所述聲音輸出單元中的每個(gè)聲音輸出單元的最終增益。
2.一種音頻處理方法,包括:
獲取包括指示音頻對(duì)象的位置的位置信息以及由二維或更多維的向量構(gòu)成并且表示聲像距所述位置的擴(kuò)散的聲像信息的元數(shù)據(jù);
基于表示由所述聲像信息確定的聲像的擴(kuò)散的區(qū)域的水平方向角和豎直方向角來(lái)計(jì)算指示所述區(qū)域中的位置的擴(kuò)展向量;以及
基于所述擴(kuò)展向量來(lái)計(jì)算提供給位于所述位置信息指示的位置附近的兩個(gè)或更多個(gè)聲音輸出單元的音頻信號(hào)中的每個(gè)音頻信號(hào)的增益,
其中,計(jì)算所述增益包括:
計(jì)算關(guān)于所述聲音輸出單元中的每個(gè)聲音輸出單元的每個(gè)擴(kuò)展向量的增益,
計(jì)算針對(duì)所述聲音輸出單元中的每個(gè)聲音輸出單元的擴(kuò)展向量所計(jì)算的增益的相加值,
將所述相加值歸一化,以及
基于歸一化的相加值來(lái)計(jì)算關(guān)于所述聲音輸出單元中的每個(gè)聲音輸出單元的最終增益。
3.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有使計(jì)算機(jī)執(zhí)行以下處理的程序,所述處理包括以下步驟:
獲取包括指示音頻對(duì)象的位置的位置信息以及由二維或更多維的向量構(gòu)成并且表示聲像距所述位置的擴(kuò)散的聲像信息的元數(shù)據(jù);
基于表示由所述聲像信息確定的聲像的擴(kuò)散的區(qū)域的水平方向角和豎直方向角來(lái)計(jì)算指示所述區(qū)域中的位置的擴(kuò)展向量;以及
基于所述擴(kuò)展向量來(lái)計(jì)算提供給位于所述位置信息指示的位置附近的兩個(gè)或更多個(gè)聲音輸出單元的音頻信號(hào)中的每個(gè)音頻信號(hào)的增益,
其中,計(jì)算所述增益包括:
計(jì)算關(guān)于所述聲音輸出單元中的每個(gè)聲音輸出單元的每個(gè)擴(kuò)展向量的增益,
計(jì)算針對(duì)所述聲音輸出單元中的每個(gè)聲音輸出單元的擴(kuò)展向量所計(jì)算的增益的相加值,
將所述相加值歸一化,以及
基于歸一化的相加值來(lái)計(jì)算關(guān)于所述聲音輸出單元中的每個(gè)聲音輸出單元的最終增益。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼公司,未經(jīng)索尼公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110611258.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





