[發(fā)明專利]基于人工智能的音頻編解碼在審
| 申請(qǐng)?zhí)枺?/td> | 202080061632.2 | 申請(qǐng)日: | 2020-06-29 |
| 公開(kāi)(公告)號(hào): | CN114341977A | 公開(kāi)(公告)日: | 2022-04-12 |
| 發(fā)明(設(shè)計(jì))人: | Z.I.斯科迪利斯;V.拉詹德蘭;G.K.索蒂爾;D.J.辛德 | 申請(qǐng)(專利權(quán))人: | 高通股份有限公司 |
| 主分類號(hào): | G10L19/12 | 分類號(hào): | G10L19/12;G10L19/13;G10L19/09;G10L19/06;G10L25/30 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 安之斐 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 音頻 解碼 | ||
1.一種用于重構(gòu)一個(gè)或多個(gè)音頻信號(hào)的裝置,包括:
存儲(chǔ)器,被配置為存儲(chǔ)音頻數(shù)據(jù);以及
一個(gè)或多個(gè)處理器,在電路中實(shí)施并耦合到所述存儲(chǔ)器,所述一個(gè)或多個(gè)處理器被配置為:
使用神經(jīng)網(wǎng)絡(luò),基于所述神經(jīng)網(wǎng)絡(luò)的一個(gè)或多個(gè)輸入,生成音頻信號(hào)的至少一個(gè)樣本的殘差信號(hào),所述殘差信號(hào)被配置為激勵(lì)長(zhǎng)期預(yù)測(cè)濾波器和短期預(yù)測(cè)濾波器中的至少一個(gè);以及
使用所述長(zhǎng)期預(yù)測(cè)濾波器和所述短期預(yù)測(cè)濾波器中的至少一個(gè)來(lái)確定重構(gòu)音頻信號(hào)的至少一個(gè)樣本,所述重構(gòu)音頻信號(hào)的所述至少一個(gè)樣本是基于使用所述神經(jīng)網(wǎng)絡(luò)為所述音頻信號(hào)的所述至少一個(gè)樣本生成的所述殘差信號(hào)來(lái)確定的。
2.根據(jù)權(quán)利要求1所述的裝置,其中所述長(zhǎng)期預(yù)測(cè)濾波器是長(zhǎng)期線性預(yù)測(cè)(LTP)濾波器。
3.根據(jù)權(quán)利要求2所述的裝置,其中所述殘差信號(hào)包括被配置為激勵(lì)所述LTP濾波器的長(zhǎng)期線性預(yù)測(cè)(LTP)殘差。
4.根據(jù)權(quán)利要求3所述的裝置,其中所述一個(gè)或多個(gè)處理器被配置為:
使用所述LTP濾波器確定所述音頻信號(hào)的所述至少一個(gè)樣本的線性預(yù)測(cè)(LP)殘差,所述音頻信號(hào)的所述至少一個(gè)樣本的所述LP殘差是基于使用所述神經(jīng)網(wǎng)絡(luò)為所述音頻信號(hào)的所述至少一個(gè)樣本生成的所述LTP殘差和使用增益和所述音頻信號(hào)的至少一個(gè)先前樣本的LP殘差確定的所述音頻信號(hào)的所述至少一個(gè)樣本的LTP預(yù)測(cè)來(lái)確定的。
5.根據(jù)權(quán)利要求4所述的裝置,其中所述增益被應(yīng)用于所述音頻信號(hào)的所述至少一個(gè)先前樣本的所述LP殘差。
6.根據(jù)權(quán)利要求4所述的裝置,其中所述短期預(yù)測(cè)濾波器是短期線性預(yù)測(cè)(LP)濾波器。
7.根據(jù)權(quán)利要求6所述的裝置,其中所述一個(gè)或多個(gè)處理器被配置為:
使用所述短期LP濾波器確定所述重構(gòu)音頻信號(hào)的所述至少一個(gè)樣本,所述重構(gòu)音頻信號(hào)的所述至少一個(gè)樣本是基于為所述音頻信號(hào)的所述至少一個(gè)樣本確定的LP預(yù)測(cè)和所述LP殘差來(lái)確定的。
8.根據(jù)權(quán)利要求7所述的裝置,其中所述神經(jīng)網(wǎng)絡(luò)的一個(gè)或多個(gè)輸入包括針對(duì)所述音頻信號(hào)的所述至少一個(gè)樣本的所述LTP預(yù)測(cè)、針對(duì)所述音頻信號(hào)的所述至少一個(gè)樣本的所述LP預(yù)測(cè)、由所述神經(jīng)網(wǎng)絡(luò)為所述音頻信號(hào)的所述至少一個(gè)先前樣本確定的先前LTP殘差和所述重構(gòu)音頻信號(hào)的至少一個(gè)先前樣本中的至少一個(gè)。
9.根據(jù)權(quán)利要求7所述的裝置,其中將使用所述神經(jīng)網(wǎng)絡(luò)為所述音頻信號(hào)的所述至少一個(gè)樣本生成的所述LTP殘差與所述音頻信號(hào)的所述至少一個(gè)樣本的所述LTP預(yù)測(cè)組合以生成所述音頻信號(hào)的所述至少一個(gè)樣本的所述LP殘差。
10.根據(jù)權(quán)利要求7所述的裝置,其中為所述音頻信號(hào)的所述至少一個(gè)樣本確定的所述LP殘差與所述音頻信號(hào)的所述至少一個(gè)樣本的所述LP預(yù)測(cè)組合以確定所述重構(gòu)音頻信號(hào)的所述至少一個(gè)樣本。
11.根據(jù)權(quán)利要求1所述的裝置,其中所述短期預(yù)測(cè)濾波器是短期線性預(yù)測(cè)(LP)濾波器。
12.根據(jù)權(quán)利要求11所述的裝置,其中所述殘差信號(hào)包括被配置為激勵(lì)所述短期LP濾波器的線性預(yù)測(cè)(LP)殘差。
13.根據(jù)權(quán)利要求12所述的裝置,其中所述一個(gè)或多個(gè)處理器被配置為:
使用所述短期LP濾波器確定所述音頻信號(hào)的所述至少一個(gè)樣本的長(zhǎng)期線性預(yù)測(cè)(LTP)殘差,所述至少一個(gè)樣本的所述LTP殘差是基于所述音頻信號(hào)的所述至少一個(gè)樣本的LP預(yù)測(cè)和使用所述神經(jīng)網(wǎng)絡(luò)生成的所述LP殘差來(lái)確定的。
14.根據(jù)權(quán)利要求13所述的裝置,其中所述長(zhǎng)期預(yù)測(cè)濾波器是長(zhǎng)期線性預(yù)測(cè)(LTP)濾波器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于高通股份有限公司,未經(jīng)高通股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202080061632.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





