[發(fā)明專利]彎曲譜和精細(xì)估計(jì)音頻編碼有效
| 申請(qǐng)?zhí)枺?/td> | 201110415397.7 | 申請(qǐng)日: | 2011-12-02 |
| 公開(公告)號(hào): | CN102568484A | 公開(公告)日: | 2012-07-11 |
| 發(fā)明(設(shè)計(jì))人: | M·L·塞爾澤;J·G·德羅珀;H·S·瑪爾瓦;A·阿塞羅;樊星 | 申請(qǐng)(專利權(quán))人: | 微軟公司 |
| 主分類號(hào): | G10L19/00 | 分類號(hào): | G10L19/00;G10L15/00 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 陳斌 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 彎曲 精細(xì) 估計(jì) 音頻 編碼 | ||
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:
從原始音頻信號(hào)(220)對(duì)彎曲頻譜估計(jì)的表示(248)進(jìn)行編碼,所述編碼基于彎曲頻譜;
使用所述彎曲頻譜估計(jì)表示(248)來生成所述原始音頻信號(hào)的平滑估計(jì)的表示;以及
使用所述平滑估計(jì)的表示來對(duì)所述原始音頻信號(hào)(220)的精細(xì)細(xì)節(jié)的精細(xì)估計(jì)表示(268)進(jìn)行編碼。
2.如權(quán)利要求1所述的方法,其特征在于,所述彎曲頻譜估計(jì)是梅爾頻譜估計(jì)。
3.如權(quán)利要求1所述的方法,其特征在于,根據(jù)變換編解碼器框架來配置所述精細(xì)估計(jì)表示。
4.如權(quán)利要求1所述的方法,其特征在于,所述精細(xì)估計(jì)表示表示頻域中的精細(xì)譜估計(jì)。
5.如權(quán)利要求1所述的方法,其特征在于,生成所述平滑估計(jì)的表示包括執(zhí)行逆變換操作。
6.如權(quán)利要求1所述的方法,其特征在于,對(duì)所述精細(xì)估計(jì)進(jìn)行編碼至少部分在頻域中執(zhí)行。
7.一個(gè)或多個(gè)其上包含計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行以下動(dòng)作:
對(duì)原始音頻信號(hào)(220)的彎曲頻譜估計(jì)的表示(332)進(jìn)行解碼;
對(duì)所述原始音頻信號(hào)(220)的精細(xì)估計(jì)的表示(334)進(jìn)行解碼;
將所述彎曲頻譜估計(jì)的表示(332)傳遞至語(yǔ)音識(shí)別引擎;以及
使用所述彎曲頻譜估計(jì)的表示(332)和所述精細(xì)估計(jì)的表示(366)來重構(gòu)表示所述原始音頻信號(hào)(220)的音頻信號(hào)(372)。
8.如權(quán)利要求7所述的一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,
所述彎曲頻譜估計(jì)是第一彎曲頻譜估計(jì);
所述原始音頻信號(hào)是第一原始音頻信號(hào);
對(duì)所述第一彎曲頻譜估計(jì)的表示進(jìn)行解碼、對(duì)所述精細(xì)估計(jì)的表示進(jìn)行解碼、將所述第一彎曲頻譜估計(jì)的表示傳遞至所述語(yǔ)音識(shí)別引擎、以及重構(gòu)表示所述第一原始音頻信號(hào)的音頻信號(hào)全部在第一操作模式中執(zhí)行;以及
所述動(dòng)作還包括從所述第一操作模式切換至第二操作模式并在所述第二操作模式中執(zhí)行各動(dòng)作,所述第二操作模式中的動(dòng)作包括:
對(duì)第二原始音頻信號(hào)的第二彎曲頻譜估計(jì)的表示進(jìn)行解碼;以及
將所述第二彎曲頻譜估計(jì)的表示傳遞至所述語(yǔ)音識(shí)別引擎;
其中所述第二操作模式不包括重構(gòu)表示所述第二原始音頻信號(hào)的音頻信號(hào)。
9.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:
在語(yǔ)音編碼系統(tǒng)(200)中,執(zhí)行以下動(dòng)作:
基于彎曲頻譜對(duì)原始音頻信號(hào)(220)的彎曲頻譜估計(jì)的表示(248)進(jìn)行編碼,所述編碼包括動(dòng)態(tài)范圍縮減操作和余弦變換操作;
使用所述彎曲頻譜估計(jì)表示(248)來生成所述原始音頻信號(hào)(220)的譜的平滑譜估計(jì)的表示;
使用所述平滑估計(jì)表示來對(duì)所述原始音頻信號(hào)(220)的精細(xì)細(xì)節(jié)的精細(xì)頻譜估計(jì)的表示(268)進(jìn)行編碼;
將所述精細(xì)估計(jì)的表示(268)和所述彎曲頻譜估計(jì)的表示(248)打包在數(shù)據(jù)流(290)中;以及
將所述數(shù)據(jù)流(290)發(fā)送至語(yǔ)音解碼和識(shí)別系統(tǒng)(300)。
10.如權(quán)利要求9所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,還包括:
在所述語(yǔ)音解碼和識(shí)別系統(tǒng)處接收所述數(shù)據(jù)流;
在所述語(yǔ)音解碼和識(shí)別系統(tǒng)中,執(zhí)行以下動(dòng)作:
對(duì)所述數(shù)據(jù)流的各分量進(jìn)行解碼,包括對(duì)所述原始音頻信號(hào)的彎曲頻譜估計(jì)的表示進(jìn)行解碼,以及對(duì)所述原始音頻信號(hào)的精細(xì)估計(jì)的表示進(jìn)行解碼;
將所述彎曲頻譜估計(jì)的表示傳遞至所述語(yǔ)音識(shí)別系統(tǒng)中的語(yǔ)音識(shí)別引擎;以及
重構(gòu)表示所述原始音頻信號(hào)的音頻信號(hào),所述重構(gòu)包括擴(kuò)展所述彎曲頻譜估計(jì)的表示的動(dòng)態(tài)范圍、執(zhí)行逆余弦變換操作、使用所述彎曲頻譜估計(jì)表示來生成平滑譜估計(jì)表示,以及將所述平滑譜估計(jì)與所述精細(xì)估計(jì)進(jìn)行組合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟公司,未經(jīng)微軟公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110415397.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 一種信道估計(jì)方法和裝置
- 基于時(shí)頻聯(lián)合的載波頻偏估計(jì)方法
- 基于改進(jìn)卡爾曼濾波的變參數(shù)迭代估計(jì)方法
- 電機(jī)驅(qū)動(dòng)系統(tǒng)以及電機(jī)控制裝置
- 意圖估計(jì)裝置和意圖估計(jì)方法
- 分布式驅(qū)動(dòng)電動(dòng)汽車路面自適應(yīng)縱向車速估計(jì)系統(tǒng)及方法
- 一種分布式驅(qū)動(dòng)電動(dòng)汽車路面附著系數(shù)估計(jì)系統(tǒng)
- 視線估計(jì)方法、終端及存儲(chǔ)介質(zhì)
- 一種SNR估計(jì)方法及其估計(jì)系統(tǒng)
- 估計(jì)車輛載荷的方法
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





