[發(fā)明專利]用于恢復(fù)語音分量的系統(tǒng)和方法在審
| 申請(qǐng)?zhí)枺?/td> | 201580060446.6 | 申請(qǐng)日: | 2015-09-11 |
| 公開(公告)號(hào): | CN107112025A | 公開(公告)日: | 2017-08-29 |
| 發(fā)明(設(shè)計(jì))人: | C·艾文達(dá)諾;J·伍德拉夫 | 申請(qǐng)(專利權(quán))人: | 美商樓氏電子有限公司 |
| 主分類號(hào): | G10L21/02 | 分類號(hào): | G10L21/02 |
| 代理公司: | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司11127 | 代理人: | 呂俊剛,師瑋 |
| 地址: | 美國(guó)伊*** | 國(guó)省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 恢復(fù) 語音 分量 系統(tǒng) 方法 | ||
1.一種用于恢復(fù)音頻信號(hào)的失真語音分量的方法,該方法包括:
確定所述音頻信號(hào)中的失真頻率區(qū)和不失真頻率區(qū),所述失真頻率區(qū)包括所述音頻信號(hào)的存在語音失真的區(qū)域;以及
利用模型執(zhí)行一次或更多次迭代,以完善對(duì)所述失真頻率區(qū)處的所述音頻信號(hào)的預(yù)測(cè),所述模型被設(shè)置成修改所述音頻信號(hào)。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述音頻信號(hào)包括通過對(duì)包含語音的聲信號(hào)進(jìn)行噪聲降低或噪聲消除中的至少一種而獲取的噪聲被抑制的音頻信號(hào)。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述聲信號(hào)在所述失真頻率區(qū)被衰減或消除。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述模型包括利用干凈的音頻信號(hào)或未損壞的音頻信號(hào)的頻譜包絡(luò)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)。
5.根據(jù)權(quán)利要求1所述的方法,其中,所完善的預(yù)測(cè)被用于恢復(fù)所述失真頻率區(qū)中的語音分量。
6.根據(jù)權(quán)利要求1所述的方法,其中,所述失真頻率區(qū)處的所述音頻信號(hào)在所述一次或更多次迭代中的第一次迭代之前被設(shè)置成零。
7.根據(jù)權(quán)利要求1所述的方法,其中,在執(zhí)行所述一次或更多次迭代中的每一次迭代之前,所述不失真頻率區(qū)處的所述音頻信號(hào)被恢復(fù)至所述音頻信號(hào)在所述一次或更多次迭代中的第一次迭代之前的值。
8.根據(jù)權(quán)利要求1所述的方法,所述方法還包括:在執(zhí)行所述一次或更多次迭代中的每一次迭代之后,比較所述迭代之前和之后的所述不失真頻率區(qū)處的所述音頻信號(hào),以確定差異。
9.根據(jù)權(quán)利要求8所述的方法,所述方法還包括:如果所述差異滿足預(yù)定標(biāo)準(zhǔn),則結(jié)束所述一次或更多次迭代。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述預(yù)定標(biāo)準(zhǔn)根據(jù)所述音頻信號(hào)的能量的下限和上限來限定。
11.一種用于恢復(fù)音頻信號(hào)的失真語音分量的系統(tǒng),該系統(tǒng)包括:
至少一個(gè)處理器;以及
存儲(chǔ)器,該存儲(chǔ)器以通信方式與所述至少一個(gè)處理器聯(lián)接,所述存儲(chǔ)器存儲(chǔ)指令,所述指令在由所述至少一個(gè)處理器執(zhí)行時(shí)執(zhí)行以下方法,該方法包括:
確定所述音頻信號(hào)中的失真頻率區(qū)和不失真頻率區(qū),所述失真頻率區(qū)包括所述音頻信號(hào)的存在語音失真的區(qū)域;以及
利用模型執(zhí)行一次或更多次迭代,以完善對(duì)所述失真頻率區(qū)處的所述音頻信號(hào)的預(yù)測(cè),所述模型被設(shè)置成修改所述音頻信號(hào)。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述音頻信號(hào)包括通過對(duì)包含語音的聲信號(hào)進(jìn)行噪聲降低或噪聲消除中的至少一種而獲取的噪聲被抑制的音頻信號(hào)。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述聲信號(hào)在所述失真頻率區(qū)被衰減或消除。
14.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述模型包括深度神經(jīng)網(wǎng)絡(luò)。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其中,所述深度神經(jīng)網(wǎng)絡(luò)利用干凈的音頻信號(hào)或未損壞的音頻信號(hào)的頻譜包絡(luò)訓(xùn)練。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述失真頻率區(qū)處的所述音頻信號(hào)在所述一次或更多次迭代中的第一次迭代之前被設(shè)置成零。
17.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,在執(zhí)行所述一次或更多次迭代中的每一次迭代之前,所述不失真頻率區(qū)處的所述音頻信號(hào)被恢復(fù)至所述一次或更多次迭代中的第一次迭代之前的值。
18.根據(jù)權(quán)利要求11所述的系統(tǒng),所述系統(tǒng)還包括,在執(zhí)行所述一次或更多次迭代中的每一次迭代之后,比較所述迭代之前和之后的所述不失真區(qū)處的所述音頻信號(hào),以確定差異。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),所述系統(tǒng)還包括:如果所述差異滿足預(yù)定標(biāo)準(zhǔn),則結(jié)束所述一次或更多次迭代,所述預(yù)定標(biāo)準(zhǔn)根據(jù)所述音頻信號(hào)的能量的下限和上限來限定。
20.一種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上包含有指令,所述指令在由至少一個(gè)處理器執(zhí)行時(shí)執(zhí)行以下方法的步驟,該方法包括:
確定所述音頻信號(hào)中的失真頻率區(qū)和不失真頻率區(qū),所述失真頻率區(qū)包括所述音頻信號(hào)的存在語音失真的區(qū)域;以及
利用模型執(zhí)行一次或更多次迭代,以完善對(duì)所述失真頻率區(qū)處的所述音頻信號(hào)的預(yù)測(cè),所述模型被設(shè)置成修改所述音頻信號(hào)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于美商樓氏電子有限公司,未經(jīng)美商樓氏電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580060446.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





