[發(fā)明專(zhuān)利]語(yǔ)音降噪方法及裝置有效

申請(qǐng)?zhí)枺?/td>	201811584024.0	申請(qǐng)日：	2018-12-24
公開(kāi)（公告）號(hào)：	CN109584895B	公開(kāi)（公告）日：	2019-10-25
發(fā)明（設(shè)計(jì)）人：	聶鐳;沙露露;鄭權(quán);張峰;聶穎	申請(qǐng)（專(zhuān)利權(quán)）人：	龍馬智芯（珠海橫琴）科技有限公司
主分類(lèi)號(hào)：	G10L21/02	分類(lèi)號(hào)：	G10L21/02;G10L25/27
代理公司：	北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240	代理人：	趙囡囡;董文倩
地址：	519000 廣東省珠***	國(guó)省代碼：	廣東;44
權(quán)利要求書(shū)：	查看更多	說(shuō)明書(shū)：	查看更多
摘要：
搜索關(guān)鍵詞：	語(yǔ)音信號(hào) 采樣點(diǎn) 語(yǔ)音降噪去噪訓(xùn)練數(shù)據(jù) 目標(biāo)帶語(yǔ)音增強(qiáng) 采樣頻率機(jī)器學(xué)習(xí) 預(yù)定格式轉(zhuǎn)換目標(biāo) 采樣
鉆瓜網(wǎng) 技術(shù)展會(huì) 專(zhuān)利詞庫(kù) 專(zhuān)利權(quán)人專(zhuān)利榜在售專(zhuān)利公布日期熱門(mén)專(zhuān)利

【權(quán)利要求書(shū)】：

1.一種語(yǔ)音降噪方法，其特征在于，包括：

將目標(biāo)帶噪語(yǔ)音信號(hào)按照預(yù)定格式中的采樣頻率進(jìn)行采樣，得到所述目標(biāo)帶噪語(yǔ)音信號(hào)的采樣點(diǎn)一；

通過(guò)語(yǔ)音增強(qiáng)模型，確定與所述目標(biāo)帶噪語(yǔ)音信號(hào)的采樣點(diǎn)一對(duì)應(yīng)的目標(biāo)去噪語(yǔ)音信號(hào)的采樣點(diǎn)二，其中，所述語(yǔ)音增強(qiáng)模型為使用多組訓(xùn)練數(shù)據(jù)通過(guò)機(jī)器學(xué)習(xí)訓(xùn)練得到的，所述多組訓(xùn)練數(shù)據(jù)中的每組訓(xùn)練數(shù)據(jù)均包括：帶噪語(yǔ)音信號(hào)的采樣點(diǎn)和與所述帶噪語(yǔ)音信號(hào)的采樣點(diǎn)對(duì)應(yīng)的去噪語(yǔ)音信號(hào)的采樣點(diǎn)；

將所述目標(biāo)去噪語(yǔ)音信號(hào)的采樣點(diǎn)二轉(zhuǎn)換目標(biāo)語(yǔ)音的去噪語(yǔ)音；

其中，在通過(guò)語(yǔ)音增強(qiáng)模型，確定與所述目標(biāo)帶噪語(yǔ)音信號(hào)的采樣點(diǎn)一對(duì)應(yīng)的目標(biāo)去噪語(yǔ)音信號(hào)的采樣點(diǎn)二之前，還包括：基于所述多組訓(xùn)練數(shù)據(jù)訓(xùn)練得到所述語(yǔ)音增強(qiáng)模型；

其中，基于所述多組訓(xùn)練數(shù)據(jù)訓(xùn)練得到所述語(yǔ)音增強(qiáng)模型包括：

將所述多組訓(xùn)練數(shù)據(jù)中的每組訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的原始帶噪語(yǔ)音信號(hào)的采樣點(diǎn)依次作為wavenet網(wǎng)絡(luò)模型的輸入；

獲取所述wavenet網(wǎng)絡(luò)模型的輸出；

將所述wavenet網(wǎng)絡(luò)模型的輸出作為預(yù)定格式的卷積層的輸入；

對(duì)輸入到所述預(yù)定格式的卷積層的所述wavenet網(wǎng)絡(luò)模型的輸出進(jìn)行平滑處理，得到所述預(yù)定格式的卷積層的輸出；

確定所述多組訓(xùn)練數(shù)據(jù)中的每組訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的與所述帶噪語(yǔ)音信號(hào)的采樣點(diǎn)對(duì)應(yīng)的去噪語(yǔ)音信號(hào)的采樣點(diǎn)和所述預(yù)定格式的卷積層的輸出之間的偏差量；

利用所述偏差量對(duì)所述wavenet網(wǎng)絡(luò)模型進(jìn)行調(diào)整，得到所述語(yǔ)音增強(qiáng)模型。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述訓(xùn)練數(shù)據(jù)為從帶噪語(yǔ)音數(shù)據(jù)集中選取出來(lái)的部分?jǐn)?shù)據(jù)，其中，所述帶噪語(yǔ)音數(shù)據(jù)集包括預(yù)定數(shù)量的由預(yù)定干凈語(yǔ)音與預(yù)定背景噪聲進(jìn)行疊加得到的帶噪語(yǔ)音。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述預(yù)定干凈語(yǔ)音為從TIMIT語(yǔ)音數(shù)據(jù)集中選取的語(yǔ)音，所述預(yù)定背景噪聲包括：加性噪聲和從Aurora2數(shù)據(jù)集中選取的噪聲。

4.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述帶噪語(yǔ)音數(shù)據(jù)集中除所述部分?jǐn)?shù)據(jù)外的另外一部分?jǐn)?shù)據(jù)作為驗(yàn)證數(shù)據(jù)，其中，所述驗(yàn)證數(shù)據(jù)用于對(duì)所述語(yǔ)音增強(qiáng)模型進(jìn)行測(cè)試。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，在將所述多組訓(xùn)練數(shù)據(jù)中的每組訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的原始帶噪語(yǔ)音信號(hào)的采樣點(diǎn)依次作為wavenet網(wǎng)絡(luò)模型的輸入之前，還包括：

按照所述多組訓(xùn)練數(shù)據(jù)中每組訓(xùn)練數(shù)據(jù)的采樣點(diǎn)的采樣順序?qū)λ龆嘟M訓(xùn)練數(shù)據(jù)進(jìn)行劃分，得到所述wavenet網(wǎng)絡(luò)模型的多個(gè)采樣點(diǎn)輸入，其中，所述多個(gè)采樣點(diǎn)輸入包括：第一采樣點(diǎn)、第二采樣點(diǎn)、第三采樣點(diǎn)、第四采樣點(diǎn)以及第五采樣點(diǎn)，所述第三采樣點(diǎn)為當(dāng)前輸入到所述wavenet網(wǎng)絡(luò)模型的采樣點(diǎn)，所述第二采樣點(diǎn)和所述第四采樣點(diǎn)分別為所述第三采樣點(diǎn)之前和所述第三采樣點(diǎn)之后的采樣點(diǎn)，所述第一采樣點(diǎn)為所述第二采樣點(diǎn)之前的采樣點(diǎn)，所述第五采樣點(diǎn)為所述第四采樣點(diǎn)之后的采樣點(diǎn)。

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述第一采樣點(diǎn)為從所述第二采樣點(diǎn)之前的第一預(yù)定數(shù)量的采樣點(diǎn)中選取的第二預(yù)定數(shù)量的采樣點(diǎn)，所述第五采樣點(diǎn)分別為從所述第四采樣點(diǎn)之后的所述第一預(yù)定數(shù)量的采樣點(diǎn)中選取的所述第二預(yù)定數(shù)量的采樣點(diǎn)。

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述第二采樣點(diǎn)，第三采樣點(diǎn)以及所述第四采樣點(diǎn)為連續(xù)的采樣點(diǎn)。

8.根據(jù)權(quán)利要求4所述的方法，其特征在于，在基于所述多組訓(xùn)練數(shù)據(jù)訓(xùn)練得到所述語(yǔ)音增強(qiáng)模型之后，還包括：利用所述驗(yàn)證數(shù)據(jù)對(duì)所述語(yǔ)音增強(qiáng)模型進(jìn)行測(cè)試。

9.一種語(yǔ)音降噪裝置，其特征在于，包括：

采樣單元，用于將目標(biāo)帶噪語(yǔ)音信號(hào)按照預(yù)定格式中的采樣頻率進(jìn)行采樣，得到所述目標(biāo)帶噪語(yǔ)音信號(hào)的采樣點(diǎn)一；

確定單元，用于通過(guò)語(yǔ)音增強(qiáng)模型，確定與所述目標(biāo)帶噪語(yǔ)音信號(hào)的采樣點(diǎn)一對(duì)應(yīng)的目標(biāo)去噪語(yǔ)音信號(hào)的采樣點(diǎn)二，其中，所述語(yǔ)音增強(qiáng)模型為使用多組訓(xùn)練數(shù)據(jù)通過(guò)機(jī)器學(xué)習(xí)訓(xùn)練得到的，所述多組訓(xùn)練數(shù)據(jù)中的每組訓(xùn)練數(shù)據(jù)均包括：帶噪語(yǔ)音信號(hào)的采樣點(diǎn)和與所述帶噪語(yǔ)音信號(hào)的采樣點(diǎn)對(duì)應(yīng)的去噪語(yǔ)音信號(hào)的采樣點(diǎn)；

轉(zhuǎn)換單元，用于將所述目標(biāo)去噪語(yǔ)音信號(hào)的采樣點(diǎn)二轉(zhuǎn)換目標(biāo)語(yǔ)音的去噪語(yǔ)音；

其中，所述語(yǔ)音降噪裝置還包括：訓(xùn)練單元，用于在通過(guò)語(yǔ)音增強(qiáng)模型，確定與所述目標(biāo)帶噪語(yǔ)音信號(hào)的采樣點(diǎn)一對(duì)應(yīng)的目標(biāo)去噪語(yǔ)音信號(hào)的采樣點(diǎn)二之前，基于所述多組訓(xùn)練數(shù)據(jù)訓(xùn)練得到所述語(yǔ)音增強(qiáng)模型；其中，所述訓(xùn)練單元包括：第一確定模塊，用于將所述多組訓(xùn)練數(shù)據(jù)中的每組訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的原始帶噪語(yǔ)音信號(hào)的采樣點(diǎn)依次作為wavenet網(wǎng)絡(luò)模型的輸入；第一獲取模塊，用于獲取所述wavenet網(wǎng)絡(luò)模型的輸出；第二確定模塊，用于將所述wavenet網(wǎng)絡(luò)模型的輸出作為預(yù)定格式的卷積層的輸入；處理模塊，用于對(duì)輸入到所述預(yù)定格式的卷積層的所述wavenet網(wǎng)絡(luò)模型的輸出進(jìn)行平滑處理，得到所述預(yù)定格式的卷積層的輸出；第三確定模塊，用于確定所述多組訓(xùn)練數(shù)據(jù)中的每組訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的與所述帶噪語(yǔ)音信號(hào)的采樣點(diǎn)對(duì)應(yīng)的去噪語(yǔ)音信號(hào)的采樣點(diǎn)和所述預(yù)定格式的卷積層的輸出之間的偏差量；第二獲取模塊，用于利用所述偏差量對(duì)所述wavenet網(wǎng)絡(luò)模型進(jìn)行調(diào)整，得到所述語(yǔ)音增強(qiáng)模型。

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于龍馬智芯（珠海橫琴）科技有限公司，未經(jīng)龍馬智芯（珠海橫琴）科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811584024.0/1.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

同類(lèi)專(zhuān)利

專(zhuān)利分類(lèi)

G 物理

G10 樂(lè)器；聲學(xué)
G10L 語(yǔ)音分析或合成；語(yǔ)音識(shí)別；音頻分析或處理
G10L21-00 為了改變語(yǔ)音信號(hào)的質(zhì)量或其可識(shí)度而處理語(yǔ)音信號(hào)，以產(chǎn)生另一種可聽(tīng)的或非可聽(tīng)的信號(hào)，例如視覺(jué)信號(hào)或觸覺(jué)信號(hào)
G10L21-02 .語(yǔ)音增強(qiáng)，例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語(yǔ)音轉(zhuǎn)換成非可聽(tīng)表達(dá)形式，例如語(yǔ)音可視化、觸覺(jué)輔助的語(yǔ)音處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專(zhuān)利文獻(xiàn)下載

說(shuō)明：

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū)；

2、支持發(fā)明專(zhuān)利、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利（升級(jí)中）；

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】