[發(fā)明專利]基于神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法、可讀存儲(chǔ)介質(zhì)及終端設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201811187136.2 | 申請(qǐng)日: | 2018-10-12 |
| 公開(公告)號(hào): | CN109360581A | 公開(公告)日: | 2019-02-19 |
| 發(fā)明(設(shè)計(jì))人: | 趙峰;彭俊清;王健宗;肖京 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G10L21/0224 | 分類號(hào): | G10L21/0224;G10L21/0232;G10L21/0316;G10L25/30 |
| 代理公司: | 深圳中一專利商標(biāo)事務(wù)所 44237 | 代理人: | 官建紅 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 時(shí)頻域分析 神經(jīng)網(wǎng)絡(luò)模型 神經(jīng)網(wǎng)絡(luò) 語音信號(hào) 語音增強(qiáng) 增強(qiáng)處理 終端設(shè)備 語音 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 短時(shí)傅里葉變換 計(jì)算機(jī)技術(shù)領(lǐng)域 傅里葉逆變換 可讀存儲(chǔ)介質(zhì) 有效抑制 噪聲干擾 預(yù)設(shè) | ||
本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種基于神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備。所述方法首先使用短時(shí)傅里葉變換對(duì)加噪語音進(jìn)行時(shí)頻域分析,得到所述加噪語音的時(shí)頻域分析結(jié)果,分別計(jì)算所述時(shí)頻域分析結(jié)果的相位及幅值,然后使用預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型對(duì)所述時(shí)頻域分析結(jié)果的幅值進(jìn)行增強(qiáng)處理,得到增強(qiáng)后的幅值,最后使用短時(shí)傅里葉逆變換對(duì)所述時(shí)頻域分析結(jié)果的相位及增強(qiáng)后的幅值進(jìn)行處理,得到增強(qiáng)后的語音。通過神經(jīng)網(wǎng)絡(luò)模型的增強(qiáng)處理,可以有效抑制語音信號(hào)中的噪聲干擾,大大增強(qiáng)了語音信號(hào)的質(zhì)量,提高用戶日常工作和生活中的溝通效率。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種基于神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備。
背景技術(shù)
現(xiàn)有語音通信過程中環(huán)境噪聲的干擾是不可避免的,周圍的環(huán)境噪音干擾將導(dǎo)致通訊設(shè)備最終接收到的是受噪聲污染的語音信號(hào),影響語音信號(hào)的質(zhì)量。特別在汽車、飛機(jī)、船只、機(jī)場(chǎng)、商場(chǎng)等噪音嚴(yán)重的公眾環(huán)境下,強(qiáng)背景噪聲嚴(yán)重影響語音信號(hào)質(zhì)量,引發(fā)用戶的聽覺疲勞,溝通效率低下,嚴(yán)重影響用戶的日常工作和生活。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供了一種基于神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備,以解決在噪音嚴(yán)重的公眾環(huán)境下,強(qiáng)背景噪聲嚴(yán)重影響語音信號(hào)質(zhì)量的問題。
本發(fā)明實(shí)施例的第一方面提供了一種基于神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法,可以包括:
使用短時(shí)傅里葉變換對(duì)加噪語音進(jìn)行時(shí)頻域分析,得到所述加噪語音的時(shí)頻域分析結(jié)果;
分別計(jì)算所述時(shí)頻域分析結(jié)果的相位及幅值;
使用預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型對(duì)所述時(shí)頻域分析結(jié)果的幅值進(jìn)行增強(qiáng)處理,得到增強(qiáng)后的幅值;
使用短時(shí)傅里葉逆變換對(duì)所述時(shí)頻域分析結(jié)果的相位及增強(qiáng)后的幅值進(jìn)行處理,得到增強(qiáng)后的語音。
本發(fā)明實(shí)施例的第二方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如下步驟:
使用短時(shí)傅里葉變換對(duì)加噪語音進(jìn)行時(shí)頻域分析,得到所述加噪語音的時(shí)頻域分析結(jié)果;
分別計(jì)算所述時(shí)頻域分析結(jié)果的相位及幅值;
使用預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型對(duì)所述時(shí)頻域分析結(jié)果的幅值進(jìn)行增強(qiáng)處理,得到增強(qiáng)后的幅值;
使用短時(shí)傅里葉逆變換對(duì)所述時(shí)頻域分析結(jié)果的相位及增強(qiáng)后的幅值進(jìn)行處理,得到增強(qiáng)后的語音。
本發(fā)明實(shí)施例的第三方面提供了一種終端設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)可讀指令,所述處理器執(zhí)行所述計(jì)算機(jī)可讀指令時(shí)實(shí)現(xiàn)如下步驟:
使用短時(shí)傅里葉變換對(duì)加噪語音進(jìn)行時(shí)頻域分析,得到所述加噪語音的時(shí)頻域分析結(jié)果;
分別計(jì)算所述時(shí)頻域分析結(jié)果的相位及幅值;
使用預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型對(duì)所述時(shí)頻域分析結(jié)果的幅值進(jìn)行增強(qiáng)處理,得到增強(qiáng)后的幅值;
使用短時(shí)傅里葉逆變換對(duì)所述時(shí)頻域分析結(jié)果的相位及增強(qiáng)后的幅值進(jìn)行處理,得到增強(qiáng)后的語音。
本發(fā)明實(shí)施例與現(xiàn)有技術(shù)相比存在的有益效果是:本發(fā)明實(shí)施例首先使用短時(shí)傅里葉變換對(duì)加噪語音進(jìn)行時(shí)頻域分析,得到所述加噪語音的時(shí)頻域分析結(jié)果,分別計(jì)算所述時(shí)頻域分析結(jié)果的相位及幅值,然后使用預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型對(duì)所述時(shí)頻域分析結(jié)果的幅值進(jìn)行增強(qiáng)處理,得到增強(qiáng)后的幅值,最后使用短時(shí)傅里葉逆變換對(duì)所述時(shí)頻域分析結(jié)果的相位及增強(qiáng)后的幅值進(jìn)行處理,得到增強(qiáng)后的語音。通過神經(jīng)網(wǎng)絡(luò)模型的增強(qiáng)處理,可以有效抑制語音信號(hào)中的噪聲干擾,大大增強(qiáng)了語音信號(hào)的質(zhì)量,提高用戶日常工作和生活中的溝通效率。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811187136.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 打緯機(jī)構(gòu)軸承間隙的時(shí)頻曲線測(cè)量方法及其裝置
- 打緯機(jī)構(gòu)軸承間隙的時(shí)頻曲線測(cè)量裝置
- 用于檢測(cè)、緩解帕金森異常步態(tài)的裝置
- 基于輸入輸出扭矩動(dòng)力學(xué)特性的行星齒輪系統(tǒng)故障監(jiān)測(cè)方法
- 時(shí)頻域疊前共成像點(diǎn)道集屬性三維分析方法
- 基于ECG信號(hào)的疲勞、情緒分析方法
- 基于神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法、可讀存儲(chǔ)介質(zhì)及終端設(shè)備
- 一種通信信號(hào)時(shí)頻域的檢測(cè)方法
- 一種基于時(shí)頻聯(lián)合分析的無創(chuàng)血液成分檢測(cè)方法及系統(tǒng)
- 矢量信號(hào)分析儀平臺(tái)5G信號(hào)時(shí)頻域數(shù)據(jù)轉(zhuǎn)換處理的方法、系統(tǒng)、裝置、處理器及存儲(chǔ)介質(zhì)
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 信息處理設(shè)備、方法和記錄媒體
- 語音信號(hào)處理電路和裝置
- 一種判斷說話人數(shù)目的方法及系統(tǒng)
- 基于人工智能的語音信號(hào)處理方法、裝置及存儲(chǔ)介質(zhì)
- 環(huán)境語音采集處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 語音識(shí)別方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)
- 語音信號(hào)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語音信號(hào)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種語音信號(hào)處理方法、裝置、介質(zhì)和設(shè)備
- 一種雙路語音同傳的收發(fā)系統(tǒng)





