[發(fā)明專利]一種基于語音降噪的聲紋識別方法和相關(guān)裝置在審
| 申請?zhí)枺?/td> | 201980003326.0 | 申請日: | 2019-12-24 |
| 公開(公告)號: | CN111108554A | 公開(公告)日: | 2020-05-05 |
| 發(fā)明(設(shè)計)人: | 陳昊亮;羅偉航 | 申請(專利權(quán))人: | 廣州國音智能科技有限公司 |
| 主分類號: | G10L17/20 | 分類號: | G10L17/20;G10L17/18;G10L17/04 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王兆林 |
| 地址: | 510000 廣東省廣州市黃埔*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語音 聲紋 識別 方法 相關(guān) 裝置 | ||
本申請公開了一種基于語音降噪的聲紋識別方法和相關(guān)裝置,其中方法包括:獲取待識別語音;對待識別語音進行去噪處理;提取去噪后的待識別語音的第一語譜圖;將第一語譜圖輸入到預(yù)置卷積神經(jīng)網(wǎng)絡(luò)模型,得到待識別語音的聲紋識別結(jié)果,本申請通過對獲取的待識別語音進行去噪處理,得到去噪后的待識別語音,基于去噪后的待識別語音進行聲紋識別,有助于提高聲紋識別結(jié)果,解決了現(xiàn)有的聲紋識別方法對于含有噪聲的待識別語音存在鑒別效果不佳的技術(shù)問題。
技術(shù)領(lǐng)域
本申請涉及聲紋識別技術(shù)領(lǐng)域,尤其涉及一種基于語音降噪的聲紋識別方法和相關(guān)裝置。
背景技術(shù)
聲紋識別是指通過未知說話人或不確定說話人的語音聲學特征與已知說話人的語音聲學特征進行綜合分析比對,做出兩者是否同一的結(jié)論的過程?,F(xiàn)有的聲紋識別方法中由于采集的待識別語音中通常包含有環(huán)境噪聲或信道噪聲,使得聲紋識別效果不佳。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N基于語音降噪的聲紋識別方法和相關(guān)裝置,用于解決現(xiàn)有的聲紋識別方法對于含有噪聲的待識別語音存在識別效果不佳的技術(shù)問題。
有鑒于此,本申請第一方面提供了一種基于語音降噪的聲紋識別方法,包括:
獲取待識別語音;
對所述待識別語音進行去噪處理;
提取去噪后的所述待識別語音的第一語譜圖;
將所述第一語譜圖輸入到預(yù)置卷積神經(jīng)網(wǎng)絡(luò)模型,得到所述待識別語音的聲紋識別結(jié)果。
優(yōu)選地,所述將所述第一語譜圖輸入到預(yù)置卷積神經(jīng)網(wǎng)絡(luò)模型,得到所述待識別語音的聲紋識別結(jié)果,之前還包括:
獲取訓練樣本語音;
對所述訓練樣本語音進行去噪處理;
提取去噪后的所述訓練樣本語音的第二語譜圖;
將所述第二語譜圖輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中進行訓練;
計算所述卷積神經(jīng)網(wǎng)絡(luò)模型對所述訓練樣本語音的識別率,當所述識別率達到閾值時,得到訓練好的所述卷積神經(jīng)網(wǎng)絡(luò)模型,將訓練好的所述卷積神經(jīng)網(wǎng)絡(luò)模型作為所述預(yù)置卷積神經(jīng)網(wǎng)絡(luò)模型。
優(yōu)選地,所述對所述待識別語音進行去噪處理,包括:
基于經(jīng)驗?zāi)B(tài)分解和小波閾值相結(jié)合的方法對所述待識別語音進行去噪處理。
優(yōu)選地,所述基于經(jīng)驗?zāi)B(tài)分解和小波閾值相結(jié)合的方法對所述待識別語音進行去噪處理,包括:
基于經(jīng)驗?zāi)B(tài)分解對所述待識別語音進行自適應(yīng)分解,得到若干個本征模函數(shù)分量;
基于小波閾值對所述本征模函數(shù)分量中的高頻本征模函數(shù)分量進行去噪處理;
將去噪后的所述高頻本征模函數(shù)分量和非高頻本征模函數(shù)分量進行相加重構(gòu),得到去噪后的所述待識別語音。
本申請第二方面提供了一種基于語音降噪的聲紋識別裝置,包括:
第一獲取模塊,用于獲取待識別語音;
第一去噪模塊,用于對所述待識別語音進行去噪處理;
第一提取模塊,用于提取去噪后的所述待識別語音的第一語譜圖;
識別模塊,用于將所述第一語譜圖輸入到預(yù)置卷積神經(jīng)網(wǎng)絡(luò)模型,得到所述待識別語音的聲紋識別結(jié)果。
優(yōu)選地,還包括:
第二獲取模塊,用于獲取訓練樣本語音;
第二去噪模塊,用于對所述訓練樣本語音進行去噪處理;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州國音智能科技有限公司,未經(jīng)廣州國音智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980003326.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





