[發(fā)明專利]基于語音降噪的聲紋識別的方法及系統(tǒng)以及智能終端在審
| 申請?zhí)枺?/td> | 201610025060.8 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN106971733A | 公開(公告)日: | 2017-07-21 |
| 發(fā)明(設(shè)計)人: | 祝銘明 | 申請(專利權(quán))人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10L17/04 | 分類號: | G10L17/04;G10L21/0208 |
| 代理公司: | 上海申新律師事務(wù)所31272 | 代理人: | 黨蕾 |
| 地址: | 310000 浙江省杭州市余杭區(qū)*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語音 聲紋 識別 方法 系統(tǒng) 以及 智能 終端 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,尤其涉及一種基于語音降噪的聲紋識別的方法及系統(tǒng)以及智能終端。
背景技術(shù)
現(xiàn)有技術(shù)中,在一些支持語音操作的智能終端中往往必須用到語音識別的功能,即通過識別說話人的聲紋以及語句得到智能終端能夠執(zhí)行的指令,進而根據(jù)該指令執(zhí)行相應(yīng)的操作。然而,在某些非說話人語音的噪聲干擾較強的應(yīng)用場合(例如應(yīng)用在一個說話人較多的空間,或者所應(yīng)用的空間的背景噪聲較強),由于背景噪聲與說話人的語音指令糅合在一起,會使語音識別更為困難,識別準(zhǔn)確度大大降低。
現(xiàn)有技術(shù)中,當(dāng)背景噪聲相對較小時可以采用一些現(xiàn)有的方法(例如譜減法和Wiener濾波)在語音識別過程中進行噪聲濾波,并取得了較為顯著的效果。但是對于一些背景噪聲較大的應(yīng)用環(huán)境下,現(xiàn)有技術(shù)中并不存在較為理想的關(guān)于噪聲濾波的技術(shù)方案,因而無法進行準(zhǔn)確的聲紋識別。
發(fā)明內(nèi)容
根據(jù)現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種基于語音降噪的聲紋識別的方法及系統(tǒng)以及智能終端的技術(shù)方案,具體包括:
一種基于語音降噪的聲紋識別的方法,適用于智能終端,其中,包括:
步驟S1,采集外部輸入的語音,并判斷所述語音的聲音強度是否高于一預(yù)設(shè)的強度閾值,并在所述聲音強度高于所述強度閾值時將所述語音確認為待判斷語音,并轉(zhuǎn)向步驟S2;
步驟S2,根據(jù)所述待判斷語音的頻譜,生成對應(yīng)所述待判斷語音上每個頻帶的估計標(biāo)識,所述估計標(biāo)識用于表示所述語音在諧波結(jié)構(gòu)上的顯著性;
步驟S3,生成對應(yīng)于所述待判斷語音的純語音的概率模型;
步驟S4,以每個所述估計標(biāo)識作為對應(yīng)的所述待判斷語音的所述頻帶的權(quán)重指標(biāo),依據(jù)所述概率模型處理得到關(guān)聯(lián)于所述語音的純語音估計值;
步驟S5,判斷所述純語音估計值是否大于一預(yù)設(shè)的估計閾值,若是執(zhí)行步驟S6,若否,返回執(zhí)行所述步驟S1;
步驟S6,根據(jù)所述純語音估計值獲取語音流,依據(jù)預(yù)設(shè)的聲紋識別模型對所述語音流進行聲紋識別。
優(yōu)選的,該基于語音降噪的聲紋識別的方法,其中,所述步驟S2中生成的所述估計標(biāo)識包括第一估計標(biāo)識;或者
所述步驟S2中生成的所述估計標(biāo)識包括第一估計標(biāo)識和第二估計標(biāo)識。
優(yōu)選的,該基于語音降噪的聲紋識別的方法,其中,所述步驟S2中,生成所述第一估計標(biāo)識的步驟具體包括:
步驟S21a,依據(jù)所述待判斷語音的所述頻譜,提取對應(yīng)于所述待判斷語音的所述諧波結(jié)構(gòu);
步驟S22a,對關(guān)聯(lián)于所述諧波結(jié)構(gòu)的數(shù)譜域上的監(jiān)控值進行規(guī)則化處理,并依據(jù)梅爾刻度對經(jīng)過規(guī)則化處理的所述監(jiān)控值執(zhí)行平滑處理;
步驟S23a,對經(jīng)過平滑處理的所述監(jiān)控值進行進一步的規(guī)則化處理,以使所述監(jiān)控值的均值為1;
步驟S24a,根據(jù)所述監(jiān)控值生成對應(yīng)所述待判斷語音的每個所述頻帶的所述第一估計標(biāo)識。
優(yōu)選的,該基于語音降噪的聲紋識別的方法,其中,所述步驟S4中,根據(jù)所述第一估計標(biāo)識處理得到所述純語音估計值的方法具體包括:
步驟S41a,處理得到關(guān)聯(lián)于所述待判斷語音的最小均方誤差估計的后驗概率;
步驟S42a,以每個所述第一估計標(biāo)識作為對應(yīng)的所述待判斷語音的所述頻帶的權(quán)重指標(biāo),依據(jù)所述概率模型對關(guān)聯(lián)于所述待判斷語音的所述后驗概率進行加權(quán)計算,以得到所述純語音估計值。
優(yōu)選的,該基于語音降噪的聲紋識別的方法,其中,所述步驟S2中,生成所述第二估計標(biāo)識的步驟具體包括:
步驟S21b,依據(jù)所述待判斷語音的所述頻譜,提取對應(yīng)于所述待判斷語音的所述諧波結(jié)構(gòu);
步驟S22b,對關(guān)聯(lián)于所述諧波結(jié)構(gòu)的數(shù)譜域上的監(jiān)控值進行規(guī)則化處理,并依據(jù)梅爾刻度對經(jīng)過規(guī)則化處理的所述監(jiān)控值執(zhí)行平滑處理;
步驟S23b,對經(jīng)過平滑處理的所述監(jiān)控值從0到1進行相應(yīng)的規(guī)則化處理;
步驟S24b,根據(jù)所述監(jiān)控值生成對應(yīng)所述待判斷語音的每個所述頻帶的所述第二估計標(biāo)識。
優(yōu)選的,該基于語音降噪的聲紋識別的方法,其中,執(zhí)行所述步驟S4之后,還根據(jù)所述第二估計標(biāo)識繼續(xù)執(zhí)行下述步驟:
針對所述待判斷語音的每個頻帶,將每個對應(yīng)的所述第二估計標(biāo)識作為權(quán)重,以在所述監(jiān)控值與所述純語音估計值之間執(zhí)行線性插值并處理得到對應(yīng)的輸出值。
一種基于語音降噪的聲紋識別的系統(tǒng),適用于智能終端,其中,包括:
采集單元,用于采集外部輸入的語音;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于芋頭科技(杭州)有限公司,未經(jīng)芋頭科技(杭州)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610025060.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





