[發(fā)明專利]基于輸出抵消噪聲的語音降噪的方法及系統(tǒng)以及智能終端在審
| 申請?zhí)枺?/td> | 201610024759.2 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN106971707A | 公開(公告)日: | 2017-07-21 |
| 發(fā)明(設(shè)計)人: | 祝銘明 | 申請(專利權(quán))人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10K11/178 | 分類號: | G10K11/178;G10L15/20 |
| 代理公司: | 上海申新律師事務所31272 | 代理人: | 黨蕾 |
| 地址: | 310000 浙江省杭州市余杭區(qū)*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 輸出 抵消 噪聲 語音 方法 系統(tǒng) 以及 智能 終端 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,尤其涉及一種基于輸出抵消噪聲的語音降噪的方法及系統(tǒng)以及智能終端。
背景技術(shù)
現(xiàn)有技術(shù)中,在一些支持語音操作的智能終端中往往必須用到語音識別的功能,即通過識別說話人的聲紋以及語句得到智能終端能夠執(zhí)行的指令,并進而根據(jù)該指令執(zhí)行相應的操作。然而,在某些非說話人語音的噪聲干擾較強的應用場合(例如應用在一個說話人較多的空間,或者所應用的空間的背景噪聲較強),由于背景噪聲與說話人的語音指令糅合在一起,會使語音識別更為困難,識別準確度大大降低。
現(xiàn)有技術(shù)中,當背景噪聲相對較小時可以采用一些現(xiàn)有的方法(例如譜減法和Wiener濾波)在語音識別過程中進行噪聲濾波,并取得了較為顯著的效果。但是對于一些背景噪聲較大的應用環(huán)境下,現(xiàn)有技術(shù)無法從背景噪聲較大的環(huán)境中提取純語音的技術(shù)方案。
發(fā)明內(nèi)容
根據(jù)現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種基于輸出抵消噪聲的語音降噪的方法及系統(tǒng)以及智能終端的技術(shù)方案,具體包括:
一種基于輸出抵消噪聲的語音降噪的方法,適用于智能終端,其中,提供復數(shù)個預先訓練的不同聲音強度的抵消噪聲,包括下述步驟:
步驟S1,采集外部輸入的語音;
步驟S2,獲取所述語音的聲音強度,將所述語音的聲音強度與復數(shù)個不同聲音強度的所述抵消噪聲進行匹配,獲取與所述語音的聲音強度相同的所述抵消噪聲,并輸出所述抵消噪聲;
步驟S3,采集外部輸入的語音,并判斷所述語音的聲音強度是否高于一 預設(shè)的強度閾值,并在所述聲音強度高于所述強度閾值時將所述語音確認為待判斷語音,并轉(zhuǎn)向步驟S4;
步驟S4,根據(jù)所述待判斷語音的頻譜,生成對應所述待判斷語音上每個頻帶的估計標識,所述估計標識用于表示所述語音在諧波結(jié)構(gòu)上的顯著性;
步驟S5,生成對應于所述待判斷語音的純語音的概率模型;
步驟S6,以每個所述估計標識作為對應的所述待判斷語音的所述頻帶的權(quán)重指標,依據(jù)所述概率模型處理得到關(guān)聯(lián)于所述語音的純語音估計值。
優(yōu)選的,該基于輸出抵消噪聲的語音降噪的方法,其中,所述步驟S4中生成的所述估計標識包括第一估計標識;或者
所述步驟S4中生成的所述估計標識包括第一估計標識和第二估計標識。
優(yōu)選的,該基于輸出抵消噪聲的語音降噪的方法,其中,所述步驟S4中,生成所述第一估計標識的步驟具體包括:
步驟S41a,依據(jù)所述待判斷語音的所述頻譜,提取對應于所述待判斷語音的所述諧波結(jié)構(gòu);
步驟S42a,對關(guān)聯(lián)于所述諧波結(jié)構(gòu)的數(shù)譜域上的監(jiān)控值進行規(guī)則化處理,并依據(jù)梅爾刻度對經(jīng)過規(guī)則化處理的所述監(jiān)控值執(zhí)行平滑處理;
步驟S43a,對經(jīng)過平滑處理的所述監(jiān)控值進行進一步的規(guī)則化處理,以使所述監(jiān)控值的均值為1;
步驟S44a,根據(jù)所述監(jiān)控值生成對應所述待判斷語音的每個所述頻帶的所述第一估計標識。
優(yōu)選的,該基于輸出抵消噪聲的語音降噪的方法,其中,所述步驟S6中,根據(jù)所述第一估計標識處理得到所述純語音估計值的方法具體包括:
步驟S61a,處理得到關(guān)聯(lián)于所述待判斷語音的最小均方誤差估計的后驗概率;
步驟S62a,以每個所述第一估計標識作為對應的所述待判斷語音的所述頻帶的權(quán)重指標,依據(jù)所述概率模型對關(guān)聯(lián)于所述待判斷語音的所述后驗概率進行加權(quán)計算,以得到所述純語音估計值。
優(yōu)選的,該基于輸出抵消噪聲的語音降噪的方法,其中,所述步驟S4中,生成所述第二估計標識的步驟具體包括:
步驟S41b,依據(jù)所述待判斷語音的所述頻譜,提取對應于所述待判斷語 音的所述諧波結(jié)構(gòu);
步驟S42b,對關(guān)聯(lián)于所述諧波結(jié)構(gòu)的數(shù)譜域上的監(jiān)控值進行規(guī)則化處理,并依據(jù)梅爾刻度對經(jīng)過規(guī)則化處理的所述監(jiān)控值執(zhí)行平滑處理;
步驟S43b,對經(jīng)過平滑處理的所述監(jiān)控值從0到1進行相應的規(guī)則化處理;
步驟S44b,根據(jù)所述監(jiān)控值生成對應所述待判斷語音的每個所述頻帶的所述第二估計標識。
優(yōu)選的,該基于輸出抵消噪聲的語音降噪的方法,其中,執(zhí)行所述步驟S6之后,還根據(jù)所述第二估計標識繼續(xù)執(zhí)行下述步驟:
針對所述待判斷語音的每個頻帶,將每個對應的所述第二估計標識作為權(quán)重,以在所述監(jiān)控值與所述純語音估計值之間執(zhí)行線性插值并處理得到對應的輸出值。
一種基于輸出抵消噪聲的語音降噪的系統(tǒng),適用于智能終端,其中,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于芋頭科技(杭州)有限公司,未經(jīng)芋頭科技(杭州)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610024759.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





