[發(fā)明專利]一種基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201910038519.1 | 申請(qǐng)日: | 2019-01-16 |
| 公開(公告)號(hào): | CN109817209B | 公開(公告)日: | 2020-09-25 |
| 發(fā)明(設(shè)計(jì))人: | 王艷芬;楊漢丹;王廣新 | 申請(qǐng)(專利權(quán))人: | 深圳市友杰智新科技有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/08;G10L21/0208;G10L21/0216 |
| 代理公司: | 深圳市深可信專利代理有限公司 44599 | 代理人: | 劉昌剛 |
| 地址: | 518000 廣東省深圳市南山區(qū)招商*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 麥克風(fēng) 陣列 智能 語音 交互 系統(tǒng) | ||
1.一種基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng),其特征在于,包括:
聲音采集模塊,用戶拾取聲音信號(hào),聲音采集模塊為雙麥克風(fēng);
第一聲音檢測(cè)模塊,用于對(duì)拾取的聲音信號(hào)進(jìn)行語音檢測(cè),當(dāng)檢測(cè)到有語音時(shí),將信號(hào)送入下一模塊;否則,將數(shù)據(jù)丟棄;
第二聲音檢測(cè)模塊,用于對(duì)云端獲取并被揚(yáng)聲器播放的音頻數(shù)據(jù)進(jìn)行語音檢測(cè),當(dāng)檢測(cè)到有語音時(shí),將信號(hào)送入下一模塊;否則,將數(shù)據(jù)丟棄;
回聲消除模塊,用于消除聲音采集模塊拾取揚(yáng)聲器播放出來的自噪聲;輸入包含兩路信號(hào),一路是聲音采集模塊拾取到的近端語音,另外一路是參考信號(hào),參考信號(hào)為從云端獲取并被揚(yáng)聲器播放的音頻數(shù)據(jù);只有滿足第一聲音檢測(cè)模塊和第二聲音檢測(cè)模塊都檢測(cè)到有聲音的時(shí)候,才會(huì)被打開執(zhí)行,否則處于直通狀態(tài);
關(guān)鍵詞語音識(shí)別模塊,用于接收從回聲消除模塊中流入的數(shù)據(jù),進(jìn)行關(guān)鍵詞語音識(shí)別,根據(jù)識(shí)別結(jié)果控制單通道降噪模塊和雙麥語音增強(qiáng)模塊的開關(guān);
單通道降噪模塊,用于當(dāng)關(guān)鍵詞語音識(shí)別模塊識(shí)別到關(guān)鍵詞后將被打開,接收第一聲音檢測(cè)模塊中的輸出,進(jìn)行降噪處理;
延時(shí)估計(jì)模塊,用于接收單通道降噪模塊的輸出信號(hào),進(jìn)行計(jì)算得到一個(gè)時(shí)延值,輸入至雙麥語音增強(qiáng)模塊;
雙麥語音增強(qiáng)模塊,用于當(dāng)關(guān)鍵詞語音識(shí)別模塊中檢測(cè)識(shí)別到關(guān)鍵詞后,將被打開,接收第一聲音檢測(cè)模塊中的數(shù)據(jù),進(jìn)行語音增強(qiáng)處理,處理之后的數(shù)據(jù)將會(huì)被傳送到云端;
云端,用于接收到本地傳送的數(shù)據(jù),進(jìn)行對(duì)應(yīng)的處理,返回本地處理結(jié)果,本地接收到處理結(jié)果后,通過揚(yáng)聲器播放出來,告知用戶;
揚(yáng)聲器,用于播放云端處理后的音頻數(shù)據(jù);
雙麥語音增強(qiáng)模塊的雙麥語音增強(qiáng)包括如下步驟:
首先對(duì)信號(hào)進(jìn)行數(shù)據(jù)對(duì)齊,即進(jìn)行相應(yīng)的延時(shí)處理;對(duì)齊后的兩路信號(hào)可表示為:
yi(m)=xi(m)+ni(m) (6)
其中i小標(biāo)表示信號(hào)通道編號(hào);
對(duì)兩路輸入信號(hào)y1(m),y2(m)經(jīng)過一個(gè)加窗處理并且取FFT變化之后變換到了頻域上,處理之后的信號(hào)是Y1(w,k),Y2(w,k);其中w表示角頻率,k表示幀序號(hào);
接下來,計(jì)算兩路信號(hào)的自相關(guān)功率譜和互相關(guān)功率譜;計(jì)算公式如下:
其中,Xi(w,k),Yi(w,k),Ni(w,k)分別表示xi(m),yi(m),ni(m)的傅里葉變化;對(duì)計(jì)算得到的自相關(guān)功率譜和互相關(guān)功率譜做平滑處理,λ為平滑系數(shù):
計(jì)算最后的增益系數(shù):
2.根據(jù)權(quán)利要求1所述的基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng),其特征在于,第一聲音檢測(cè)模塊和第二聲音檢測(cè)模塊的語音檢測(cè)處理包括如下步驟:
首先對(duì)數(shù)字音頻信號(hào)進(jìn)行分幀處理,計(jì)算每一幀的短時(shí)能量和短時(shí)過零率兩個(gè)特征;根據(jù)這兩個(gè)特征,利用雙門限判決法估計(jì)得到語音檢測(cè)結(jié)果;
3.根據(jù)權(quán)利要求1所述的基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng),其特征在于,回聲消除模塊的回聲消除處理包括如下步驟:
回聲消除算法采用步長(zhǎng)因子可變的NLMS算法,計(jì)算公式如下:
其中,x(n)是參考端信號(hào)(ref),矢量形式可寫成:
x(n)=[x(n),x(n-1),........x(n-M+1)]T
其中η是修正的步長(zhǎng)常量,0η2,δ為一個(gè)較小的整數(shù),一般取0.0001;w(n)是自適應(yīng)濾波器系數(shù),用于估計(jì)回聲路徑,y(n)是系統(tǒng)輸出,d(n)是近端信號(hào)(near),它包含了目標(biāo)語音,以及由揚(yáng)聲器播放出來的干擾語音和環(huán)境噪聲;e(n)是誤差信號(hào),它也是回聲消除算法得到的最終輸出結(jié)果。
4.根據(jù)權(quán)利要求1所述的基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng),其特征在于,關(guān)鍵詞語音識(shí)別模塊的關(guān)鍵詞語音識(shí)別是通過大量的語料,利用深度神經(jīng)網(wǎng)絡(luò)CNN網(wǎng)絡(luò)訓(xùn)練生成的一個(gè)分類器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市友杰智新科技有限公司,未經(jīng)深圳市友杰智新科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910038519.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





