[發(fā)明專利]一種基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng)有效

申請(qǐng)?zhí)枺?/td>	201910038519.1	申請(qǐng)日：	2019-01-16
公開（公告）號(hào)：	CN109817209B	公開（公告）日：	2020-09-25
發(fā)明（設(shè)計(jì)）人：	王艷芬;楊漢丹;王廣新	申請(qǐng)（專利權(quán)）人：	深圳市友杰智新科技有限公司
主分類號(hào)：	G10L15/22	分類號(hào)：	G10L15/22;G10L15/08;G10L21/0208;G10L21/0216
代理公司：	深圳市深可信專利代理有限公司 44599	代理人：	劉昌剛
地址：	518000 廣東省深圳市南山區(qū)招商***	國(guó)省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于麥克風(fēng) 陣列智能語音交互系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng)，其特征在于，包括：

聲音采集模塊，用戶拾取聲音信號(hào)，聲音采集模塊為雙麥克風(fēng)；

第一聲音檢測(cè)模塊，用于對(duì)拾取的聲音信號(hào)進(jìn)行語音檢測(cè)，當(dāng)檢測(cè)到有語音時(shí)，將信號(hào)送入下一模塊；否則，將數(shù)據(jù)丟棄；

第二聲音檢測(cè)模塊，用于對(duì)云端獲取并被揚(yáng)聲器播放的音頻數(shù)據(jù)進(jìn)行語音檢測(cè)，當(dāng)檢測(cè)到有語音時(shí)，將信號(hào)送入下一模塊；否則，將數(shù)據(jù)丟棄；

回聲消除模塊，用于消除聲音采集模塊拾取揚(yáng)聲器播放出來的自噪聲；輸入包含兩路信號(hào)，一路是聲音采集模塊拾取到的近端語音，另外一路是參考信號(hào)，參考信號(hào)為從云端獲取并被揚(yáng)聲器播放的音頻數(shù)據(jù)；只有滿足第一聲音檢測(cè)模塊和第二聲音檢測(cè)模塊都檢測(cè)到有聲音的時(shí)候，才會(huì)被打開執(zhí)行，否則處于直通狀態(tài)；

關(guān)鍵詞語音識(shí)別模塊，用于接收從回聲消除模塊中流入的數(shù)據(jù)，進(jìn)行關(guān)鍵詞語音識(shí)別，根據(jù)識(shí)別結(jié)果控制單通道降噪模塊和雙麥語音增強(qiáng)模塊的開關(guān)；

單通道降噪模塊，用于當(dāng)關(guān)鍵詞語音識(shí)別模塊識(shí)別到關(guān)鍵詞后將被打開，接收第一聲音檢測(cè)模塊中的輸出，進(jìn)行降噪處理；

延時(shí)估計(jì)模塊，用于接收單通道降噪模塊的輸出信號(hào)，進(jìn)行計(jì)算得到一個(gè)時(shí)延值，輸入至雙麥語音增強(qiáng)模塊；

雙麥語音增強(qiáng)模塊，用于當(dāng)關(guān)鍵詞語音識(shí)別模塊中檢測(cè)識(shí)別到關(guān)鍵詞后，將被打開，接收第一聲音檢測(cè)模塊中的數(shù)據(jù)，進(jìn)行語音增強(qiáng)處理，處理之后的數(shù)據(jù)將會(huì)被傳送到云端；

云端，用于接收到本地傳送的數(shù)據(jù)，進(jìn)行對(duì)應(yīng)的處理，返回本地處理結(jié)果，本地接收到處理結(jié)果后，通過揚(yáng)聲器播放出來，告知用戶；

揚(yáng)聲器，用于播放云端處理后的音頻數(shù)據(jù)；

雙麥語音增強(qiáng)模塊的雙麥語音增強(qiáng)包括如下步驟：

首先對(duì)信號(hào)進(jìn)行數(shù)據(jù)對(duì)齊，即進(jìn)行相應(yīng)的延時(shí)處理；對(duì)齊后的兩路信號(hào)可表示為：

y_i(m)＝x_i(m)+n_i(m) (6)

其中i小標(biāo)表示信號(hào)通道編號(hào)；

對(duì)兩路輸入信號(hào)y₁(m)，y₂(m)經(jīng)過一個(gè)加窗處理并且取FFT變化之后變換到了頻域上，處理之后的信號(hào)是Y₁(w,k)，Y₂(w,k)；其中w表示角頻率，k表示幀序號(hào)；

接下來，計(jì)算兩路信號(hào)的自相關(guān)功率譜和互相關(guān)功率譜；計(jì)算公式如下：

其中，X_i(w,k),Y_i(w,k),N_i(w,k)分別表示x_i(m)，y_i(m)，n_i(m)的傅里葉變化；對(duì)計(jì)算得到的自相關(guān)功率譜和互相關(guān)功率譜做平滑處理，λ為平滑系數(shù)：

計(jì)算最后的增益系數(shù)：

2.根據(jù)權(quán)利要求1所述的基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng)，其特征在于，第一聲音檢測(cè)模塊和第二聲音檢測(cè)模塊的語音檢測(cè)處理包括如下步驟：

首先對(duì)數(shù)字音頻信號(hào)進(jìn)行分幀處理，計(jì)算每一幀的短時(shí)能量和短時(shí)過零率兩個(gè)特征；根據(jù)這兩個(gè)特征，利用雙門限判決法估計(jì)得到語音檢測(cè)結(jié)果；

3.根據(jù)權(quán)利要求1所述的基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng)，其特征在于，回聲消除模塊的回聲消除處理包括如下步驟：

回聲消除算法采用步長(zhǎng)因子可變的NLMS算法，計(jì)算公式如下：

其中，x(n)是參考端信號(hào)(ref)，矢量形式可寫成：

x(n)＝[x(n),x(n-1),........x(n-M+1)]^T

其中η是修正的步長(zhǎng)常量，0η2，δ為一個(gè)較小的整數(shù)，一般取0.0001；w(n)是自適應(yīng)濾波器系數(shù)，用于估計(jì)回聲路徑，y(n)是系統(tǒng)輸出，d(n)是近端信號(hào)(near)，它包含了目標(biāo)語音，以及由揚(yáng)聲器播放出來的干擾語音和環(huán)境噪聲；e(n)是誤差信號(hào)，它也是回聲消除算法得到的最終輸出結(jié)果。

4.根據(jù)權(quán)利要求1所述的基于雙麥克風(fēng)陣列的智能語音交互系統(tǒng)，其特征在于，關(guān)鍵詞語音識(shí)別模塊的關(guān)鍵詞語音識(shí)別是通過大量的語料，利用深度神經(jīng)網(wǎng)絡(luò)CNN網(wǎng)絡(luò)訓(xùn)練生成的一個(gè)分類器。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市友杰智新科技有限公司，未經(jīng)深圳市友杰智新科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910038519.1/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種適合各地方言的駕駛員語音智能交互設(shè)備及方法
下一篇：語音寫作方法、裝置、終端和存儲(chǔ)介質(zhì)

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識(shí)別；音頻分析或處理
G10L15-00 語音識(shí)別
G10L15-02 .語音識(shí)別的特征提取；識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識(shí)別系統(tǒng)，例如對(duì)說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】