[實(shí)用新型]自校準(zhǔn)的遠(yuǎn)場語音交互設(shè)備有效
| 申請?zhí)枺?/td> | 201621197888.3 | 申請日: | 2016-11-04 |
| 公開(公告)號: | CN206489876U | 公開(公告)日: | 2017-09-12 |
| 發(fā)明(設(shè)計(jì))人: | 陳日林;馮大航;陳孝良;常樂 | 申請(專利權(quán))人: | 北京聲智科技有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10L21/0316 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司11021 | 代理人: | 任巖 |
| 地址: | 100086 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 校準(zhǔn) 語音 交互 設(shè)備 | ||
技術(shù)領(lǐng)域
本實(shí)用新型總體上涉及語音處理技術(shù)領(lǐng)域,尤其涉及自校準(zhǔn)的遠(yuǎn)場語音交互設(shè)備。
背景技術(shù)
麥克風(fēng)陣列技術(shù)近幾十年來受到了研究者的廣泛關(guān)注,特別是最近幾年來,
受到人工智能繁榮發(fā)展的驅(qū)動(dòng),遠(yuǎn)場語音識別技術(shù)得到更大的關(guān)注,對作為遠(yuǎn)場語音識別前端的麥克風(fēng)陣列技術(shù)提出了更大的要求。目前針對遠(yuǎn)場語音識別的主要方法包括MVDR(Minimum Variance DistortionlessResponse,最小方差無畸變響應(yīng))和多通道維納濾波方法,不管哪一種方法都是進(jìn)行了遠(yuǎn)場假設(shè),通常認(rèn)為通道到達(dá)每個(gè)麥克風(fēng)的幅度一致,只是聲波到達(dá)時(shí)間不同,但實(shí)際中通常不同通道麥克風(fēng)增益不同,同時(shí)由于距離衰減等因素造成幅度差異,因此需要對麥克風(fēng)增益及信號幅度衰減進(jìn)行補(bǔ)償,才能保證算法性能。同時(shí)上述算法都需要明確麥克風(fēng)的準(zhǔn)確位置,大量方法與研究也是基于麥克風(fēng)準(zhǔn)確位置設(shè)計(jì)的,并且所有麥克風(fēng)都能正常工作,極端情況下,一旦麥克風(fēng)無法正常錄音工作,將導(dǎo)致算法性能急劇下降,在實(shí)際產(chǎn)品應(yīng)用中,麥克風(fēng)位置通常是已知的,但在使用過程中很難保證其中的某個(gè)麥克風(fēng)發(fā)生問題,無法正常錄音,這種情形下需要剔除問題麥克風(fēng),此時(shí)原有的麥克風(fēng)位置信息需要更新,為保證陣列算法仍然能夠正常工作,此時(shí)需要校準(zhǔn)確定正常麥克風(fēng)陣列構(gòu)成的新麥克風(fēng)陣列及其相關(guān)信息。
現(xiàn)有技術(shù)對麥克風(fēng)信號的校準(zhǔn),通常采用大型校準(zhǔn)設(shè)備在專用的實(shí)驗(yàn)室內(nèi)完成,非常費(fèi)時(shí)費(fèi)力,并不適用于消費(fèi)電子。例如,現(xiàn)有技術(shù)一(CN200810213962,一種麥克風(fēng)陣列及麥克風(fēng)陣列校準(zhǔn)的方法和模塊)采用靜默期的背景噪聲作為校準(zhǔn)聲源,計(jì)算不同通道的增益,調(diào)整不同通道到相同增益。該技術(shù)方案采用靜默期的相干性較低的背景噪聲作為校準(zhǔn) 聲源,麥克風(fēng)接收信號的信噪比較低,校準(zhǔn)誤差較大,同時(shí)只考慮麥克風(fēng)自身的增益,沒有考慮傳播衰減等造成的幅度誤差,特別對于遠(yuǎn)場情形下,各麥克風(fēng)的語音信號之間仍然存在較大幅度誤差,不適合于麥克風(fēng)陣列信號處理。
現(xiàn)有技術(shù)二“Robust speech recognition using beamforming with adaptivemicrophone gains and multichannel noise reduction”采用語音段信號作為校準(zhǔn)聲源,計(jì)算不同通道的增益。該技術(shù)方案一方面在增益計(jì)算中沒有剔出噪聲的影響,噪聲增益計(jì)算不準(zhǔn)確,另一方面對于極端情況,即麥克風(fēng)損壞無法正常工作的情形下,針對麥克風(fēng)陣列沒有提出解決方案。
實(shí)用新型內(nèi)容
(一)要解決的技術(shù)問題
本實(shí)用新型提供了一種自校準(zhǔn)的遠(yuǎn)場語音交互設(shè)備。
(二)技術(shù)方案
本實(shí)用新型提供了一種自校準(zhǔn)的遠(yuǎn)場語音交互設(shè)備,包括:麥克風(fēng)陣列與自校準(zhǔn)和語音識別終端,所述麥克風(fēng)陣列與所述自校準(zhǔn)和語音識別終端電性連接;所述麥克風(fēng)陣列采集遠(yuǎn)場語音信號,并將所述遠(yuǎn)場語音信號傳輸至所述自校準(zhǔn)和語音識別終端,其中,所述遠(yuǎn)場語音信號包含由麥克風(fēng)通道增益和信號傳播衰減引起的誤差;所述自校準(zhǔn)和語音識別終端對所述誤差進(jìn)行校準(zhǔn),得到增強(qiáng)語音輸出。
優(yōu)選地,遠(yuǎn)場語音交互設(shè)備還包括控制端,所述控制端為手機(jī)。
優(yōu)選地,所述自校準(zhǔn)和語音識別終端為計(jì)算機(jī)或服務(wù)器。
優(yōu)選地,所述自校準(zhǔn)和語音識別終端包括:自校準(zhǔn)模塊和廣義旁瓣對消器,所述麥克風(fēng)陣列連接自校準(zhǔn)模塊,所述自校準(zhǔn)模塊連接所述廣義旁瓣對消器,其中,所述自校準(zhǔn)模塊對所述誤差進(jìn)行校準(zhǔn),校準(zhǔn)后的遠(yuǎn)場語音信號傳輸至所述廣義旁瓣對消器;所述廣義旁瓣對消器對校準(zhǔn)后的遠(yuǎn)場語音信號進(jìn)行處理,得到增強(qiáng)語音輸出。
優(yōu)選地,所述自校準(zhǔn)模塊包括:語音活動(dòng)檢測模塊、相對增益計(jì)算模塊和增益校準(zhǔn)模塊;其中,所述語音活動(dòng)檢測模塊選取麥克風(fēng)陣列的一個(gè)麥克風(fēng)作為參考通道,利用所述參考通道提取遠(yuǎn)場語音信號中的語音段;所述相對增益計(jì)算模塊連接所述語音活動(dòng)檢測模塊,利用所述語音段計(jì)算 麥克風(fēng)陣列中的其他麥克風(fēng)相對于所述參考通道的相對增益;所述增益校準(zhǔn)模塊連接所述相對增益計(jì)算模塊,根據(jù)所述相對增益,將其他麥克風(fēng)的語音段調(diào)整到參考通道的增益水平,得到校準(zhǔn)后的遠(yuǎn)場語音信號。
優(yōu)選地,所述廣義旁瓣對消器包括:固定波束形成模塊、阻塞矩陣模塊、自適應(yīng)噪聲抵消模塊;其中,校準(zhǔn)后的遠(yuǎn)場語音信號分別進(jìn)入固定波束形成模塊和阻塞矩陣模塊;固定波束形成模塊對校準(zhǔn)后的遠(yuǎn)場語音信號進(jìn)行處理,生成語音參考信號;阻塞矩陣模塊對校準(zhǔn)后的遠(yuǎn)場語音信號進(jìn)行處理,生成噪聲參考信號,語音參考信號與經(jīng)過自適應(yīng)噪聲抵消模塊的噪聲參考信號求差,得到增強(qiáng)語音輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司,未經(jīng)北京聲智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201621197888.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動(dòng)設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





