[發(fā)明專利]用輔助鍵座麥克風(fēng)來檢測和抑制音頻流中的鍵盤瞬態(tài)噪聲在審
| 申請?zhí)枺?/td> | 202010781730.5 | 申請日: | 2015-12-30 |
| 公開(公告)號: | CN112071327A | 公開(公告)日: | 2020-12-11 |
| 發(fā)明(設(shè)計)人: | 西蒙·J·戈德席爾;赫伯特·巴克納;簡·斯科格隆 | 申請(專利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0216 |
| 代理公司: | 中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 李佳;鄧聰惠 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 輔助 麥克風(fēng) 檢測 抑制 音頻 中的 鍵盤 瞬態(tài) 噪聲 | ||
1.一種方法,包括:
在用戶裝置的數(shù)據(jù)處理硬件處,接收來自所述用戶裝置的第一麥克風(fēng)的音頻信號,所述音頻信號包含由所述第一麥克風(fēng)捕獲的語音數(shù)據(jù)和瞬態(tài)噪聲;
在所述數(shù)據(jù)處理硬件處,從所述用戶裝置的第二麥克風(fēng)接收關(guān)于所述瞬態(tài)噪聲的信息,其中第二麥克風(fēng)被定位為:
與所述第一麥克風(fēng)分開;并且
接近所述瞬態(tài)噪聲的源;
由所述數(shù)據(jù)處理硬件使用被配置為將所述第二麥克風(fēng)映射到所述第一麥克風(fēng)上的統(tǒng)計模型,基于關(guān)于從所述第二麥克風(fēng)接收到的所述瞬態(tài)噪聲的信息,來估計所述瞬態(tài)噪聲在接收自所述第一麥克風(fēng)的所述音頻信號中的貢獻(xiàn);
由所述數(shù)據(jù)處理硬件通過基于所述瞬時噪聲的所估計的貢獻(xiàn)從接收自所述第一麥克風(fēng)的所述音頻信號中提取所述語音數(shù)據(jù),來產(chǎn)生具有降低的瞬態(tài)噪聲的語音信號;和
由所述數(shù)據(jù)處理硬件基于所述語音信號來生成可聽輸出。
2.根據(jù)權(quán)利要求1所述的方法,其中,估計所述瞬態(tài)噪聲在來自所述第一麥克風(fēng)的音頻信號中的貢獻(xiàn)還基于貝葉斯推斷方法。
3.根據(jù)權(quán)利要求1所述的方法,其中,從所述第二麥克風(fēng)接收到的所述信息包括關(guān)于所述瞬態(tài)噪聲的頻譜-振幅信息。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述瞬態(tài)噪聲的源是所述用戶裝置的鍵座,并且包含在所述音頻信號中的所述瞬態(tài)噪聲是鍵點(diǎn)擊。
5.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括:由所述數(shù)據(jù)處理硬件基于從所述第二麥克風(fēng)接收到的所述信息來調(diào)整所述瞬態(tài)噪聲在所述音頻信號中的所估計的貢獻(xiàn)。
6.根據(jù)權(quán)利要求5所述的方法,其中,調(diào)整所述瞬態(tài)噪聲在所述音頻信號中的所估計的貢獻(xiàn)包括:按比例增加或者按比例縮小所估計的貢獻(xiàn)。
7.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括:由所述數(shù)據(jù)處理硬件基于經(jīng)過調(diào)整的所估計的貢獻(xiàn),確定在來自所述第一麥克風(fēng)的所述音頻信號中在每個時間幀中在每個頻率處所述瞬態(tài)噪聲的估計功率水平。
8.根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括:由所述數(shù)據(jù)處理硬件基于在來自所述第一麥克風(fēng)的所述音頻信號中在每個時間幀中在每個頻率處所述瞬態(tài)噪聲的所述估計功率水平,從由所述第一麥克風(fēng)捕獲到的所述音頻信號中提取所述語音數(shù)據(jù)。
9.根據(jù)權(quán)利要求1所述的方法,其中,估計所述瞬態(tài)噪聲在所述音頻信號中的貢獻(xiàn)包括:使用期望最大化算法來確定包含所述語音數(shù)據(jù)的一部分所述音頻信號的最大后驗(yàn)MAP估計。
10.根據(jù)權(quán)利要求1所述的方法,其中,估計所述瞬態(tài)噪聲在來自所述第一麥克風(fēng)的所述音頻信號中的貢獻(xiàn)包括:估計在多個時間幀的每個時間幀中在每個頻率處所述瞬態(tài)噪聲的功率水平。
11.一種系統(tǒng),包括:
用戶裝置的數(shù)據(jù)處理硬件;和
與所述數(shù)據(jù)處理硬件通信的存儲器硬件,所述存儲器硬件存儲指令,所述指令當(dāng)在所述數(shù)據(jù)處理硬件上執(zhí)行時使所述數(shù)據(jù)處理硬件執(zhí)行操作,所述操作包括:
接收來自所述用戶裝置的第一麥克風(fēng)的音頻信號,所述音頻信號包含由所述第一麥克風(fēng)捕獲的語音數(shù)據(jù)和瞬態(tài)噪聲;
從所述用戶裝置的第二麥克風(fēng)獲得關(guān)于所述瞬態(tài)噪聲的信息,其中第二麥克風(fēng)被定位為:
與所述第一麥克風(fēng)分開;并且
接近所述瞬態(tài)噪聲的源;
使用被配置為將所述第二麥克風(fēng)映射到所述第一麥克風(fēng)上的統(tǒng)計模型,估計所述瞬態(tài)噪聲在接收自所述第一麥克風(fēng)的所述音頻信號中的貢獻(xiàn);
通過基于所述瞬時噪聲的所估計的貢獻(xiàn)從接收自所述第一麥克風(fēng)的所述音頻信號中提取所述語音數(shù)據(jù),來產(chǎn)生具有降低的噪聲的語音信號;和
基于所述語音信號來生成可聽輸出。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中,估計所述瞬態(tài)噪聲在來自所述第一麥克風(fēng)的音頻信號中的貢獻(xiàn)還基于貝葉斯推斷方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010781730.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





