[發(fā)明專利]用輔助鍵座麥克風(fēng)來檢測和抑制音頻流中的鍵盤瞬態(tài)噪聲在審

申請?zhí)枺?/td>	202010781730.5	申請日：	2015-12-30
公開（公告）號：	CN112071327A	公開（公告）日：	2020-12-11
發(fā)明（設(shè)計）人：	西蒙·J·戈德席爾;赫伯特·巴克納;簡·斯科格隆	申請（專利權(quán)）人：	谷歌有限責(zé)任公司
主分類號：	G10L21/0208	分類號：	G10L21/0208;G10L21/0216
代理公司：	中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219	代理人：	李佳;鄧聰惠
地址：	美國加利***	國省代碼：	暫無信息
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	輔助麥克風(fēng) 檢測抑制音頻中的鍵盤瞬態(tài) 噪聲
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種方法，包括：

在用戶裝置的數(shù)據(jù)處理硬件處，接收來自所述用戶裝置的第一麥克風(fēng)的音頻信號，所述音頻信號包含由所述第一麥克風(fēng)捕獲的語音數(shù)據(jù)和瞬態(tài)噪聲；

在所述數(shù)據(jù)處理硬件處，從所述用戶裝置的第二麥克風(fēng)接收關(guān)于所述瞬態(tài)噪聲的信息，其中第二麥克風(fēng)被定位為：

與所述第一麥克風(fēng)分開；并且

接近所述瞬態(tài)噪聲的源；

由所述數(shù)據(jù)處理硬件使用被配置為將所述第二麥克風(fēng)映射到所述第一麥克風(fēng)上的統(tǒng)計模型，基于關(guān)于從所述第二麥克風(fēng)接收到的所述瞬態(tài)噪聲的信息，來估計所述瞬態(tài)噪聲在接收自所述第一麥克風(fēng)的所述音頻信號中的貢獻(xiàn)；

由所述數(shù)據(jù)處理硬件通過基于所述瞬時噪聲的所估計的貢獻(xiàn)從接收自所述第一麥克風(fēng)的所述音頻信號中提取所述語音數(shù)據(jù)，來產(chǎn)生具有降低的瞬態(tài)噪聲的語音信號；和

由所述數(shù)據(jù)處理硬件基于所述語音信號來生成可聽輸出。

2.根據(jù)權(quán)利要求1所述的方法，其中，估計所述瞬態(tài)噪聲在來自所述第一麥克風(fēng)的音頻信號中的貢獻(xiàn)還基于貝葉斯推斷方法。

3.根據(jù)權(quán)利要求1所述的方法，其中，從所述第二麥克風(fēng)接收到的所述信息包括關(guān)于所述瞬態(tài)噪聲的頻譜-振幅信息。

4.根據(jù)權(quán)利要求1所述的方法，其中，所述瞬態(tài)噪聲的源是所述用戶裝置的鍵座，并且包含在所述音頻信號中的所述瞬態(tài)噪聲是鍵點(diǎn)擊。

5.根據(jù)權(quán)利要求1所述的方法，進(jìn)一步包括：由所述數(shù)據(jù)處理硬件基于從所述第二麥克風(fēng)接收到的所述信息來調(diào)整所述瞬態(tài)噪聲在所述音頻信號中的所估計的貢獻(xiàn)。

6.根據(jù)權(quán)利要求5所述的方法，其中，調(diào)整所述瞬態(tài)噪聲在所述音頻信號中的所估計的貢獻(xiàn)包括：按比例增加或者按比例縮小所估計的貢獻(xiàn)。

7.根據(jù)權(quán)利要求5所述的方法，進(jìn)一步包括：由所述數(shù)據(jù)處理硬件基于經(jīng)過調(diào)整的所估計的貢獻(xiàn)，確定在來自所述第一麥克風(fēng)的所述音頻信號中在每個時間幀中在每個頻率處所述瞬態(tài)噪聲的估計功率水平。

8.根據(jù)權(quán)利要求7所述的方法，進(jìn)一步包括：由所述數(shù)據(jù)處理硬件基于在來自所述第一麥克風(fēng)的所述音頻信號中在每個時間幀中在每個頻率處所述瞬態(tài)噪聲的所述估計功率水平，從由所述第一麥克風(fēng)捕獲到的所述音頻信號中提取所述語音數(shù)據(jù)。

9.根據(jù)權(quán)利要求1所述的方法，其中，估計所述瞬態(tài)噪聲在所述音頻信號中的貢獻(xiàn)包括：使用期望最大化算法來確定包含所述語音數(shù)據(jù)的一部分所述音頻信號的最大后驗(yàn)MAP估計。

10.根據(jù)權(quán)利要求1所述的方法，其中，估計所述瞬態(tài)噪聲在來自所述第一麥克風(fēng)的所述音頻信號中的貢獻(xiàn)包括：估計在多個時間幀的每個時間幀中在每個頻率處所述瞬態(tài)噪聲的功率水平。

11.一種系統(tǒng)，包括：

用戶裝置的數(shù)據(jù)處理硬件；和

與所述數(shù)據(jù)處理硬件通信的存儲器硬件，所述存儲器硬件存儲指令，所述指令當(dāng)在所述數(shù)據(jù)處理硬件上執(zhí)行時使所述數(shù)據(jù)處理硬件執(zhí)行操作，所述操作包括：

接收來自所述用戶裝置的第一麥克風(fēng)的音頻信號，所述音頻信號包含由所述第一麥克風(fēng)捕獲的語音數(shù)據(jù)和瞬態(tài)噪聲；

從所述用戶裝置的第二麥克風(fēng)獲得關(guān)于所述瞬態(tài)噪聲的信息，其中第二麥克風(fēng)被定位為：

與所述第一麥克風(fēng)分開；并且

接近所述瞬態(tài)噪聲的源；

使用被配置為將所述第二麥克風(fēng)映射到所述第一麥克風(fēng)上的統(tǒng)計模型，估計所述瞬態(tài)噪聲在接收自所述第一麥克風(fēng)的所述音頻信號中的貢獻(xiàn)；

通過基于所述瞬時噪聲的所估計的貢獻(xiàn)從接收自所述第一麥克風(fēng)的所述音頻信號中提取所述語音數(shù)據(jù)，來產(chǎn)生具有降低的噪聲的語音信號；和

基于所述語音信號來生成可聽輸出。

12.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中，估計所述瞬態(tài)噪聲在來自所述第一麥克風(fēng)的音頻信號中的貢獻(xiàn)還基于貝葉斯推斷方法。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司，未經(jīng)谷歌有限責(zé)任公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010781730.5/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種生物旋轉(zhuǎn)球式反應(yīng)器脫除氮氧化物的裝置及方法
下一篇：燃?xì)馇袛嚅y與減壓閥集成控制裝置

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質(zhì)量或其可識度而處理語音信號，以產(chǎn)生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強(qiáng)，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴(kuò)展
G10L21-06 .將語音轉(zhuǎn)換成非可聽表達(dá)形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】