[發明專利]一種遠場語音喚醒方法及設備有效
| 申請號: | 201710853952.1 | 申請日: | 2017-09-20 |
| 公開(公告)號: | CN107464565B | 公開(公告)日: | 2020-08-04 |
| 發明(設計)人: | 耿雷 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06;G10L15/26;G10L21/0208 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 喚醒 方法 設備 | ||
本發明實施例公開了一種遠場語音喚醒方法及設備。其中,遠場語音喚醒方法包括:前端音頻信號處理芯片獲取麥克風陣列拾取的多路語音信號中的至少一路語音信號,并確定至少一路語音信號是否為語音喚醒信號;主處理器獲取多路語音信號中的至少兩路語音信號,并依據多路語音喚醒識別模型確定至少兩路語音信號是否為語音喚醒信號,若至少一路語音信號是語音喚醒信號,且至少兩路語音信號是語音喚醒信號,則主處理器控制執行喚醒操作。本發明實施例基于前端音頻信號處理芯片和主處理器,對麥克風陣列拾取的多路語音信號作兩次語音喚醒信號識別,大大降低了誤喚醒率,提升了用戶體驗。
技術領域
本發明實施例涉及語音喚醒技術,尤其涉及一種遠場語音喚醒方法及設備。
背景技術
隨著語音識別技術的飛速發展,語音喚醒技術的應用越來越普遍,隨著用戶對語音喚醒設備的體驗要求越來越高,語音喚醒技術不再局限于近距離范圍的喚醒,因此出現了遠場語音喚醒技術。
現有的遠場語音喚醒技術有兩種實現方式,一種是基于前端音頻信號處理芯片(通常是音頻專用DSP)的語音喚醒實現方式,另一種是基于主處理器(CPU)的語音喚醒實現方式。但是,無論是基于前端音頻信號處理芯片還是基于主處理器的離線喚醒識別引擎,都受限于芯片的運算能力及存儲容量,導致離線識別的聲學模型相對簡單,從而使語音喚醒引擎性能下降,造成語音喚醒誤識別的增加,尤其是在有噪聲環境下,誤喚醒的幾率會更高。
發明內容
本發明實施例提供一種遠場語音喚醒方法及設備,大大降低了誤喚醒率,提升了用戶體驗。
第一方面,本發明實施例提供了一種遠場語音喚醒方法,該方法包括:
前端音頻信號處理芯片獲取麥克風陣列拾取的多路語音信號中的至少一路語音信號,并確定所述至少一路語音信號是否為語音喚醒信號;
主處理器獲取所述多路語音信號中的至少兩路語音信號,所述主處理器依據多路語音喚醒識別模型確定所述至少兩路語音信號是否為語音喚醒信號,其中,所述多路語音喚醒識別模型預先依據多路語音喚醒樣本信號訓練得到;
若所述至少一路語音信號是語音喚醒信號,且所述至少兩路語音信號是語音喚醒信號,則所述主處理器控制執行喚醒操作。
第二方面,本發明實施例還提供了一種遠場語音喚醒設備,該設備包括麥克風陣列、前端音頻信號處理芯片和主處理器;其中,
所述麥克風陣列拾取多路語音信號;
所述前端音頻信號處理芯片獲取所述多路語音信號中的至少一路語音信號,并確定所述至少一路語音信號是否為語音喚醒信號;
所述主處理器獲取所述多路語音信號中的至少兩路語音信號,并依據多路語音喚醒識別模型確定所述至少兩路語音信號是否為語音喚醒信號,其中,所述多路語音喚醒識別模型預先依據多路語音喚醒樣本信號訓練得到;
若所述至少一路語音信號是語音喚醒信號,且所述至少兩路語音信號是語音喚醒信號,則所述主處理器控制執行喚醒操作。
本發明實施例通過前端音頻信號處理芯片獲取麥克風陣列拾取的多路語音信號中的至少一路語音信號,并確定至少一路語音信號是否為語音喚醒信號;通過主處理器獲取多路語音信號中的至少兩路語音信號,并利用多路語音喚醒識別模型確定至少兩路語音信號是否為語音喚醒信號,基于前端音頻信號處理芯片和主處理器,對麥克風陣列拾取的多路語音信號作兩次語音喚醒信號識別,大大降低了誤喚醒率,提升了用戶體驗。
附圖說明
圖1是本發明實施例一中的遠場語音喚醒方法的流程圖;
圖2是本發明實施例二中的遠場語音喚醒方法的流程圖;
圖3是本發明實施例三中的遠場語音喚醒設備的結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710853952.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:語音交互方法、裝置及設備
- 下一篇:語音識別方法和裝置





