[發明專利]多音區語音識別方法、裝置及存儲介質在審
| 申請號: | 202110970147.3 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN113658588A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 歐陽能鈞;梁啟仍;宋曄 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/26;G10L21/0216;G10L21/0272 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 王云紅;賈慧娜 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多音 語音 識別 方法 裝置 存儲 介質 | ||
本發明實施例提出一種多音區語音識別方法、裝置及計算機可讀存儲介質。其中多音區語音識別方法包括:使用麥克風模組收集語音采集環境中的語音,其中,預先為所述麥克風模組中的每個麥克風設置目標音區,所述目標音區是預先設定的所述語音采集環境中的多個獨立音區中的一個;判斷所述語音是否來自目標音區;對來自除所述目標音區之外的其他音區的語音進行抑制;對抑制后的語音進行識別。本發明實施例使用麥克風模組隔離出不同音區,通過隔離出多個音區實現了語音采集環境內全員使用語音,并且每個音區隔離度能達到15?20dB,實現了理想的隔離效果。
本申請是申請日為2018年09月29日、申請號為201811147010.2、發明名稱為“多音區語音識別方法、裝置及存儲介質”的中國專利申請的分案申請。
技術領域
本發明涉及信息技術領域,尤其涉及一種多音區語音識別方法、裝置及計算機可讀存儲介質。
背景技術
傳統的語音識別技術方案都是圍繞一個目標用戶進行服務的。例如,傳統的車載語音識別技術方案是圍繞司機一個人服務的,前端麥克風的角度是對準主駕駛位來設計的。傳統的核心垂類導航、音樂、電話等也都是圍繞司機來展開設計的。其中,垂類就是垂直領域,特指某個領域,開發者可以根據用戶使用場景設定特定領域使得識別結果更準確。比如垂直領域設定為“音樂”,則在語音識別時會優先識別為音樂相關的歌曲名、歌手名或者歌詞。
傳統的語音識別技術方案的缺陷在于只針對一個目標用戶服務,無法實現在語音采集環境中全員使用語音服務。仍以車載語音識別為例,傳統的語音識別技術方案只針對司機一個人服務,無法實現車內全員使用語音服務,給車內乘客帶來不佳的用戶體驗。
發明內容
本發明實施例提供一種多音區語音識別方法、裝置及計算機可讀存儲介質,以至少解決現有技術中的一個或多個技術問題。
第一方面,本發明實施例提供了一種多音區語音識別方法,包括:使用麥克風模組收集語音采集環境中的語音,其中,預先為所述麥克風模組中的每個麥克風設置目標音區,所述目標音區是預先設定的所述語音采集環境中的多個獨立音區中的一個;判斷所述語音是否來自目標音區;對來自除所述目標音區之外的其他音區的語音進行抑制;對抑制后的語音進行識別。
結合第一方面,本發明實施例在第一方面的第一種實現方式中,對抑制后的語音進行識別,包括:接收來自所述麥克風模組中的多個麥克風的抑制后的語音;從所述多個麥克風的目標音區中選擇一個獨立音區進行語音識別。
結合第一方面的第一種實現方式,本發明實施例在第一方面的第二種實現方式中,從所述多個麥克風的目標音區中選擇一個獨立音區進行語音識別,包括:識別所述多個麥克風的目標音區中是否有某個獨立音區的語音中出現喚醒詞;若識別出某個獨立音區的語音中出現喚醒詞,則選擇出現喚醒詞的獨立音區作為識別音區,對所述識別音區的語音進行語音識別。
結合第一方面的第二種實現方式,本發明實施例在第一方面的第三種實現方式中,對所述識別音區的語音進行語音識別之后,還包括:判斷所述識別音區的識別過程是否結束;若所述識別音區的識別過程已經結束,則重新從所述多個麥克風的目標音區中選擇一個獨立音區進行語音識別。
結合第一方面、第一方面的第一種實現方式、第一方面的第二種實現方式或第一方面的第三種實現方式,本發明實施例在第一方面的第四種實現方式中,所述語音采集環境包括車載環境;所述麥克風模組包括布置于前排頂燈位置的第一麥克風模組和布置于后排扶手箱出風口位置的第二麥克風模組,或者所述麥克風模組包括布置于前排頂燈位置的第一麥克風模組和布置于后排天窗邊緣位置的第三麥克風模組。
結合第一方面的第四種實現方式,本發明實施例在第一方面的第五種實現方式中,對抑制后的語音進行識別之前,還包括:接收來自車機系統的所述抑制后的語音,其中,所述抑制后的語音是由所述麥克風模組通過音頻總線傳輸給所述車機系統的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110970147.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種碳包覆鐵酸鋅催化劑的制備方法及其應用
- 下一篇:顯示膜片、殼體和電子設備





