[發(fā)明專利]多音區(qū)語音識別方法、裝置及存儲介質在審
| 申請?zhí)枺?/td> | 202110970147.3 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN113658588A | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設計)人: | 歐陽能鈞;梁啟仍;宋曄 | 申請(專利權)人: | 百度在線網(wǎng)絡技術(北京)有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/26;G10L21/0216;G10L21/0272 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 王云紅;賈慧娜 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多音 語音 識別 方法 裝置 存儲 介質 | ||
1.一種多音區(qū)語音識別方法,其特征在于,包括:
使用麥克風模組收集語音采集環(huán)境中的語音,其中,預先為所述麥克風模組中的每個麥克風設置目標音區(qū),所述目標音區(qū)是預先設定的所述語音采集環(huán)境中的多個獨立音區(qū)中的一個;判斷所述語音是否來自目標音區(qū);
對來自除所述目標音區(qū)之外的其他音區(qū)的語音進行抑制;
接收來自所述麥克風模組中的多個麥克風的抑制后的語音;
從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別。
2.根據(jù)權利要求1所述的方法,其特征在于,從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別,包括:
識別所述多個麥克風的目標音區(qū)中是否有某個獨立音區(qū)的語音中出現(xiàn)喚醒詞;
若識別出某個獨立音區(qū)的語音中出現(xiàn)喚醒詞,則選擇出現(xiàn)喚醒詞的獨立音區(qū)作為識別音區(qū),對所述識別音區(qū)的語音進行語音識別。
3.根據(jù)權利要求2所述的方法,其特征在于,對所述識別音區(qū)的語音進行語音識別之后,還包括:
判斷所述識別音區(qū)的識別過程是否結束;
若所述識別音區(qū)的識別過程已經(jīng)結束,則重新從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別。
4.根據(jù)權利要求1-3中任一項所述的方法,其特征在于,所述語音采集環(huán)境包括車載環(huán)境;所述麥克風模組包括布置于前排頂燈位置的第一麥克風模組和布置于后排扶手箱出風口位置的第二麥克風模組,或者所述麥克風模組包括布置于前排頂燈位置的第一麥克風模組和布置于后排天窗邊緣位置的第三麥克風模組。
5.根據(jù)權利要求4所述的方法,其特征在于,對抑制后的語音進行識別之前,還包括:
接收來自車機系統(tǒng)的所述抑制后的語音,其中,所述抑制后的語音是由所述麥克風模組通過音頻總線傳輸給所述車機系統(tǒng)的。
6.根據(jù)權利要求5所述的方法,其特征在于,還包括:
設置所述車機系統(tǒng)的時分傳輸機制的隊列排布方式,以適于傳輸所述抑制后的語音。
7.根據(jù)權利要求1-3中任一項所述的方法,其特征在于,對抑制后的語音進行識別之后,還包括:
根據(jù)語音識別的結果產(chǎn)生對所述抑制后的語音的響應信息;
展示所述語音識別的結果及所述響應信息。
8.一種多音區(qū)語音識別裝置,其特征在于,包括:
語音采集單元,用于使用麥克風模組收集語音采集環(huán)境中的語音,其中,預先為所述麥克風模組中的每個麥克風設置目標音區(qū),所述目標音區(qū)是預先設定的所述語音采集環(huán)境中的多個獨立音區(qū)中的一個;
判斷單元,用于判斷所述語音是否來自目標音區(qū);
抑制單元,用于對來自除所述目標音區(qū)之外的其他音區(qū)的語音進行抑制;
語音識別單元,包括接收子單元和識別子單元,其中,所述接收子單元用于接收來自所述麥克風模組中的多個麥克風的抑制后的語音;所述識別子單元用于從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別。
9.根據(jù)權利要求8所述的裝置,其特征在于,所述識別子單元還用于:
識別所述多個麥克風的目標音區(qū)中是否有某個獨立音區(qū)的語音中出現(xiàn)喚醒詞;
若識別出某個獨立音區(qū)的語音中出現(xiàn)喚醒詞,則選擇出現(xiàn)喚醒詞的獨立音區(qū)作為識別音區(qū),對所述識別音區(qū)的語音進行語音識別。
10.根據(jù)權利要求9所述的裝置,其特征在于,所述識別子單元還用于:
對所述識別音區(qū)的語音進行語音識別之后,判斷所述識別音區(qū)的識別過程是否結束;
若所述識別音區(qū)的識別過程已經(jīng)結束,則重新從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網(wǎng)絡技術(北京)有限公司,未經(jīng)百度在線網(wǎng)絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110970147.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種碳包覆鐵酸鋅催化劑的制備方法及其應用
- 下一篇:顯示膜片、殼體和電子設備





