[發(fā)明專利]多音區(qū)語音識別方法、裝置及存儲介質在審

申請?zhí)枺?/td>	202110970147.3	申請日：	2018-09-29
公開（公告）號：	CN113658588A	公開（公告）日：	2021-11-16
發(fā)明（設計）人：	歐陽能鈞;梁啟仍;宋曄	申請（專利權）人：	百度在線網(wǎng)絡技術（北京）有限公司
主分類號：	G10L15/20	分類號：	G10L15/20;G10L15/26;G10L21/0216;G10L21/0272
代理公司：	北京市鑄成律師事務所 11313	代理人：	王云紅;賈慧娜
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	多音語音識別方法裝置存儲介質
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種多音區(qū)語音識別方法，其特征在于，包括：

使用麥克風模組收集語音采集環(huán)境中的語音，其中，預先為所述麥克風模組中的每個麥克風設置目標音區(qū)，所述目標音區(qū)是預先設定的所述語音采集環(huán)境中的多個獨立音區(qū)中的一個；判斷所述語音是否來自目標音區(qū)；

對來自除所述目標音區(qū)之外的其他音區(qū)的語音進行抑制；

接收來自所述麥克風模組中的多個麥克風的抑制后的語音；

從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別。

2.根據(jù)權利要求1所述的方法，其特征在于，從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別，包括：

識別所述多個麥克風的目標音區(qū)中是否有某個獨立音區(qū)的語音中出現(xiàn)喚醒詞；

若識別出某個獨立音區(qū)的語音中出現(xiàn)喚醒詞，則選擇出現(xiàn)喚醒詞的獨立音區(qū)作為識別音區(qū)，對所述識別音區(qū)的語音進行語音識別。

3.根據(jù)權利要求2所述的方法，其特征在于，對所述識別音區(qū)的語音進行語音識別之后，還包括：

判斷所述識別音區(qū)的識別過程是否結束；

若所述識別音區(qū)的識別過程已經(jīng)結束，則重新從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別。

4.根據(jù)權利要求1-3中任一項所述的方法，其特征在于，所述語音采集環(huán)境包括車載環(huán)境；所述麥克風模組包括布置于前排頂燈位置的第一麥克風模組和布置于后排扶手箱出風口位置的第二麥克風模組，或者所述麥克風模組包括布置于前排頂燈位置的第一麥克風模組和布置于后排天窗邊緣位置的第三麥克風模組。

5.根據(jù)權利要求4所述的方法，其特征在于，對抑制后的語音進行識別之前，還包括：

接收來自車機系統(tǒng)的所述抑制后的語音，其中，所述抑制后的語音是由所述麥克風模組通過音頻總線傳輸給所述車機系統(tǒng)的。

6.根據(jù)權利要求5所述的方法，其特征在于，還包括：

設置所述車機系統(tǒng)的時分傳輸機制的隊列排布方式，以適于傳輸所述抑制后的語音。

7.根據(jù)權利要求1-3中任一項所述的方法，其特征在于，對抑制后的語音進行識別之后，還包括：

根據(jù)語音識別的結果產(chǎn)生對所述抑制后的語音的響應信息；

展示所述語音識別的結果及所述響應信息。

8.一種多音區(qū)語音識別裝置，其特征在于，包括：

語音采集單元，用于使用麥克風模組收集語音采集環(huán)境中的語音，其中，預先為所述麥克風模組中的每個麥克風設置目標音區(qū)，所述目標音區(qū)是預先設定的所述語音采集環(huán)境中的多個獨立音區(qū)中的一個；

判斷單元，用于判斷所述語音是否來自目標音區(qū)；

抑制單元，用于對來自除所述目標音區(qū)之外的其他音區(qū)的語音進行抑制；

語音識別單元，包括接收子單元和識別子單元，其中，所述接收子單元用于接收來自所述麥克風模組中的多個麥克風的抑制后的語音；所述識別子單元用于從所述多個麥克風的目標音區(qū)中選擇一個獨立音區(qū)進行語音識別。