[發明專利]語音識別方法、裝置、設備和存儲介質在審
| 申請號: | 202111055499.2 | 申請日: | 2019-03-11 |
| 公開(公告)號: | CN113782019A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 陳建哲;張騰飛;向偉 | 申請(專利權)人: | 百度國際科技(深圳)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/20;G10L21/02;G10L21/0216;G01S5/18 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 曹遠;段丹輝 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 設備 存儲 介質 | ||
本發明實施例提出一種語音識別方法、裝置、設備和存儲介質。其中,所述語音識別方法可以包括:獲取來自多個位置的多路喚醒語音信號;對所述多路喚醒語音信號進行聲源定位,確定喚醒語音位置;對所述喚醒語音位置之外的其他位置的音頻信號進行抑制,以得到待識別信號;對所述待識別信號進行語音識別。通過先確定出喚醒語音位置,可以對其他位置的音頻信號進行抑制,從而保持喚醒語音位置的語音的有效性,減少其他位置的噪聲信號對語音識別的影響,減少對喚醒語音位置的干擾。
本申請是申請日為2019年03月11日、申請號為201910180338.2、發明名稱為“語音識別方法、裝置、設備和存儲介質”的中國專利申請的分案申請。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種語音識別方法、裝置、設備和存儲介質。
背景技術
目前的車載語音識別系統,通常只允許安靜的環境下,某個特定位置人進行語音輸入。但是,在車載環境下,經常出現車上有多人說話的場景。例如,有人在打電話,同時另外有其他人想語音發起導航之類的操作。此時如果電話的聲音被車機的麥克風錄入,可能造成車機出現很多誤識別。
發明內容
本發明實施例提供一種語音識別方法、裝置、設備和存儲介質,以解決現有技術中的一個或多個技術問題。
第一方面,本發明實施例提供了一種語音識別方法,包括:
獲取來自多個位置的多路喚醒語音信號;
對所述多路喚醒語音信號進行聲源定位,確定喚醒語音位置;
對所述喚醒語音位置之外的其他位置的音頻信號進行抑制,以得到待識別信號;
對所述待識別信號進行語音識別。
在本發明的一個實施例中,對所述多路喚醒語音信號進行聲源定位,確定喚醒語音位置,包括:
利用所述多路喚醒語音信號的信號能量進行聲源定位,將信號能量最大的一路喚醒語音信號對應的位置確定為喚醒語音位置。
在本發明的一個實施例中,該方法還包括:
利用波束成形的方式調整麥克風陣列的角度,以使得所述麥克風陣列朝向所述喚醒語音位置。
在本發明的一個實施例中,對所述喚醒語音位置之外的其他位置的音頻信號進行抑制,以得到待識別信號,包括:
接收所述喚醒語音位置的麥克風的第一語音信號;
接收所述其他位置的各麥克風的第二語音信號;
利用數字信號處理器從所述第一語音信號中消除各所述第二語音信號,以得到待識別信號。
在本發明的一個實施例中,對所述喚醒語音位置之外的其他位置的音頻信號進行抑制,以得到待識別信號,包括:
控制所述其他位置的麥克風停止收音;
接收所述喚醒語音位置的麥克風的待識別信號。
第二方面,本發明實施例提供了一種語音識別裝置,包括:
獲取單元,用于獲取來自多個位置的多路喚醒語音信號;
聲源定位單元,用于對所述多路喚醒語音信號進行聲源定位,確定喚醒語音位置;
抑制單元,用于對所述喚醒語音位置之外的其他位置的音頻信號進行抑制,以得到待識別信號;
識別單元,用于對所述待識別信號進行語音識別。
在本發明的一個實施例中,所述聲源定位單元還用于利用所述多路喚醒語音信號的信號能量進行聲源定位,將信號能量最大的一路喚醒語音信號對應的位置確定為喚醒語音位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度國際科技(深圳)有限公司,未經百度國際科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111055499.2/2.html,轉載請聲明來源鉆瓜專利網。





