[發(fā)明專利]多路語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910164535.5 | 申請日: | 2019-03-05 |
| 公開(公告)號: | CN109920405A | 公開(公告)日: | 2019-06-21 |
| 發(fā)明(設(shè)計)人: | 陳建哲;彭漢迎;歐陽能鈞 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/26;G10L25/03 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 胡艾青;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻采集 語音識別 音頻數(shù)據(jù) 語音信號 區(qū)域?qū)?yīng) 多路 可讀存儲介質(zhì) 語音識別結(jié)果 音頻信號 波束成形處理 多路音頻信號 麥克風(fēng)陣列 干擾抑制 噪音信號 識別率 采集 削弱 講話 | ||
本發(fā)明實施例提供一種多路語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì)。本發(fā)明實施例的方法,通過接收多路麥克風(fēng)陣列采集的音頻數(shù)據(jù),對每路音頻數(shù)據(jù)進(jìn)行波束成形處理,得到每路音頻數(shù)據(jù)中與對應(yīng)音頻采集區(qū)域?qū)?yīng)的音頻信號,削弱該路音頻數(shù)據(jù)中其他方向上的音頻信號;對多路音頻信號進(jìn)行干擾抑制處理得到每個音頻采集區(qū)域?qū)?yīng)語音信號,減少其他音頻采集區(qū)域的噪音信號對該路語音信號的干擾,對各語音信號語音識別得到每個音頻采集區(qū)域?qū)?yīng)的語音識別結(jié)果,提高了語音識別的識別率;在多人同時講話時,抑制各路語音信號間的相互干擾,得到每個音頻采集位置對應(yīng)的語音識別結(jié)果,提高了語音識別的效率和準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明實施例涉及語音識別技術(shù)領(lǐng)域,尤其涉及一種多路語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
目前,車輛上的車機(jī)都是只在前排設(shè)置一路雙聲道麥克風(fēng),包括左、右聲道兩個麥克風(fēng),主要用于采集正駕駛位附近的音頻數(shù)據(jù),通過對采集的音頻數(shù)據(jù)進(jìn)行語音識別,來識別司機(jī)向車機(jī)發(fā)出的指令等識別語。
但是,如果車輛上坐在副駕駛位或者后排座位的乘客向車機(jī)發(fā)出識別語時,由于聲源距離麥克風(fēng)較遠(yuǎn),麥克風(fēng)采集的音頻數(shù)據(jù)質(zhì)量較差,導(dǎo)致語音識別率很低,尤其在多人同時講識別語時,會造成混響,更加難以正確識別出識別語。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種多路語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì),用以解決現(xiàn)有技術(shù)中車輛上的語音識別方法的語音識別率很低的問題。
本發(fā)明實施例的一個方面是提供一種多路語音識別方法,包括:
接收多路麥克風(fēng)陣列采集的音頻數(shù)據(jù),每路所述麥克風(fēng)陣列指向車輛內(nèi)的一個音頻采集區(qū)域,用于采集一路音頻數(shù)據(jù);
根據(jù)每路麥克風(fēng)陣列相對于對應(yīng)音頻采集區(qū)域的位置,對每路所述音頻數(shù)據(jù)進(jìn)行波束成形處理,得到每路所述音頻數(shù)據(jù)中與對應(yīng)音頻采集區(qū)域?qū)?yīng)的音頻信號;
對多路所述音頻信號進(jìn)行干擾抑制處理,得到每個所述音頻采集區(qū)域?qū)?yīng)語音信號;
對各所述音頻采集區(qū)域?qū)?yīng)的語音信號進(jìn)行語音識別,得到每個所述音頻采集區(qū)域?qū)?yīng)的語音識別結(jié)果。
本發(fā)明實施例的另一個方面是提供一種多路語音識別裝置,包括:
數(shù)據(jù)獲取模塊,用于接收多路麥克風(fēng)陣列采集的音頻數(shù)據(jù),每路所述麥克風(fēng)陣列指向車輛內(nèi)的一個音頻采集區(qū)域,用于采集一路音頻數(shù)據(jù);
波束成形模塊,用于根據(jù)每路麥克風(fēng)陣列相對于對應(yīng)音頻采集區(qū)域的位置,對每路所述音頻數(shù)據(jù)進(jìn)行波束成形處理,得到每路所述音頻數(shù)據(jù)中與對應(yīng)音頻采集區(qū)域?qū)?yīng)的音頻信號;
干擾抑制處理模塊,用于對多路所述音頻信號進(jìn)行干擾抑制處理,得到每個所述音頻采集區(qū)域?qū)?yīng)語音信號;
語音識別模塊,用于對各所述音頻采集區(qū)域?qū)?yīng)的語音信號進(jìn)行語音識別,得到每個所述音頻采集區(qū)域?qū)?yīng)的語音識別結(jié)果。
本發(fā)明實施例的另一個方面是提供一種多路語音識別設(shè)備,包括:
存儲器,處理器,以及存儲在所述存儲器上并可在所述處理器上運行的計算機(jī)程序,
所述處理器運行所述計算機(jī)程序時實現(xiàn)上述所述的多路語音識別方法。
本發(fā)明實施例的另一個方面是提供一種計算機(jī)可讀存儲介質(zhì),存儲有計算機(jī)程序,
所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)上述所述的多路語音識別方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910164535.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種音頻調(diào)整方法、終端及計算機(jī)可讀存儲介質(zhì)
- 音頻數(shù)據(jù)識別方法及系統(tǒng)
- 消除背景音頻數(shù)據(jù)的方法、裝置和系統(tǒng)
- 音頻數(shù)據(jù)確定方法、裝置、設(shè)備和介質(zhì)
- 音頻分類的方法、裝置、設(shè)備以及存儲介質(zhì)
- 一種音頻處理方法及電子設(shè)備
- 一種音頻傳輸方法和裝置
- 一種音頻數(shù)據(jù)生成方法、音頻數(shù)據(jù)轉(zhuǎn)寫方法及其裝置
- 語音數(shù)據(jù)的處理方法、裝置及電子設(shè)備
- 模型訓(xùn)練、數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)





