[發(fā)明專利]車輛、音頻識別方法、裝置、設備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202111539665.6 | 申請日: | 2021-12-15 |
| 公開(公告)號: | CN114420114A | 公開(公告)日: | 2022-04-29 |
| 發(fā)明(設計)人: | 張道林;勾曉菲;李娟;汪亮 | 申請(專利權)人: | 北京羅克維爾斯科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L21/02;H04R1/40 |
| 代理公司: | 北京開陽星知識產(chǎn)權代理有限公司 11710 | 代理人: | 吳崇 |
| 地址: | 101300 北京市順義區(qū)高麗營*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 車輛 音頻 識別 方法 裝置 設備 介質(zhì) | ||
1.一種音頻識別方法,其特征在于,包括:
獲取至少一個原始音頻,每個所述原始音頻對應至少一個目標音區(qū),所述目標音區(qū)對應目標車輛的一個車廂位置;
針對所述目標音區(qū),對所述原始音頻中除所述目標音區(qū)之外的其他音區(qū)內(nèi)的音頻進行音區(qū)抑制,得到所述目標音區(qū)對應的音頻數(shù)據(jù);
將音區(qū)抑制得到的各個所述目標音區(qū)對應的所述音頻數(shù)據(jù)混合,得到待識別音頻;
利用所述待識別音頻,識別針對所述目標車輛的控制指令。
2.根據(jù)權利要求1所述的方法,其特征在于,
所述利用所述待識別音頻,識別針對所述目標車輛的控制指令,包括:
對所述待識別音頻進行文本轉換,得到轉換文本;
根據(jù)所述轉換文本,生成所述控制指令。
3.根據(jù)權利要求2所述的方法,其特征在于,
所述對所述待識別音頻進行文本轉換,得到轉換文本,包括:
對所述待識別音頻進行文本轉換,得到至少一個語音文本,每個所述語音文本對應一個發(fā)聲對象;
將滿足預設條件的所述語音文本,確定為所述轉換文本。
4.根據(jù)權利要求3所述的方法,其特征在于,
所述預設條件包括以下一者:
起始時間最早的語音文本;
結束時間最晚的語音文本;
最早出現(xiàn)關鍵詞的語音文本;
與目標發(fā)聲對象對應的語音文本,所述目標發(fā)聲對象是待識別音區(qū)的發(fā)聲對象。
5.根據(jù)權利要求3所述的方法,其特征在于,所述轉換文本為與目標發(fā)聲對象對應的語音文本,所述目標發(fā)聲對象是待識別音區(qū)的發(fā)聲對象;
在所述對所述待識別音頻進行文本轉換,得到至少一個語音文本之后,在所述將滿足預設條件的語音文本,確定為所述轉換文本之前,所述方法還包括:
記錄所述至少一個語音文本與所述至少一個語音文本對應的發(fā)聲對象之間的對應關系;
所述將滿足預設條件的語音文本,確定為所述轉換文本,包括:
確定所述目標發(fā)聲對象;
基于所記錄的所述對應關系,確定與所述目標發(fā)聲對象對應的語音文本;
將所述語音文本確定為所述轉換文本。
6.根據(jù)權利要求1所述的方法,其特征在于,在所述針對所述目標音區(qū),對所述原始音頻中除所述目標音區(qū)之外的其他音區(qū)內(nèi)的音頻進行音區(qū)抑制,得到所述目標音區(qū)對應的音頻數(shù)據(jù)之后,所述方法還包括:
判斷音區(qū)抑制得到的各個所述目標音區(qū)對應的音頻數(shù)據(jù)中是否包括待識別音區(qū)的音頻數(shù)據(jù);
其中,所述將音區(qū)抑制得到的各個所述目標音區(qū)對應的所述音頻數(shù)據(jù)混合,得到待識別音頻,包括:
若音區(qū)抑制得到的各個所述目標音區(qū)對應的所述音頻數(shù)據(jù)中不包括所述待識別音區(qū)的音頻數(shù)據(jù),對音區(qū)抑制得到的各個所述目標音區(qū)的音頻數(shù)據(jù)進行混音處理,得到所述待識別音頻;
若音區(qū)抑制得到的各個所述目標音區(qū)對應的音頻數(shù)據(jù)中包括所述待識別音區(qū)的音頻數(shù)據(jù),將所述待識別音區(qū)的音頻數(shù)據(jù)確定為所述待識別音頻。
7.根據(jù)權利要求1所述的方法,其特征在于,所述音區(qū)抑制得到的各個所述目標音區(qū)對應的所述音頻數(shù)據(jù)混合,得到待識別音頻,包括:
按照音區(qū)抑制得到的各個所述目標音區(qū)的重要排序,確定音區(qū)抑制得到的各個目標音區(qū)對應的所述音頻數(shù)據(jù)的音頻調(diào)整量;
針對每一所述音頻數(shù)據(jù),按照所述音頻數(shù)據(jù)的所述音頻調(diào)整量對所述音頻數(shù)據(jù)進行音頻調(diào)整,得到調(diào)整后的所述音頻數(shù)據(jù);
基于調(diào)整后的各個所述音頻數(shù)據(jù),生成所述待識別音頻。
8.根據(jù)權利要求1所述的方法,其特征在于,在所述利用所述待識別音頻,識別針對所述目標車輛的控制指令之后,所述方法還包括:
控制所述目標車輛的目標設備執(zhí)行所述控制指令對應的操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京羅克維爾斯科技有限公司,未經(jīng)北京羅克維爾斯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111539665.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





