[發(fā)明專利]車載多音區(qū)語音交互方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202310057346.4 | 申請(qǐng)日: | 2023-01-19 |
| 公開(公告)號(hào): | CN115881125B | 公開(公告)日: | 2023-05-23 |
| 發(fā)明(設(shè)計(jì))人: | 吳俊楠;湯欣鈺;高鵬;王育軍 | 申請(qǐng)(專利權(quán))人: | 小米汽車科技有限公司;北京小米松果電子有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;B60R16/037;G10L25/18 |
| 代理公司: | 北京法勝知識(shí)產(chǎn)權(quán)代理有限公司 11922 | 代理人: | 黃海艷 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 車載 多音 語音 交互 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種車載多音區(qū)語音交互方法,其特征在于,車輛座艙內(nèi)設(shè)置兩對(duì)麥克風(fēng),所述兩對(duì)麥克風(fēng)形成多個(gè)音區(qū),所述方法包括:
對(duì)所述兩對(duì)麥克風(fēng)中的目標(biāo)麥克風(fēng)采集的語音信號(hào)進(jìn)行頻域轉(zhuǎn)換,以獲取所述目標(biāo)麥克風(fēng)采集的語音信號(hào)對(duì)應(yīng)的頻譜信號(hào),其中,所述頻譜信號(hào)上包括多個(gè)頻點(diǎn);
針對(duì)所述頻譜信號(hào)上的每個(gè)頻點(diǎn),確定第一對(duì)麥克風(fēng)采集的語音信號(hào)在所述每個(gè)頻點(diǎn)上的第一相位差及第二對(duì)麥克風(fēng)采集的語音信號(hào)在所述每個(gè)頻點(diǎn)上的第二相位差;
根據(jù)所述每個(gè)頻點(diǎn)對(duì)應(yīng)的第一相位差和第二相位差,確定所述每個(gè)頻點(diǎn)所屬的音區(qū);
根據(jù)各頻點(diǎn)所屬的音區(qū),確定每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào);
根據(jù)所述每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào)的識(shí)別結(jié)果,控制相應(yīng)車載設(shè)備執(zhí)行相應(yīng)動(dòng)作;
其中,在所述對(duì)所述兩對(duì)麥克風(fēng)中的目標(biāo)麥克風(fēng)采集的語音信號(hào)進(jìn)行頻域轉(zhuǎn)換,以獲取所述目標(biāo)麥克風(fēng)采集的語音信號(hào)對(duì)應(yīng)的頻譜信號(hào)之前,還包括:
獲取每個(gè)麥克風(fēng)采集的語音信號(hào);
根據(jù)所述語音信號(hào)的強(qiáng)度,確定聲源所屬的音區(qū);
根據(jù)所述聲源所屬的音區(qū),從所述兩對(duì)麥克風(fēng)中確定出所述目標(biāo)麥克風(fēng)。
2.如權(quán)利要求1所述的方法,其特征在于,所述第一對(duì)麥克風(fēng)將所述座艙分為前方區(qū)域和后方區(qū)域,所述第二對(duì)麥克風(fēng)將所述座艙分為左側(cè)區(qū)域和右側(cè)區(qū)域,所述根據(jù)所述每個(gè)頻點(diǎn)對(duì)應(yīng)的第一相位差和第二相位差,確定所述每個(gè)頻點(diǎn)所屬的音區(qū),包括:
根據(jù)所述第一相位差,從所述前方區(qū)域和所述后方區(qū)域中確定出所述每個(gè)頻點(diǎn)所屬的第一位置區(qū)域;
根據(jù)所述第二相位差,從所述左側(cè)區(qū)域和所述左側(cè)區(qū)域中確定出所述每個(gè)頻點(diǎn)所屬的第二位置區(qū)域;
根據(jù)所述第一位置區(qū)域與所述第二位置區(qū)域之間的交集,確定所述每個(gè)頻點(diǎn)所屬的音區(qū)。
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各頻點(diǎn)所屬的音區(qū),確定每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào),包括:
根據(jù)所述各頻點(diǎn)所屬的音區(qū),確定每個(gè)音區(qū)對(duì)應(yīng)的掩碼信息;
根據(jù)所述掩碼信息和任一麥克風(fēng)采集的語音信號(hào),確定所述每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào)。
4.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各頻點(diǎn)所屬的音區(qū),確定每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào),包括:
根據(jù)所述各頻點(diǎn)所屬的音區(qū),確定屬于同一音區(qū)的頻點(diǎn);
將屬于同一音區(qū)的頻點(diǎn)按照時(shí)間順序進(jìn)行組合,以獲取所述每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào)。
5.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào)的識(shí)別結(jié)果,控制相應(yīng)車載設(shè)備執(zhí)行相應(yīng)動(dòng)作,包括:
利用預(yù)先訓(xùn)練的降噪模型,對(duì)每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào)進(jìn)行降噪處理,以獲取降噪信號(hào);
對(duì)所述每個(gè)音區(qū)對(duì)應(yīng)的降噪信號(hào)進(jìn)行語音識(shí)別,以獲取識(shí)別結(jié)果;
根據(jù)所述識(shí)別結(jié)果控制相應(yīng)車載設(shè)備執(zhí)行相應(yīng)動(dòng)作。
6.一種車載多音區(qū)語音交互裝置,其特征在于,車輛座艙內(nèi)設(shè)置兩對(duì)麥克風(fēng),所述兩對(duì)麥克風(fēng)形成多個(gè)音區(qū),所述裝置包括:
轉(zhuǎn)換模塊,用于對(duì)所述兩對(duì)麥克風(fēng)中的目標(biāo)麥克風(fēng)采集的語音信號(hào)進(jìn)行頻域轉(zhuǎn)換,以獲取所述目標(biāo)麥克風(fēng)采集的語音信號(hào)對(duì)應(yīng)的頻譜信號(hào),其中,所述頻譜信號(hào)上包括多個(gè)頻點(diǎn);
第一確定模塊,用于針對(duì)所述頻譜信號(hào)上的每個(gè)頻點(diǎn),確定第一對(duì)麥克風(fēng)采集的語音信號(hào)在所述每個(gè)頻點(diǎn)上的第一相位差及第二對(duì)麥克風(fēng)采集的語音信號(hào)在所述每個(gè)頻點(diǎn)上的第二相位差;
第二確定模塊,用于根據(jù)所述每個(gè)頻點(diǎn)對(duì)應(yīng)的第一相位差和第二相位差,確定所述每個(gè)頻點(diǎn)所屬的音區(qū);
第三確定模塊,用于根據(jù)各頻點(diǎn)所屬的音區(qū),確定每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào);
控制模塊,用于根據(jù)所述每個(gè)音區(qū)對(duì)應(yīng)的語音信號(hào)的識(shí)別結(jié)果,控制相應(yīng)車載設(shè)備執(zhí)行相應(yīng)動(dòng)作;
獲取模塊,用于獲取每個(gè)麥克風(fēng)采集的語音信號(hào);
第四確定模塊,用于根據(jù)所述語音信號(hào)的強(qiáng)度,確定聲源所屬的音區(qū);
第五確定模塊,用于根據(jù)所述聲源所屬的音區(qū),從所述兩對(duì)麥克風(fēng)中確定出所述目標(biāo)麥克風(fēng)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于小米汽車科技有限公司;北京小米松果電子有限公司,未經(jīng)小米汽車科技有限公司;北京小米松果電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310057346.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 文字輸入方法及文字輸入裝置
- 多音字預(yù)測(cè)方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 確定多音字發(fā)音的方法及裝置
- 多音字預(yù)測(cè)方法及消歧方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種多音字讀音消歧裝置及方法
- 多音字的識(shí)別方法、裝置、可讀介質(zhì)和電子設(shè)備
- 多音字處理方法及裝置、模型訓(xùn)練方法及裝置
- 文本注音方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 多音字的注音方法及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 多音字處理方法及裝置





