[發明專利]車載多音區語音交互方法、裝置、電子設備和存儲介質有效
| 申請號: | 202310057346.4 | 申請日: | 2023-01-19 |
| 公開(公告)號: | CN115881125B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 吳俊楠;湯欣鈺;高鵬;王育軍 | 申請(專利權)人: | 小米汽車科技有限公司;北京小米松果電子有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;B60R16/037;G10L25/18 |
| 代理公司: | 北京法勝知識產權代理有限公司 11922 | 代理人: | 黃海艷 |
| 地址: | 100176 北京市大興區北京經*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 車載 多音 語音 交互 方法 裝置 電子設備 存儲 介質 | ||
本申請提出一種車載多音區語音交互方法、裝置、電子設備和存儲介質,其中,方法包括:對兩對麥克風中的目標麥克風采集的語音信號進行頻域轉換,以獲取頻譜信號;針對頻譜信號上的每個頻點,確定第一對麥克風采集的語音信號在每個頻點上的第一相位差及第二對麥克風采集的語音信號在每個頻點上的第二相位差;根據每個頻點對應的第一相位差和第二相位差,確定每個頻點所屬的音區;根據各頻點所屬的音區,確定每個音區對應的語音信號;根據每個音區對應的語音信號的識別結果,控制相應車載設備執行相應動作。該方法可以有效地將各個音區的語音信號分離開,使得各個音區獨立交互,互不影響,提高了各座位上語音交互的精準性。
技術領域
本申請涉及車聯網技術領域,尤其涉及一種車載多音區語音交互方法、裝置、電子設備和存儲介質。
背景技術
語音在車輛智能座艙的設計中處于核心地位。人與座艙之間的語音交互容易受到車內其他人聲干擾,影響交互體驗。
相關技術中,可以采用波束方法將主駕駛和副駕駛的音區分隔開,將后排左右兩個音區分割開。但是,波束對干擾的壓制性能有限,并且主駕駛或者副駕駛說話,在后排的兩個麥克風也能接收到完整的信號,若后排乘客說話,前排的麥克風也能接收到完整的信號,從而會影響各座位上語音交互的精準性。
發明內容
本申請提出一種車載多音區語音交互方法、裝置、電子設備和存儲介質。具體方案如下:
本申請一方面實施例提出了一種車載多音區語音交互方法,車輛座艙內設置兩對麥克風,兩對麥克風形成多個音區,該方法包括:
對兩對麥克風中的目標麥克風采集的語音信號進行頻域轉換,以獲取目標麥克風采集的語音信號對應的頻譜信號;
針對頻譜信號上的每個頻點,確定第一對麥克風采集的語音信號在每個頻點上的第一相位差及第二對麥克風采集的語音信號在每個頻點上的第二相位差;
根據每個頻點對應的第一相位差和第二相位差,確定每個頻點所屬的音區;
根據各頻點所屬的音區,確定每個音區對應的語音信號;
根據每個音區對應的語音信號的識別結果,控制相應車載設備執行相應動作。
本申請另一方面方面實施例提出了一種車載多音區語音交互裝置,車輛座艙內設置兩對麥克風,兩對麥克風形成多個音區,該裝置包括:
轉換模塊,用于對兩對麥克風中的目標麥克風采集的語音信號進行頻域轉換,以獲取目標麥克風采集的語音信號對應的頻譜信號;
第一確定模塊,用于針對頻譜信號上的每個頻點,確定第一對麥克風采集的語音信號在每個頻點上的第一相位差及第二對麥克風采集的語音信號在每個頻點上的第二相位差;
第二確定模塊,用于根據每個頻點對應的第一相位差和第二相位差,確定每個頻點所屬的音區;
第三確定模塊,用于根據各頻點所屬的音區,確定每個音區對應的語音信號;
控制模塊,用于根據每個音區對應的語音信號的識別結果,控制相應車載設備執行相應動作。
本申請另一方面實施例提出了一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時,實現如前述一方面所述的方法。
本申請另一方面實施例提出了一種非臨時性計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如前述一方面所述的方法。
本申請另一方面實施例提出了一種計算機程序產品,其上存儲有計算機程序,所述程序被處理器執行時實現如前述一方面所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于小米汽車科技有限公司;北京小米松果電子有限公司,未經小米汽車科技有限公司;北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310057346.4/2.html,轉載請聲明來源鉆瓜專利網。





