[發明專利]語音交互方法、車輛、服務器、系統和存儲介質在審
| 申請號: | 202110432528.6 | 申請日: | 2021-04-21 |
| 公開(公告)號: | CN113031905A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 孫仿遜;胡梓垣;翁志偉 | 申請(專利權)人: | 廣州小鵬汽車科技有限公司 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16;G06F40/30;G06F16/33;G10L15/18;G10L15/183 |
| 代理公司: | 深圳市智圈知識產權代理事務所(普通合伙) 44351 | 代理人: | 周獻 |
| 地址: | 510640 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 交互 方法 車輛 服務器 系統 存儲 介質 | ||
本發明涉及語音技術領域,特別是涉及一種語音交互方法、車輛、服務器和存儲介質,方法包括:車輛接收用戶的語音請求,并將語音請求和當前車載系統圖形用戶界面的上下文信息發送至服務器;服務器根據上下文信息完成語音請求的自然語言理解處理;服務器利用自然語言理解處理結果,生成車輛可執行的指令并發送給車輛;車輛接收并執行該指令,同時將執行結果通過語音反饋給用戶。語音交互過程中服務器可以充分利用上下文信息完成自然語言理解處理,由于增加了更多維度的信息,用戶在車輛中看到圖形用戶界面上的任何內容都可以通過語音進行操作,進而提高了人機交互系統的交互質量。
相關申請的交叉引用
本申請要求于2020年06月28日提交的申請號為202010596817.5的中國申請的優先權,其在此處于所有目的通過引用將其全部內容并入本文。
技術領域
本發明涉及語音技術領域,特別是涉及一種語音交互方法、車輛、服務器、系統和存儲介質。
背景技術
隨著汽車智能化和語音技術的發展,語音在汽車上的運用越來越廣泛。在用戶駕駛車輛的過程中,能夠無接觸地實現用戶對車輛或者車輛上車載系統的控制,可以在保障行車安全的情況下增強用戶的使用體驗。
汽車智能化帶來了更強的車機芯片和圖形芯片,新一代車機芯片的算力以及圖形芯片的性能,使得在車載系統上實現像手機一樣更豐富的界面和更有趣味的動畫成為了一種可能。現在車輛上使用語音的方式經常是設置一個獨立的語音助理,在接收完用戶的語音請求后,通過服務器給予反饋。這種使用方式和車載系統的界面是完全獨立的,由于只利用語音信號,缺少更多維度的信息,使人機交互系統的交互質量難以令人滿意。
發明內容
鑒于上述問題,提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種語音交互方法、車輛、服務器、系統和存儲介質。
為了解決上述問題,本發明實施例公開了一種語音交互方法,應用于包括車輛和可與車輛進行通信的服務器組成的語音交互系統,其特征在于,包括:
車輛接收用戶的語音請求,并將語音請求和當前車載系統圖形用戶界面的上下文信息發送至服務器;
服務器根據上下文信息完成語音請求的自然語言理解處理;
服務器利用自然語言理解處理結果,生成車輛可執行的指令并發送給車輛;
車輛接收并執行該指令,同時將執行結果通過語音反饋給用戶。
進一步地,上下文信息包括當前車載系統圖形用戶界面中可操作的控件的名稱和類型、可操作的控件支持的動作、動作的取值范圍和可操作的控件當前的狀態。
進一步地,服務器根據上下文信息完成語音請求的自然語言理解處理,包括:
根據上下文信息創建場景語義空間;
對語音請求進行語義理解并輸出語義理解結果;
在場景語義空間,利用語義理解結果對可操作的控件進行檢索、召回、排序和匹配;
輸出可操作的控件響應該語音請求的操作作為自然語言理解處理結果。
進一步地,根據上下文信息創建場景語義空間,包括:
接收車輛發送的上下文信息;
載入并解析上下文信息中包括的場景元素;
根據場景元素生成場景語義文檔。
進一步地,對語音請求進行語義理解并輸出語義理解結果,包括:
對語音請求中的文本進行文本預處理和文本歸一化處理,然后提取句子主干;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州小鵬汽車科技有限公司,未經廣州小鵬汽車科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110432528.6/2.html,轉載請聲明來源鉆瓜專利網。





