[發明專利]車載語音識別方法、裝置、可讀存儲介質及電子設備在審
| 申請號: | 202010107278.4 | 申請日: | 2020-02-21 |
| 公開(公告)號: | CN111354363A | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 莫凡;孫玨;薛思皓;毛麗旦·玉素甫江 | 申請(專利權)人: | 鎂佳(北京)科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06 |
| 代理公司: | 北京臻之知識產權代理有限公司 11629 | 代理人: | 趙福梅 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 車載 語音 識別 方法 裝置 可讀 存儲 介質 電子設備 | ||
本公開涉及一種車載語音識別方法、裝置、可讀存儲介質及電子設備。方法包括:獲取車輛內的音頻信息;根據所述音頻信息和訓練后的語音識別模型,確定與所述音頻信息相匹配的文本信息;在對語音識別模型進行訓練時,由于是采用車輛內特定場景下的歷史音頻信息和與該歷史音頻信息相匹配的文本信息進行訓練的,所以,訓練后的語音識別模型能夠適應車載語音場景,進而在利用該語音識別模型對車輛內的音頻信息進行識別時,可以提高語音識別模型的識別率,以使語音識別模型準確地識別出文本信息,提升用戶的使用體驗。
技術領域
本公開涉及語音識別技術領域,具體地,涉及一種車載語音識別方法、裝置、可讀存儲介質及電子設備。
背景技術
隨著語音識別技術的快速發展,人們對車輛的要求越來越高,人們不只是希望能夠安全駕駛,在保證安全駕駛的前提下,人們同樣希望擁有良好的駕駛體驗。因此,越來越多的語音識別裝置安裝在車輛上(通常稱為車載語音識別系統),用戶可以通過語音或智能語音設備進行交互,控制智能語音設備執行相應的操作,實現對車輛的自動控制,提升整車高端化、技術化。
發明內容
本公開的目的是提供一種車載語音識別方法、裝置、可讀存儲介質及電子設備,以提高車載語音識別的準確率。
為了實現上述目的,本公開提供一種車載語音識別方法,包括:
獲取車輛內的音頻信息;
根據所述音頻信息和訓練后的語音識別模型,確定與所述音頻信息相匹配的文本信息;
其中,所述語音識別模型通過以下訓練方式得到:
獲取所述車輛內特定場景下的歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息;
根據所述歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息,對所述語音識別模型進行訓練,以得到訓練后的所述語音識別模型。
可選地,所述語音識別模型包括在線語音識別模型和離線語音識別模型,所述方法還包括:
根據所述在線語音識別模型輸出的文本信息,確定所述歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息;
所述根據所述歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息,對所述語音識別模型進行訓練,以得到訓練后的所述語音識別模型,包括:
根據所述歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息,對所述離線語音識別模型進行訓練,以得到訓練后的所述離線語音識別模型。
可選地,每一車輛各自對應不同的在線語音識別模塊、離線語音識別模型;所述根據所述在線語音識別模型輸出的文本信息,確定所述歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息,包括:
針對每一車輛,根據該車輛的在線語音識別模型輸出的文本信息,確定該車輛的所述歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息。
可選地,所述根據所述在線語音識別模型輸出的文本信息,確定所述歷史音頻信息以及與所述歷史音頻信息相匹配的歷史文本信息,包括:
獲取所述在線語音識別模型輸出的文本信息;
確定所述文本信息是否位于預設列表中,所述預設列表中包括所述車輛的車機端能夠執行的操作對應的文本信息;
若所述文本信息位于預設列表中,則存儲所述在線語音識別模型輸出的所述文本信息,以及與所述文本信息對應的音頻信息;
在所存儲的音頻信息達到預設數值時,將所存儲的所述音頻信息、所述文本信息分別作為所述歷史音頻信息、所述歷史文本信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鎂佳(北京)科技有限公司,未經鎂佳(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010107278.4/2.html,轉載請聲明來源鉆瓜專利網。





