[發明專利]通過無線電廣播的持續性訓練和發音改進在審
| 申請號: | 201811073250.2 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN109523996A | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | G·塔瓦爾;K·R·布克;X·F·趙 | 申請(專利權)人: | 通用汽車環球科技運作有限責任公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/30;G10L15/06;H04W4/44;H04B1/3822 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 王麗輝 |
| 地址: | 美國密*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻數據 語音模式 發音 廣播 無線電廣播 發射機 接收廣播 統計分析 持續性 處理器 服務器 數據庫 傳送 語音 改進 | ||
處理器在車輛中接收廣播,從廣播中選擇音頻數據,處理從廣播中選擇的音頻數據,基于處理確定選擇的音頻數據的語音模式,從廣播中選擇和選擇的音頻數據相似的音頻數據的附加實例,處理來自廣播的音頻數據的附加實例,確定音頻數據的附加實例的語音模式,以及從選擇的音頻數據的語音模式和音頻數據的附加實例的語音模式中選擇多個語音模式。發射機將多個語音模式傳送至服務器,以基于對多個語音模式的統計分析確定選擇的音頻數據的最優發音并將選擇的音頻數據的最優發音添加到用來在車輛中識別語音的數據庫。
引言
在此章節中提供的信息是用于大體呈現本公開背景的目的。當前署名的發明人的工作就其在本章節所描述的以及在提交時可以不另外被作為是現有技術的多個方面的描述而言既不明確地也不隱含地被認可為是本公開的現有技術。
本公開大體上涉及語音識別系統,并且更具體地,涉及通過無線電廣播用于語音識別系統的持續性訓練和發音改進。
語音(Speech)識別系統(也被稱為語音(voice)識別系統)在車輛、個人計算設備等等中得到使用。例如,在車輛中,駕駛員可以使用這些系統來發出發起電話呼叫的語音命令、向導航系統發出搜索感興趣地方的語音命令,等等。在個人計算設備中,例如計算機和智能電話,用戶可以向瀏覽器發出在因特網上沖浪的語音命令。在其他實例中,一些軟件程序可以采用用戶的口述內容(即,將用戶的語音轉換成文本)。
發明內容
一種系統包括處理器,所述處理器配置為:在車輛中接收廣播,從在車輛中接收的廣播選擇音頻數據,基于處理確定選擇的音頻數據的語音模式,從廣播中選擇和選擇的音頻數據相似的音頻數據的附加實例,處理來自廣播的音頻數據的附加實例,確定音頻數據的附加實例的語音模式,以及從選擇的音頻數據的語音模式和音頻數據的附加實例的語音模式中選擇多個語音模式。該系統進一步包括發射機,該發射機被配置將多個語音模式傳送至服務器,以基于對多個語音模式的統計分析確定選擇的音頻數據的最優發音,并將選擇的音頻數據的該最優發音添加到用來在車輛中識別語音的數據庫。
在其他特征中,車輛中的廣播包括無線電廣播。處理器被配置為從車輛的乘員接收語音輸入。發射機被配置為將對應于該語音輸入的數據傳送至服務器。發射機被配置為通過蜂窩網絡將對應于語音數據的輸入作為音頻或作為語音模式傳送至服務器。系統進一步包括接收機,該接收機被配置為根據服務器利用數據庫對對應于語音輸入的數據的處理,從服務器接收對語音輸入的響應。該響應基于利用數據庫對語音輸入的正確識別,而不管與該語音輸入相關聯的發音如何。
在其他特征中,處理器被配置為從選擇的音頻數據的語音模式和音頻數據的附加實例的語音模式中選擇在預定范圍內匹配的多個語音模式。
在其他特征中,統計分析包括蒙特卡洛模擬,并且最優發音基于蒙特卡洛模擬的結果的分布的平均值是否大于或等于預定閾值來確定。
在其他特征中,數據庫包括針對包括選擇的音頻數據的數據類型的語音詞典和語言模型中的一個或多個。
在其他特征中,選擇的音頻數據包括人的姓名、地方的名稱、人的位置、地方的位置、音樂專輯的名稱、歌曲的標題或者藝術家的姓名。
在其他特征中,處理器被配置為利用字素到音素對應確定選擇的音頻數據的語音模式和音頻數據的附加實例的語音模式。
在其他特征中,系統進一步包括接收機,該接收機被配置為基于數據庫從服務器接收對車輛乘員的語音請求的響應。發射機和接收機被配置為通過蜂窩網絡與服務器進行通信。
在其他特征中,系統進一步包括接收機,該接收機被配置為基于數據庫從服務器接收對車輛乘員的語音請求的響應。該語音請求包括:人的姓名、地方的名稱、人的位置、地方的位置、音樂專輯的名稱、歌曲的標題或者藝術家的姓名。
在其他特征中,處理器被配置從車輛乘員接收語音輸入。并且基于利用數據庫對語音輸入的正確識別提供響應,而不管與該語音輸入相關聯的發音如何。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于通用汽車環球科技運作有限責任公司,未經通用汽車環球科技運作有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811073250.2/2.html,轉載請聲明來源鉆瓜專利網。





