[發(fā)明專利]一種人體語音識別傳輸方法及系統(tǒng)在審

申請?zhí)枺?/td>	201810099028.3	申請日：	2018-01-31
公開（公告）號：	CN108417203A	公開（公告）日：	2018-08-17
發(fā)明（設計）人：	鄭英	申請（專利權）人：	廣東聚晨知識產權代理有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/06;G10L15/22
代理公司：	佛山市智匯聚晨專利代理有限公司 44409	代理人：	張艷梅
地址：	528000 廣東省佛山市禪城區(qū)季***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別語音數(shù)據(jù) 傳輸方法及系統(tǒng) 發(fā)音方式用戶人體語音指令特征點預處理語音識別技術調整參數(shù) 語音采集傳輸
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種人體語音識別傳輸方法及系統(tǒng)，屬于語音識別技術領域，所述方法包括：采集用戶人體的語音數(shù)據(jù)；預處理所述語音數(shù)據(jù)；提取所述語音數(shù)據(jù)的特征點；選擇對應于提取的所述特征點的發(fā)音方式模型；通過使用所選擇的發(fā)音方式模型來調整參數(shù)，所述參數(shù)是用于識別語音指令的基準；基于調整的所述參數(shù)來識別所述用戶人體的所述語音指令。利用本發(fā)明實施例，能夠實現(xiàn)人體語音的識別跟傳輸，提高語音識別性能。

技術領域

本發(fā)明涉及語音識別技術領域，尤其涉及一種人體語音識別傳輸方法及系統(tǒng)。

背景技術

人機接口 (HMI) 使用戶通過視覺、聽覺、或觸覺與機器進行交流。為了最小化駕駛員的注意力轉移并且提高便利性，已嘗試使用語音識別作為車輛內的HMI。根據(jù)常規(guī)的人體語音識別傳輸系統(tǒng)，使用標準語言的各種用戶人體的聲音被存儲為語音數(shù)據(jù)，并且使用該語音數(shù)據(jù)來執(zhí)行語音識別。然而，在這種系統(tǒng)中，難以保證語音識別性能，這是因為使用語音識別功能的用戶人體的發(fā)音方式例如發(fā)音語調、發(fā)音速度、以及方言等通常不同于對應于語音數(shù)據(jù)的發(fā)音方式。

發(fā)明內容

本發(fā)明提供了一種人體語音識別傳輸方法及系統(tǒng)，具有以下優(yōu)點：基于針對每個區(qū)域的語音數(shù)據(jù)生成針對每個區(qū)域的發(fā)音方式模型；選擇對應于提取的特征點的發(fā)音方式模型；以及調整參數(shù)，該參數(shù)是用于識別語音識別指令的基準。

為達到上述目的，本發(fā)明公開了一種人體語音識別傳輸方法，所述方法包括：

采集用戶人體的語音數(shù)據(jù)；

預處理所述語音數(shù)據(jù)；

提取所述語音數(shù)據(jù)的特征點；

選擇對應于提取的所述特征點的發(fā)音方式模型；

通過使用所選擇的發(fā)音方式模型來調整參數(shù)，所述參數(shù)是用于識別語音指令的基準；

基于調整的所述參數(shù)來識別所述用戶人體的所述語音指令。

可選的，所述預處理所述語音數(shù)據(jù)的步驟包括：

將模擬語音數(shù)據(jù)轉換為數(shù)字語音數(shù)據(jù)；

校正所述語音數(shù)據(jù)的增益；

以及消除所述語音數(shù)據(jù)中的噪聲。

可選的，所述發(fā)音方式模型由以下步驟生成：