[發(fā)明專利]一種用戶語音識別方法和裝置有效
| 申請?zhí)枺?/td> | 201910578720.9 | 申請日: | 2019-06-28 |
| 公開(公告)號: | CN110570843B | 公開(公告)日: | 2021-03-05 |
| 發(fā)明(設計)人: | 鞠向宇;趙曉朝;袁志偉;戴帥湘 | 申請(專利權)人: | 北京驀然認知科技有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/07;G10L15/187 |
| 代理公司: | 北京智丞瀚方知識產權代理有限公司 11810 | 代理人: | 楊樂 |
| 地址: | 100083 北京市海淀區(qū)學院*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 語音 識別 方法 裝置 | ||
本發(fā)明公開了一種用戶語音識別方法和裝置,所述方法包括:根據(jù)用戶的聲紋識別用戶,得到用戶ID;根據(jù)用戶ID判斷該用戶是否為首次接入用戶;如果該用戶是首次接入用戶,則根據(jù)該用戶的聲紋特征獲得用戶特征數(shù)據(jù),根據(jù)用戶特征數(shù)據(jù)加載對應的初始聲學模型和初始語言模型,并將所述用戶的初始聲學模型和/或初始語言模型分享到特定群體中進行訓練,得到與該用戶對應的聲學模型和語言模型;如果該用戶不是首次接入用戶,則根據(jù)該用戶ID,分別加載與該用戶對應的聲學模型和語言模型。通過本發(fā)明的方法和裝置,解決了不同用戶由于發(fā)音習慣,說話習慣,使用場景新詞而導致的識別效果差的問題。
技術領域
本發(fā)明實施例涉及語音識別技術領域,特別涉及一種用戶語音識別方法和 裝置。
背景技術
語音識別系統(tǒng)的模型通常由聲學模型和語言模型兩部分組成,分別對應于語 音到音節(jié)概率的計算和音節(jié)到字概率的計算。目前的語音識別中使用的聲學模 型和語言模型大都是通用模型,例如,隱馬爾可夫模型HMM和N-Gram。
但是目前的語音識別引擎識別效果還不夠準確,通用模型往往解決不了用 戶的發(fā)音習慣和說話習慣問題,例如當用戶說話語速較快或者使用發(fā)言導致前 后鼻音不分,發(fā)不了翹舌音等,又或者用戶的語言習慣不完全符合語法,如導 航去某地點,我要去,推薦吃飯的地方,附近有哪些好吃的等等,利用現(xiàn)有的 這些通用模型無法準確識別。
發(fā)明內容
針對現(xiàn)有技術中的問題,本發(fā)明提供一種用戶語音識別方法和裝置。
本發(fā)明提供一種用戶語音識別方法,其特征在于:
步驟100,根據(jù)用戶的聲紋識別用戶,得到用戶ID;
步驟101,根據(jù)用戶ID判斷該用戶是否為首次接入用戶;
步驟102,如果該用戶是首次接入用戶,則根據(jù)該用戶的聲紋特征獲得用戶 特征數(shù)據(jù),根據(jù)用戶特征數(shù)據(jù)加載對應的初始聲學模型和初始語言模型;
步驟103,如果該用戶不是首次接入用戶,則根據(jù)該用戶ID,分別加載與 該用戶對應的聲學模型和語言模型。
進一步的,所述步驟102之后還包括步驟1021,對所述初始聲學模型和初 始語言模型進行訓練,得到與該用戶對應的聲學模型和語言模型。
進一步的,所述步驟1021中,所述對初始聲學模型和初始語言模型進行訓 練,得到與該用戶對應的聲學模型和語言模型具體為:
根據(jù)該用戶的語音識別記錄該用戶的常用高頻詞和/或不同場景常用的前 綴詞,積累用戶數(shù)據(jù),持續(xù)調整所述初始語言模型以得到與該用戶對應的聲學 模型和語言模型。
優(yōu)選的,所述步驟1021中,還包括將所述用戶的初始聲學模型和/或初始 語言模型分享到特定群體中進行訓練。
進一步的,所述用戶將初始聲學模型和/或初始語言模型分享到特定群體中 進行訓練具體為:
所述用戶將所述初始聲學模型分享到與該用戶具有相同或相似發(fā)音習慣的 群體中進行訓練;和/或所述用戶將所述初始語言模型分享到與該用戶具有相同 或相似的語言習慣的群體中進行訓練。
進一步的,所述根據(jù)用戶特征數(shù)據(jù)加載對應的初始聲學模型和初始語言模 型具體為通過聲紋識別所述用戶的地域和/或性別和/或年齡,對應的加載初始 聲學模型。
進一步的,所述用戶向特定群體或其他用戶分享與所述用戶對應的語言模 型或聲學模型;和/或,所述用戶調用其他群體或其他用戶的語言模型作為該用 戶的初始語言模型和/或所述用戶調用其他群體或其他用戶的聲學模型作為該 用戶的初始聲學模型。
本發(fā)明提供一種用戶語音識別裝置,其特征在于,所述裝置包括:
識別模塊,根據(jù)用戶的聲紋識別用戶,得到用戶ID;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京驀然認知科技有限公司,未經北京驀然認知科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910578720.9/2.html,轉載請聲明來源鉆瓜專利網。





