[發明專利]語音識別方法及裝置有效
| 申請號: | 201610156615.2 | 申請日: | 2016-03-18 |
| 公開(公告)號: | CN105654955B | 公開(公告)日: | 2019-11-12 |
| 發明(設計)人: | 何占盈;徐斌;高海東 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L17/04 | 分類號: | G10L17/04;G10L17/02;G10L17/14;H04L29/08 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 陶敏;劉芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 | ||
本發明實施例提供一種語音識別方法及裝置,包括:獲取第一聲學模型,所述第一聲學模型表示輸入的語音信號與預設狀態的映射關系,所述預設狀態為與所述語音信號對應的文本的基本組成元素;接收第一語音信號;根據所述第一語音信號及第二聲學模型確定所述預設狀態的概率值;所述第二聲學模型是根據輸入的第二語音信號及所述第一聲學模型確定得到的,所述第一語音信號及所述第二語音信號是由相同的用戶輸入的;所述語音信號包括所述第一語音信號及所述第二語音信號;根據預設的語言模型及詞典將所述第一語音信號對應的所述預設狀態的概率值解碼為第一文本。本發明實施例提供的語音識別方法及裝置,可以提高對特定用戶輸入的語音的識別精確度。
技術領域
本發明實施例涉及信息技術領域,尤其涉及一種語音識別方法及裝置。
背景技術
語音識別技術是機器通過識別和理解過程將人發出的聲音、字節或短語轉換為相應的文字或符號,或者給出響應的一種信息技術。隨著信息技術的飛速發展,語音識別技術已經廣泛地應用于人們的日常生活中。例如:使用終端設備時,采用語音識別技術,用戶可以通過輸入語音的方式方便地在終端設備中輸入信息。
現有的語音識別技術采用的語音識別方法有多種,例如:模型匹配法、概率模型法等。目前業界通常采用的是概率模型法語音識別技術。概率模型法語音識別技術,是通過云端對大量的不同用戶輸入的語音進行聲學訓練,得到一個通用的聲學模型,根據所述通用的聲學模型及語言模型將待識別的語音信號解碼為文本輸出。
但是,由于現有技術中的語音識別方法采用的是對大量不同用戶的輸入語音進行訓練得到的通用聲學模型,當針對特定用戶輸入的語音進行識別時,識別結果不夠精準。
發明內容
本發明實施例提供一種語音識別方法及裝置,用以解決現有技術中的語音識別方法針對特定用戶輸入的語音進行識別時,識別結果不夠精準的問題。
第一方面,本發明實施例提供一種語音識別方法。該方法包括:語音識別裝置獲取用于表示輸入的語音信號與預設狀態的映射關系的第一聲學模型,其中,預設狀態表示與語音信號對應的文本的基本組成元素。語音信號包括第一語音信號及第二語音信號。語音識別裝置接收用戶輸入的第一語音信號后,根據第一語音信號及第二聲學模型確定預設狀態的概率值。其中,所述第二聲學模型是語音識別裝置根據相同用戶輸入的第二語音信號及第一聲學模型確定得到的。語音識別裝置內預設語言模型及詞典,其中,語言模型用于表示預設狀態與語音信號對應的文本之間映射關系的語言模型,詞典中包括組成所述文本的詞語的集合。語音識別裝置根據預設的語言模型及詞典將第一語音信號對應的預設狀態的概率值解碼為第一文本。
本發明實施提供的語音識別方法,根據用戶輸入的第二語音信號及第一聲學模型確定第二聲學模型,使得所述第二聲學模型與所述用戶發音特征更加匹配,根據所述第二聲學模型可以更準確地確定所述用戶輸入的第一語音信號對應的預設狀態的概率值,將所述預設狀態的概率值解碼為文本時,可以得到更準確的語音識別結果。
一種可能的實施方式中,該方法還包括:語音識別裝置根據第二語音信號及第一聲學模型確定第二聲學模型。語音識別裝置先根據第二語音信號及第一聲學模型,計算得到第二語音信號對應的預設狀態的實際概率值;然后根據第二語音信號對應的預設狀態的實際概率值確定第二語音信號對應的狀態的近似概率值;最后根據第二語音信號、第二語音信號對應的各個狀態的實際概率值和近似概率值,以及第一聲學模型,計算得到第二聲學模型。
通過上述可能的實施方式,根據近似概率值與實際概率值之間的差值對第一聲學模型進行更新計算,可以對第二語音信號轉換為預設狀態過程中產生的誤差進行修正,從而得到更加精確的針對該用戶進行語音識別的第二聲學模型,使得語音識別裝置在使用所述第二聲學模型對用戶輸入的語音進行識別時,能夠得到更加精確的識別結果。
一種可能的實施方式中,所述第二語音信號還包括噪聲信號,所述噪聲信號的分貝值低于第一預設閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610156615.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體器件及包括半導體器件的存儲系統
- 下一篇:一種云端語音識別系統及方法





