[發明專利]語音識別方法及裝置有效
| 申請號: | 201610156615.2 | 申請日: | 2016-03-18 |
| 公開(公告)號: | CN105654955B | 公開(公告)日: | 2019-11-12 |
| 發明(設計)人: | 何占盈;徐斌;高海東 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L17/04 | 分類號: | G10L17/04;G10L17/02;G10L17/14;H04L29/08 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 陶敏;劉芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 | ||
1.一種語音識別方法,其特征在于,包括:
獲取第一聲學模型,所述第一聲學模型表示輸入的語音信號與預設狀態的映射關系,所述預設狀態為與所述語音信號對應的文本的基本組成元素;
接收第一語音信號;
根據所述第一語音信號及第二聲學模型確定所述預設狀態的概率值;所述第二聲學模型是根據輸入的第二語音信號及所述第一聲學模型確定得到的,所述第一語音信號及所述第二語音信號是由相同的用戶輸入的;所述語音信號包括所述第一語音信號及所述第二語音信號;
根據預設的語言模型及詞典將所述第一語音信號對應的所述預設狀態的概率值解碼為第一文本;所述語言模型表示所述預設狀態與所述語音信號對應的文本之間的映射關系,所述詞典包括組成所述文本的詞語的集合,所述文本包括所述第一文本;
所述根據第二聲學模型確定所述第一語音信號對應的狀態概率值之前,還包括:
根據所述第二語音信號及所述第一聲學模型確定所述第二聲學模型;
所述根據用戶輸入的所述第二語音信號及所述第一聲學模型確定所述第二聲學模型,包括:
根據所述第二語音信號及所述第一聲學模型,計算得到所述第二語音信號對應的預設狀態的實際概率值;
根據所述第二語音信號對應的預設狀態的實際概率值確定所述第二語音信號對應的狀態的近似概率值;
根據所述第二語音信號、所述第二語音信號對應的各個狀態的實際概率值和近似概率值,以及所述第一聲學模型,計算得到所述第二聲學模型。
2.根據權利要求1所述的方法,其特征在于,所述第二語音信號還包括噪聲信號,所述噪聲信號的分貝值低于第一預設閾值。
3.根據權利要求1所述的方法,其特征在于,所述根據第二聲學模型確定所述第一語音信號對應的預設狀態的概率值之前,還包括:
根據所述第二語音信號,確定代表用戶的發音特征的第一頻率;
提取所述第一語音信號的信號特征值;
放大所述第一語音信號在所述第一頻率上的信號特征值,和/或縮小所述第一語音信號在第二頻率上的信號特征值,所述第二頻率與所述第一頻率不相同。
4.根據權利要求3所述的方法,其特征在于,所述根據所述第二語音信號,確定代表用戶的發音特征的第一頻率,包括:
將所述第二語音信號轉化為頻域信號;
計算所述頻域信號中出現的各個頻率在所述頻域信號的所有頻率中出現的概率值;
確定大于第二預設閾值的所述概率值對應的頻率,為代表所述用戶的發音特征的所述第一頻率。
5.根據權利要求1所述的方法,其特征在于,所述詞典中還包括與所述詞語對應的識別概率值,所述方法還包括:
根據所述第二語音信號,確定所述詞典中的用戶常用詞語;
在所述詞典中增大所述用戶常用詞語對應的識別概率值,得到更新后的詞典;
所述根據預設的語言模型及詞典將所述第一語音信號對應的預設狀態的概率值解碼為第一文本,包括:
根據所述語言模型及所述更新后的詞典將所述第一語音信號對應的狀態的概率值解碼為所述第一文本。
6.根據權利要求5所述的方法,其特征在于,所述根據所述第二語音信號,確定所述詞典中的用戶常用詞語,包括:
對所述第二語音信號進行識別,獲得所述第二語音信號對應的第二文本;
統計所述第二文本中每個詞語在所述第二文本中的出現頻率;
確定出現頻率大于第三預設閾值的所述詞語為所述用戶常用詞語詞語。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610156615.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體器件及包括半導體器件的存儲系統
- 下一篇:一種云端語音識別系統及方法





