[發明專利]語音識別方法及語音識別裝置有效
| 申請號: | 201710082111.5 | 申請日: | 2017-02-15 |
| 公開(公告)號: | CN108447471B | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 萬秋生 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/04;G10L15/26 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 | ||
1.一種語音識別方法,其特征在于,包括以下步驟:
獲取采集的待識別語音信息,并確定所述待識別語音信息的語意信息;
在所述語意信息不滿足預設規則時,對所述待識別語音信息進行分段處理,獲得各語音片段,并提取各所述語音片段的聲紋信息;
在本地聲紋數據庫中存在尚未匹配過的聲紋信息時,從所述本地聲紋數據庫中獲取一個尚未匹配過的聲紋信息作為待匹配聲紋信息;
對各所述語音片段的聲紋信息與所述待匹配聲紋信息進行匹配,從各所述語音片段的聲紋信息中確定出與所述待匹配聲紋信息匹配成功的篩選后聲紋信息;
將各所述篩選后聲紋信息對應的語音片段進行組合,獲得組合語音信息,并確定所述組合語音信息的組合語意信息;
在所述組合語意信息滿足所述預設規則時,將所述組合語意信息作為語音識別結果。
2.根據權利要求1所述的語音識別方法,其特征在于,還包括步驟:
在所述組合語意信息不滿足所述預設規則時,返回在本地聲紋數據庫中存在尚未匹配過的聲紋信息時,從所述本地聲紋數據庫中獲取一個尚未匹配過的聲紋信息作為待匹配聲紋信息的步驟。
3.根據權利要求1所述的語音識別方法,其特征在于,還包括步驟:
在所述語意信息滿足所述預設規則時,將所述語意信息作為語音識別結果;
4.根據權利要求3所述的語音識別方法,其特征在于,在所述語意信息滿足所述預設規則時,將所述語意信息作為語音識別結果之后,還包括步驟:
提取所述待識別語音信息的聲紋信息;
將提取的所述聲紋信息與所述本地聲紋數據庫中存儲的各聲紋信息進行比對;
在提取的所述聲紋信息與所述本地聲紋數據庫中存儲的各聲紋信息均匹配失敗時,將提取的所述聲紋信息存儲于所述本地聲紋數據庫。
5.根據權利要求4所述的語音識別方法,其特征在于,將所述聲紋信息存儲于所述本地聲紋數據庫的方式包括:
建立提取的所述聲紋信息的用戶標識;
將提取的所述聲紋信息與對應的所述用戶標識關聯存儲于所述本地聲紋數據庫,并將所述用戶標識的優先等級初始化為初始等級。
6.根據權利要求5所述的語音識別方法,其特征在于,還包括步驟:
在提取的所述聲紋信息與所述本地聲紋數據庫中存儲的聲紋信息匹配成功時,將提取的所述聲紋信息對應的用戶標識的優先等級增加預設等級。
7.根據權利要求1所述的語音識別方法,其特征在于,所述本地聲紋數據庫中存儲的聲紋信息與用戶標識對應;
從所述本地聲紋數據庫中獲取一個尚未匹配過的聲紋信息作為待匹配聲紋信息的方式包括:
根據所述用戶標識的優先等級的預設等級順序,從所述本地聲紋數據庫中獲取一個尚未匹配過的用戶標識對應的聲紋信息作為待匹配聲紋信息。
8.根據權利要求1所述的語音識別方法,其特征在于,
在確定所述待 識別語音信息的語意信息之后,對所述待識別語音信息進行分段處理之前,還包括步驟:提取所述語意信息的關鍵詞;
當所述語意信息不符合預設語法規則、所述語意信息的關鍵詞不同時存在一個詞庫或在本地指令庫中不存在與所述語意信息的關鍵詞對應的指令時,判定所述語意信息不滿足所述預設規則;
在確定所述組合語音信息的組合語意信息之后,將所述組合語意信息作為語音識別結果之前,還包括步驟:提取所述組合語意信息的關鍵詞;
當所述組合語意信息符合所述預設語法規則,所述組合語意信息的關鍵詞同時存在于一個詞庫且在所述本地指令庫中存在與所述組合語意的關鍵詞對應的指令時,判定所述組合語意信息滿足所述預設規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710082111.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于聲道和韻律特征的情感語音轉換方法
- 下一篇:語音喚醒方法及裝置





