[發明專利]語音識別方法、裝置及電子設備有效
| 申請號: | 201310177246.1 | 申請日: | 2013-05-14 |
| 公開(公告)號: | CN104157285A | 公開(公告)日: | 2014-11-19 |
| 發明(設計)人: | 李露;盧鯉;張翔;饒豐;岳帥;陳波;馬建雄;劉海波 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 滕一斌 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 電子設備 | ||
1.一種語音識別方法,其特征在于,所述方法包括:
從獲取到的語音信號中提取音頻特征;
根據所述音頻特征識別出音節混淆網絡;
根據所述音節混淆網絡和預設的標音詞表生成詞語網格;
在所述詞語網格中計算最優文字序列作為識別結果。
2.根據權利要求1所述的語音識別方法,其特征在于,所述根據所述音頻特征識別出音節混淆網絡,包括:
根據所述音頻特征識別出包括至少兩條音節路徑的音節混淆網絡;或者,
根據所述音頻特征識別出只包括最優音節路徑的音節混淆網絡。
3.根據權利要求1所述的語音識別方法,其特征在于,所述音節混淆網絡包括按序排列的至少一個切片,每個切片包含一組音節,每個音節對應有一個得分,所述根據所述音頻混淆網絡和預設的標音詞表生成詞語網格,包括:
遍歷所述音節混淆網絡中的每個切片在預設的標音詞表中所對應的候選文字;
若當前切片中的音節與所述當前切片之后的切片中的音節各自所對應的候選文字組合后是一個詞語,則將所述詞語生成為一個網格節點,并將所述當前切片中的音節與所述當前切片之后的切片中的音節各自所對應的得分的乘積作為所述網格節點的得分;
若當前切片中的音節與所述當前切片之后的切片中的音節各自所對應的候選文字組合后不是一個詞語,則將所述當前切片中的音節所對應的候選文字單獨生成為一個網格節點,并將所述當前切片中的音節所對應的得分作為所述網格節點的得分;
將生成的各個網格節點按照各自對應的音節所處的順序進行相對應的連接,并與開始網格節點和結束網格節點一起生成為詞語網格。
4.根據權利要求1所述的語音識別方法,其特征在于,所述詞語網格包括開始網格節點、結束網格節點和位于所述開始網格節點和所述結束網格節點之間的至少一條節點路徑,所述在所述詞語網格中計算最優文字序列作為識別結果,包括:
在所述開始網格節點和所述結束網格節點之間的各條節點路徑上分別設置一令牌,并將各個令牌從所述開始網格節點開始向所述結束網格節點逐步移動;
在逐步移動過程中根據途經網格節點的得分和預設的語言模型的概率計算各個令牌的得分;
在抵達所述結束網格節點的各個令牌中選擇得分最高的一個令牌所對應的節點路徑上的各個網格節點所對應的候選文字組合作為所述最優文字序列。
5.根據權利要求4所述的語音識別方法,其特征在于,所述在逐步移動過程中根據途經網格節點的得分和預設的語言模型的概率計算各個令牌的得分,包括:
對于每一個令牌,根據當前途經網格節點的得分和預設的語言模型的概率計算所述令牌的得分;
檢測所述令牌的得分是否小于預設閾值;
若檢測結果為所述令牌的得分不小于所述預設閾值,則將所述令牌移動到下一個網格節點并重復上述步驟。
6.根據權利要求4或5任一所述的語音識別方法,其特征在于,所述在逐步移動過程中根據途經網格節點的得分和預設的語言模型的概率計算各個令牌的得分之前,還包括:
根據不同的詞表生成并保存至少一個語言模型;
若增加一個詞表,則根據增加的所述詞表生成新的語言模型,并增加入所述至少一個語言模型中;
若刪除一個所述詞表,則根據刪除的所述詞表從所述至少一個語言模型中刪除相應的語言模型;
若修改一個所述詞表,則根據修改的所述詞表生成新的語言模型,并增加入所述至少一個語言模型中,或者,根據修改的所述詞表從所述至少一個語言模型中修改相應的語言模型。
7.一種語音識別裝置,其特征在于,所述裝置包括:
特征提取模塊,用于從獲取到的語音信號中提取音頻特征;
音節識別模塊,用于根據所述音頻特征識別出音節混淆網絡;
網格生成模塊,用于根據所述音節混淆網絡和預設的標音詞表生成詞語網格;
文字識別模塊,用于在所述詞語網格中計算最優文字序列作為識別結果。
8.根據權利要求7所述的裝置,其特征在于,所述音節識別模塊,用于根據所述音頻特征識別出包括至少兩條音節路徑的音節混淆網絡;或者,
所述音節識別模塊,用于根據所述音頻特征識別出只包括最優音節路徑的音節混淆網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310177246.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種藍牙耳機語音識別方法
- 下一篇:一種五指組合控制的新型電子樂器





