[發(fā)明專利]一種語音識別的方法和裝置有效
| 申請?zhí)枺?/td> | 201210314129.0 | 申請日: | 2012-08-29 |
| 公開(公告)號: | CN103680500B | 公開(公告)日: | 2018-10-16 |
| 發(fā)明(設計)人: | 錢勝 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G10L15/14 | 分類號: | G10L15/14 |
| 代理公司: | 北京鴻德海業(yè)知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 裝置 | ||
1.一種語音識別的方法,其特征在于,該方法包括:
訓練解碼網(wǎng)絡時采用上下文相關的隱馬爾科夫模型HMM,所述上下文相關的HMM中HMM狀態(tài)與音素的上下文相關;在解碼網(wǎng)絡中的詞尾增加靜音sil模型,并將解碼網(wǎng)絡中該sil模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil;
利用所述解碼網(wǎng)絡獲得待識別語音的HMM狀態(tài)跳轉序列。
2.根據(jù)權利要求1所述的方法,其特征在于,該方法還包括:在所述解碼網(wǎng)絡中語言模型的末尾增加一條到該語言模型頭部的跳轉。
3.根據(jù)權利要求2所述的方法,其特征在于,該方法還包括:在所述HMM狀態(tài)跳轉序列基礎上查詢語言模型確定最優(yōu)路徑后,如果最優(yōu)路徑中存在從所述語言模型的末尾至頭部的跳轉,則確定存在句間停頓。
4.根據(jù)權利要求3所述的方法,其特征在于,該方法還包括:
依據(jù)所述待識別語音的最優(yōu)路徑,在所述句間停頓的位置添加標點符號。
5.一種語音識別的裝置,其特征在于,該裝置包括:
網(wǎng)絡訓練單元,用于訓練解碼網(wǎng)絡時采用上下文相關的隱馬爾科夫模型HMM,所述上下文相關的HMM中HMM狀態(tài)與音素的上下文相關;在解碼網(wǎng)絡中的詞尾增加靜音sil模型,并將解碼網(wǎng)絡中該sil模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil;
路徑確定單元,用于利用所述解碼網(wǎng)絡獲得待識別語音的HMM狀態(tài)跳轉序列。
6.根據(jù)權利要求5所述的裝置,其特征在于,所述網(wǎng)絡訓練單元,還用于在所述解碼網(wǎng)絡中語言模型的末尾增加一條到該語言模型頭部的跳轉。
7.根據(jù)權利要求6所述的裝置,其特征在于,所述路徑確定單元,還用于在所述HMM狀態(tài)跳轉序列基礎上查詢語言模型確定最優(yōu)路徑;
該裝置還包括:
停頓識別單元,用于如果所述路徑確定單元確定出的最優(yōu)路徑中存在從所述語言模型的末尾至頭部的跳轉,則確定存在句間停頓。
8.根據(jù)權利要求7所述的裝置,其特征在于,所述停頓識別單元,還用于依據(jù)所述待識別語音的最優(yōu)路徑,在所述句間停頓的位置添加標點符號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210314129.0/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:具有掩埋位線的半導體器件及其制造方法
- 下一篇:液體噴出裝置





