[發明專利]語音識別方法及系統有效
| 申請號: | 201110387826.4 | 申請日: | 2011-11-29 |
| 公開(公告)號: | CN102376305A | 公開(公告)日: | 2012-03-14 |
| 發明(設計)人: | 潘青華;王智國;何婷婷;劉聰;胡國平;胡郁;劉慶峰 | 申請(專利權)人: | 安徽科大訊飛信息科技股份有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L19/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 趙景平;逯長明 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 系統 | ||
1.一種語音識別方法,其特征在于,包括:
構建一遍解碼識別網絡;
對接收的語音信號在所述一遍解碼識別網絡中搜索得到一遍解碼候選項;
如果所述一遍解碼候選項滿足一遍解碼條件,則輸出一遍解碼得到的最優識別結果;
如果所述一遍解碼候選項不滿足一遍解碼條件,則根據一遍解碼延時以及解碼可信度對所述一遍解碼候選項進行優化處理;
根據優化處理后的一遍解碼候選項,構建二遍解碼識別網絡;
對接收的語音信號在所述二遍解碼識別網絡中進行二遍解碼,得到二遍解碼候選項;
輸出二遍解碼得到的最優識別結果。
2.根據權利要求1所述的方法,其特征在于,按以下方式確定所述一遍解碼候選項是否滿足一遍解碼條件:
統計一遍解碼延時;
如果所述一遍解碼延時大于預設的第一時間閾值,則確定所述一遍解碼候選項滿足一遍解碼條件。
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
如果所述一遍解碼延時小于或等于預設的第一時間閾值,則計算一遍解碼的最優路徑得分和次優路徑得分的差值;
如果所述差值大于預設的第一概率閾值,則確定所述一遍解碼候選項滿足一遍解碼條件。
4.根據權利要求2所述的方法,其特征在于,所述統計一遍解碼延時包括:
按以下公式計算所述一遍解碼延時:t-(tE+ts*(NE-1));
其中,t為當前時間,tE為所述接收的語音信號的最后一個語音段的接收時刻,ts為語音信號處理時設置的幀移長度,NE為最后一個語音段所包括的語音幀總數。
5.根據權利要求2或3或4所述的方法,其特征在于,所述根據一遍解碼延時以及解碼可信度對所述一遍解碼候選項進行優化處理包括:
計算自適應于所述一遍解碼延時的概率裁剪門限;
選擇計算得到的概率裁剪門限以及預設的裁剪門限閾值中的較小值作為網絡優化裁剪門限;
刪除一遍解碼得到的一遍解碼候選項中概率得分與最優路徑概率得分差值大于所述網絡優化裁剪門限的候選項。
6.根據權利要求5所述的方法,其特征在于,所述方法還包括:
預先建立解碼延時與概率裁剪門限的對應關系;
所述計算自適應于所述一遍解碼延時的概率裁剪門限包括:根據所述解碼延時與概率裁剪門限的對應關系確定自適應于所述一遍解碼延時的概率裁剪門限。
7.根據權利要求5所述的方法,其特征在于,所述方法還包括:
預先訓練得到概率裁剪門限模型;
所述計算自適應于所述一遍解碼延時的概率裁剪門限包括:根據訓練得到的概率裁剪門限模型確定自適應于所述一遍解碼延時的概率裁剪門限。
8.根據權利要求2或3或4所述的方法,其特征在于,所述方法還包括:
在對接收的語音信號在二遍解碼識別網絡中進行二遍解碼過程中,統計所述語音信號中當前語音數據幀的累計解碼延時;
如果當前語音數據幀的累計解碼延時超過預設的第二時間域值,則停止二遍解碼,并輸出一遍解碼得到的最優識別結果。
9.根據權利要求8所述的方法,其特征在于,所述統計所述語音信號中當前語音數據幀的累計解碼延時包括:
按以下公式計算第k個語音段中第i個語音數據幀解碼延時:
t-(tk+ts*(i-1));
其中,t為當前時間,tk為第k個語音段的接收時刻,ts為語音信號處理時設置的幀移長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽科大訊飛信息科技股份有限公司,未經安徽科大訊飛信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110387826.4/1.html,轉載請聲明來源鉆瓜專利網。





