[發明專利]語音識別方法及系統有效

申請號：	201110387826.4	申請日：	2011-11-29
公開（公告）號：	CN102376305A	公開（公告）日：	2012-03-14
發明（設計）人：	潘青華;王智國;何婷婷;劉聰;胡國平;胡郁;劉慶峰	申請（專利權）人：	安徽科大訊飛信息科技股份有限公司
主分類號：	G10L15/00	分類號：	G10L15/00;G10L19/00
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	趙景平;逯長明
地址：	230088 安徽***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音識別方法，其特征在于，包括：

構建一遍解碼識別網絡；

對接收的語音信號在所述一遍解碼識別網絡中搜索得到一遍解碼候選項；

如果所述一遍解碼候選項滿足一遍解碼條件，則輸出一遍解碼得到的最優識別結果；

如果所述一遍解碼候選項不滿足一遍解碼條件，則根據一遍解碼延時以及解碼可信度對所述一遍解碼候選項進行優化處理；

根據優化處理后的一遍解碼候選項，構建二遍解碼識別網絡；

對接收的語音信號在所述二遍解碼識別網絡中進行二遍解碼，得到二遍解碼候選項；

輸出二遍解碼得到的最優識別結果。

2.根據權利要求1所述的方法，其特征在于，按以下方式確定所述一遍解碼候選項是否滿足一遍解碼條件：

統計一遍解碼延時；

如果所述一遍解碼延時大于預設的第一時間閾值，則確定所述一遍解碼候選項滿足一遍解碼條件。

3.根據權利要求2所述的方法，其特征在于，所述方法還包括：

如果所述一遍解碼延時小于或等于預設的第一時間閾值，則計算一遍解碼的最優路徑得分和次優路徑得分的差值；

如果所述差值大于預設的第一概率閾值，則確定所述一遍解碼候選項滿足一遍解碼條件。

4.根據權利要求2所述的方法，其特征在于，所述統計一遍解碼延時包括：

按以下公式計算所述一遍解碼延時：t-(t_E+t_s*(N_E-1))；

其中，t為當前時間，t_E為所述接收的語音信號的最后一個語音段的接收時刻，t_s為語音信號處理時設置的幀移長度，N_E為最后一個語音段所包括的語音幀總數。

5.根據權利要求2或3或4所述的方法，其特征在于，所述根據一遍解碼延時以及解碼可信度對所述一遍解碼候選項進行優化處理包括：

計算自適應于所述一遍解碼延時的概率裁剪門限；

選擇計算得到的概率裁剪門限以及預設的裁剪門限閾值中的較小值作為網絡優化裁剪門限；

刪除一遍解碼得到的一遍解碼候選項中概率得分與最優路徑概率得分差值大于所述網絡優化裁剪門限的候選項。

6.根據權利要求5所述的方法，其特征在于，所述方法還包括：

預先建立解碼延時與概率裁剪門限的對應關系；

所述計算自適應于所述一遍解碼延時的概率裁剪門限包括：根據所述解碼延時與概率裁剪門限的對應關系確定自適應于所述一遍解碼延時的概率裁剪門限。

7.根據權利要求5所述的方法，其特征在于，所述方法還包括：

預先訓練得到概率裁剪門限模型；

所述計算自適應于所述一遍解碼延時的概率裁剪門限包括：根據訓練得到的概率裁剪門限模型確定自適應于所述一遍解碼延時的概率裁剪門限。

8.根據權利要求2或3或4所述的方法，其特征在于，所述方法還包括：

在對接收的語音信號在二遍解碼識別網絡中進行二遍解碼過程中，統計所述語音信號中當前語音數據幀的累計解碼延時；

如果當前語音數據幀的累計解碼延時超過預設的第二時間域值，則停止二遍解碼，并輸出一遍解碼得到的最優識別結果。

9.根據權利要求8所述的方法，其特征在于，所述統計所述語音信號中當前語音數據幀的累計解碼延時包括：

按以下公式計算第k個語音段中第i個語音數據幀解碼延時：

t-(t_k+t_s*(i-1))；

其中，t為當前時間，t_k為第k個語音段的接收時刻，t_s為語音信號處理時設置的幀移長度。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于安徽科大訊飛信息科技股份有限公司，未經安徽科大訊飛信息科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201110387826.4/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：混合具有寬的顆粒尺寸分布的散狀固體材料的方法及混合站
下一篇：線材接觸防止構件和加熱器裝置的維護方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】