[發明專利]一種疊字語音識別方法及系統有效

申請號：	202010315390.7	申請日：	2020-04-21
公開（公告）號：	CN111696524B	公開（公告）日：	2023-02-14
發明（設計）人：	張廣學;肖龍源;葉志堅;李稀敏;劉曉葳	申請（專利權）人：	廈門快商通科技股份有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/16;G10L15/26
代理公司：	廈門仕誠聯合知識產權代理事務所(普通合伙) 35227	代理人：	吳圳添
地址：	361009 福建省廈門市***	國省代碼：	福建;35
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種疊字語音識別方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種疊字語音識別方法，包括以下步驟：獲取待識別語音；提取待識別語音的語音特征，語音特征包括能量衰減特征；將語音特征輸入已經訓練好的神經網絡模型中；神經網絡模型判斷是否有疊字出現。本發明還公開了一種采用上述方法的疊字語音識別系統。本發明加入了能量衰減特征進行識別，提高疊字的識別率。

技術領域

本發明涉及語音識別技術領域，特別是一種疊字語音識別方法及系統。

背景技術

語音識別技術已應用在生活的方方面面，如會議記錄、語言互譯、娛樂影音等。然而，對于一些疊字的語音，識別率還有待提高。在語譜圖中，有些疊字的發音頻域較窄、特征不明顯或是輔音發音特征不明顯，導致識別過程中會出現多字或是少字現象。

發明內容

本發明為解決上述問題，提供了一種疊字語音識別方法及系統，加入了能量衰減特征進行識別，提高疊字的識別率。

為實現上述目的，本發明采用的技術方案為：

一種疊字語音識別方法，包括以下步驟：

獲取待識別語音；

提取所述待識別語音的語音特征，所述語音特征包括能量衰減特征；

將所述語音特征輸入已經訓練好的神經網絡模型中；

所述神經網絡模型判斷是否有疊字出現。

優選的，提取所述能量衰減特征的方法，包括以下步驟：

提取元音音素的共振峰的頻率；

提取所述頻率下所述待識別語音的能量衰減曲線，得到能量衰減特征。

優選的，所述能量衰減曲線不包括非元音音素的能量衰減點。

優選的，所述語音特征還包括MFCC特征和I-VECTOR特征。

優選的，所述神經網絡模型的構建方法，包括以下步驟：

準備訓練語料和所述訓練語料對應的文本；

對訓練語料的語音進行對齊；

提取所述訓練語料的語料語音特征；

將所述語料語音特征輸入所述神經網絡模型進行訓練，直至滿足訓練結束條件。

優選的，還包括步驟：所述神經網絡模型輸出識別文本。

優選的，所述神經網絡模型為TDNN時延神經網絡。

基于同樣的發明構思，本發明還提供了一種疊字語音識別系統，包括：

語音輸入終端，用于輸入所述待識別語音；

識別模塊，用于對所述待識別語音的音頻數據進行識別，判定待識別語音是否有疊字出現。

本發明的有益效果是：

(1)提高疊字的識別率，減少非疊字的干擾；

(2)去除非元音音素的能量衰減點，加強能量衰減特征的特征性；

(3)使用端到端的網絡結構進行識別，直接輸出識別文本。

附圖說明

圖1為本發明一實施例所提供的神經網絡模型構建的流程圖。

具體實施方式

為了使本發明所要解決的技術問題、技術方案及有益效果更加清楚、明白，以下結合具體實施例對本發明進行進一步詳細說明。應當理解，此處所描述的具體實施例僅用以解釋本發明，并不用于限定本發明。

實施例一

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司，未經廈門快商通科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010315390.7/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】