[發明專利]中英文混合語音識別方法在審

申請號：	202010026451.8	申請日：	2020-01-10
公開（公告）號：	CN111243597A	公開（公告）日：	2020-06-05
發明（設計）人：	吳與同;范光宇;孫焜;張鵬飛;生洪源	申請（專利權）人：	上海電機學院
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/14;G10L15/16;G10L15/00;G10L15/02;G10L15/32;G10L25/24
代理公司：	上海伯瑞杰知識產權代理有限公司 31227	代理人：	李慶;王一琦
地址：	200240 ***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	中英文混合語音識別方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供一種中英文混合語音識別方法，包括步驟：S1：獲取語音信號；S2：將語音信號輸入一中文語音識別系統，中文語音識別系統將語音信號中的中文部分識別為中文文字；S3：判斷語音信號中是否有尚未識別的部分，如無跳至步驟S6；S4：將語音信號中尚未識別的部分輸入一英文語音識別系統，英文語音識別系統將語音信號中尚未識別的部分識別為英文文字；S5：利用一中文翻譯數據庫將英文文字翻譯為中文文字；S6：利用一中文詞性數據庫對中文文字添加詞性標簽；S7：利用詞性標簽和中文語序結構對中文文字排序；S8：驗證并輸出排序后的中文文字。本發明的一種中英文混合語音識別方法，可實現對中英文混合的句子進行識別。

技術領域

本發明涉及信息處理領域，尤其涉及一種中英文混合語音識別方法。

背景技術

近幾年，語音識別技術保持高速發展。語音識別是將語音轉換為對應的文字的一種智能信息處理技術。將語音轉換為文字有利于計算機終端進行進一步地處理，所以語音識別技術被廣泛地用于各個領域并且成為很多設備的標配，手機端的語音助手，地圖導航，智能音響等。

雖然現在的語音識別技術已經給人類帶來了便利，總體讓人滿意，但是目前的語音識別系統只停留在單純的中文識別和英文識別，無法同時進行中英文同時辨別，在中英混合識別方面仍然有很大的提升空間。

發明內容

針對上述現有技術中的不足，本發明提供一種中英文混合語音識別方法，可實現對中英文混合的句子進行識別。

為了實現上述目的，本發明提供一種中英文混合語音識別方法，包括步驟：

S1：獲取語音信號；

S2：將所述語音信號輸入一中文語音識別系統，所述中文語音識別系統將所述語音信號中的中文部分識別為中文文字；

S3：判斷所述語音信號中是否有尚未識別的部分，如無跳至步驟S6；

S4：將所述語音信號中尚未識別的部分輸入一英文語音識別系統，所述英文語音識別系統將所述語音信號中尚未識別的部分識別為英文文字；

S5：利用一中文翻譯數據庫將所述英文文字翻譯為中文文字；

S6：利用一中文詞性數據庫對所述中文文字添加詞性標簽；

S7：利用所述詞性標簽和中文語序結構對所述中文文字排序；

S8：驗證并輸出排序后的中文文字。

優選地，所述S2步驟進一步包括步驟：

S21：預處理，進行A/D轉換；

S22：分幀加窗，將數字化后的所述語音信號分成多段數字語音信號；

S23：信息提取，通過傅里葉變換譜經對數運算再取傅里葉反變得到所述數字語音信號的倒譜；

S24：匹配判決，利用聲學模型對所述數字語音信號的倒譜進行識別，獲得所述中文文字。

優選地，所述S22進一步包括步驟：

S221：分幀，將數字化后的所述語音信號分成多段數字語音信號；

S222：對所述數字語音信號加窗。

優選地，所述聲學模型包括HMM聲學模型。

優選地，所述S4步驟進一步包括步驟：

S41：預處理，進行A/D轉換；

S42：分幀加窗，將數字化后的所述語音信號分成多段數字語音信號；

S43：信息提取，通過傅里葉變換譜經對數運算再取傅里葉反變得到所述數字語音信號的倒譜；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于上海電機學院，未經上海電機學院許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010026451.8/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種基于GaN功率器件的整流系統
下一篇：一種液冷回路的檢測方法、裝置、設備及存儲介質

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】