[發明專利]中英文混合語音識別方法在審
| 申請號: | 202010026451.8 | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN111243597A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 吳與同;范光宇;孫焜;張鵬飛;生洪源 | 申請(專利權)人: | 上海電機學院 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/14;G10L15/16;G10L15/00;G10L15/02;G10L15/32;G10L25/24 |
| 代理公司: | 上海伯瑞杰知識產權代理有限公司 31227 | 代理人: | 李慶;王一琦 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中英文 混合 語音 識別 方法 | ||
本發明提供一種中英文混合語音識別方法,包括步驟:S1:獲取語音信號;S2:將語音信號輸入一中文語音識別系統,中文語音識別系統將語音信號中的中文部分識別為中文文字;S3:判斷語音信號中是否有尚未識別的部分,如無跳至步驟S6;S4:將語音信號中尚未識別的部分輸入一英文語音識別系統,英文語音識別系統將語音信號中尚未識別的部分識別為英文文字;S5:利用一中文翻譯數據庫將英文文字翻譯為中文文字;S6:利用一中文詞性數據庫對中文文字添加詞性標簽;S7:利用詞性標簽和中文語序結構對中文文字排序;S8:驗證并輸出排序后的中文文字。本發明的一種中英文混合語音識別方法,可實現對中英文混合的句子進行識別。
技術領域
本發明涉及信息處理領域,尤其涉及一種中英文混合語音識別方法。
背景技術
近幾年,語音識別技術保持高速發展。語音識別是將語音轉換為對應的文字的一種智能信息處理技術。將語音轉換為文字有利于計算機終端進行進一步地處理,所以語音識別技術被廣泛地用于各個領域并且成為很多設備的標配,手機端的語音助手,地圖導航,智能音響等。
雖然現在的語音識別技術已經給人類帶來了便利,總體讓人滿意,但是目前的語音識別系統只停留在單純的中文識別和英文識別,無法同時進行中英文同時辨別,在中英混合識別方面仍然有很大的提升空間。
發明內容
針對上述現有技術中的不足,本發明提供一種中英文混合語音識別方法,可實現對中英文混合的句子進行識別。
為了實現上述目的,本發明提供一種中英文混合語音識別方法,包括步驟:
S1:獲取語音信號;
S2:將所述語音信號輸入一中文語音識別系統,所述中文語音識別系統將所述語音信號中的中文部分識別為中文文字;
S3:判斷所述語音信號中是否有尚未識別的部分,如無跳至步驟S6;
S4:將所述語音信號中尚未識別的部分輸入一英文語音識別系統,所述英文語音識別系統將所述語音信號中尚未識別的部分識別為英文文字;
S5:利用一中文翻譯數據庫將所述英文文字翻譯為中文文字;
S6:利用一中文詞性數據庫對所述中文文字添加詞性標簽;
S7:利用所述詞性標簽和中文語序結構對所述中文文字排序;
S8:驗證并輸出排序后的中文文字。
優選地,所述S2步驟進一步包括步驟:
S21:預處理,進行A/D轉換;
S22:分幀加窗,將數字化后的所述語音信號分成多段數字語音信號;
S23:信息提取,通過傅里葉變換譜經對數運算再取傅里葉反變得到所述數字語音信號的倒譜;
S24:匹配判決,利用聲學模型對所述數字語音信號的倒譜進行識別,獲得所述中文文字。
優選地,所述S22進一步包括步驟:
S221:分幀,將數字化后的所述語音信號分成多段數字語音信號;
S222:對所述數字語音信號加窗。
優選地,所述聲學模型包括HMM聲學模型。
優選地,所述S4步驟進一步包括步驟:
S41:預處理,進行A/D轉換;
S42:分幀加窗,將數字化后的所述語音信號分成多段數字語音信號;
S43:信息提取,通過傅里葉變換譜經對數運算再取傅里葉反變得到所述數字語音信號的倒譜;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海電機學院,未經上海電機學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010026451.8/2.html,轉載請聲明來源鉆瓜專利網。





