[發明專利]中英文混合語音識別方法在審
| 申請號: | 202010026451.8 | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN111243597A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 吳與同;范光宇;孫焜;張鵬飛;生洪源 | 申請(專利權)人: | 上海電機學院 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/14;G10L15/16;G10L15/00;G10L15/02;G10L15/32;G10L25/24 |
| 代理公司: | 上海伯瑞杰知識產權代理有限公司 31227 | 代理人: | 李慶;王一琦 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中英文 混合 語音 識別 方法 | ||
1.一種中英文混合語音識別方法,包括步驟:
S1:獲取語音信號;
S2:將所述語音信號輸入一中文語音識別系統,所述中文語音識別系統將所述語音信號中的中文部分識別為中文文字;
S3:判斷所述語音信號中是否有尚未識別的部分,如無跳至步驟S6;
S4:將所述語音信號中尚未識別的部分輸入一英文語音識別系統,所述英文語音識別系統將所述語音信號中尚未識別的部分識別為英文文字;
S5:利用一中文翻譯數據庫將所述英文文字翻譯為中文文字;
S6:利用一中文詞性數據庫對所述中文文字添加詞性標簽;
S7:利用所述詞性標簽和中文語序結構對所述中文文字排序;
S8:驗證并輸出排序后的中文文字。
2.根據權利要求1所述的中英文混合語音識別方法,其特征在于,所述S2步驟進一步包括步驟:
S21:預處理,進行A/D轉換;
S22:分幀加窗,將數字化后的所述語音信號分成多段數字語音信號;
S23:信息提取,通過傅里葉變換譜經對數運算再取傅里葉反變得到所述數字語音信號的倒譜;
S24:匹配判決,利用聲學模型對所述數字語音信號的倒譜進行識別,獲得所述中文文字。
3.根據權利要求2所述的中英文混合語音識別方法,其特征在于,所述S22進一步包括步驟:
S221:分幀,將數字化后的所述語音信號分成多段數字語音信號;
S222:對所述數字語音信號加窗。
4.根據權利要求3所述的中英文混合語音識別方法,其特征在于,所述聲學模型包括HMM聲學模型。
5.根據權利要求4所述的中英文混合語音識別方法,其特征在于,所述S4步驟進一步包括步驟:
S41:預處理,進行A/D轉換;
S42:分幀加窗,將數字化后的所述語音信號分成多段數字語音信號;
S43:信息提取,通過傅里葉變換譜經對數運算再取傅里葉反變得到所述數字語音信號的倒譜;
S44:匹配判決,利用聲學模型對所述數字語音信號的倒譜進行識別,獲得所述英文文字。
6.根據權利要求5所述的中英文混合語音識別方法,其特征在于,所述S42進一步包括步驟:
S421:分幀,將數字化后的所述語音信號分成多段數字語音信號;
S422:對所述數字語音信號加窗。
7.根據權利要求6所述的中英文混合語音識別方法,其特征在于,所述S6步驟中,所述詞性標簽包括:主語、謂語、賓語、狀語、補語和定語。
8.根據權利要求7所述的中英文混合語音識別方法,其特征在于,所述S7步驟中,所述中文語序結構包括:主謂、主謂賓、定主狀謂、定主謂、主狀謂、定主謂賓、主狀謂賓、主謂補賓、定主狀謂賓、定主謂補賓、主狀謂補賓和定主狀謂補賓。
9.根據權利要求8所述的中英文混合語音識別方法,其特征在于,所述S8步驟中的所述驗證步驟包括步驟:
計算所有所述中文文字的所述詞性標簽的總數;
計算所述中文文字所組成的語句所對應的中文語序結構中詞性的個數;
當所述詞性標簽的總數與所述詞性的個數相等時通過驗證。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海電機學院,未經上海電機學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010026451.8/1.html,轉載請聲明來源鉆瓜專利網。





