[發明專利]基于語音識別技術的漢語學習系統無效
| 申請號: | 201210120314.6 | 申請日: | 2012-04-23 |
| 公開(公告)號: | CN102682768A | 公開(公告)日: | 2012-09-19 |
| 發明(設計)人: | 黨建武;黃典;王洪翠;魏建國;陳栓;宋嬋 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/14;G10L15/26;G10L19/00 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李素蘭 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 識別 技術 漢語 學習 系統 | ||
1.一種基于語音識別技術的漢語學習系統,包括語音識別單元、語音合成單元、計算機輔助漢語學習單元,其特征在于:
語音識別單元,接收外界輸入語音后,由語音識別算法結合已訓練好的模型作出判決,給出語音識別的結果,完成語音到文本的轉換;
語音合成單元,將任意文字信息實時轉化為標準流暢的語音朗讀出來,完成文字到語音的轉換;
漢語學習單元,提供一套用戶界面、易操作的漢語學習軟件操作平臺;其中:
所述語音識別單元的算法為:建立語音識別網絡,開始語音識別,讀入待處理的語音數據,判定被識別語音數據是否結束,將識別語音數據產生網絡,轉換為標示文件,由此完成語音識別算法;
所述語音識別單元基于Speech?SDK平臺實現,包括應用程序接口API和設備驅動接口DDI;應用程序通過API層和語音程序接口SAPI通信,語音引擎則通過DDI層和語音程序接口SAPI進行交互;
所述漢語學習單元提供的功能接口包括:選擇學習方式接口、錄音和回放接口、系統評估接口、示范朗讀功能接口。
2.如權利要求1所述的基于語音識別技術的漢語學習系統,其特征在于,所述外界輸入語音包括兩部分數據:一部分是在系統的聲學模型訓練和測試階段所用數據,通過數據采集獲得的;另一部分是用戶在使用系統時直接輸入的語音。
3.如權利要求2所述的基于語音識別技術的漢語學習系統,其特征在于,所述數據采集,其采樣精度是16kHz,量化精度是16位。
4.如權利要求1所述的基于語音識別技術的漢語學習系統,其特征在于,所述語音識別單元在聲學模型選擇方面,選擇隱馬爾科夫模型,并通過HTK工具包進行聲學模型訓練,選擇2階39維的MFCC參數作為聲學模型訓練的語音特征參數,MFCC參數的高斯混合數為7。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210120314.6/1.html,轉載請聲明來源鉆瓜專利網。





