[發(fā)明專利]基于語音識別技術(shù)的漢語學(xué)習(xí)系統(tǒng)無效
| 申請?zhí)枺?/td> | 201210120314.6 | 申請日: | 2012-04-23 |
| 公開(公告)號: | CN102682768A | 公開(公告)日: | 2012-09-19 |
| 發(fā)明(設(shè)計)人: | 黨建武;黃典;王洪翠;魏建國;陳栓;宋嬋 | 申請(專利權(quán))人: | 天津大學(xué) |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/14;G10L15/26;G10L19/00 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 李素蘭 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語音 識別 技術(shù) 漢語 學(xué)習(xí) 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計算機輔助語言學(xué)習(xí)(CALL:Computer?Assisted?Language?Learning)領(lǐng)域,特別是涉及計算機輔助漢語學(xué)習(xí)系統(tǒng)。
背景技術(shù)
改革開放30多年來,我國已成為世界經(jīng)濟大國,近些年來,國家多次強調(diào)要著眼于推動中華文化走向世界,形成與中國國際地位相對稱的文化“軟實力”,而要讓中國文化走向世界,毫無疑問首先要讓漢語走向世界。數(shù)據(jù)顯示,截至2011年8月底,國家漢辦主導(dǎo)在世界各國已建立353所孔子學(xué)院和473個孔子課堂,但仍難以滿足4000多萬國內(nèi)外漢語學(xué)習(xí)者的需求,師資缺口巨大。隨著個人計算機的普及和語音技術(shù)的迅猛發(fā)展,計算機輔助語言學(xué)習(xí)(CALL:Computer?Assisted?Language?Learning)系統(tǒng)的使用是解決問題的有效途徑。
CALL系統(tǒng)最早起源于20世紀(jì)六十年代,軟件開發(fā)者基于程序式教學(xué)理論開始設(shè)計輔助學(xué)習(xí)系統(tǒng),將教師從繁重的機械型勞作中解脫出來,使教師們可以把更多時間和精力投入到創(chuàng)作型工作中,PLATO項目是早期CALL系統(tǒng)的代表作之一。近些年來,隨著個人計算機、網(wǎng)絡(luò)技術(shù)和語音識別技術(shù)的不斷發(fā)展,CALL系統(tǒng)也取得了長足的進步。在外國語言的CALL系統(tǒng)方面,研究團隊和成果比較豐富。例如:IBM的“Watch?Me?Read”針對母語是非英語的兒童,能檢測出讀錯的單詞并回放正確發(fā)音;CMU的LISTEN利用SPHINX識別器進行發(fā)音中的韻律評價和非母語語料庫的研究;Subarashii系統(tǒng)中,學(xué)習(xí)者根據(jù)情景(如邀請朋友看電影)和提示信息去解決一個問題,系統(tǒng)通過這樣的練習(xí)方式培養(yǎng)學(xué)習(xí)者的日語口語表達能力;另外,還有HUGO系統(tǒng)、CMU的商業(yè)產(chǎn)品NativeAccentTM和日語學(xué)習(xí)的CallJ系統(tǒng)等;然而,令人遺憾的是,與如火如荼發(fā)展的外國語言CALL系統(tǒng)相比,漢語CALL系統(tǒng),特別是應(yīng)用語音識別技術(shù)的CALL系統(tǒng)的研究為數(shù)不多。
本發(fā)明針對當(dāng)前漢語CALL系統(tǒng)的匱乏以及“漢語熱”的愈發(fā)盛行的現(xiàn)狀,旨在為學(xué)習(xí)者提供一套基于語音識別和合成技術(shù)的、易操作的、完備的、具有良好用戶交互性的漢語學(xué)習(xí)系統(tǒng),在實現(xiàn)學(xué)習(xí)者輕松使用系統(tǒng)、更好的學(xué)習(xí)漢語目標(biāo)的同時,為漢語CALL系統(tǒng)的發(fā)展和推廣添磚加瓦。
發(fā)明內(nèi)容
基于上述現(xiàn)有技術(shù)存在的問題,本發(fā)明提出了一種基于語音識別技術(shù)的漢語學(xué)習(xí)系統(tǒng),結(jié)合語音識別技術(shù),進行有與語音合成功能的計算機輔助語言學(xué)習(xí)系統(tǒng)。
本發(fā)明提出了一種基于語音識別技術(shù)的漢語學(xué)習(xí)系統(tǒng),包括語音識別單元、語音合成單元、計算機輔助漢語學(xué)習(xí)單元,其特征在于:
語音識別單元,接收外界輸入語音后,由語音識別算法結(jié)合已訓(xùn)練好的模型作出判決,給出語音識別的結(jié)果,完成語音到文本的轉(zhuǎn)換;
語音合成單元,將任意文字信息實時轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀出來,完成文字到語音的轉(zhuǎn)換;
漢語學(xué)習(xí)單元,提供一套用戶界面、易操作的漢語學(xué)習(xí)軟件操作平臺;其中:
所述語音識別單元的算法為:建立語音識別網(wǎng)絡(luò),開始語音識別,讀入待處理的語音數(shù)據(jù),判定被識別語音數(shù)據(jù)是否結(jié)束,將識別語音數(shù)據(jù)產(chǎn)生網(wǎng)絡(luò),轉(zhuǎn)換為標(biāo)示文件,由此完成語音識別算法;
所述語音識別單元基于Speech?SDK平臺實現(xiàn),包括應(yīng)用程序接口API和設(shè)備驅(qū)動接口DDI;應(yīng)用程序通過API層和語音程序接口SAPI通信,語音引擎則通過DDI層和語音程序接口SAPI進行交互;
所述漢語學(xué)習(xí)單元提供的功能接口包括:選擇學(xué)習(xí)方式接口、錄音和回放接口、系統(tǒng)評估接口、示范朗讀功能接口。
所述外界輸入語音包括兩部分?jǐn)?shù)據(jù):一部分是指在系統(tǒng)的聲學(xué)模型訓(xùn)練和測試階段所用數(shù)據(jù),通過數(shù)據(jù)采集獲得的;另一部分是用戶在使用系統(tǒng)時直接輸入的語音。
所述數(shù)據(jù)采集,其采樣精度是16kHz,量化精度是16位。
所述語音識別單元在聲學(xué)模型選擇方面,選擇隱馬爾科夫模型,并通過HTK工具包進行聲學(xué)模型訓(xùn)練,選擇2階39維的MFCC參數(shù)作為聲學(xué)模型訓(xùn)練的語音特征參數(shù),MFCC參數(shù)的高斯混合數(shù)為7。
與現(xiàn)有技術(shù)相比,本發(fā)明可以很大程度上彌補當(dāng)前漢語CALL系統(tǒng)的市場匱乏,尤其是應(yīng)用語音識別技術(shù)的漢語CALL系統(tǒng)匱乏的問題,促進計算機輔助學(xué)習(xí)領(lǐng)域中漢語CALL系統(tǒng)的發(fā)展和推廣。
附圖說明
圖1為本發(fā)明基于語音識別的漢語學(xué)習(xí)系統(tǒng)的系統(tǒng)結(jié)構(gòu)示意圖;
圖2為本發(fā)明基于語音識別的漢語學(xué)習(xí)系統(tǒng)的語音識別單元算法流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210120314.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





