[發明專利]一種口語評測系統及其方法在審
| 申請號: | 202011299829.8 | 申請日: | 2020-11-19 |
| 公開(公告)號: | CN112599115A | 公開(公告)日: | 2021-04-02 |
| 發明(設計)人: | 潘晨杰;蔡騁 | 申請(專利權)人: | 上海電機學院 |
| 主分類號: | G10L15/01 | 分類號: | G10L15/01;G10L25/30;G10L25/48;G10L25/51;G10L25/78 |
| 代理公司: | 上海科盛知識產權代理有限公司 31225 | 代理人: | 葉敏華 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 口語 評測 系統 及其 方法 | ||
1.一種口語評測系統,其特征在于,包括教師客戶端(1)、學生客戶端(2)以及服務器(3),所述教師客戶端(1)、學生客戶端(2)分別與服務器(3)相互連接,所述教師客戶端(1)用于教師用戶管理學生信息、上傳語料數據、上傳教師用戶信息、上傳教學計劃信息以及查看所有學生口語分數;
所述學生客戶端(2)用于學生用戶上傳學生用戶信息、獲取語料數據及教學計劃信息、上傳待測語音以及查看當前用戶口語分數;
所述服務器(3)用于存儲教師用戶信息以及學生用戶信息、存儲語料數據、對待測語音進行準確度、完整度和流暢度評測、得到對應于學生用戶的口語分數。
2.根據權利要求1所述的一種口語評測系統,其特征在于,所述服務器(3)內設置有通信模塊(31)、數據庫(32)以及語音評價模塊(33),所述教師客戶端(1)和學生客戶端(2)均通過通信模塊(31)與數據庫(32)相互連接,所述語音評價模塊(33)的輸入端通過通信模塊(31)與學生客戶端(2)連接,所述語音評價模塊(33)的輸出端與數據庫(32)連接,所述語音評價模塊(33)用于對來自學生客戶端(2)的待測語音進行準確度、完整度和流暢度評測,得到對應的口語分數;
所述數據庫(32)用于存儲教師用戶信息及學生用戶信息、存儲來自教師客戶端(1)的語料數據及教學計劃信息、存儲與學生用戶信息對應的口語分數。
3.根據權利要求1所述的一種口語評測系統,其特征在于,所述通信模塊(31)具體采用兩層C/S架構、Serverless架構或混合架構,所述混合架構包括C/S架構和Serverless架構。
4.根據權利要求2所述的一種口語評測系統,其特征在于,所述語音評價模塊(33)包括依次連接預處理單元、特征提取單元、模式匹配單元和后處理單元,所述預處理單元與學生客戶端(2)連接,所述后處理單元與數據庫(32)連接,所述預處理單元用于對待測語音進行濾波及分幀處理;
所述特征提取單元用于從預處理后的待測語音信號中提取特征向量;
所述模式匹配單元用于識別出待測語音對應的語句信息;
所述后處理單元根據待測語音及其對應的語句信息、語料數據,得到待測語音對應的準確度、完整度和流暢度分數,即為口語分數。
5.根據權利要求4所述的一種口語評測系統,其特征在于,所述模式匹配單元內設置有與特征提取單元連接的訓練模型,所述訓練模型用于根據待測語音的特征向量,識別輸出對應的語句信息。
6.根據權利要求5所述的一種口語評測系統,其特征在于,所述訓練模型具體選用隱馬爾可夫結合神經網絡的模型結構。
7.根據權利要求6所述的一種口語評測系統,其特征在于,所述訓練模型包括聲學模型和語言模型,所述聲學模型通過對大量語音數據進行訓練獲得,其輸入是語音特征向量,其輸出為音素信息;
所述語言模型通過對大量文本信息進行訓練獲得,其輸出為單個字或詞相互關聯的概率。
8.一種應用如權利要求1所述口語評測系統的口語評測方法,其特征在于,包括以下步驟:
S1、教師客戶端獲取教師用戶信息、學生名單、教學計劃信息以及語料數據,并將獲取的信息數據傳輸給服務器進行存儲;
S2、學生客戶端獲取學生用戶信息,并傳輸給服務器進行存儲;
S3、學生客戶端從服務器獲取語料數據,并將獲取的語料數據輸出給學生用戶;
S4、學生客戶端接收來自學生用戶的待測語音,并傳輸給服務器;
S5、服務器對待測語音進行準確度、完整度及流暢度評測,得到口語分數,并將該口語分數與學生用戶信息對應進行存儲、將該口語分數輸出給學生客戶端;
S6、教師客戶端從服務器獲取學生名單中已有學生對應的口語分數,以便教師用戶查看其學生的口語學習成果。
9.根據權利要求8所述的一種口語評測方法,其特征在于,所述語料數據包括測試語句信息及對應的語音數據。
10.根據權利要求9所述的一種口語評測系統,其特征在于,所述步驟S5中服務器對待測語音進行準確度、完整度及流暢度評測的具體過程為:
S51、對待測語音進行預處理,具體是采用濾波方法對待測語音數字信號進行去噪處理,并對待測語音數字信號進行端點檢測、音段切分,以得到有效語音的起始點及結束點;
S52、從預處理后的有效語音中提取能夠表征語音特性的特征向量;
S53、將特征向量輸入聲學模型,得到對應的音素串,基于動態時間規整法,找到每個音素的起止時間及各音素之間的分界點,通過字典匹配的方式,得到各音素對應的文本信息;
S54、將各音素對應的文本信息輸入語言模型,得到待測語音對應概率最高的語句信息;
S55、將待測語音對應概率最高的語句信息與測試語句信息進行對比,生成準確度評分;
統計待測語音的發音間隔、發音起始點及結束點,生成完整度評分以及流暢度評分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海電機學院,未經上海電機學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011299829.8/1.html,轉載請聲明來源鉆瓜專利網。





