[發明專利]一種詩詞背誦評測方法及系統、一種終端及存儲介質在審
| 申請號: | 201710504389.7 | 申請日: | 2017-06-28 |
| 公開(公告)號: | CN107316638A | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 高強;吳凡;夏龍;閻鵬;鄧澍軍;郭常圳 | 申請(專利權)人: | 北京粉筆未來科技有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/14;G10L15/16;G10L15/26;G10L17/04 |
| 代理公司: | 北京智信禾專利代理有限公司11637 | 代理人: | 吳肖肖 |
| 地址: | 100093 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 詩詞 背誦 評測 方法 系統 終端 存儲 介質 | ||
技術領域
本發明涉及語音識別及測評技術領域,特別涉及一種詩詞背誦評測方法及系統、一種終端及存儲介質。
背景技術
目前詩詞背誦的主體用戶主要為中小學生,通用的語音識別技術針對其他使用者時很難像中小學生一樣將發聲數據達到最優的效果,詩詞背誦的識別準確率比較低;如果想要達到較高的識別準確率就需要大量的訓練數據,所使用的訓練數據基本是由專業麥克風錄制的,再經過比較長的訓練時間,訓練方法也比較復雜;如今在移動互聯網時代,用戶在進行詩詞背誦檢測時,大部分都是利用PC機麥克風、手機麥克風等錄音設備錄制詩詞背誦語音,然后進行識別檢測,使用現有的語音識別技術對這種通過非專業麥克風錄制的詩詞背誦語音識別不精確,并且需要單獨對詩詞背誦語音中的噪聲做處理,增加額外的去噪聲處理時間,成本高、響應時間長。
發明內容
有鑒于此,本申請提供一種詩詞背誦評測方法及系統、一種終端及存儲介質,以實現面對多種用戶群體以及復雜的背誦環境下可以對詩詞背誦的內容快速準確識別并且檢測出背誦錯誤率。
一方面,本申請提供一種詩詞背誦評測方法,包括:
確定待背誦詩詞;
獲取所述待背誦詩詞的語音;
對所述語音進行預處理;
將預處理后的所述語音上傳至服務器;
所述服務器中預先建立的識別模型將所述語音轉換成文字;
將所述文字與所述待背誦詩詞進行比較,根據預設的評分規則計算出所述文字的得分;
將所述得分反饋至客戶端。
可選地,對所述語音進行預處理包括:
對所述語音分片;
將分片的所述語音進行壓縮。
可選地,所述將預處理后的所述語音上傳至服務器后還包括:
對上傳至服務器的所述語音解壓縮;
將解壓縮后的所述語音進行靜音檢測。
可選地,預先建立所述識別模型的步驟包括:
構建初始的語音識別網絡,
所述語音識別網絡接收語音訓練數據;
將接收到的其中一條語音訓練數據轉換成文字;
計算轉換的所述文字與所述語音訓練數據的真實文字之間的誤差;
若所述誤差大于或等于預設閾值,根據所述誤差調整所述語音識別網絡的參數,然后再次執行所述將接收到的其中一條語音訓練數據轉換成文字的步驟,繼續訓練所述語音識別網絡;
若所述誤差小于預設閾值,所述語音識別網絡訓練結束。
可選地,所述構造語音訓練數據包括:
獲取原始詩詞語音,將所述原始詩詞語音作為訓練數據;
在所述原始詩詞語音中摻雜噪聲生成新的訓練數據。
可選地,所述原始詩詞語音包括不同音質和/或不同聲音特征的詩詞語音。
可選地,所述構造語音訓練數據還包括:
獲取原始非詩詞語音,將所述原始非詩詞語音作為訓練數據。
可選地,所述識別模型包括隱馬爾可夫模型(Hidden Markov Model,HMM)和/或深度神經網絡模型(DNN)。
可選地,所述使用所述服務器中預先建立的識別模型將所述語音轉換成文字,還包括:使用語言模型對轉換后的所述文字進行糾錯。
可選地,使用語言模型對轉換后的所述文字進行糾錯之后,還包括:利用概率模型將轉換后的所述文字與所述待背誦詩詞的真實文字進行結果對齊。
可選地,所述概率模型用來判斷背誦的詩詞內容為順序背誦、重新背誦或遺漏背誦。
可選地,利用概率模型將轉換后的所述文字與所述待背誦詩詞的真實文字進行結果對齊,還包括:
如果背誦的詩詞正確,則將背誦正確的詩詞顯示為第一顏色,
如果背誦的詩詞錯誤,則將背誦錯誤的詩詞顯示為與第一顏色不同的第二顏色;
如果重新背誦的詩詞正確,則將已經顯示為第二顏色的詩詞修改為第一顏色;
如果發生遺漏背誦的詩詞且背誦的詩詞部分正確,則將遺漏背誦的詩詞顯示為第二顏色,將背誦正確的詩詞顯示為第一顏色。
另一方面,本申請提供一種詩詞背誦評測系統,包括客戶端和服務器,所述客戶端包括:
選擇模塊,用于確定待背誦詩詞;
獲取模塊,用于獲取所述待背誦詩詞的語音;
預處理模塊,用于對所述語音進行預處理;
上傳模塊,用于將預處理后的所述語音上傳至服務器;
所述服務器包括:
轉換模塊,用于使用所述服務器中預先建立的識別模型將所述語音轉換成文字;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京粉筆未來科技有限公司,未經北京粉筆未來科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710504389.7/2.html,轉載請聲明來源鉆瓜專利網。





