[發明專利]一種用戶語言評估方法及系統在審
| 申請號: | 201810036799.8 | 申請日: | 2018-01-15 |
| 公開(公告)號: | CN108257615A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 蔡森川;杜娟;何嘉斌;顧嘉唯 | 申請(專利權)人: | 北京物靈智能科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G06K9/46;G06F17/30 |
| 代理公司: | 北京市天璽沐澤專利代理事務所(普通合伙) 11532 | 代理人: | 謝鑫 |
| 地址: | 100102 北京市朝陽區望京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 跟讀 評估 目標文本 用戶語言 文本 接收用戶 用戶學習 語言學習 播放 復讀 采集 申請 語言 | ||
1.一種用戶語言評估方法,其特征在于,包括:
識別當前文本是否為目標文本;
當識別當前文本為目標文本時,則接收用戶的跟讀操作;
確定執行跟讀操作對應的待播放的第一跟讀音頻;
播放第一跟讀音頻;
采集用戶根據所述第一跟讀音頻復讀的第二跟讀音頻;
對用戶的第二跟讀音頻進行評估。
2.如權利要求1所述的方法,其特征在于,識別當前文本是否為目標文本,具體包括:
獲取當前文本圖像;
提取所述當前文本圖像的圖像特征;
在預先存儲的圖像特征數據庫中查找是否存在所提取的圖像特征;
若是,則識別當前文本為目標文本;
若否,則識別當前文本為非目標文本。
3.如權利要求2所述的方法,其特征在于,提取當前文本圖像的圖像特征,具體包括:
通過卷積神經網絡算法提取當前文本圖像的圖像特征;或
通過循環神經網絡算法提取當前文本圖像的圖像特征;或
通過尺度不變特征變化算法提取當前文本圖像的圖像特征。
4.如權利要求1所述的方法,其特征在于,確定執行跟讀操作對應的待播放的第一跟讀音頻,具體包括:
獲取目標文本中的待讀文本頁圖像;
提取所述待讀文本頁圖像的圖像特征;
根據所述待讀文本頁圖像的圖像特征,在頁碼特征數據庫中,確定所述待讀文本頁對應的頁碼;
根據所述待讀文本頁對應的頁碼,在語句標記文本數據庫中,確定所述頁碼對應的語句標記文本;
根據所述頁碼以及所述頁碼對應的語句標記文本,獲取第一跟讀音頻;
將所獲取的第一跟讀音頻確定為執行跟讀操作對應的待播放的第一跟讀音頻。
5.如權利要求4所述的方法,其特征在于,對用戶的第二跟讀音頻進行評估,具體包括:
依次提取用戶的第二跟讀音頻中的各單詞音頻;
按提取單詞音頻的順序針對每個單詞音頻,依次提取該單詞音頻中的各音素音頻;
按提取音素音頻的順序針對每個音素音頻,確定該音素音頻對應的標準音素音頻,并將該音素音頻與標準音素音頻進行對比,確定該音素音頻的第一分數值;
針對任一單詞音頻,將該單詞音頻所包含的所有音素音頻的第一分數值之和作為該單詞音頻的第二分數值;
將所述用戶的第二跟讀音頻所包含的所有單詞音頻的第二份數值之和作為所述用戶的第二跟讀音頻的評估值;
根據所述用戶的第二跟讀音頻的評估值,對用戶的第二跟讀音頻進行評估。
6.如權利要求5所述的方法,其特征在于,確定該音素音頻對應的標準音素音頻,具體包括:
根據包含該音素音頻的單詞音頻的提取順序,在所述語句標記文本中提取單詞音頻對應的單詞;
根據該音素音頻的提取順序,在所提取的單詞音頻對應的單詞中提取該音素音頻對應的單詞音標;
根據所提取該音素音頻對應的單詞音標,在標準音素音頻數據庫中,確定所述單詞音標對應的標準音素音頻。
7.如權利要求5所述的方法,其特征在于,根據所述用戶的第二跟讀音頻的評估值,對用戶的第二跟讀音頻進行評估,具體包括:
判斷所述用戶的第二跟讀音頻的評估值是否超過預設的閾值;
若是,則所述用戶的第二跟讀音頻合格,并提示用戶;
若否,則所述用戶的第二跟讀音頻未合格,并重復播放所述第二跟讀音頻。
8.一種用戶語言評估系統,其特征在于,包括:
中央處理器,用于識別當前文本是否為目標文本;
圖像反饋裝置,用于當中央處理器識別當前文本為目標文本時,則接收用戶的跟讀操作;
中央處理器,用于確定執行跟讀操作對應的待播放的第一跟讀音頻;
揚聲器,用于播放第一跟讀音頻;
麥克風,用于采集用戶根據所述第一跟讀音頻復讀的第二跟讀音頻;
云端服務器,用于對用戶的第二跟讀音頻進行評估。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京物靈智能科技有限公司,未經北京物靈智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810036799.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:音頻數據標注的方法及其系統
- 下一篇:一種噪聲場景識別系統及方法





