[發明專利]具備多讀音糾錯功能的語言學習系統在審
| 申請號: | 202310398343.7 | 申請日: | 2023-04-14 |
| 公開(公告)號: | CN116434780A | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 郭晶晶;劉恕 | 申請(專利權)人: | 威盛電子股份有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L25/78;G10L15/02;G10L15/06;G10L15/26;G10L25/30;G06N3/044;G06N3/0442;G06N3/08;G09B5/06 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇;宋曉雯 |
| 地址: | 中國臺灣新北*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 具備 讀音 糾錯 功能 語言 學習 系統 | ||
1.一種具備多讀音糾錯功能的語言學習系統,其特征在于,包括:
運行在數據處理服務器上的音頻質量檢測系統,偵測用戶朗讀文本的音頻的多讀音,以提示用戶進行糾正。
2.根據權利要求1的具備多讀音糾錯功能的語言學習系統,還包括:
運行在該數據處理服務器上的數據預處理系統,該數據預處理系統包括標注系統、以及音頻預處理系統,用以根據該文本、以及該音頻,分別產生標注、以及音頻數據;
該音頻質量檢測系統基于該標注、以及該音頻數據,判別該音頻相對該文本是否有多讀音。
3.根據權利要求2的具備多讀音糾錯功能的語言學習系統,其中,該音頻質量檢測系統運行:
強制對齊系統,令該音頻數據強制對齊包括文本音素序列的該標注,產生強制對齊結果,顯示該音頻各幀對應該文本音素序列中的哪些音素,且屬所對應音素的哪個狀態;
無效幀判別系統,自該強制對齊結果,判別該音頻數據中,無法對齊該文本音素序列的無效幀,是否對應多讀音。
4.根據權利要求3的具備多讀音糾錯功能的語言學習系統,其中:
在該音頻數據中無法對齊該文本音素序列的一連串無效幀的幀數超過多讀音判別閾值時,該無效幀判別系統判別該一連串無效幀對應多讀音。
5.根據權利要求4的具備多讀音糾錯功能的語言學習系統,其中:
在該一連串無效幀的幀數不超過該多讀音判別閾值時,該無效幀判別系統判別該一連串無效幀為靜音。
6.根據權利要求4的具備多讀音糾錯功能的語言學習系統,其中:
該多讀音判別閾值取決于該音頻的采樣率。
7.根據權利要求4的具備多讀音糾錯功能的語言學習系統,其中,該音頻質量檢測系統還運行:
語音活動檢測系統,以深度學習的循環神經網絡為該音頻數據過濾噪音。
8.根據權利要求7的具備多讀音糾錯功能的語言學習系統,其中:
該多讀音判別閾值取決于該語音活動檢測系統的演算法。
9.根據權利要求4的具備多讀音糾錯功能的語言學習系統,其中:
該多讀音判別閾值為15。
10.根據權利要求3的具備多讀音糾錯功能的語言學習系統,其中:
該音頻數據中無法對齊該文本音素序列的無效幀,在該強制對齊結果中,以特定數字表示。
11.根據權利要求10的具備多讀音糾錯功能的語言學習系統,其中:
該強制對齊結果中,在一連串該特定數字出現次數超過多讀音判別閾值時,該無效幀判別系統判別該一連串特定數字所對應的一連串無效幀對應多讀音。
12.根據權利要求11的具備多讀音糾錯功能的語言學習系統,其中:
該特定數字為1。
13.根據權利要求4的具備多讀音糾錯功能的語言學習系統,還包括:
人機界面,由用戶端裝置運行,供用戶選擇文本進行朗讀錄音,并上傳該文本、以及該音頻至該數據處理服務器;
其中:
響應該無效幀判別系統判別該一連串無效幀對應多讀音,運行在該數據處理服務器上的該音頻質量檢測系統,通過網絡回傳通知,經該人機界面,提示用戶有多讀音。
14.根據權利要求13的具備多讀音糾錯功能的語言學習系統,其中:
該音頻質量檢測系統還包括后驗概率計算系統、以及指定級別音頻質量打分系統,基于該強制對齊結果,進行后驗概率計算,繼而實現該音頻特定級別的打分,以通過網絡回傳通知,經該人機界面,提示用戶;且偵測到的多讀音反映在打分上。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于威盛電子股份有限公司,未經威盛電子股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310398343.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種單晶硅片切片系統及其工藝
- 下一篇:一種無人機槳葉束槳器





