[發明專利]語言學習系統在審
| 申請號: | 202310398141.2 | 申請日: | 2023-04-14 |
| 公開(公告)號: | CN116434779A | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 郭晶晶;劉恕 | 申請(專利權)人: | 威盛電子股份有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L15/26;G10L15/02;G10L15/06;G10L25/30;G06N3/044;G06N3/08;G09B5/04 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇;宋曉雯 |
| 地址: | 中國臺灣新北*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語言 學習 系統 | ||
本發明提供一種語言學習系統,其涉及高可信度音頻質量檢測技術,在一數據處理服務器上運行一數據預處理系統、以及一音頻質量檢測系統。該數據預處理系統包括一標注系統、以及一音頻預處理系統,用以根據一文本、以及用戶朗讀該文本的一音頻,分別產生一標注、以及一音頻數據。該音頻質量檢測系統是基于該標注、以及該音頻數據為該音頻打分。該標注系統包括一人工智能模型,響應該文本包括多音單詞的狀況而產生該標注。
技術領域
本發明關于語言學習系統,特別有關于口說的音頻質量檢測(Goodness?ofpronunciation,簡稱GOP)。
背景技術
隨著計算機的技術發展,語言學習系統功能越來越強大。使用者可準備各種文本進行口說訓練。系統可對用戶錄音的完整度、流暢度、準確度…等進行評分反饋,幫助用戶提升口語。此功能稱為音頻質量檢測(GOP)。
如何提升音頻質量檢測(GOP)的可信度,還幫助用戶改善口說,為本技術領域一項重大課題。
發明內容
本發明提出一種高可信度音頻質量檢測(GOP)的語言學習系統。
根據本發明一種實施方式實現的一語言學習系統包括運行在一數據處理服務器上的一數據預處理系統、以及一音頻質量檢測系統。該數據預處理系統包括一標注系統、以及一音頻預處理系統,用以根據一文本、以及用戶朗讀該文本的一音頻,分別產生一標注、以及一音頻數據。該音頻質量檢測系統是基于該標注、以及該音頻數據為該音頻打分。該標注系統包括一人工智能模型,響應該文本包括多音單詞的狀況而產生該標注。所述多音單詞為不同詞性不同發音的單詞、或特殊單詞,所述特殊單詞包括數字、或地名。
該人工智能模型會適應該文本的多音單詞狀況,使該標注符合理想發音,進而提升該音頻質量檢測系統的可信度。用戶的錯誤發音可被確實指正。
一種實施方式中,該人工智能模型包括對應不同多音單詞的多個音頻-標注模型。響應該文本為單詞文本、且是多音單詞的狀況,對應的音頻-標注模型運作,根據該音頻產生該標注。
一種實施方式中,該人工智能模型包括一句子-標注模型。響應該文本為句子文本、且該句子文本包括多音單詞的狀況,該句子-標注模型運作,根據該句子文本產生該標注。
一種實施方式中,該語言學習系統還包括一人機界面,由用戶端裝置運行,供用戶選擇文本進行朗讀錄音,并上傳該文本、以及該音頻至該數據處理服務器。
下文特舉實施例,并配合所附圖示,詳細說明本發明內容。
附圖說明
圖1圖解一種語言學習系統100;
圖2以方塊圖圖解一特定單詞的音頻-標注模型的實施架構;
圖3以方塊圖圖解句子-標注模型128的一種實施架構;
圖4根據本發明一種實施方式圖解標注系統112的工作流程;
圖5圖解語言模型502、以及聲學模型504的一種建立方式;
圖6圖解音頻質量檢測(GOP)系統120的一種實施方式,其中即應用了圖5訓練出的語言模型502、以及聲學模型504;
圖7圖解一種語言學習系統700;
圖8圖解具備多讀音糾錯功能的音頻質量檢測(GOP)系統720的一種實施方式;以及
圖9為具備多讀音糾錯功能的音頻質量檢測(GOP)系統720運作的流程圖。
其中,附圖中符號的簡單說明如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于威盛電子股份有限公司,未經威盛電子股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310398141.2/2.html,轉載請聲明來源鉆瓜專利網。





