[發明專利]語言學習系統在審
| 申請號: | 202310398141.2 | 申請日: | 2023-04-14 |
| 公開(公告)號: | CN116434779A | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 郭晶晶;劉恕 | 申請(專利權)人: | 威盛電子股份有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L15/26;G10L15/02;G10L15/06;G10L25/30;G06N3/044;G06N3/08;G09B5/04 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇;宋曉雯 |
| 地址: | 中國臺灣新北*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語言 學習 系統 | ||
1.一種語言學習系統,其特征在于,包括:
運行在數據處理服務器上的數據預處理系統、以及音頻質量檢測系統,
其中:
該數據預處理系統包括標注系統、以及音頻預處理系統,用以根據文本、以及用戶朗讀該文本的音頻,分別產生標注、以及音頻數據;
該音頻質量檢測系統基于該標注、以及該音頻數據為該音頻打分;且
該標注系統包括人工智能模型,響應該文本包括多音單詞的狀況而產生該標注,所述多音單詞為不同詞性不同發音的單詞、或特殊單詞,所述特殊單詞包括數字、或地名。
2.根據權利要求1所述的語言學習系統,其中:
該人工智能模型包括對應不同多音單詞的多個音頻-標注模型;且
響應該文本為單詞文本、且是多音單詞的狀況,對應的音頻-標注模型運作,根據該音頻,依照置信度產生該標注。
3.根據權利要求2所述的語言學習系統,其中:
各音頻-標注模型的訓練采用所對應單詞的多個標準發音音頻作為輸入,并以該多個標準發音音頻的理想標注為輸出。
4.根據權利要求2所述的語言學習系統,其中,各音頻-標注模型的輸入至輸出間串接有:
深度神經網絡;以及
全連接層。
5.根據權利要求4所述的語言學習系統,其中,各音頻-標注模型還包括:
輸入層,接收該音頻;
音頻特征獲取層,提取該音頻的梅爾頻率倒譜系數特征;以及
歸一化層,將所述梅爾頻率倒譜系數特征歸一化,以輸入該深度神經網絡。
6.根據權利要求1所述的語言學習系統,其中:
該人工智能模型包括句子-標注模型;且
響應該文本為句子文本、且該句子文本包括多音單詞的狀況,該句子-標注模型運作,根據該句子文本產生該標注。
7.根據權利要求6所述的語言學習系統,其中:
該句子-標注模型的訓練采用訓練文本作為輸入,各訓練文本為包括多音單詞的句子文本;且
該句子-標注模型的訓練以各訓練文本的理想標注為輸出。
8.根據權利要求7所述的語言學習系統,其中,該句子-標注模型包括:
輸入層,將包括多音單詞的句子文本轉換為句子向量,以經處理產生對應的理想標注。
9.根據權利要求8所述的語言學習系統,其中,該句子-標注模型還包括:
分詞系統,響應分詞需求,將句子向量分詞后,再經處理產生對應的理想標注。
10.根據權利要求6所述的語言學習系統,其中,該句子-標注模型的輸入至輸出間串接有:
嵌入層;
作為編碼器的長短期記憶網絡;
作為解碼器的長短期記憶網絡;以及
全連接層。
11.根據權利要求10所述的語言學習系統,其中:
該句子-標注模型采用激活函數Softmax。
12.根據權利要求11所述的語言學習系統,其中,該句子-標注模型還包括:
輸入層,將包括多音單詞的句子文本轉換為句子向量,以輸入該嵌入層。
13.根據權利要求12所述的語言學習系統,其中,該句子-標注模型還包括:
分詞系統,響應分詞需求,將句子向量分詞后,再輸入該嵌入層。
14.根據權利要求1所述的語言學習系統,其中:
該標注系統還包括詞典;且
該標注系統通過查詢該詞典,來判斷該文本是否包括多音單詞,以啟動該人工智能模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于威盛電子股份有限公司,未經威盛電子股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310398141.2/1.html,轉載請聲明來源鉆瓜專利網。





