[發明專利]糾音方法、糾音裝置及非瞬時性存儲介質在審
| 申請號: | 202111283587.8 | 申請日: | 2021-11-01 |
| 公開(公告)號: | CN113990351A | 公開(公告)日: | 2022-01-28 |
| 發明(設計)人: | 董秋思;楊曉飛 | 申請(專利權)人: | 蘇州聲通信息科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/30;G10L25/24;G10L25/72 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 彭久云 |
| 地址: | 215000 江蘇省蘇州市蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 方法 裝置 瞬時 存儲 介質 | ||
一種糾音方法、糾音裝置及非瞬時性存儲介質。糾音方法包括:獲取單詞和第一音頻數據;基于單詞,對第一音頻數據進行發音診斷操作,以生成發音診斷結果。單詞的標準發音包括至少一個標準音素,發音診斷操作包括:基于第一聲學模型,對第一音頻數據與標準發音進行對齊操作,以得到每個標準音素的時間邊界;根據每個標準音素的時間邊界,確定每個標準音素的評分;基于第二聲學模型,對第一音頻數據進行識別操作,以得到解碼音素序列和每個解碼音素的時間邊界;根據每個解碼音素的時間邊界,確定每個解碼音素的評分;確定各個標準音素與各個解碼音素之間的對應關系;以及基于對應關系、各個標準音素的評分和各個解碼音素的評分,生成發音診斷結果。
技術領域
本公開的實施例涉及一種糾音方法、糾音裝置及非瞬時性存儲介質。
背景技術
隨著科學技術的發展,越來越多的語言學習者使用語言學習類應用程序(APP)輔助語言學習。在一些語言學習類應用程序中,應用程序提供商通過互聯網將學習材料發送到客戶端,用戶經由客戶端獲取學習材料,進行對應的學習。除了學習語法和詞匯之外,提升發音能力也是語言學習過程中極為重要的一部分。通常情況下,用戶會通過朗讀、跟讀等方式來提升自身的發音能力。然而,多數情況下用戶無法得知自身發音是否準確。
發明內容
本公開至少一些實施例提供一種糾音方法。該糾音方法包括:獲取單詞和第一音頻數據;基于所述單詞,對所述第一音頻數據進行發音診斷操作,以生成發音診斷結果;其中,所述單詞的標準發音包括至少一個標準音素;基于所述單詞,對所述第一音頻數據進行所述發音診斷操作,以生成所述發音診斷結果,包括:基于第一聲學模型,對所述第一音頻數據與所述標準發音進行對齊操作,以得到所述標準發音中的每個標準音素在所述第一音頻數據中的時間邊界;根據所述每個標準音素的時間邊界確定的音頻段,確定所述每個標準音素的評分;基于第二聲學模型,對所述第一音頻數據進行識別操作,以得到解碼音素序列和所述解碼音素序列中的每個解碼音素在所述第一音頻數據中的時間邊界,其中,所述解碼音素序列包括至少一個解碼音素;根據所述每個解碼音素的時間邊界確定的音頻段,確定所述每個解碼音素的評分;確定所述標準發音中的各個標準音素與所述解碼音素序列中的各個解碼音素之間的對應關系;以及基于所述對應關系、各個標準音素的評分和各個解碼音素的評分,生成所述發音診斷結果。
例如,在本公開一些實施例提供的糾音方法中,確定所述標準發音中的各個標準音素與所述解碼音素序列中的各個解碼音素之間的對應關系,包括:以音素作為編輯元素,對所述標準發音與所述解碼音素序列進行編輯距離操作,以確定所述對應關系。
例如,在本公開一些實施例提供的糾音方法中,所述編輯距離操作包括音素替換操作,不同音素之間的音素替換操作的權重至少不完全相同。
例如,在本公開一些實施例提供的糾音方法中,基于所述對應關系、各個標準音素的評分和各個解碼音素的評分,生成所述發音診斷結果,包括:響應于任一標準音素有與之對應的解碼音素,判斷所述任一標準音素的評分是否低于第一分數閾值;響應于所述任一標準音素的評分低于所述第一分數閾值,根據所述任一標準音素的時間邊界以及對應于所述任一標準音素的解碼音素的時間邊界,計算所述任一標準音素與對應于所述任一標準音素的解碼音素之間的邊界重合度;以及,響應于所述任一標準音素與對應于所述任一標準音素的解碼音素不同且所述任一標準音素與對應于所述任一標準音素的解碼音素之間的邊界重合度不小于重合度閾值,在所述發音診斷結果中指明對于所述任一標準音素發生了誤讀情況。
例如,在本公開一些實施例提供的糾音方法中,基于所述對應關系、各個標準音素的評分和各個解碼音素的評分,生成所述發音診斷結果,還包括:判斷對應于所述任一標準音素的解碼音素的評分與所述任一標準音素的評分之差是否不小于第二分數閾值;以及,響應于對應于所述任一標準音素的解碼音素的評分與所述任一標準音素的評分之差不小于所述第二分數閾值,在所述誤讀情況中指明將所述任一標準音素誤讀成對應于所述任一標準音素的解碼音素。
例如,在本公開一些實施例提供的糾音方法中,根據下述公式計算邊界重合度:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州聲通信息科技有限公司,未經蘇州聲通信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111283587.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鞋跟打圓和拔釘一體設備
- 下一篇:風口組件、空調器及其空調器的控制方法





