[發明專利]一種發音識別的方法、裝置及電子設備在審
| 申請號: | 202110763972.6 | 申請日: | 2021-07-06 |
| 公開(公告)號: | CN113506563A | 公開(公告)日: | 2021-10-15 |
| 發明(設計)人: | 莫貴明;王丹;龐永強;饒豐;楊熙 | 申請(專利權)人: | 北京一起教育科技有限責任公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/16;G10L15/26;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 牛亭亭 |
| 地址: | 100032 北京市西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 發音 識別 方法 裝置 電子設備 | ||
本發明提供了一種發音識別方法、裝置及電子設備,其中,該方法包括:預設包含至少四個子模型的發音屬性識別模型,四個子模型分別用于識別發音位置及水平位置、發音位置及垂直位置、發音位置及嘴唇形狀、發音方式;確定目標語音數據中的每個音素數據,并確定音素數據的發音維度;根據音素數據的類別確定音素數據在不同發音維度中的發音屬性。通過本發明實施例提供的發音識別的方法、裝置及電子設備,不需要設置過多的發音屬性識別模型,可以簡化模型,提高訓練以及識別效率;且在訓練子模型時,元音或輔音的樣本均可以標注有意義的標簽,從而可以避免增加無意義的標注,能夠保證每個子模型識別結果的準確度。
技術領域
本發明涉及語音識別技術領域,具體而言,涉及一種發音識別的方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
語言學習一直是人們所學知識中非常重要的一部分。在今天,隨著計算機技術的發展,計算機輔助語言學習系統(Computer-assisted language learning system,CALL)也變得越來越流行。使用CALL系統,使得學習者可在方便的時間,以輕松的心態及適當的節奏學習第二語言。作為CALL系統不可或缺的一部分,計算機輔助發音訓練系統(Computer-assisted pronunciation training system,CAPT)的主要目的就是給學習者提供糾正性的發音反饋,讓學習者清楚發音的具體錯誤及相應的糾正信息。
發音指的是通過唇、舌頭、顎、咽等構音器官的摩擦和阻斷動作,發出各種語音的過程。一般而言,針對輔音的發音屬性(Articulatory attributes),使用發音位置和發音方式來描述;針對元音的發音屬性,使用三個維度的特征來描述,包括:水平維度(Tonguebackness)、垂直維度(Tongue height)、嘴唇形狀(Roundedness)。通過識別出語言學習者在發音過程的發音屬性,并與標準文本對應的發音屬性做比較,可以得出學習者存在的具體發音錯誤,并給出準確的糾正信息。
傳統的發音識別方案,主要是通過語言學的知識制定相關規則,以抽取音頻中和發音屬性相關的特征。該方法識別效果差,且難以解決個體化差異較大的問題。部分方案采用建模的方式進行識別,但由于識別元音、輔音的發音屬性時的所用的維度也各不相同,維度較多,模型較為復雜。
發明內容
為解決現有存在的技術問題,本發明實施例提供一種發音識別的方法、裝置、電子設備及計算機可讀存儲介質。
第一方面,本發明實施例提供了一種發音識別的方法,包括:
預設包含至少四個子模型的發音識別模型,四個所述子模型分別用于識別發音位置及水平位置、發音位置及垂直位置、發音位置及嘴唇形狀、發音方式;
獲取待識別的目標語音數據以及與所述目標語音數據對應的標準文本,根據所述發音識別模型確定所述目標語音數據中的每個音素數據,并確定所述音素數據的發音維度,所述發音維度包括發音位置、發音方式、水平位置、垂直位置和嘴唇形狀;
根據所述標準文本確定所述音素數據的類別,并根據所述音素數據的類別確定所述音素數據在不同發音維度中的發音屬性;其中,在所述音素數據的類別為元音的情況下,確定所述音素數據在水平位置、垂直位置和嘴唇形狀中的發音屬性;在所述音素數據的類別為輔音的情況下,確定所述音素數據在發音位置和發音方式中的發音屬性。
第二方面,本發明實施例還提供了一種發音識別的裝置,包括:
模型模塊,用于預設包含至少四個子模型的發音識別模型,四個所述子模型分別用于識別發音位置及水平位置、發音位置及垂直位置、發音位置及嘴唇形狀、發音方式;
處理模塊,用于獲取待識別的目標語音數據以及與所述目標語音數據對應的標準文本,根據所述發音識別模型確定所述目標語音數據中的每個音素數據,并確定所述音素數據的發音維度,所述發音維度包括發音位置、發音方式、水平位置、垂直位置和嘴唇形狀;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京一起教育科技有限責任公司,未經北京一起教育科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110763972.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種治療尿失禁的尿道周圍水循環控尿裝置
- 下一篇:二維碼的識別方法及裝置





