[發明專利]基于重音突現度的英語發音質量評價方法有效
| 申請號: | 202011213272.1 | 申請日: | 2020-11-04 |
| 公開(公告)號: | CN112466335B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 艾群 | 申請(專利權)人: | 吉林體育學院 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L15/00 |
| 代理公司: | 上海旭新專利代理事務所(普通合伙) 31474 | 代理人: | 毛碧娟 |
| 地址: | 130000 吉林*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 重音 突現 英語 發音 質量 評價 方法 | ||
1.一種基于重音突現度的英語發音質量評價方法,所述方法包括如下步驟:
?S1:通過第一拾音陣列接收第一語音輸入,所述第一語音輸入包含至少一個英文序列;
S2:通過第二預處理模塊對所述第一語音輸入進行預處理,得到預處理語音序列,所述預處理語音序列包括多個存在重疊區間的子序列;
S3:基于所述多個子序列的分布特征,對所述第一語音輸入進行發音質量評價;
其特征在于:
所述第一拾音陣列包括多個處于不同位置的收音麥克風;
所述步驟S2所述預處理包括如下步驟:
S21:對所述第一語音輸入進行預加重處理;
S22:對所述預加重處理后的第一語音輸入信號進行分幀;
S23:通過譜減法對所述分幀后的序列進行去噪;
S24:對所述去噪后的序列進行端點檢測,獲取每兩個相鄰端點之間的音頻頻域特征;
所述步驟22對所述預加重處理后的第一語音輸入信號進行分幀,得到多個分幀子序列,每個所述分幀子序列包括起始端點和終止端點,
所述步驟S3所述的多個子序列的分布特征,包括相鄰的第一分幀子序列和第二分幀子序列的端點分布特征;
所述步驟S3所述基于所述多個子序列的分布特征,對所述第一語音輸入進行發音質量評價,具體包括:
S31:對于每個相鄰的第一分幀子序列和第二分幀子序列,計算其重疊度:
其中,為所述第一分幀子序列的起始端點和終止端點;為所述第二分幀子序列的起始端點和終止端點;表示端點距離計算;
?S32:基于所述預處理語音序列的所有相鄰分幀子序列的重疊度分布,計算所述預處理語音序列的質量評分score:
;
其中,表示對所有大于的重疊度求和;表示對所有重疊度求和。
2.如權利要求1所述的一種基于重音突現度的英語發音質量評價方法,其特征在于:
所述第一拾音陣列包括第一收音麥克風和第二收音麥克風;
所述第一收音麥克風和第二收音麥克風同時接收所述第一語音輸入。
3.如權利要求1所述的一種基于重音突現度的英語發音質量評價方法,其特征在于:
所述步驟S21具體包括:
通過高通濾波器對所述第一語音輸入進行預加重處理,所述高通濾波器的傳遞函數為:,其中,;
z為傳遞函數變量;n為所述第一拾音陣列包含的所述收音麥克風的數量。
4.如權利要求1所述的一種基于重音突現度的英語發音質量評價方法,其特征在于:
所述步驟S22具體包括:
采用滑動時間窗口對所述進行預加重處理后的第一語音輸入信號進行分幀;
所述滑動時間窗口函數表達式如下:
;N為每一幀的長度。
5.如權利要求2所述的一種基于重音突現度的英語發音質量評價方法,其特征在于:
所述第一收音麥克風和第二收音麥克風分別連接所述第二預處理模塊,
所述第二預處理模塊對所述第一收音麥克風接收的第一語音輸入和所述第二收音麥克風接收的所述第一語音輸入分別進行預處理,分別得到第一預處理語音序列和第二預處理語音序列。
6.一種計算機可讀存儲介質,其上存儲有計算機可執行程序指令,通過包含處理器和存儲器的終端設備,執行所述可執行程序指令,用于實現權利要求1-5任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林體育學院,未經吉林體育學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011213272.1/1.html,轉載請聲明來源鉆瓜專利網。





