[發明專利]一種基于深度音頻特征的構音障礙嚴重程度估計方法在審
| 申請號: | 201810223054.2 | 申請日: | 2018-03-19 |
| 公開(公告)號: | CN108597542A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 李鵬乾;李艷雄;李錦彬 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G10L25/66 | 分類號: | G10L25/66;G10L25/30;G10L25/27;G10L25/03;G10L25/12 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 王東東 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻特征 程度估計 聲學特征 隱馬爾可夫模型 輸出概率 瓶頸 測試語音 判決結果 神經網絡 特性差異 輸入帶 樣本 刻畫 語音 | ||
本發明公開了一種基于深度音頻特征的構音障礙嚴重程度估計方法,包括:提取聲學特征;將上述聲學特征輸入帶瓶頸層的深度神經網絡,從瓶頸層提取深度音頻特征;將上述深度音頻特征作為輸入,采用Baum?Welch算法訓練的隱馬爾可夫模型;最后將測試語音樣本的深度音頻特征依次輸入上述訓練好的四個隱馬爾可夫模型,采用Viterbi算法得到四個輸出概率,輸出概率最大的模型所對應的類別也就是構音障礙嚴重程度即為判決結果。本發明采用的深度音頻特征是一種深層變換特征,相比于傳統聲學特征能更有效刻畫構音障礙語音的特性差異,在構音障礙嚴重程度估計中可以獲得更加優異的效果。
技術領域
本發明涉及語音處理和深度學習技術,尤其涉及一種基于深度音頻特征的構音障礙嚴重程度估計方法。
背景技術
構音障礙是兒童各類言語功能障礙中最常見的一種,常表現為吐字不清,可細分為省略音、替代音,歪曲音和贅加音,均影響正常的言語交流,常導致對方無法理解患者希望表達的內容。然而,由于不會給患者帶來明顯的外表缺陷或身體上的痛苦,這種病癥常常無法及時被發現,從而延誤了最佳的矯正時間。隨著兒童年齡的增長,構音障礙的康復訓練所需的時間和金錢成本也會迅速提高。因此,及時發現兒童是否存在構音障礙問題對于患兒的康復有著重要意義。目前,國內對于構音障礙的評估方法主要有描記法、音標法、標準化測驗法等。均需要專業人士進行主觀地評估,康復矯治也是在評估的基礎上進行。然而,由于我國相關領域專業人士的不足,相當一部分構音障礙患者得不到及時治療。此外,評估方法主觀性較強,不同專家很可能對其嚴重程度做出不同的評估。現有的檢查儀器方法,譬如光纖維腭咽喉內鏡檢查、電視熒光放射照相術等檢查法,喉動態描記法、舌壓力傳感器等等,雖然評價比較客觀準確,但是這些儀器普遍比較昂貴,且一些診斷方法具有入侵性,給患者帶來嚴重的不適,患者非常不樂意配合診斷。
發明內容
為了克服現有技術存在的缺點與不足,本發明提供一種基于深度音頻特征的構音障礙嚴重程度估計方法。本發明的方法采用深度神經網絡提取語音的深度音頻特征,再采用Baum-Welch算法訓練代表正常語音、輕度構音障礙語音、中度構音障礙語音和重度構音障礙語音的隱馬爾可夫模型(Hidden Markov Model,HMM),然后對隱馬爾可夫模型分類器進行判決,從而估計測試者構音障礙的嚴重程度。
本發明采用如下技術方案:
一種基于深度音頻特征的構音障礙嚴重程度估計方法,包括如下步驟:
S1、對語音數據進行預處理,提取聲學特征,所述聲學特征包括線性預測系數、基頻、基頻微擾、振幅、振幅微擾,過零率及共振峰,得到語音數據特征矩陣F=[線性預測系數,基頻,基頻微擾,振幅,振幅微擾,過零率,共振峰];
S2、將語音數據特征矩陣F作為輸入,通過無監督預訓練和有監督精確調整兩個步驟構造帶瓶頸層的深度神經網絡特征提取器,從深度神經網絡特征提取器的瓶頸層提取語音數據所對應的深度音頻特征;
S3、將訓練語音數據的深度音頻特征作為輸入,采用Baum-Welch算法訓練代表正常語音、輕度構音障礙語音、中度構音障礙語音和重度構音障礙語音的隱馬爾可夫模型;
S4、采用S2步驟提取測試語音的深度音頻特征,采用Viterbi算法計算深度音頻特征輸入每個隱馬爾可夫模型的輸出概率,輸出概率最大的模型對應的類別作為判決結果。
所述S1中預處理,具體包括如下步驟:
S1.1、預加重:采用傳遞函數為H(z)=1-αz-1的數字濾波器對輸入的語音數據進行濾波,其中α為一個取值范圍在[0.9,1]的常系數;
S1.2、分幀:將預加重后的語音切分成固定長度的語音幀,幀長為L,幀移為S,第t幀語音表示為xt'(n),1≤t≤T,0≤n≤N-1,其中T和N分別表示幀數和每幀的采樣點數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810223054.2/2.html,轉載請聲明來源鉆瓜專利網。





