[發(fā)明專利]一種基于深度音頻特征的構(gòu)音障礙嚴(yán)重程度估計(jì)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810223054.2 | 申請(qǐng)日: | 2018-03-19 |
| 公開(公告)號(hào): | CN108597542A | 公開(公告)日: | 2018-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 李鵬乾;李艷雄;李錦彬 | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G10L25/66 | 分類號(hào): | G10L25/66;G10L25/30;G10L25/27;G10L25/03;G10L25/12 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 王東東 |
| 地址: | 510640 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻特征 程度估計(jì) 聲學(xué)特征 隱馬爾可夫模型 輸出概率 瓶頸 測(cè)試語音 判決結(jié)果 神經(jīng)網(wǎng)絡(luò) 特性差異 輸入帶 樣本 刻畫 語音 | ||
1.一種基于深度音頻特征的構(gòu)音障礙嚴(yán)重程度估計(jì)方法,其特征在于,包括如下步驟:
S1、對(duì)語音數(shù)據(jù)進(jìn)行預(yù)處理,提取聲學(xué)特征,所述聲學(xué)特征包括線性預(yù)測(cè)系數(shù)、基頻、基頻微擾、振幅、振幅微擾,過零率及共振峰,得到語音數(shù)據(jù)特征矩陣F=[線性預(yù)測(cè)系數(shù),基頻,基頻微擾,振幅,振幅微擾,過零率,共振峰];
S2、將語音數(shù)據(jù)特征矩陣F作為輸入,通過無監(jiān)督預(yù)訓(xùn)練和有監(jiān)督精確調(diào)整兩個(gè)步驟構(gòu)造帶瓶頸層的深度神經(jīng)網(wǎng)絡(luò)特征提取器,從深度神經(jīng)網(wǎng)絡(luò)特征提取器的瓶頸層提取語音數(shù)據(jù)所對(duì)應(yīng)的深度音頻特征;
S3、將訓(xùn)練語音數(shù)據(jù)的深度音頻特征作為輸入,采用Baum-Welch算法訓(xùn)練代表正常語音、輕度構(gòu)音障礙語音、中度構(gòu)音障礙語音和重度構(gòu)音障礙語音的隱馬爾可夫模型;
S4、采用S2步驟提取測(cè)試語音的深度音頻特征,采用Viterbi算法計(jì)算深度音頻特征輸入每個(gè)隱馬爾可夫模型的輸出概率,輸出概率最大的模型對(duì)應(yīng)的類別作為判決結(jié)果。
2.根據(jù)權(quán)利要求1所述的構(gòu)音障礙嚴(yán)重程度估計(jì)方法,其特征在于,所述S1中預(yù)處理,具體包括如下步驟:
S1.1、預(yù)加重:采用傳遞函數(shù)為H(z)=1-αz-1的數(shù)字濾波器對(duì)輸入的語音數(shù)據(jù)進(jìn)行濾波,其中α為一個(gè)取值范圍在[0.9,1]的常系數(shù);
S1.2、分幀:將預(yù)加重后的語音切分成固定長(zhǎng)度的語音幀,幀長(zhǎng)為L(zhǎng),幀移為S,第t幀語音表示為x′t(n),1≤t≤T,0≤n≤N-1,其中T和N分別表示幀數(shù)和每幀的采樣點(diǎn)數(shù);
S1.3、加窗:將各幀語音與窗函數(shù)ω(n)相乘,取漢明窗為窗函數(shù)ω(n):
3.根據(jù)權(quán)利要求2所述的構(gòu)音障礙嚴(yán)重程度估計(jì)方法,其特征在于,所述S1中提取線性預(yù)測(cè)系數(shù),具體包括以下步驟:
計(jì)算加窗后的第t幀語音xt(n)的自相關(guān)函數(shù)Rt(j):
得到Y(jié)ule-Walker矩陣方程,其中p為線性預(yù)測(cè)系數(shù)的階數(shù);
采用萊文遜-杜賓算法求解上述矩陣方程,得到最終解為所提取的線性預(yù)測(cè)系數(shù)。
4.根據(jù)權(quán)利要求2所述的構(gòu)音障礙嚴(yán)重程度估計(jì)方法,其特征在于,S1中提取基頻F0,具體采用自相關(guān)法,步驟如下:
對(duì)語音幀xt(n)做中心削波處理,得到y(tǒng)t(n):
其中CL值為語音幀最大幅度的0.65倍;
計(jì)算yt(n)的自相關(guān)函數(shù):
檢測(cè)Ry(i)的峰值點(diǎn),得到峰值點(diǎn)集合VP,則基音周期,
其中I為峰值點(diǎn)數(shù),T0取倒數(shù)即為第t幀語音的基頻F0(t)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810223054.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種音頻識(shí)別方法及設(shè)備、存儲(chǔ)介質(zhì)
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 聲學(xué)場(chǎng)景分類方法、裝置及相應(yīng)設(shè)備
- 一種網(wǎng)絡(luò)電臺(tái)的音頻專輯內(nèi)容質(zhì)量評(píng)價(jià)方法及系統(tǒng)
- 一種音頻信息處理方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)
- 音頻拼接檢測(cè)方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 說話人識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)
- 音頻特征處理方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 用于基于塊的運(yùn)動(dòng)估計(jì)的方法和設(shè)備
- 一種塊效應(yīng)檢測(cè)方法
- 通信質(zhì)量估計(jì)方法、裝置和基站
- 估計(jì)方法、估計(jì)設(shè)備以及制造方法
- 車輛高壓蓄電池的劣化判定裝置及方法
- 電池劣化程度估計(jì)裝置以及電池劣化程度估計(jì)方法
- 電池劣化程度估計(jì)裝置以及估計(jì)方法
- 劣化程度估計(jì)裝置和劣化程度估計(jì)方法
- 用于估計(jì)電裝置的損壞程度的方法、裝置和系統(tǒng)
- 用于人群估計(jì)技術(shù)的集成和自動(dòng)切換的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)
- 食管檢測(cè)儀及其用品
- 聲音處理設(shè)備、聲音處理方法和程序
- 聲學(xué)模型優(yōu)化方法、裝置及語音喚醒方法、裝置和終端
- 用于語音識(shí)別的聲學(xué)模型訓(xùn)練方法及裝置
- 基于空間特征補(bǔ)償?shù)亩嗤ǖ勒Z音識(shí)別聲學(xué)建模方法及裝置
- 語音識(shí)別方法和裝置
- 聲學(xué)模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 語音轉(zhuǎn)寫模型、方法、介質(zhì)及電子設(shè)備
- 語音合成方法、裝置、可讀介質(zhì)及電子設(shè)備
- 詞聲學(xué)特征系統(tǒng)、詞聲學(xué)特征系統(tǒng)的訓(xùn)練方法及系統(tǒng)
- 認(rèn)知無線電系統(tǒng)中基于隱馬爾可夫模型的頻譜接入方法
- 一種基于隱馬爾可夫模型的人臉識(shí)別方法
- 基于隱馬爾可夫模型的云計(jì)算資源調(diào)度方法和系統(tǒng)
- 基于隱馬爾可夫模型的英文簡(jiǎn)歷關(guān)鍵字段抽取方法
- 基于遺傳算法的隱馬爾科夫模型在主機(jī)風(fēng)險(xiǎn)評(píng)估中的應(yīng)用
- 用于推薦系統(tǒng)的數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置和電子設(shè)備
- SDN數(shù)據(jù)中心基于隱馬爾可夫模型的多徑路由選徑方法
- 基于高斯混合的因子隱馬爾可夫負(fù)荷分解方法
- 隱馬爾可夫模型在地圖匹配中的優(yōu)化方法及GPS定位方法
- 基于隱馬爾可夫模型的Costas信號(hào)解碼方法、系統(tǒng)及存儲(chǔ)介質(zhì)





