[發(fā)明專利]基于語音特征與機(jī)器學(xué)習(xí)的抑郁癥自動評估系統(tǒng)和方法有效
| 申請?zhí)枺?/td> | 201611147549.9 | 申請日: | 2016-12-13 |
| 公開(公告)號: | CN106725532B | 公開(公告)日: | 2018-04-24 |
| 發(fā)明(設(shè)計)人: | 胡斌;劉振宇;康環(huán)宇 | 申請(專利權(quán))人: | 蘭州大學(xué) |
| 主分類號: | A61B5/16 | 分類號: | A61B5/16 |
| 代理公司: | 北京匯彩知識產(chǎn)權(quán)代理有限公司11563 | 代理人: | 王鍵 |
| 地址: | 730000 *** | 國省代碼: | 甘肅;62 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語音 特征 機(jī)器 學(xué)習(xí) 抑郁癥 自動 評估 系統(tǒng) 方法 | ||
1.一種基于語音特征與機(jī)器學(xué)習(xí)的抑郁癥自動評估系統(tǒng),其特征在于,包括
(a)語音采集錄音模塊,用于對被試者施以不同的情緒語料刺激的同時,記錄被試者的語音信息;所述語音采集分為“語音問答”、“文本朗讀”、“圖片描述”三個模塊,分別包含正向、中性、負(fù)向三種情緒的問題、文本和圖片;
(b)語音特征計算模塊,用于對采集的語音信號進(jìn)行預(yù)處理后,計算語音的聲學(xué)特征;所述語音特征計算模塊包含預(yù)處理模塊,所述預(yù)處理模塊包括依次連接的預(yù)加重、降噪、濾波模塊,對采集的語音信號依次進(jìn)行預(yù)加重、降噪和濾波處理;所述預(yù)加重模塊采用k值為0.97的預(yù)加重濾波器,所述濾波模塊采用通帶頻率為60~4500Hz的濾波器;所述語音的聲學(xué)特征包括局部特征與統(tǒng)計學(xué)特征,計算局部特征時,將語音切分為幀,對單個語音幀進(jìn)行計算;統(tǒng)計學(xué)特征是在多個語音幀之間進(jìn)行計算;
(c)語音數(shù)據(jù)庫模塊,包含用于語音特征有效性分析、分類器訓(xùn)練優(yōu)化、系統(tǒng)分類率的相關(guān)數(shù)據(jù);所述語音數(shù)據(jù)庫模塊運(yùn)行在本系統(tǒng)的計算機(jī)上,用Microsoft SQL Server實現(xiàn);包含的數(shù)據(jù)為:語音文件的語音特征、人工診斷標(biāo)簽、分類器分類標(biāo)簽,該數(shù)據(jù)庫只保存經(jīng)過醫(yī)生診斷的被試數(shù)據(jù);
(d)機(jī)器學(xué)習(xí)模塊,用語音數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行語音特征與抑郁癥的相關(guān)性分析,以確定有效特征的提取方式,并訓(xùn)練用于自動評估的分類器;所述機(jī)器學(xué)習(xí)模塊包括分類器,使用的分類器模型為支持向量機(jī);支持向量機(jī)使用LIB支持向量機(jī)來實現(xiàn),選取的核函數(shù)為Radial Basis Function;
所述確定的有效特征提取方式是指:第一步,先采用最小冗余最大相關(guān)的方式,去掉明顯不相關(guān)的特征,從語音數(shù)據(jù)庫中保存的語音特征中初步篩選出一個特征子集,作為待選特征集;第二步,在待選特征集中,排除一個特征后,用特征子集去訓(xùn)練分類器,計算出該特征子集的分類率,若分類率明顯降低,則說明該特征有效,應(yīng)作為有效特征;若分類率不改變或升高,說明該特征為無效特征;多次重復(fù)第二步操作,對待選特征集進(jìn)行至少一次的遍歷之后,保留下來的特征,即構(gòu)成有效特征集;
(e)自動評估模塊,提取被試者有效語音特征并進(jìn)行抑郁程度分類,實現(xiàn)依據(jù)輸入的語音樣本自動評估被試者的抑郁程度;具體包括:第一步,將沒有人工診斷結(jié)果的被試語音樣本,按照機(jī)器學(xué)習(xí)模塊確定的有效特征提取方式,計算出有效特征;第二步,將有效特征輸入由機(jī)器學(xué)習(xí)模塊訓(xùn)練好的分類器,由分類器進(jìn)行抑郁程度的分類;
所述基于語音特征與機(jī)器學(xué)習(xí)的抑郁癥自動評估系統(tǒng)的工作步驟為:
1)語音信息采集錄音獲取語音樣本:通過對被試者施以不同的情緒語料刺激的同時,使用錄音設(shè)備記錄被試者的語音信息;
2)語音特征計算獲取語音特征集:語音樣本通過預(yù)處理后,計算語音的聲學(xué)特征;將經(jīng)過醫(yī)生診斷的語音聲學(xué)特征,包含診斷結(jié)果一起存入語音數(shù)據(jù)庫;沒有經(jīng)過醫(yī)生診斷的被試語音樣本則進(jìn)入步驟4);
3)依據(jù)存入語音數(shù)據(jù)庫的語音聲學(xué)特征進(jìn)行機(jī)器學(xué)習(xí),確定語音有效特征提取方式,訓(xùn)練用于自動評估的分類器;
4)提取有效特征并進(jìn)行分類得出評估結(jié)論:提取出被試語音樣本在評估抑郁癥過程中最有效的語音特征,即有效特征;并通過訓(xùn)練好的分類器對提取的有效特征進(jìn)行分類,實現(xiàn)依據(jù)輸入的語音樣本自動評估被試者的抑郁程度;
其中,所述步驟1)中,包括以下步驟:首先測量現(xiàn)場噪音,排除噪聲源,在噪聲符合要求之后,開始語音采集;語音采集過程中分別施以不同的情緒語料刺激,包括“語音問答”、“文本朗讀”、“圖片描述”三個不同的實驗情境;
所述步驟2)中,包括語音聲學(xué)特征計算的步驟:第一步,將語音切分為幀,在單個語音幀中計算出局部聲學(xué)特征;第二步,在多個語音幀之間,計算出統(tǒng)計學(xué)特征;第三步,若是已經(jīng)過醫(yī)生診斷的被試,將該被試的所有語音特征和人工診斷結(jié)果存入語音數(shù)據(jù)庫;所述的特征提取算法包括但不限于:共振峰計算、有聲段檢測、MFCC、TEO、HNR、SNR、PPQ、APQ;
所述步驟3)中,包括特征有效性分析與分類器訓(xùn)練的步驟:第一步,使用語音樣本庫中的已有人工診斷結(jié)論的數(shù)據(jù),先采用最小冗余最大相關(guān)的方式,去掉明顯不相關(guān)的特征,從語音聲學(xué)特征計算出的特征集中初步篩選出一個特征的子集,作為待選特征集;第二步,在待選特征集中,排除一個特征后,用剩余特征訓(xùn)練分類器,若分類率明顯降低,則說明該特征有效,并重復(fù)第二步;多次循環(huán),對待選特征集進(jìn)行至少一次的遍歷之后,保留下來的特征,即構(gòu)成有效特征集;有效特征集包含的特征即為有效特征;通過所述步驟最終訓(xùn)練出的分類器,即為用于自動評估時使用的分類器;
所述步驟4)中,包括自動診斷的步驟:第一步,將沒有人工診斷結(jié)果的被試語音樣本,按照步驟3)確定的有效特征提取方式,計算出有效特征;第二步,將有效特征輸入由步驟3)訓(xùn)練好的分類器,由分類器進(jìn)行抑郁程度的分類;所述分類是指以兩種標(biāo)簽:正常、抑郁進(jìn)行分類。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述語音采集錄音模塊包括采集設(shè)備、錄音設(shè)備,采集設(shè)備有電腦控制端、噪聲計、監(jiān)聽耳機(jī)、音箱、麥克風(fēng)、聲卡、防噴罩、話筒支架;所述監(jiān)聽耳機(jī)、音箱、麥克風(fēng)、聲卡均連接至電腦;錄音設(shè)備采用NEUMANN TLM102麥克 風(fēng)和采樣率為44.1kHz、數(shù)據(jù)長度為24位的RME FIREFACE UCX聲卡;采集的錄音數(shù)據(jù)以.WAV格式保存。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘭州大學(xué),未經(jīng)蘭州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611147549.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





