[發明專利]一種病理嗓音的識別方法無效
| 申請號: | 201410027836.0 | 申請日: | 2014-01-22 |
| 公開(公告)號: | CN103778913A | 公開(公告)日: | 2014-05-07 |
| 發明(設計)人: | 張曉俊;曹毅;陶智;黃程韋;吳迪;肖仲喆 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/10 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 曹毅 |
| 地址: | 215000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 病理 嗓音 識別 方法 | ||
技術領域
本發明屬于聲音識別領域,具體的涉及一種病理嗓音的識別方法。
背景技術
對嗓音狀況的調查表明,目前我國至少有1億人患有各種嗓音疾病,原因涉及到生理和工作環境等許多方面。如何保留和提高喉發音功能及其檢測方法成為了眾多信號處理及統計模式識別領域研究者共同關注的焦點。隨著計算機技術及統計模式識別的迅猛發展,建立在模型統計基礎上的病理嗓音自動檢測也迅速成為了研究熱點,經過幾十年的發展,形成了眾多的研究方法。
在特征優化方面,本發明運用連接F屬性的評估的屬性選擇的優化算法,再用兩種分類器,對數據進行進一步優化分類,探討各種病理嗓音的特征。接下來用基于期望值最大化的高斯混合模型,對優化后的嗓音特征進行有效識別。一般的利用傳統的高斯混合模型識別的流程如圖1所示,分為訓練部分和識別部分。建模首先要提取嗓音信號的特征,特征提取之后特征優化,然后訓練得到模型。識別部分首先進行特征提取,再進行特征優化,此時需要與訓練好的模型進行匹配得到匹配得分,再和設定的閾值比較,最后得到判別結果。但是傳統的基于極大似然估計的高斯混合模型必須要求數據處理中不含隱變量,而實際實驗中嗓音特征無法避免的會存在隱變量,這就給基于極大似然估計的高斯混合模型識別語音帶來了困難。
發明內容
本發明的目的是克服目前病理嗓音系統存在的上述缺點,通過EM算法,消掉隱變量,通過特征優化組合參數,經過分類器,再運用高斯混合模型,明顯提高正確識別率。
為實現上述技術目的,達到上述技術效果,本發明通過以下技術方案實現:
一種病理嗓音的識別方法,包括特征參數輸入模塊、特征優化模塊、病理嗓音識別模塊、匹配判斷模塊和內容呈現模塊,所述病理嗓音識別模塊包括基于期望值最大化的高斯混合模型(GMM-EM)建立單元、模型訓練單元和語音識別單元,
????其中所述模型(GMM-EM)建立單元和模型訓練單元包括以下步驟:
????步驟2.1)確定高斯混合模型代表公式,如下:
其中,,分別表示第i個高斯分量的權重、均值向量和方差矩陣,表示m維的特征向量,K是高斯模型的分量數目;
????步驟2.2)E步計算得到初始化參數,計算公式如下:
??????????????j=1,..,K,?t=1,…,n;
????步驟2.3)M步計算更新參數,計算公式如下:
??????????
????????
????;
????步驟2.4)針對各類病理嗓音種類,提取各種特征參數;
步驟2.5)對每類嗓音每種特征參數進行GMM訓練,得到訓練的GMM矩陣;
步驟2.6)運用連接F屬性的評估的屬性選擇的算法對數據進行組合優化,提取出若干個參數;
步驟2.7)運用兩種分類器,對數據進行進一步特征優化;
步驟2.8)將步驟2.7)中提取的特征參數輸入訓練好的GMM,求其似然度;
步驟2.9)根據步驟2.8)算出的似然度,計算各類病理嗓音的匹配概率;
步驟2.10)對步驟2.9)求出的各特征參數匹配概率加權求和得總匹配度Match;
步驟2.11)將步驟2.9)求得的總匹配度Match和閾值進行比較,如果大于閾值,將進行各特征的貢獻率計算,如果小于閾值,將進行計數及送入結束判斷;
步驟2.12)對步驟2.11)中的總匹配度Match小于閾值且不滿足結束條件的嗓音信號送回進行新一輪的訓練,如果滿足結束條件,則訓練結束;
所述語音識別單元包括以下步驟:
步驟2.13)輸入識別嗓音信號進行特征提取;
步驟2.14)運用連接F屬性的評估的屬性選擇的算法對數據進行組合優化,提取出若干參數;
步驟2.15)運用兩種分類器,對數據進行進一步特征優化;
步驟2.16)加載步驟2.12)中訓練好的識別模型;
步驟2.17)將步驟2.14)中提取的特征與加載好的識別模型進行匹配;
步驟2.18)若匹配,則識別結束,若不匹配則載入下一個訓練好的模型,并轉入步驟2.13)。
進一步的,所述特征參數輸入模塊包括數據庫單元和選擇單元,并且所述特征參數輸入模塊和特征優化模塊包括以下步驟:
步驟1.1)對病理嗓音特征庫進行特征空間采樣,生成特征子集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410027836.0/2.html,轉載請聲明來源鉆瓜專利網。





