[發明專利]面向家居環境的智能哭聲檢測方法在審
| 申請號: | 201810208673.4 | 申請日: | 2018-03-14 |
| 公開(公告)號: | CN108461091A | 公開(公告)日: | 2018-08-28 |
| 發明(設計)人: | 張暉;毛小旺 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L17/02;G10L17/04 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 姚姣陽 |
| 地址: | 210003 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 哭聲檢測 家居環境 樣本數據庫 均值參數 判決系統 同類數據 訓練樣本 業務體驗 音頻數據 智能終端 智能 差異性 單模型 樣本庫 準確率 分類 檢測 服務 | ||
1.一種面向家居環境的智能哭聲檢測方法,其特征在于,包括如下步驟:
S1,采集哭聲與非哭聲語音信號,分兩類存入樣本庫;并對樣本庫中各類語音信號進行預處理,得到各類語音信號對應的語音幀序列;
S2,對S1中所述語音幀序列中每一幀,提取24維的音頻特征,得到各類語音信號對應特征向量序列;
S3,以S2中所述特征向量序列,作為GMM訓練樣本,采用EM算法,分別訓練哭聲GMM模型和非哭聲GMM模型;并提取訓練好的GMM模型中各個高斯分量的均值參數,組成均值向量序列;
S4,對S3所述均值向量序列中每一個向量,添加類別標簽,并保存到均值特征樣本集;并以均值特征樣本集作為訓練樣本,訓練SVM模型;
S5,采集待識別的音頻信號,并按照S1至S2的方法,提取信號對應的音頻特征序列;其次,將音頻特征序列中每一幀信號,與S3中所述均值向量序列中每一個均值向量,計算二者的似然概率,取概率最大值所對應的均值向量,作為GMM模型對該幀信號的判決結果;最后,遍歷音頻特征序列中所有幀,得到均值向量序列X={X1,X2,...,Xp,...,XL};其中,Xp為第p幀信號對應的均值向量,L為音頻特征序列長度;
S6,將S5中所述均值向量序列X={X1,X2,...,Xp,...,XL},輸入SVM模型,逐幀進行判決,最后將每幀判決結果h(Xp),按照下式進行累加求均值,得到最終音頻文件的識別結果R;
其中,h(Xp)為SVM模型判決函數,輸出值為1或-1;若R取值為正,則待識別音頻信號判決為哭聲;若R取值為負,則待識別音頻信號判決為非哭聲。
2.根據權利要求1所述的面向家居環境的智能哭聲檢測方法,其特征在于,S1中所述對各類語音信號進行預處理,具體包括如下步驟:
S201,將采集到的各類語音信號,轉換成對應數字信號,分兩類存入樣本庫;
S202,對S201所述數字信號,依次進行歸一化、預加重、分幀、加窗處理后,得到各類語音信號對應的語音幀序列。
3.根據權利要求1所述的面向家居環境的智能哭聲檢測方法,其特征在于,S2中所述對語音幀序列中每一幀信號,提取24維的音頻特征,具體包括如下步驟:
S301,對語音幀序列中每一幀信號,經過FFT變換、Mel濾波器組、對數變換、DCT變換后提取12維的MFCC特征C(m);
其中,Ci(m)代表語音幀序列中第i幀信號的MFCC特征,1≤i≤L,L為音頻幀序列長度;m為特征分量的標號,1≤m≤12;
S302,對S301所述MFCC特征C(m),按照如下差分公式,計算12維差分MFCC特征ΔC(m);
其中,ΔCl(m)代表音頻幀序列中第l幀信號的差分MFCC特征,2≤l≤L-2,-2≤k≤2;
S303,將S301與S302所述特征合并,組成24維的音頻特征C={c1,c2,...,cw,...,c24},1≤w≤24。
4.根據權利要求1所述的面向家居環境的智能哭聲檢測方法,其特征在于,S3中所述用特征向量序列訓練GMM模型過程中,采用改進的K-means方法對GMM模型進行初始化,具體包括如下步驟:
S401,根據GMM設置的分量數M,從特征向量序列中,隨機選取M個聚類中心點O={O1,O2,...,Oj,...,OM};其中,Oj表示第j個聚類中心,是24維向量;
S402,計算特征向量序列中,第n幀特征向量
Cn={cn1,cn2,...,cnw,...,cn24}
中數據的方差其中,1≤w≤24;
S403,采用如下所示加權的歐氏距離公式,比較第n幀特征向量與各個聚類中心的距離Dis(n,Oj),1≤j≤M,選取最小距離對應的聚類中心,作為第n幀特征向量的聚類結果;
S404,對特征向量序列中所有幀,執行S402至S403操作,得到所有幀的聚類結果;
S405,重新劃分每個類的聚類中心,以每個類所包含特征向量的均值作為該類新的聚類中心;并計算新、舊聚類中心的歐式距,是否小于0.001;若是,初始化過程結束;否則,繼續迭代進行S402至S404的處理步驟,直至滿足新、舊聚類中心的歐式距小于0.001的條件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810208673.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:語音信號處理裝置及語音信號處理方法
- 下一篇:一種對帕金森病語音分析的方法





