[發明專利]基于模式匹配的哭聲識別方法及智能看護系統有效
| 申請號: | 201710628135.6 | 申請日: | 2017-07-28 |
| 公開(公告)號: | CN107591162B | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 張暉;毛小旺;高財政 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/51;G08B21/00 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 劉莎 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模式 匹配 哭聲 識別 方法 智能 看護 系統 | ||
1.基于模式匹配的哭聲識別方法,其特征在于,包括以下具體步驟:
步驟1,采集嬰兒哭聲語音信號,建立哭聲數據庫,具體為:
S101,采集若干嬰兒哭聲語音信號,并將其分別轉換成數字語音信號;
S102,在設定的時間窗內,對S101中的數字語音信號進行分幀加窗處理,得到多幀語音信號;對每幀語音信號分別提取12維的梅爾頻率倒譜系數MFCC作為其特征向量,從而得到多幀語音信號對應的特征向量序列;
S103,采用K-means算法對S102中得到的若干特征向量序列進行聚類,并對聚類后每類中的特征向量序列求取平均值后,存入哭聲數據庫;
步驟2,實時采集當前環境中的語音信號并轉換成數字語音信號,根據S102中的方法對提取實時數字語音信號的特征向量序列;
步驟3,將步驟2中提取的實時數字語音信號的特征向量序列與步驟1中聚類后每類特征向量序列的均值進行逐幀匹配,將每幀匹配到的相似度最大的類別作為該幀的識別結果;
步驟4,根據步驟3中得到的每幀的識別結果,判斷實時語音信號是否為哭聲,完成識別;具體為:
S401,統計實時數字語音信號的特征向量序列中識別結果為第i類的幀數Si,其中,1≤i≤n,n為聚類的類別總數;
S402,選取S401中得到的Si的最大值對應的類別作為實時數字語音信號的特征向量序列的識別結果;
S403,判斷是否超過實時數字語音信號的特征向量序列長度的一半,若是,則判定實時語音信號為哭聲,否則判定為非哭聲。
2.根據權利要求1所述的基于模式匹配的哭聲識別方法,其特征在于,該方法還包括將步驟4中判定結果為哭聲的特征向量序列加入哭聲數據庫中,通過K-means算法對哭聲數據庫進行重新聚類。
3.根據權利要求1所述的基于模式匹配的哭聲識別方法,其特征在于,步驟S102中對數字語音信號進行分幀加窗處理之前,還包括對數字語音信號依次進行歸一化和預加重處理。
4.根據權利要求1所述的基于模式匹配的哭聲識別方法,其特征在于,步驟S102中設定的時間窗為5s。
5.根據權利要求1所述的基于模式匹配的哭聲識別方法,其特征在于,步驟S102中分幀加窗處理具體為:每幀長度為20ms,窗函數為漢明窗,前后相鄰兩幀具有半幀的重疊區。
6.基于如權利要求1至5中任一所述的基于模式匹配的哭聲識別方法的智能看護裝置,其特征在于,包括:
音頻模塊,用于實時采集當前環境中的語音信號,并對實時語音信號進行預處理;根據控制模塊的指令播放預存的語音;
哭聲識別模塊,用于建立哭聲數據庫,并對預處理后的實時語音信號進行匹配,判斷該語音是否為哭聲;
控制模塊,用于接收哭聲識別模塊的識別結果,若結果是哭聲,則向用戶端發送報警信號,同時向音頻模塊發送指令以播放預存的語音;接收用戶端發送的指令,直接控制音頻模塊播放預存的語音。
7.根據權利要求6所述的智能看護裝置,其特征在于,音頻模塊包括:
語音采集單元,用于實時采集當前環境中的語音信號;
預處理單元,用于將實時語音信號轉換成數字語音信號后,在設定的時間窗內對數字語音信號依次進行歸一化、預加重、分幀、加窗處理,并提取實時語音特征向量序列,將特征向量序列發送至哭聲數據庫存儲;
音頻存儲單元,用于存儲具有安撫嬰兒情緒功能的語音數據;
音頻播放單元,用于接收控制模塊發送的播放指令,從音頻存儲單元獲取語音數據,并解碼播放。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710628135.6/1.html,轉載請聲明來源鉆瓜專利網。





