[發明專利]一種嬰兒啼哭聲識別提示方法及系統有效
| 申請號: | 201710787722.X | 申請日: | 2017-09-04 |
| 公開(公告)號: | CN107767874B | 公開(公告)日: | 2020-08-28 |
| 發明(設計)人: | 周燕莉 | 申請(專利權)人: | 南方醫科大學南方醫院 |
| 主分類號: | G10L17/06 | 分類號: | G10L17/06;G10L25/24;G10L25/66;G06K9/00 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 鄭澤萍;胡輝 |
| 地址: | 510515 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 嬰兒 啼哭 識別 提示 方法 系統 | ||
本發明公開了一種嬰兒啼哭聲識別提示方法及系統,包括步驟:實時獲取嬰兒的啼哭聲信號和動作圖像;對嬰兒啼哭聲信號進行預處理后,計算獲得嬰兒啼哭聲信號的反向梅爾頻率倒譜系數,并對反向梅爾頻率倒譜系數進行離散化處理,得到反向梅爾頻率倒譜系數的離散值;根據預設的基于貝葉斯分類算法建立的嬰兒哭聲識別模型,對反向梅爾頻率倒譜系數的離散值進行分類處理,從而識別出該嬰兒啼哭聲信號所對應的哭聲狀態;采用實時獲取的嬰兒動作圖像校驗從嬰兒啼哭聲信號識別獲得的哭聲狀態;發出對應的提示信號。本發明計算方法簡單,計算效率高,識別精度高,可以提高哭聲狀態識別的準確度和精度,可廣泛應用于嬰兒護理領域中。
技術領域
本發明涉及嬰兒聲音分析技術領域,特別是涉及一種嬰兒啼哭聲識別提示方法及系統。
背景技術
啼哭是嬰兒表達的唯一方式,是一種特殊的“語言”。嬰兒的哭聲有幾種基本表達,包括饑餓、困倦、需要拍嗝、腸痙攣和不舒適,現代科學研究表明,全世界的寶寶在3月齡前,嬰兒的哭聲根據嬰兒的當前狀態而存在固有的典型模式,可成人一般不能準確理解嬰兒啼哭的原因,不能了解嬰兒啼哭所反應的需求,這樣難免造成對嬰兒護理、照料的不周,不利于嬰兒的健康成長。對于現在的新生兒科、產科或月子中心等醫療服務機構來說,嬰兒住院期間,對嬰兒啼哭聲進行監視是通過采集到嬰兒啼哭聲后,人工去查看嬰兒的情況,或者同時還采集嬰兒的圖像,結合圖像來判斷嬰兒的需求。這種方式也依賴于護士等工作人員的經驗,不能準確、科學地獲取嬰兒啼哭聲所反應的需求狀態。
發明內容
為了解決上述的技術問題,本發明的目的是提供一種嬰兒啼哭聲識別提示方法及系統。
本發明解決其技術問題所采用的技術方案是:
一種嬰兒啼哭聲識別提示方法,包括以下步驟:
實時獲取嬰兒的啼哭聲信號和動作圖像;
對嬰兒啼哭聲信號進行預處理后,計算獲得嬰兒啼哭聲信號的反向梅爾頻率倒譜系數,并對反向梅爾頻率倒譜系數進行離散化處理,得到反向梅爾頻率倒譜系數的離散值;
根據預設的基于貝葉斯分類算法建立的嬰兒哭聲識別模型,對反向梅爾頻率倒譜系數的離散值進行分類處理,從而識別出該嬰兒啼哭聲信號所對應的哭聲狀態;
基于預設的動作行為數據庫,采用實時獲取的嬰兒動作圖像校驗從嬰兒啼哭聲信號識別獲得的哭聲狀態;
基于校驗后的哭聲狀態,發出對應的提示信號。
進一步,所述哭聲狀態包括以下狀態中的任一種:饑餓、困倦、需要拍嗝、腸痙攣和不舒適。
進一步,還包括建立哭聲識別模型這一步驟,其包括步驟:
獲取多個嬰兒啼哭聲樣本信號,并標注每個嬰兒啼哭聲樣本信號所對應的哭聲狀態;
對每個嬰兒啼哭聲樣本信號進行預處理后,計算獲得嬰兒啼哭聲樣本信號的反向梅爾頻率倒譜系數,并對反向梅爾頻率倒譜系數進行離散化處理,得到反向梅爾頻率倒譜系數的離散值;
建立樣本數據庫,記錄下每個嬰兒啼哭聲樣本信號所對應的哭聲狀態、反向梅爾頻率倒譜系數的離散值;
利用貝葉斯分類算法對樣本數據庫進行處理后,建立貝葉斯分類模型,并將貝葉斯分類模型作為嬰兒哭聲識別模型。
進一步,所述利用貝葉斯分類算法對樣本數據庫進行處理后,建立貝葉斯分類模型,并將貝葉斯分類模型作為嬰兒哭聲識別模型這一步驟,具體包括步驟:
統計樣本數據庫中每個哭聲狀態所對應的嬰兒啼哭聲樣本信號的數量,進而計算樣本數據庫中每個哭聲狀態的統計概率;
統計每個哭聲狀態下的每個反向梅爾頻率倒譜系數的離散值所對應的嬰兒啼哭聲樣本信號的數量,進而計算每個哭聲狀態下的每個反向梅爾頻率倒譜系數的離散值的條件概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南方醫科大學南方醫院,未經南方醫科大學南方醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710787722.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:地漏(大鼻象)
- 下一篇:用于移動計算裝置的由音頻信標激活的數字內容提取





