[發明專利]一種嬰兒哭聲的識別方法及系統在審
| 申請號: | 201910362576.5 | 申請日: | 2019-04-30 |
| 公開(公告)號: | CN111862991A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 董勤波 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G10L17/18 | 分類號: | G10L17/18;G10L17/06;G10L17/02 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 牛崢;王麗琴 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 嬰兒 哭聲 識別 方法 系統 | ||
本發明公開了一種嬰兒哭聲的識別方法及系統,本發明實施例在識別嬰兒哭聲時基于聲紋識別技術,采用聲紋識別技術對從采集的嬰兒哭聲的提取特征進行聲紋識別,確認該嬰兒哭聲對應的嬰兒年齡;再根據嬰兒年齡輸入到對應的針對不同嬰兒年齡建立的哭聲類別識別神經網絡模型中,得到該嬰兒哭聲對應的嬰兒哭聲類別,從而確認嬰兒哭聲的具體含義,以確定嬰兒對應的各種狀況。由于本發明實施例在識別嬰兒哭聲過程中,采用了相結合的聲紋識別技術及神經網絡技術,所以識別的準確度及精確度比較高,簡單且易于執行。
技術領域
本發明涉及語音識別技術,特別識別一種嬰兒哭聲的識別方法及系統。
背景技術
隨著語音識別技術的發展,將語音識別應用到越來越多的領域,比如識別嬰兒各種類別的哭聲,以確定嬰兒對應的各種狀況。針對嬰兒哭聲的識別,一般采用的方法為:采用語音采集技術采集哭聲,將采集得到的哭聲與已設置的嬰兒哭聲相匹配,確定是否為嬰兒哭聲,再將確認的嬰兒哭聲與已設置的哭聲類別相匹配,匹配成功后,就可以確認采集的哭聲對應的哭聲類別,最終確認嬰兒哭聲的具體含義。
采用上述嬰兒哭聲的識別方法比較繁瑣和困難,需要兩次匹配才能識別得到嬰兒哭聲的含義。更進一步地,其識別嬰兒哭聲常常采用語音識別技術識別,由于不用類別的嬰兒哭聲差別不很大,且匹配的數據庫樣本受限,在采用語音識別技術識別時準確度及精確度不高,常常會識別錯誤,造成用戶體驗度不高。
發明內容
有鑒于此,本發明實施例提供一種嬰兒哭聲的識別方法,該方法能夠簡單且容易地準確識別嬰兒哭聲。
本發明實施例還提供一種嬰兒哭聲的識別系統,該系統能夠簡單且容易地準確識別嬰兒哭聲。
本發明實施例是這樣實現的:
一種嬰兒哭聲的識別方法,包括:
采集含有嬰兒哭聲的音頻信號;
提取所述音頻信號的特征;
采用聲紋識別方式將所述音頻信號的特征轉換為所述音頻的嬰兒哭聲特征序列;
根據設置的不同嬰兒哭聲特征序列對應嬰兒年齡的對應關系,確定所述音頻的嬰兒哭聲特征序列對應的嬰兒年齡;
將所述音頻信號的嬰兒哭聲特征序列輸入到設置的對應所述嬰兒年齡的哭聲類別識別神經網絡模型中,輸出所述音頻信號的特征對應的嬰兒哭聲類別。
所述采用聲紋識別方式將所述音頻信號的特征轉換為所述音頻的嬰兒哭聲特征序列包括:
設置聲紋識別神經網絡模型,將所述音頻信號的特征輸入到設置的聲紋識別神經網絡模型中,輸出所述音頻的嬰兒哭聲特征序列。
在所述采集含有嬰兒哭聲的音頻信號之前,所述方法包括:
計算設定時間段內接收音頻信號的平均能量,判斷所述接收的音頻信號的平均能量是否超過設置的能量閾值,如果是,執行所述采集含有嬰兒哭聲的音頻信號的步驟。
所述提取所述音頻信號的特征包括:
采用梅爾Mel濾波方式提取梅爾頻率倒普系數MFCC特征,將MFCC特征作為所述音頻信號的特征。
所述方法還包括:
設置不同嬰兒哭聲特征序列對應嬰兒識別身份的對應關系,確定所述音頻的嬰兒哭聲特征序列對應的嬰兒識別身份。
所述方法還包括:
當未輸出所述音頻信號的特征對應的嬰兒哭聲類別時,輸出所述音頻信號的特征對應的非嬰兒哭聲類別,或不知含義的哭聲類別。
所述輸出所述音頻信號的特征對應嬰兒哭聲類別包括:
獲取得到對應嬰兒哭聲類別的輸出概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362576.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:風力發電機組的轉速控制方法及裝置
- 下一篇:容器





