[發明專利]一種嬰兒哭聲識別方法、裝置及設備在審
| 申請號: | 201910029052.4 | 申請日: | 2019-01-12 |
| 公開(公告)號: | CN109658953A | 公開(公告)日: | 2019-04-19 |
| 發明(設計)人: | 喬宇;王群 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/18;G10L25/21;G10L25/24;G10L25/30;G10L25/51 |
| 代理公司: | 深圳中一專利商標事務所 44237 | 代理人: | 高星 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻特征向量 嬰兒哭聲 語音數據段 采集語音數據 裝置及設備 監護終端 結果發送 模型識別 截取 時長 | ||
一種嬰兒哭聲識別方法包括:采集語音數據,截取預定時長的語音數據段;計算所述語音數據段中包括的兩個或者兩個以上的音頻特征向量;根據預先設定的識別模型識別所述音頻特征向量,將所述識別結果發送至監護終端。由于識別結果是根據兩個或兩個以上的音頻特征向量所識別,因而識別結果更加準確可靠,有利于提高嬰兒哭聲識別的精度。
技術領域
本申請屬于聲音識別領域,尤其涉及一種嬰兒哭聲識別方法、裝置及設備。
背景技術
新生嬰兒在表達情感需求或生理需求時,一般通過嬰兒的哭聲傳遞給外部世界。在現實生活中,由于照顧新生嬰兒的工作基本托付給家里的老人或嬰兒的母親等監護人,并且監護人往往會同時身兼多職。因而,當嬰兒處于睡眠狀態的時候,監護人可能會忙于其它事情而處于離開狀態。由于空間距離的原因,嬰兒的啼哭并不一定能被監護人直接聽到,使得監護人不能及時的聽到嬰兒的需求。
為了使得監護人能夠及時的聽到嬰兒的需求,目前已經出現一些嬰兒哭聲的提醒裝置,基于攝像頭或穿戴式設備等數據采集設備,將數據采集設備接入網絡,通過云端來完成識別工作。目前常見的識別方案是基于分貝、過零率或能量這些單一指標來確定是否需要報警,當環境中出現干擾音時,容易使得誤報率較高。
發明內容
有鑒于此,本申請實施例提供了一種嬰兒哭聲識別方法、裝置及設備,以解決現有技術中識別嬰兒哭聲的方法中,當環境出現干擾時,容易使得誤報率高的問題。
本申請實施例的第一方面提供了一種嬰兒哭聲識別方法,所述嬰兒哭聲識別方法包括:
采集語音數據,截取預定時長的語音數據段;
計算所述語音數據段中包括的兩個或者兩個以上的音頻特征向量;
根據預先設定的識別模型識別所述音頻特征向量,將所述識別結果發送至監護終端。
結合第一方面,在第一方面的第一種可能實現方式中,所述計算所述語音數據段中包括的兩個或者兩個以上的音頻特征向量的步驟包括:
計算所述語音數據段中的過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者多種;
選擇過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者兩種以上的特征序列生成音頻特征向量。
結合第一方面的第一種可能實現方式,在第一方面的第二種可能實現方式中,所述選擇過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者兩種以上的特征序列生成音頻特征向量的步驟包括:
選擇過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者兩種以上的特征序列,計算所選擇的特征序列的均值;
根據所計算的均值確定所述音頻特征向量。
結合第一方面,在第一方面的第三種可能實現方式中,所述根據預先設定的識別模型識別所述音頻特征向量,將所述識別結果發送至監護終端的步驟包括:
判斷當前網絡是否處于連接狀態;
如果當前網絡處于連接狀態,則將所述音頻特征向量發送至云服務器,以使得云服務器根據識別結果向所述監護終端發送應用提醒消息。
結合第一方面的第三種可能實現方式,在第一方面的第四種可能實現方式中,所述方法還包括:
如果當前網絡處于斷開狀態,則通過本地存儲的神經網絡模型識別所述音頻特征向量;
當識別結果為預定的告警結果時,向監護終端發送短信息或者撥打告警電話。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910029052.4/2.html,轉載請聲明來源鉆瓜專利網。





