[發明專利]一種嬰兒哭聲識別方法、裝置及設備在審

申請號：	201910029052.4	申請日：	2019-01-12
公開（公告）號：	CN109658953A	公開（公告）日：	2019-04-19
發明（設計）人：	喬宇;王群	申請（專利權）人：	深圳先進技術研究院
主分類號：	G10L25/03	分類號：	G10L25/03;G10L25/18;G10L25/21;G10L25/24;G10L25/30;G10L25/51
代理公司：	深圳中一專利商標事務所 44237	代理人：	高星
地址：	518055 廣東省深圳***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音頻特征向量嬰兒哭聲語音數據段采集語音數據裝置及設備監護終端結果發送模型識別截取時長
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

一種嬰兒哭聲識別方法包括：采集語音數據，截取預定時長的語音數據段；計算所述語音數據段中包括的兩個或者兩個以上的音頻特征向量；根據預先設定的識別模型識別所述音頻特征向量，將所述識別結果發送至監護終端。由于識別結果是根據兩個或兩個以上的音頻特征向量所識別，因而識別結果更加準確可靠，有利于提高嬰兒哭聲識別的精度。

技術領域

本申請屬于聲音識別領域，尤其涉及一種嬰兒哭聲識別方法、裝置及設備。

背景技術

新生嬰兒在表達情感需求或生理需求時，一般通過嬰兒的哭聲傳遞給外部世界。在現實生活中，由于照顧新生嬰兒的工作基本托付給家里的老人或嬰兒的母親等監護人，并且監護人往往會同時身兼多職。因而，當嬰兒處于睡眠狀態的時候，監護人可能會忙于其它事情而處于離開狀態。由于空間距離的原因，嬰兒的啼哭并不一定能被監護人直接聽到，使得監護人不能及時的聽到嬰兒的需求。

為了使得監護人能夠及時的聽到嬰兒的需求，目前已經出現一些嬰兒哭聲的提醒裝置，基于攝像頭或穿戴式設備等數據采集設備，將數據采集設備接入網絡，通過云端來完成識別工作。目前常見的識別方案是基于分貝、過零率或能量這些單一指標來確定是否需要報警，當環境中出現干擾音時，容易使得誤報率較高。

發明內容

有鑒于此，本申請實施例提供了一種嬰兒哭聲識別方法、裝置及設備，以解決現有技術中識別嬰兒哭聲的方法中，當環境出現干擾時，容易使得誤報率高的問題。

本申請實施例的第一方面提供了一種嬰兒哭聲識別方法，所述嬰兒哭聲識別方法包括：

采集語音數據，截取預定時長的語音數據段；

計算所述語音數據段中包括的兩個或者兩個以上的音頻特征向量；

根據預先設定的識別模型識別所述音頻特征向量，將所述識別結果發送至監護終端。

結合第一方面，在第一方面的第一種可能實現方式中，所述計算所述語音數據段中包括的兩個或者兩個以上的音頻特征向量的步驟包括：

計算所述語音數據段中的過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者多種；

選擇過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者兩種以上的特征序列生成音頻特征向量。

結合第一方面的第一種可能實現方式，在第一方面的第二種可能實現方式中，所述選擇過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者兩種以上的特征序列生成音頻特征向量的步驟包括：

選擇過零率特征序列、能量特征序列、多階梅爾頻率倒譜系數特征序列或頻譜質心特征序列中的兩種或者兩種以上的特征序列，計算所選擇的特征序列的均值；