[發明專利]一種嬰幼兒啼哭聲檢測方法、裝置、設備及介質在審
| 申請號: | 201710835270.8 | 申請日: | 2017-09-15 |
| 公開(公告)號: | CN107818779A | 公開(公告)日: | 2018-03-20 |
| 發明(設計)人: | 謝湘;張立強 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/06;G10L15/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司11291 | 代理人: | 黃志華 |
| 地址: | 100081 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 嬰幼兒 啼哭 檢測 方法 裝置 設備 介質 | ||
1.一種嬰幼兒啼哭聲檢測方法,其特征在于,所述方法包括:
根據預設的劃分方法,將待識別的語音信息劃分為多個第一語音段;
確定每個第一語音段的第一語譜圖;
針對每個第一語音段,根據該第一語音段的第一語譜圖及預先訓練完成的殘差網絡模型,識別該第一語音段是否包含嬰幼兒啼哭聲。
2.如權利要求1所述的嬰幼兒啼哭聲檢測方法,其特征在于,所述殘差網絡模型的訓練過程包括:
針對每個樣本語音信息,根據預設的劃分方法,將該樣本語音信息劃分為多個第二語音段,標記該第二語音段是否包含嬰幼兒啼哭聲;
確定每個第二語音段的第二語譜圖;
針對每個第二語音段,根據預先標記的該第二語音段是否包含嬰幼兒啼哭聲以及該第二語音段的第二語譜圖,對殘差網絡模型進行訓練。
3.如權利要求2所述的嬰幼兒啼哭聲檢測方法,其特征在于,所述根據預設的劃分方法,將該樣本語音信息劃分為多個第二語音段包括:
根據第一設定時長將樣本語音信息劃分為多個第二語音段,并且每個在后的第二語音段,與其相鄰的在前的第二語音段重疊第二設定時長,其中第二設定時長小于第一設定時長。
4.如權利要求1所述的嬰幼兒啼哭聲檢測方法,其特征在于,所述根據預設的劃分方法,將待識別的語音信息劃分為多個第一語音段包括:
根據第一設定時長將待識別的語音信息劃分為多個第一語音段,并且每個在后的第一語音段,與其相鄰的在前的第一語音段重疊第二設定時長,其中第二設定時長小于第一設定時長。
5.一種嬰幼兒啼哭聲檢測裝置,其特征在于,所述裝置包括:
劃分模塊,用于根據預設的劃分方法,將待識別的語音信息劃分為多個第一語音段;
確定模塊,用于確定每個第一語音段的第一語譜圖;
識別模塊,用于針對每個第一語音段,根據該第一語音段的第一語譜圖及預先訓練完成的殘差網絡模型,識別該第一語音段是否包含嬰幼兒啼哭聲。
6.如權利要求5所述的裝置,其特征在于,所述劃分模塊,還用于針對每個樣本語音信息,根據預設的劃分方法,將該樣本語音信息劃分為多個第二語音段,標記該第二語音段是否包含嬰幼兒啼哭聲;
所述確定模塊,還用于確定每個第二語音段的第二語譜圖;
所述裝置還包括:
訓練模塊,用于針對每個第二語音段,根據預先標記的該第二語音段是否包含嬰幼兒啼哭聲以及該第二語音段的第二語譜圖,對殘差網絡模型進行訓練。
7.如權利要求6所述的裝置,其特征在于,所述劃分模塊,具體用于根據第一設定時長將樣本語音信息劃分為多個第二語音段,并且每個在后的第二語音段,與其相鄰的在前的第二語音段重疊第二設定時長,其中第二設定時長小于第一設定時長。
8.如權利要求5所述的裝置,其特征在于,所述劃分模塊,具體用于根據第一設定時長將待識別的語音信息劃分為多個第一語音段,并且每個在后的第一語音段,與其相鄰的在前的第一語音段重疊第二設定時長,其中第二設定時長小于第一設定時長。
9.一種電子設備,其特征在于,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
存儲器,用于存放計算機程序;
處理器,用于執行存儲器上所存放的程序時,實現權利要求1-4任一項所述的方法步驟。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執行時實現權利要求1-4任一項所述的方法步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710835270.8/1.html,轉載請聲明來源鉆瓜專利網。





