[發明專利]一種識別特征聲音的方法和裝置在審
| 申請號: | 201810801712.1 | 申請日: | 2018-07-20 |
| 公開(公告)號: | CN110751942A | 公開(公告)日: | 2020-02-04 |
| 發明(設計)人: | 李俊玲;王博 | 申請(專利權)人: | 北京京東金融科技控股有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/04;G10L15/06;G10L15/10;G10L15/26;G10L15/24 |
| 代理公司: | 11219 中原信達知識產權代理有限責任公司 | 代理人: | 張一軍;李陽 |
| 地址: | 101111 北京市北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音數據 特征聲音 段單元 計算機技術領域 方法和裝置 聲音識別 時間距離 取出 合并 檢測 | ||
本發明公開了一種識別特征聲音的方法和裝置,涉及計算機技術領域。該方法的一具體實施方式包括:對待檢測聲音數據進行拆分處理,并截取出至少一段單元聲音數據;從所述至少一段單元聲音數據中,確定出屬于特征聲音的單元聲音數據;根據所述屬于特征聲音的單元聲音數據之間的時間距離,對其進行合并以得到特征聲音片段。該方法能夠提高聲音識別的準確性,還可以進一步根據每段單元聲音數據的起始時間和結束時間,準確的確定出每段特征聲音片段的起始時間和結束時間。
技術領域
本發明涉及計算機技術領域,尤其涉及一種識別特征聲音的方法和裝置。
背景技術
隨著計算機技術和深度學習的發展,借助聲音特征的分析技術可以實現一些特征聲音(咳嗽聲、求救聲或者打嗝聲等)的識別,以達到自動監測的目的。這種監測方法具備成本低、效率高、全方位非接觸監控的優點,能夠在一定程度上降低人力成本。現有技術中對于特征聲音的識別,一般是通過直接對獲取的待檢測聲音數據進行判斷處理。最終的結果為該一大段待檢測聲音中具有特征聲音,或者不具有特征聲音。該現有技術中識別特征聲音的方法,不僅識別的準確性低,也無法確定出特征聲音的起始時間和結束時間。
發明內容
有鑒于此,本發明實施例提供一種識別特征聲音的方法和裝置,能夠提高聲音識別的準確性,還可以進一步根據每段單元聲音數據的起始時間和結束時間,準確的確定出每段特征聲音片段的起始時間和結束時間。
為實現上述目的,根據本發明實施例的一個方面,提供了一種識別特征聲音的方法。
本發明實施例的識別特征聲音的方法包括:對待檢測聲音數據進行拆分處理,并截取出至少一段單元聲音數據;從所述至少一段單元聲音數據中,確定出屬于特征聲音的單元聲音數據;根據所述屬于特征聲音的單元聲音數據之間的時間距離,對其進行合并以得到特征聲音片段。
可選地,所述對待檢測聲音數據進行拆分處理,并截取出至少一段單元聲音數據的步驟包括:根據滑動窗口對待檢測聲音數據進行拆分處理;截取出單元聲音數據,所述單元聲音數據為每個滑動窗口中包括的聲音數據。
可選地,從所述至少一段單元聲音數據中,確定出屬于特征聲音的單元聲音數據的步驟包括:通過訓練的檢測模型,確定每段單元聲音數據為特征聲音的概率;根據預設的概率閾值,從所述至少一段單元聲音數據中,標注出屬于特征聲音的單元聲音數據。
可選地,在通過訓練的檢測模型,確定每段單元聲音數據為特征聲音的概率之前,還包括:獲取標注后的訓練數據,其中標注為1的訓練數據為特征聲音,標注為0的訓練數據為非特征聲音;搭建包括3層二維卷積神經網絡以及兩層全連接層的網絡模型,其中,最后一層全連接層包含有采用sigmoid激活函數的神經元;基于所述訓練數據和所述網絡模型,訓練得到檢測模型,其中目標損失函數Loss為:
Loss=-∑targets*log(predict)
targets表示真實值,取值為0或者1;predict表示預測值。
可選地,根據預設的概率閾值,從所述至少一段單元聲音數據中,標注出屬于特征聲音的單元聲音數據的步驟包括:判斷單元聲音數據為特征聲音的概率是否大于預設的概率閾值,如果大于,則將該單元聲音數據標注為1;否則標注為0;
根據所述屬于特征聲音的單元聲音數據之間的時間距離,對其進行合并以得到特征聲音片段的步驟包括:按照時間順序,將連續標注為1的單元聲音數據進行合并,以得到至少一段的初步特征聲音片段。
可選地,在按照時間順序,將連續標注為1的單元聲音數據進行合并之后,還包括:判斷所述至少一段的步特征聲音片段之間的時間距離是否小于預設的距離偏移量;如果小于,則將其進行合并以得到特征聲音片段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東金融科技控股有限公司,未經北京京東金融科技控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810801712.1/2.html,轉載請聲明來源鉆瓜專利網。





