[發明專利]音頻事件檢測方法、裝置及計算機可讀存儲介質有效
| 申請號: | 201710797265.2 | 申請日: | 2017-09-06 |
| 公開(公告)號: | CN108510982B | 公開(公告)日: | 2020-03-17 |
| 發明(設計)人: | 劉海波 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L25/27;G10L25/30 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 蔣雅潔;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 事件 檢測 方法 裝置 計算機 可讀 存儲 介質 | ||
本發明公開了一種音頻事件檢測方法、裝置及計算機可讀存儲介質,該方法包括:利用從分幀處理得到的各時刻的音頻數據中分別提取指定特征向量輸入訓練得到的RNN/BI?RNN模型中,以實現音頻事件的檢測。使用訓練得到的RNN/BI?RNN模型對音頻事件進行檢測,由于RNN模型在進行音頻事件檢測時除了使用當前時刻的信息,還將使用當前時刻之前時刻的信息,且BI?RNN模型除了使用當前時刻的信息和當前時刻之前時刻的信息以外,還將使用當前時刻之后時刻的信息,因此,RNN/BI?RNN模型的學習能力相對于GMM和SVM更強,使用具有更強學習能力的RNN/BI?RNN模型對音頻事件進行檢測,具有更優的檢測效果。
技術領域
本發明涉及音頻檢測技術領域,尤其涉及一種音頻事件檢測方法、裝置及計算機可讀存儲介質。
背景技術
當今世界正處在信息爆炸的時代,信息正在以指數級的速度增長。多媒體技術和互聯網技術的不斷發展,使得對海量多媒體數據進行自動分析處理的必要性大大提高,且通過對多媒體數據進行分析,能夠有效的滿足用戶的需求。例如,針對體育比賽來說,通過對喝彩聲,鼓掌聲、歡呼聲、笑聲之類的音頻事件的檢測,來在體育比賽的音頻中提取精彩場景,使得用戶能夠更便捷的找到自己感興趣的片段。
目前,常用的音頻事件的檢測方法包括:基于高斯混合模型(Gaussian MixtureModel,GMM)檢測音頻中的音頻事件,及使用支持向量機(Support Vector Machine,SVM)檢測音頻中的音頻事件。然而,這兩種方法的學習能力不強,當音頻較為復雜或者包含的音頻事件較多時,檢測效果不佳。
發明內容
本發明的主要目的在于提供一種音頻事件檢測方法、裝置及計算機可讀存儲介質,旨在解決現有技術中利用GMM和SVM檢測音頻中的音頻事件時,由于GMM和SVM的學習能力不強,帶來的檢測效果不佳的技術問題。
為實現上述目的,本發明第一方面提供一種音頻事件檢測方法,包括:
對待檢測的音頻進行分幀處理,并從分幀處理得到的各時刻的音頻數據中分別提取指定特征向量;
將所述各時刻的音頻數據的指定特征向量輸入訓練得到的RNN/BI-RNN模型中,得到所述各時刻的音頻數據中各音頻事件的后驗概率,所述RNN/BI-RNN是基于訓練音頻及預置的所述各音頻事件訓練得到的;
根據所述各時刻的音頻數據中各音頻事件的后驗概率及預置的音頻解碼算法,從所述各時刻的音頻數據中檢測音頻事件的最佳音頻數據序列。
為實現上述目的,本發明第二方面提供一種音頻事件檢測裝置,包括:
第一分幀提取模塊,用于對待檢測的音頻進行分幀處理,并從分幀處理得到的各時刻的音頻數據中分別提取指定特征向量;
輸入模塊,用于將所述各時刻的音頻數據的指定特征向量輸入訓練得到的RNN/BI-RNN模型中,得到所述各時刻的音頻數據中各音頻事件的后驗概率,所述RNN/BI-RNN是基于訓練音頻及預置的所述各音頻事件訓練得到的;
檢測模塊,用于根據所述各時刻的音頻數據中各音頻事件的后驗概率及預置的音頻解碼算法,從所述各時刻的音頻數據中檢測音頻事件的最佳音頻數據序列。
為實現上述目的,本發明第三方面提供一種終端設備,包括:存儲器、處理器及存儲在所述存儲器上且在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時,實現如本發明實施例第一方面提供的音頻事件檢測方法中的各個步驟。
為實現上述目的,本發明第四方面提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時,實現如本發明第一方面音頻事件檢測方法中的各個步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710797265.2/2.html,轉載請聲明來源鉆瓜專利網。





