[發明專利]音頻數據處理方法、裝置、計算機設備以及存儲介質有效
| 申請號: | 201911155938.X | 申請日: | 2019-11-22 |
| 公開(公告)號: | CN111028860B | 公開(公告)日: | 2021-08-06 |
| 發明(設計)人: | 毛光亮;陳茂華;曾劍鋒 | 申請(專利權)人: | 深圳市康冠智能科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 林燕云 |
| 地址: | 518000 廣東省深圳市龍崗*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 數據處理 方法 裝置 計算機 設備 以及 存儲 介質 | ||
本發明實施例公開了一種音頻數據處理方法、裝置、計算機設備以及存儲介質,所述方法包括:對原始音頻數據進行重采樣;將重采樣后的音頻數據轉換為重疊幀;使用Hanming窗對重疊幀進行加權處理,再對加權處理后的重疊幀中的每一音頻數據幀執行快速離散傅里葉變換,得到離散音頻數據;將獲得的離散音頻數據進行歸一化處理,再采用預設輕量級音頻分析庫提取歸一化處理后的離散音頻數據中的魯棒性特征;將魯棒性特征與預設模板魯棒性特征進行特征匹配;若魯棒性特征與預設模板魯棒性特征不匹配,判定原始音頻數據為異常音頻數據,否則判定原始音頻數據為正常音頻數據。本發明能夠提高音頻處理的準確性以及音頻測試的效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種音頻數據處理方法、裝置、計算機設備以及存儲介質。
背景技術
目前,市面上存在的音頻處理技術,由于需要通過將音頻數據進行喇叭回放之后才能完成音頻處理,這種處理方式需要靜音環境才能夠順利進行,但是,現實中的很多場景都是噪音環境,例如工廠,由于有噪音滲入喇叭所回放的聲音中,導致在對音頻進行處理(例如音頻識別)時,大部分的音頻識別都是靠人為的主觀意識進行判斷才能夠完成,這種傳統的處理方式無法在噪音環境中完成,嚴重影響了音頻處理的準確性,降低音頻測試的效率。
發明內容
有鑒于此,本發明實施例提供一種音頻數據處理方法、裝置、計算機設備以及存儲介質,能夠提高音頻處理的準確性以及音頻測試的效率。
一方面,本發明實施例提供了一種音頻數據處理方法,該方法包括:
對原始音頻數據進行重采樣;
將重采樣后的音頻數據轉換為重疊幀;
使用Hanming窗對所述重疊幀進行加權處理,再對加權處理后的重疊幀中的每一音頻數據幀執行快速離散傅里葉變換,得到離散音頻數據;
將獲得的離散音頻數據進行歸一化處理,再采用預設輕量級音頻分析庫提取歸一化處理后的離散音頻數據中的魯棒性特征;
將魯棒性特征與預設模板魯棒性特征進行特征匹配;
若所述魯棒性特征與預設模板魯棒性特征不匹配,判定所述原始音頻數據為異常音頻數據;
若所述魯棒性特征與預設模板魯棒性特征匹配,判定所述原始音頻數據為正常音頻數據。
另一方面,本發明實施例提供了一種音頻數據處理裝置,所述裝置包括:
重采樣單元,用于對原始音頻數據進行重采樣;
轉換單元,用于將重采樣后的音頻數據轉換為重疊幀;
加權處理單元,用于使用Hanming窗對所述重疊幀進行加權處理,再對加權處理后的重疊幀中的每一音頻數據幀執行快速離散傅里葉變換,得到離散音頻數據;
處理提取單元,用于將獲得的離散音頻數據進行歸一化處理,再采用預設輕量級音頻分析庫提取歸一化處理后的離散音頻數據中的魯棒性特征;
匹配單元,用于將魯棒性特征與預設模板魯棒性特征進行特征匹配;
第一判定單元,用于若所述魯棒性特征與預設模板魯棒性特征不匹配,判定所述原始音頻數據為異常音頻數據;
第二判定單元,用于若所述魯棒性特征與預設模板魯棒性特征匹配,判定所述原始音頻數據為正常音頻數據。
又一方面,本發明實施例還提供了一種計算機設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如上所述的音頻數據處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市康冠智能科技有限公司,未經深圳市康冠智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911155938.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鎢尾礦綜合回收裝置
- 下一篇:一種漆液溫控設備





