[發明專利]一種工業流水線音頻識別方法、裝置及存儲介質在審
| 申請號: | 202011294784.5 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112489627A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 劉軍;徐梓涵;張建行;侯青;劉洋;孫思琪;姜佳寧 | 申請(專利權)人: | 武漢工程大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/22 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 尉保芳 |
| 地址: | 430000 湖北省武*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 工業 流水線 音頻 識別 方法 裝置 存儲 介質 | ||
1.一種工業流水線音頻識別方法,其特征在于,包括如下步驟:
導入多個原始音頻數據,并分別對多個所述原始音頻數據進行數據轉化處理,得到多個待處理音頻數據;
分別對多個所述待處理音頻數據進行降維處理,得到多個降維音頻數據;
分別對多個所述降維音頻數據進行特征提取,得到多個音頻特征數據,并集合多個所述音頻特征數據,得到音頻特征數據集;
構建訓練模型,并根據所述訓練模型對所述音頻特征數據集進行訓練,得到音頻特征模型;
對所述音頻特征模型進行參數更新,得到更新后的音頻特征模型;
根據所述更新后的特征檢測模型對待識別的音頻數據進行識別,得到識別結果。
3.根據權利要求1所述的工業流水線音頻識別方法,其特征在于,所述分別對多個所述待處理音頻數據進行降維處理,得到多個降維音頻數據的過程包括:
利用PCA主成分分析算法分別對多個所述待處理音頻數據進行降維處理,得到多個降維音頻數據。
4.根據權利要求3所述的工業流水線音頻識別方法,其特征在于,所述分別對多個所述降維音頻數據進行特征提取,得到多個音頻特征數據的過程包括:
分別對多個所述降維音頻數據進行語譜圖的構建,得到多個語譜圖;
根據多個所述語譜圖分別對對應的各個所述降維音頻數據進行特征提取,得到各個所述降維音頻數據對應的音頻特征數據。
5.根據權利要求4所述的工業流水線音頻識別方法,其特征在于,所述分別對多個所述降維音頻數據進行語譜圖的構建得到多個語譜圖的過程包括:
導入預設的滑動窗口,并根據所述滑動窗口分別對各個所述降維音頻數據進行分幀處理,得到各個所述降維音頻數據對應的分幀后的音頻數據;
分別對各個所述分幀后的音頻數據進行快速傅立葉變換,得到各個所述降維音頻數據對應的音頻數據橫坐標和音頻數據頻率刻度;
利用周期圖算法分別對各個所述音頻數據橫坐標進行功率譜估值的計算,得到各個所述降維音頻數據對應的功率譜估值;
分別對各個所述功率譜估值進行質量分數的計算,得到各個所述降維音頻數據對應的質量分數;
根據各個所述質量分數和對應的所述音頻數據頻率刻度進行二維圖的構建,得到多個語譜圖。
6.根據權利要求5所述的工業流水線音頻識別方法,其特征在于,所述利用周期圖算法分別對各個所述音頻數據橫坐標進行功率譜估值的計算,得到各個所述降維音頻數據對應的功率譜估值的過程包括:
通過第一式分別對各個所述音頻數據橫坐標進行功率譜估值的計算,得到各個所述降維音頻數據對應的功率譜估值,所述第一式為:
Y=X*X,
其中,X為音頻數據橫坐標,Y為功率譜估值。
7.根據權利要求6所述的工業流水線音頻識別方法,其特征在于,所述分別對各個所述功率譜估值進行質量分數的計算,得到各個所述降維音頻數據對應的質量分數的過程包括:
通過第二式分別對各個所述功率譜估值進行質量分數的計算,得到各個所述降維音頻數據對應的質量分數,所述第二式為:
M=10*log10(Y),
其中,M為質量分數,Y為功率譜估值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢工程大學,未經武漢工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011294784.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種特殊人群用安全插頭
- 下一篇:一種抗熱震的熱障涂層材料及制備方法





