[發明專利]基于神經網絡的聲音檢測方法、工業聲學檢測系統及方法在審
| 申請號: | 202110431912.4 | 申請日: | 2021-04-21 |
| 公開(公告)號: | CN113140229A | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 朱寶鶴;任百吉;孫永吉 | 申請(專利權)人: | 上海泛德聲學工程有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/30;G10L25/24;G06N3/04;G06N3/08 |
| 代理公司: | 上海諾衣知識產權代理事務所(普通合伙) 31298 | 代理人: | 劉艷芝 |
| 地址: | 201613 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 聲音 檢測 方法 工業 聲學 系統 | ||
1.基于卷積神經網絡的聲音檢測方法,其特征在于:包括卷積神經網絡模型的訓練階段和預測階段,其中,在訓練階段,首先,對已標記標簽的聲音信號做預處理,將一定數量的聲音信號轉換為二維音頻特征;然后,將所有二維音頻特征和標簽作為樣本,輸入至未訓練的卷積神經網絡模型進行訓練,獲得具有訓練好參數的卷積神經網絡模型;
在預測階段,實時將獲取的聲音信號轉換為二維音頻特征,并輸入至訓練好的卷積神經網絡模型,獲取卷積神經網絡模型輸出的聲音預測。
2.根據權利要求1所述的基于卷積神經網絡的聲音檢測方法,其特征在于:將一定數量的聲音信號轉換為二維音頻特征的過程如下:
對聲音信號設定時間長度進行分幀,得到N個聲音片段,每一個聲音片段即為一幀,對每一幀聲音信號計算對數梅爾特征,將所有分幀的對數梅爾特征合成得到二維音頻特征,
對數梅爾特征的計算方法如下所示:
每幀聲音信號→傅里葉變換→取模→梅爾濾波器→對數變換→對數梅爾特征。
3.根據權利要求1所述的基于卷積神經網絡的聲音檢測方法,其特征在于:卷積神經網絡模型的訓練流程如下:
步驟1、將已經標記過“正常”或“異常”標簽的聲音信號按比例劃分為訓練集和測試集;
步驟2、將訓練集中的所有數據分批依次輸入卷積神經網絡模型,每輸入一批數據計算一次模型輸出值,利用輸出值和標簽計算損失函數值,應用損失函數值對卷積神經網絡模型的參數進行一次更新,同時計算訓練集預測準確率,輸入完所有批次數據即完成一個訓練周期;
步驟3、一個訓練周期結束后,將測試集數據導入當前參數更新的卷積神經網絡模型,計算測試集的預測準確率和損失函數值;
步驟4、重復執行步驟2、步驟3,直至預先設定的訓練周期總數完成,獲取具有訓練好參數的卷積神經網絡模型。
4.根據權利要求1所述的基于卷積神經網絡的聲音檢測方法,其特征在于:卷積神經網絡模型輸出的聲音預測過程如下:
將實時采集的聲音信號轉換為二維音頻特征,輸入訓練好的卷積神經網絡模型,輸出一個概率值,該概率值范圍為[0,1],當概率值小于0.5時,預測為“正常”,否則,預測為“異常”。
5.根據權利要求1所述的基于卷積神經網絡的聲音檢測方法,其特征在于:卷積神經網絡模型的構建方法如下:
所述卷積神經網絡模型由多個卷積層塊、一個池化層和一個全連接層按順序連接構成,其中,卷積層塊是3路分支結構,分別是3ⅹ3卷積層、1ⅹ1卷積層和殘差分支;3路分支各自經過批規范層后相加,由ReLU激活函數運算輸出新的音頻特征。
6.工業聲學智能檢測方法,其特征在于:首先,在工業現場獲取一定數量的聲音信號,并對所有聲音信號標記標簽;其次,對已標記標簽的聲音信號做預處理,轉換為二維音頻特征;然后,將所有二維音頻特征和標簽作為樣本,輸入至未訓練的卷積神經網絡模型進行訓練,獲得具有訓練好參數的卷積神經網絡模型;最后,應用訓練好參數的卷積神經網絡模型進行聲音預測,實時將在工業現場獲取的聲音信號轉換為二維音頻特征,并輸入至訓練好參數的卷積神經網絡模型,獲取卷積神經網絡模型輸出的聲音預測,判斷工業現場的聲音信號是否合格。
7.根據權利要求6所述的工業聲學智能檢測方法,其特征在于:在工業現場,通過聲音采集裝置獲取一定數量的聲音信號,并對所有聲音信號進行人工標記標簽,作為訓練神經網絡模型的聲音樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海泛德聲學工程有限公司,未經上海泛德聲學工程有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110431912.4/1.html,轉載請聲明來源鉆瓜專利網。





