[發明專利]基于改進ResNet18的供水管道泄漏聲音識別方法在審
| 申請號: | 202310377109.6 | 申請日: | 2023-04-11 |
| 公開(公告)號: | CN116343826A | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 邵蔚;鄭峰;蔡龍生 | 申請(專利權)人: | 蘇州建交園智科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/30 |
| 代理公司: | 蘇州國誠專利代理有限公司 32293 | 代理人: | 王會 |
| 地址: | 215200 江蘇省蘇州市吳江區東太湖生態旅游度假區*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進 resnet18 供水 管道 泄漏 聲音 識別 方法 | ||
1.基于改進ResNet18的供水管道泄漏聲音識別方法,其特征在于,包括以下步驟:
首先,采集得到供水管道漏水和不漏水的音頻數據,隨后,將音頻數據進行數據增強,再轉換成對數伽瑪譜圖,再進行特征提取,最后,將特征提取后的數據輸入改進的Resnet18_CBAM模型訓練,輸出分類結果。
2.根據權利要求1所述的基于改進ResNet18的供水管道泄漏聲音識別方法,其特征在于,所述音頻數據通過水下機器人或設置于供水管道上的芯片采集得到。
3.根據權利要求1所述的基于改進ResNet18的供水管道泄漏聲音識別方法,其特征在于,將音頻數據進行數據增強的步驟包括:
將采集到的音頻數據分成訓練集和測試集,將訓練集數據的音聲信號進行5種聲學轉換,包括:
1)正向高音偏移:所有訓練樣本均按偏移系數為+12進行正向高音偏移;
2)負向高音偏移:所有訓練樣本均按偏移系數為-12進行負向高音偏移;
3)音頻時間拉伸:所有訓練樣本高音保持不變,速度降低至0.8倍;
4)添加白噪聲:對音頻信號疊加白噪聲系數0.02;
5)音頻時間縮短:所有訓練樣本高音保持不變,速度提升至1.2倍。
4.根據權利要求1所述的基于改進ResNet18的供水管道泄漏聲音識別方法,其特征在于,所述對數伽瑪譜圖的轉換步驟包括:
1)、采用明漢窗寬為23毫秒的短時傅里葉變換提取能量譜圖;
2)、將128波段的伽瑪頓濾波器組應用到能量譜圖上,并將譜圖轉換為對數尺度,即得到了對數伽瑪馬譜圖;
3)、為利用有限的數據,對數伽瑪馬譜圖被分割成128幀,幀與幀之間50%重疊;
4)、對數伽瑪馬譜圖被分割成128幀,幀與幀之間80%重疊;
5)、計算原始能量譜的一階時間導數,得到原始能量譜的Δ信息;
6)、將上面三者連接在一起作為特征提取網絡的輸入,其尺寸為128×128×3。
5.根據權利要求4所述的基于改進ResNet18的供水管道泄漏聲音識別方法,其特征在于,步驟2)中,所述伽瑪頓濾波器組為一個標準的耳蝸聽覺濾波器,濾波器的時域脈沖響應為:
gi(t)=Atn-1exp(-2πbit)cos(2πfi+φi)U(t),t≥0,1≤i≤N
其中,A為濾波器增益;n是濾波器的階數;fi是濾波器的中心頻率;φi是相位;U(t)為階躍函數;bi為濾波器的衰減因子,它決定了脈沖響應的衰減速度,并與相應的濾波器的帶寬有關,bi=1.019ERB(fi),ERB(fi)為等效矩形帶寬,通過下式得到:
6.根據權利要求1所述的基于改進ResNet18的供水管道泄漏聲音識別方法,其特征在于,所述方法采用CNN特征提取網絡在幀級時域、頻域上進行特征提取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州建交園智科技有限公司,未經蘇州建交園智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310377109.6/1.html,轉載請聲明來源鉆瓜專利網。





