[發明專利]一種基于語譜圖紋理特征的音頻場景識別方法在審
| 申請號: | 202010091722.8 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111276158A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 徐翹楚;汪斌;陳淑聰;姜飛龍;朱海濱;李興隆;張奧;毛凌航 | 申請(專利權)人: | 嘉興學院 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/51 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 314000 浙江省嘉興市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語譜圖 紋理 特征 音頻 場景 識別 方法 | ||
1.一種基于語譜圖紋理特征的音頻場景識別方法,其特征在于該方法的具體步驟是:
步驟(1):將輸入音頻集隨機劃分成訓練音頻和測試音頻;
步驟(2):將輸入訓練音頻和測試音頻提取出語譜圖,并進行規范化處理;
步驟(3):采用二維Gabor濾波器對訓練音頻和測試音頻的語譜圖進行變換,具體如下:
建立L個二維Gabor濾波器,二維Gabor濾波器有M個尺度和N個方向。因此有L=M×N;若輸入音頻語譜圖為D(x,y),x=1,2,...,W,y=1,2,...,H;其中W和H分別為語譜圖的寬度和高度;經過二維Gabor濾波后,得到Gabor系數為G(m,n,i,j),其中m為Gabor系數的尺度索引;n為Gabor系數的方向索引;0≤m≤M-1,0≤n≤N-1;
L個二維Gabor濾波器的設計步驟如下:
對于二維離散Gabor濾波器,有如下公式:
x′=x cosθn+y sinθn
y′=y cosθn-x sinθn
θn=2πn/N,其中n=0,1,...,N-1,fm=a-mfmax,其中fmax為最高頻率,m=0,1,...,M-1;
構造L=M×N個Gabor濾波器后,將輸入音頻頻譜圖經過L個Gabor濾波器進行濾波,得到Gabor系數G(m,n,x,y),計算公式如下:
G(m,n,x,y)=D(x,y)*f(x,y,fm,θn)
其中,D(x,y)為輸入音頻語譜圖,f(x,y,fm,θn)為第m個尺度和第n個方向的Gabor濾波器,符號*為卷積操作,G(x,y,m,n)為音頻語譜圖經Gabor濾波后得到的Gabor濾波結果;
步驟(4):求取Gabor濾波結果G(m,n,x,y)的幅度,采用公式如下:
其中,A(m,n,x,y)為Gabor濾波結果幅度;RE(G(m,n,x,y))為Gabor濾波結果G(x,y,m,n)的實部;IM(G(m,n,x,y))為Gabor濾波結果G(x,y,m,n)的虛部;
步驟(5):對音頻頻譜圖的不同尺度的Gabor濾波結果幅度A(m,n,x,y)求取像素距離d=1,方向為θ=0°,θ=45°,θ=90°和θ=135°四個方向的灰度共生矩陣,具體是:
將Gabor濾波結果幅度A(m,n,x,y)的取值歸一化到[0,255]范圍,同時計算方向為θ=0°,θ=45°,θ=90°和θ=135°四個方向的灰度共生矩陣,記為CM0(p,q)、CM45(p,q)、CM90(p,q)和CM135(p,q),其中0≤p≤255,0≤q≤255;
步驟(6):計算得到四個方向灰度共生矩陣的歸一化矩陣,具體計算公式如下:
步驟(7):對四個方向的灰度共生矩陣計算二階矩、熵、對比度和均勻度,計算方法如下:
二階矩計算公式為:
其中θ=0°,45°,90°,135°;
熵計算公式為:
其中θ=0°,45°,90°,135°;
對比度計算公式為:
其中θ=0°,45°,90°,135°;
均勻度計算公式為:
其中θ=0°,45°,90°,135°;
步驟(8):將四個方向的二階矩,熵,對比度和均勻度組合成特征向量,公式如下:
F={WM0,WM45,WM90,WM135,WE0,WE45,WE90,WE135,
WC0,WC45,WC90,WC135,WH0,WH45,WH90,WH135}
步驟(9):將特征向量F合并音頻場景類別送到支持向量機中進行訓練,得到訓練后的支持向量機;
步驟(10):將測試音頻同樣按步驟(1)到步驟(8)提取出特征向量F,送到訓練后的支持向量機中進行測試,得到音頻場景分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于嘉興學院,未經嘉興學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010091722.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于視覺的產品缺陷檢測裝置
- 下一篇:一種顯示屏及其制備方法和顯示裝置





