[發(fā)明專利]一種基于加性間距膠囊網(wǎng)絡的家庭活動聲音事件分類方法有效
| 申請?zhí)枺?/td> | 201911145336.6 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN110968729B | 公開(公告)日: | 2022-05-17 |
| 發(fā)明(設計)人: | 王章權;劉半藤;鄭啟航;施佳椰;陳友榮 | 申請(專利權)人: | 浙江樹人學院(浙江樹人大學) |
| 主分類號: | G06F16/65 | 分類號: | G06F16/65;G06K9/62 |
| 代理公司: | 紹興市寅越專利代理事務所(普通合伙) 33285 | 代理人: | 鄧愛民 |
| 地址: | 312030 浙江省紹*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 間距 膠囊 網(wǎng)絡 家庭 活動 聲音 事件 分類 方法 | ||
1.一種基于加性間距膠囊網(wǎng)絡的家庭活動聲音事件分類方法,其特征在于:包括如下步驟:
步驟1:判斷音頻樣本的時長并裁剪至符合要求,使用對數(shù)Mel濾波器對裁剪好的音頻進行濾波,將濾波后的音頻樣本與標簽編碼組成樣本對,所有音頻樣本處理后形成的樣本對構建成樣本數(shù)據(jù)集;
步驟2:以膠囊神經(jīng)網(wǎng)絡模型作為骨干,利用Transition層與膠囊神經(jīng)網(wǎng)絡模型的結合計算加性間距SoftMax損失函數(shù),構建出加性間距膠囊網(wǎng)絡模型;
步驟3:將預先構建好的樣本對作為加性間距膠囊網(wǎng)絡模型的輸入,經(jīng)過迭代優(yōu)化網(wǎng)絡參數(shù)獲得訓練好的加性間距膠囊網(wǎng)絡模型;
步驟4:判斷待分類音頻樣本的時長并進行裁剪至符合要求,使用對數(shù)Mel濾波器對裁剪好的待分類音頻進行濾波,將濾波后的待分類音頻輸入訓練好的加性間距膠囊網(wǎng)絡模型進行分類;
所述步驟2中加性間距膠囊網(wǎng)絡模型的構建方法如下:
2.1使用VGG16網(wǎng)絡進行特征提取,使用膠囊網(wǎng)絡作為特征整合器,對膠囊層各個參數(shù)進行初始化,添加權重變量并計算膠囊單元的預測輸出值;
2.2判斷是否達到迭代次數(shù),若否進入2.3,若是則進入2.4;
2.3計算膠囊單元分類概率分布,根據(jù)分類概率分布計算出膠囊單元的輸出向量并激活,最后更新膠囊權重關系矩陣;
2.4輸出歸一化后的膠囊單元向量;
2.5定義Transition層的權重參數(shù),利用2.4中輸出的膠囊單元向量計算出分類向量;
2.6定義權重參數(shù)矩陣,并設置每行向量的模為1;
2.7計算分類向量與權重參數(shù)矩陣的內積,然后計算加性間距損失。
2.根據(jù)權利要求1所述的一種基于加性間距膠囊網(wǎng)絡的家庭活動聲音事件分類方法,其特征在于:所述步驟1中樣本對的構建方法如下:
1.1判斷音頻樣本的時長是否符合設定值,時長不足設定值的予以補全至設定值,時長超過設定值的予以裁剪至設定值;
1.2對符合時長要求的音頻樣本進行STFT變換;
1.3使用Mel對數(shù)濾波器對STFT變換后的音頻樣本進行濾波;
1.4將濾波后的音頻樣本從幅度單位轉換為分貝單位,獲得輸入樣本;
1.5處理輸入標簽,將標簽值轉換為向量,得到向量化標簽編碼;
1.6將1.4中獲得的輸入樣本與1.5中獲得的標簽編碼組成樣本對進行保存。
3.根據(jù)權利要求1所述的一種基于加性間距膠囊網(wǎng)絡的家庭活動聲音事件分類方法,
其特征在于:
所述2.1中,添加膠囊網(wǎng)絡層,并設置輸入長度、輸出長度、迭代次數(shù)參數(shù),添加權重變量Wij,其中i代表當前層l膠囊單元索引,j代表層(l+1)膠囊單元索引,初始化膠囊單元第i層與第j層間的連接權重矩陣bij為0;計算輸入膠囊單元ui與權重變量Wij的預測輸出值為
所述2.3中,對于層l的所有膠囊單元i,計算分類概率分布為ci=softmax(bij),對于層(l+1)的所有膠囊單元j,計算經(jīng)過概率分布ci加權后的膠囊單元輸出為對于層(l+1)的所有膠囊單元j,計算歸一化的膠囊單元輸出vj=squash(sj),其中更新膠囊單元第i層與第j層間的膠囊權重關系矩陣為
所述2.5中,定義Transition層的權重參數(shù)T,并利用2.4的輸出歸一化后的膠囊單元向量計算出分類向量
所述2.7中,定義權重參數(shù)矩陣為w,計算分類向量fj與權重參數(shù)矩陣w的內積為cos(θj)=wTfj,其中θj表示分類向量fj與權重參數(shù)矩陣的轉置wT的夾角,加性間距損失Lams計算如下:
其中s為比例參數(shù),m為間距參數(shù),yi為該樣本正確標簽,cos(θyi)表示類向量fyi與權重參數(shù)矩陣的轉置wT的夾角余弦值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江樹人學院(浙江樹人大學),未經(jīng)浙江樹人學院(浙江樹人大學)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911145336.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡和網(wǎng)絡終端
- 網(wǎng)絡DNA
- 網(wǎng)絡地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡系統(tǒng)及網(wǎng)絡至網(wǎng)絡橋接器
- 一種電力線網(wǎng)絡中根節(jié)點網(wǎng)絡協(xié)調方法和系統(tǒng)
- 一種多網(wǎng)絡定位方法、存儲介質及移動終端
- 網(wǎng)絡裝置、網(wǎng)絡系統(tǒng)、網(wǎng)絡方法以及網(wǎng)絡程序
- 從重復網(wǎng)絡地址自動恢復的方法、網(wǎng)絡設備及其存儲介質
- 神經(jīng)網(wǎng)絡的訓練方法、裝置及存儲介質
- 網(wǎng)絡管理方法和裝置





