[發明專利]一種改進DCNN的音樂流派分類方法在審
| 申請號: | 202011280422.0 | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112466329A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 劉萬軍;王佳銘;曲海成;王俊愷 | 申請(專利權)人: | 遼寧工程技術大學 |
| 主分類號: | G10L25/30 | 分類號: | G10L25/30;G10L25/51;G10L25/24;G10L25/18;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 北京華夏正合知識產權代理事務所(普通合伙) 11017 | 代理人: | 韓登營;張麗萍 |
| 地址: | 123000 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 改進 dcnn 音樂 流派 分類 方法 | ||
1.一種改進DCNN的音樂流派分類方法,其特征在于,包括以下步驟:
步驟1:輸入訓練集和驗證集;
步驟2:提取音頻信息MFCC特征;
步驟3:生成頻譜;
步驟4:頻譜切割;
步驟5:輸入網絡模型;
步驟6:訓練模型;
步驟7:驗證模型;
步驟8:是否達到指定批次,若否進入到步驟6;
步驟9:輸出模型。
2.如權利要求1所述的改進DCNN的音樂流派分類方法,其特征在于,所述步驟2中,提取音頻信息的方法為:
如果音樂數據的聲道為立體聲,則對音樂數據進行聲道轉換,由立體聲轉換為單聲道,降低信息冗余;
然后通過對音樂數據的梅爾頻率倒譜系數進行提取,將音樂的時域數據轉換到頻域,使音樂數據表示更加貼近人耳。
3.如權利要求1所述的改進DCNN的音樂流派分類方法,其特征在于,所述步驟4中,將頻譜切分為227×227像素的切片后輸入網絡模型,以此更加擬合人類的學習和認知規律;頻譜切片以x軸表示時間,y軸表示頻率,其中頂部為最高頻率,底部為最低頻率;以灰度顯示頻率的縮放幅度,其中白色為最大值,黑色為最小值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遼寧工程技術大學,未經遼寧工程技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011280422.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:防護件、面板組件和空調器
- 下一篇:冷卻激光切割頭及激光切割機





