[發明專利]基于自適應CNN和半監督自訓練模型的音樂分類方法有效
| 申請號: | 202011464477.7 | 申請日: | 2020-12-14 |
| 公開(公告)號: | CN112487237B | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 張旭;羅朗;陳賢 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/65 | 分類號: | G06F16/65;G06F16/683;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重慶輝騰律師事務所 50215 | 代理人: | 王海軍 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自適應 cnn 監督 訓練 模型 音樂 分類 方法 | ||
1.一種基于自適應CNN和半監督自訓練模型的音樂分類方法,其特征在于,包括:
S1:獲取歌曲的歌詞數據,將獲取的歌詞數據輸入到數據庫的列表中;
S2:采用預訓練的Bert模型對列表中的歌詞數據進行處理,轉化為句子向量;
S3:采用DUTIR中文情緒識別模型提取列表中歌詞數據的情感,得到情感特征向量;
S4:將句子向量和情感特征向量進行拼接,得到拼接向量;
S5:將拼接向量輸入到訓練好的自適應CNN模型中進行初步分類,得到初步分類結果;半監督自訓練模型包括三個不同的分類器;對半監督自訓練模型處理數據的過程包括:
S51:將所有的初步分類結果進行集合,得到初步分類樣本集;將初步分類樣本集分成三個初步分類樣本子集;
S52:將三個初步分類樣本子集分別輸入到三個不同的分類器中進行初步訓練,得到三種分類結果;
S53:通過三種分類結果判斷輸入的數據分類是否完善,直到所有的初步分類樣本集中的數據處理完,則停止模型的訓練;
S6:將初步分類結果輸入到半監督自訓練模型進行精細分類,得到精細劃分標簽;
S7:根據精細劃分標簽對輸入的音樂數據進行精細分類。
2.根據權利要求1所述的一種基于自適應CNN和半監督自訓練模型的音樂分類方法,其特征在于,對自適應CNN模型進行訓練的過程包括:
步驟1:獲取歌曲庫中的歌曲數據,對各首歌曲數據進行預處理,得到模型訓練樣本集;
步驟2:將訓練樣本集中的拼接向量輸入到自適應CNN模型的Attention層,提取拼接向量的關鍵信息;
步驟3:將拼接向量輸入到自適應CNN模型的卷積層提取關鍵信息的主要特征;主要特征的獲取包括采用不同大小的卷積核分別提取關鍵信息的不同的特征和隱藏特征,將所有提取的不同特征和隱藏特征進行融合,得到主要特征;
步驟4:將主要特征輸入到最大池化層降低特征維度,得到初步分類結果。
3.根據權利要求2所述的一種基于自適應CNN和半監督自訓練模型的音樂分類方法,其特征在于,對各首歌曲數據進行預處理包括提取各首歌曲的歌詞,構建歌詞列表;采用Bert模型將歌詞列表中的數據轉化為句子向量;提取列表中歌詞數據的情感特征向量;將句子向量和情感特征向量進行拼接,得到訓練集。
4.根據權利要求2所述的一種基于自適應CNN和半監督自訓練模型的音樂分類方法,其特征在于,在Attention層提取關鍵信息的公式為:
其中,Q,K,V分別表示對拼接向量的不同權重的表示,dk表示拼接向量的維度,softmax表示對括號中的所用進行Softmax操作,KT表示K的轉置。
5.根據權利要求2所述的一種基于自適應CNN和半監督自訓練模型的音樂分類方法,其特征在于,得到主要特征的公式為:
其中,表示在卷積核大小為fj下的卷積操作,表示卷積核所代表的矩陣,Scon表示拼接向量的關鍵信息,表示偏置參數,表示在卷積操作中的最大值,V表示在不同大小卷積核的卷積下最大值的集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011464477.7/1.html,轉載請聲明來源鉆瓜專利網。





