[發明專利]基于循環神經網絡和注意力機制的音樂流派分類方法在審
| 申請號: | 201810538183.0 | 申請日: | 2018-05-30 |
| 公開(公告)號: | CN108846048A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 劉勝藍;馮林;姚佳寧 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/04 |
| 代理公司: | 大連星海專利事務所有限公司 21208 | 代理人: | 裴毓英 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音樂流派 循環神經網絡 聲譜圖 分類 注意力機制 注意力模型 概率分布 加權平均 特征學習 音樂特征 音樂信號 權重 注意力 并行 短時傅里葉變換 抽象特征 神經網絡 雙向循環 特征表示 特征權重 特征設置 提取特征 融合 自動地 學習 | ||
本發明公開了一種基于循環神經網絡和注意力機制的音樂流派分類方法。首先,音樂信號通過短時傅里葉變換得到聲譜圖,利用雙向循環神經網絡根據聲譜圖進行特征學習,得到更高層次的抽象特征,同時利用并行的注意力模型,從聲譜圖中學習得到與特征表示相對應的注意力概率分布,用于設置音樂特征表示的不同權重。然后根據特征權重對特征進行加權平均,得到融合后的特征。最后利用融合后的音樂特征進行音樂流派的分類。本發明方法利用并行的循環神經網絡和注意力模型,自動地根據音樂信號進行特征學習,并利用注意力概率分布為特征設置合理的權重,對特征進行加權平均后再進行分類,提高了音樂流派分類的準確性,避免了手工提取特征的復雜性和局限性。
技術領域
本發明涉及音樂檢索領域,尤其涉及基于循環神經網絡和注意力機制的音樂流派分類方法。
背景技術
通過人工的方式難以對海量的音樂數據進行分類和管理。對于用戶而言,又需要能夠在數據量龐大的音樂庫中快速檢索到感興趣的音樂。所以音樂流派分類成為了音樂信息檢索領域中熱門的研究方向之一。
通過傳統的分類框架進行分類,特征提取的過程復雜不易實現,需要該領域內較為專業的先驗知識,而且通過人工提取的音樂特征缺乏通用性,只適用于單一的分類任務。因此本發明利用循環神經網絡自動地實現特征學習并得到特征表示,同時利用注意力模型為特征設置不同的權重,得到更高級的音樂特征,從而提升音樂流派分類的準確性。
發明內容
本發明實施例提供一種基于循環神經網絡和注意力機制的音樂流派分類方法,利用并行的循環神經網絡和注意力模型自動地根據音樂信號進行特征學習,并為特征表示分配合理的注意力概率,提高了音樂流派分類的準確性,避免了手工提取特征的復雜性和局限性。
本發明提供的一種基于循環神經網絡和注意力機制的音樂流派分類方法,包括以下步驟:
步驟S101:利用短時傅里葉變換對原始的音樂信號進行變換,得到對應的音樂信號的聲譜圖;
步驟S102:利用雙向循環神經網絡,根據音樂信號的聲譜圖進行特征學習,并得到特征表示,同時利用并行的注意力模型學習得到與特征表示相對應的注意力概率分布;
步驟S103:根據注意力模型學習到的特征權重對特征進行加權平均,得到融合后的特征,并利用該特征進行音樂流派的分類。
優選的,所述步驟S102,利用雙向循環神經網絡不斷地學習并得到音樂信號的特征表示
優選的,利用并行的注意力模型學習得到與特征表示相對應的注意力概率分布;
首先給定由短時傅里葉變換得到的音樂信號聲譜圖X和標簽y,以及雙向循環神經網絡F(W,X),得到能夠表征音樂信號特性的特征表示Xbrnn;
同時,利用并行的由卷積神經網絡實現的注意力模型,從聲譜圖中學習得到注意力的分數表示E,對注意力分數進行歸一化得到注意力的概率分布,如下公示所示:
其中,αi表示注意力概率分布α中第i個注意力概率值;ei表示表示注意力分數E中的第i個分數值;T表示特征Xbrnn中列向量的數量。
優選的,所述步驟S103:利用注意力概率分布α為特征表示Xbrnn設置不同的權重,得到更高級的特征H,并利用softmax函數對H進行音樂流派的分類;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810538183.0/2.html,轉載請聲明來源鉆瓜專利網。





