[發明專利]一種基于DCNN聯合特征表示的音樂推薦方法有效
| 申請號: | 202110338511.4 | 申請日: | 2021-03-26 |
| 公開(公告)號: | CN113094544B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 陳湘濤;柳玉洋;王莎莎 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F16/683 | 分類號: | G06F16/683;G06N3/0464;G06N3/08;G10L21/0208 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410082 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 dcnn 聯合 特征 表示 音樂 推薦 方法 | ||
1.一種基于DCNN聯合特征表示的音樂推薦方法,其特征在于,包括:
音樂預處理和增強:用于處理原始音樂數據,以及增強音樂音頻用來進行特征的提取;
音樂特征建模模塊:在音樂音頻預處理和增強后,通過FFT、Mel濾波器生成聲譜圖、音頻譜圖和Log梅爾譜圖,以及提取MFCC、頻譜質心音頻特征,用于模型訓練的初始樣本,然后結合DCNN、CNN進行建模,分別得到基于Log梅爾譜圖的DCNN模型和基于MFCC的CNN模型,并對其進行訓練;
推薦方法模塊:音樂特征建模模塊和推薦方法模塊是雙向連接,進行兩端訓練; 將訓練得到的低維特征向量進行組合拼接,再進行下一步工作并推薦音樂,上述模塊具體包括以下步驟:
S1.音樂格式轉換:將原始音樂數據進行格式轉換,統一格式為MP3,并對每首音樂按照“類別-ID”的形式進行標識;
S2.音樂音頻的增強:由于原始音樂數據可能會存在噪聲或音質受損的情況,因此需要對其進行增強,降噪主要利用濾波器,在降噪過程中,盡可能不損傷原始的音樂音頻信號,回聲消除利用NLMS算法實現,音頻的采樣率調整利用SoX處理;
S3.聲譜圖和音頻譜圖:主要包括音頻進行FFT生成聲譜圖、Log梅爾譜圖; 音樂音頻信號經過預加重、分幀加窗和FFT獲得音頻聲譜圖,在輸入到梅爾濾波器組中,進一步得到梅爾譜圖,最后進行對數運算得到Log梅爾譜圖,用于第一通道的模型輸入;
S4.音頻特征的提取,使用librosa庫進行音樂片段的MFCC特征的提取,保存為文件,作為第二通道的輸入數據;
其中,在步驟S3中采用1024的窗口大小,相鄰窗距為512,窗函數使用α=0.46的漢寧窗,梅爾濾波器數量為128,以及以10為底的對數運算; 在步驟S1、S2和S3中使用Log梅爾譜圖作為第一通道的DCNN網絡模型的輸入,經過多輪訓練,不斷減小音樂特征真值與預測值之間的交叉熵誤差,直至達到最佳的訓練目的,最終得到回歸預測模型,即基于Log梅爾譜圖的DCNN模型;
上述第一通道的DCNN加入了批量歸一化層,同時采用ReLu激活函數和Adam優化方法,由4個卷積層和4個池化層交替出現,以及1個全連接組成;
然后,在步驟S4中將其得到的音樂元數據進行特征統計處理,使其適合網絡的輸入要求,訓練并調整其權重參數,最終得到MFCC-CNN模型; 該模型采用簡單的網絡結構,即卷積層、池化層均為一維的兩層的,且全連接層比基于Log梅爾譜圖的DCNN多了一層;
最后,將第一通道和第二通道的結果組合在一起,進入全連接層和softmax層,softmax公式如下:再結合CB算法原理,實現滿足用戶偏好的音樂TopN推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110338511.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種壓風供氧雙重降溫防護系統
- 下一篇:后交叉韌帶重建手術用脛骨隧道定位器





