[發明專利]一種基于演唱者聲音特質的歌曲推薦方法在審
| 申請號: | 201710206783.2 | 申請日: | 2017-03-31 |
| 公開(公告)號: | CN106991163A | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 余春艷;蘇金池;劉煌;郭文忠 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G10L25/48 |
| 代理公司: | 福州元創專利商標代理有限公司35100 | 代理人: | 蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 演唱者 聲音 特質 歌曲 推薦 方法 | ||
1.一種基于演唱者聲音特質的歌曲推薦方法,其特征在于:包括如下步驟:
步驟S1:分析曲庫中歌曲的簡譜信息,得到各個歌曲的MIDI音高基準序列,分析出歌曲的音級分布直方圖,得到各個歌曲的演唱音域要求;
步驟S2:采用MELODIA算法分析用戶清唱錄音文件,得到演唱者演唱該歌曲的MIDI音高值序列,取得步驟S1中得到的同一歌曲的MIDI音高基準序列,計算演唱者的基準演唱能力,提取其演唱音域;
步驟S3:對歌手的清唱文件提取時頻信號表征,輸入到深度卷積神經網絡中對網絡進行迭代訓練,得到訓練好的深度卷積神經網絡及人聲音色嵌入空間;
步驟S4:根據歌手的清唱文件提取時頻信號表征,將其輸入到步驟S3中訓練好的深度卷積神經網絡中,網絡的輸出對應于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為原唱歌手的人聲音色表征;
步驟S5:分析演唱者的清唱聲音片段,同樣采用步驟S4的方法,得到人聲音色嵌入空間中的一組3維音色特征向量,作為演唱者人聲音色表征;
步驟S6:根據歌曲的演唱音域要求和演唱者的演唱音域,計算出用戶與歌曲之間的音域匹配度;
步驟S7:根據原唱歌手和演唱者的人聲音色表征,計算演唱者與各歌手的音色相似度;
步驟S8:根據音域匹配度和音色相似度,計算曲庫中每首歌曲對于該用戶的推薦度。
2.根據權利要求1所述的一種基于演唱者聲音特質的歌曲推薦方法,其特征在于:所述步驟S6具體包括以下步驟:
步驟S61:根據歌曲音級分布直方圖得到每個音級的權重,每個音級的權重等于該音級出現的次數除以該歌曲中所有音級出現次數的總和,計算公式的定義具體為:
其中,num(X)表示音級X在簡譜中出現的次數,Xmax表示簡譜中音符的最大MIDI值,Xmin表示簡譜中音符的最小MIDI值;
步驟S62:利用歌曲的音級分布情況與用戶在各個音級的演唱能力評估值,計算出用戶演唱音域與歌曲音域要求的匹配度,音域匹配度的計算公式的定義具體為:
其中,U(X)表示用戶在音級X上的演唱能力評估值。
3.根據權利要求1所述的一種基于演唱者聲音特質的歌曲推薦方法,其特征在于:所述步驟S7中,演唱者的聲音片段嵌入到音色嵌入空間中后,分別計算演唱者與嵌入空間中各歌手的音色相似度,音色相似度的計算公式的定義具體為:
Tim_sim(u,s)=1-tanh(μ||Z1-Z2||2)
其中,||Z1-Z2||2表示兩點之間的歐氏距離,μ為經驗系數,tanh為雙曲正切函數。
4.根據權利要求1所述的一種基于演唱者聲音特質的歌曲推薦方法,其特征在于:所述步驟S8中,在進行最終的推薦時,綜合考慮用戶的演唱音域與曲庫中歌曲的音域要求的匹配度以及用戶的音色與曲庫中歌手的音色相似性,計算曲庫中每首歌曲對于該用戶的推薦度,推薦度的計算公式的定義具體為:
Recom(u,s)=cRan_mat(u,s)+(1-c)Tim_sim(u,s)
其中,Recom(u,s)表示歌曲s對于用戶u的推薦度,Ran_mat(u,s)表示歌曲s對于用戶u的音域匹配度,Tim_sim(u,s)表示用戶u的音色與歌曲s的原唱歌手音色的相似度,c取值為0.7。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710206783.2/1.html,轉載請聲明來源鉆瓜專利網。





