[發明專利]一種基于演唱者聲音特質的歌曲推薦方法在審
| 申請號: | 201710206783.2 | 申請日: | 2017-03-31 |
| 公開(公告)號: | CN106991163A | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 余春艷;蘇金池;劉煌;郭文忠 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G10L25/48 |
| 代理公司: | 福州元創專利商標代理有限公司35100 | 代理人: | 蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 演唱者 聲音 特質 歌曲 推薦 方法 | ||
技術領域
本發明涉及歌唱領域的音頻信號處理方法,特別是涉及一種基于演唱者聲音特質的歌曲推薦方法。
背景技術
音樂推薦系統重在向用戶推薦其可能喜歡聽的歌曲,采用的推薦技術主要可以分為基于內容的推薦和基于協同過濾的推薦。基于內容的推薦算法主要根據音樂自身的音頻特征進行推薦,包括MFCC等底層特征或者旋律、節奏、流派、情感等特征。基于協同過濾的推薦算法主要根據用戶之間的點播行為或者播放記錄,以用戶之間的相似性為基礎進行推薦。
近年來,在移動互聯網應用的快速發展和各檔大型真人音樂選秀類節目的雙重刺激下,音樂推薦系統從為用戶推薦喜歡聽的歌曲這一傳統應用場景逐漸遷移,進而滲透進入為用戶推薦喜歡唱的歌曲等新興應用場景。
然而,應用場景的遷移并沒有伴隨著音樂推薦方法的同步遷移。以唱吧APP為例,APP中的推薦功能推薦的歌曲以當前熱門歌曲為主。但是,熱門歌曲并不適合所有用戶演唱。有可能歌曲音調太高了,由于用戶自身演唱音域范圍及演唱能力的限制導致高音部分唱不上去;也有可能歌曲適合用粗獷的、有爆發力的聲音去演繹,而用戶卻是個聲音甜美的女生。
顯然,新的推薦應用場景需要新的推薦模式。在K歌的應用場景下,用戶不僅僅是聽歌曲,更重要的是能最大程度地演繹好歌曲。這是一個雙向匹配的過程,一方面,需要考慮用戶自身聲音的特質,例如用戶實際的演唱音域及聲音的音色等;另一方面,需要考慮歌曲對演唱能力的要求,例如歌曲要求的音域范圍及怎樣的音色更適合演繹該歌曲的情感等。
為了更好的介紹基于演唱者聲音特質的歌曲推薦的概念,介紹一些相關音樂、人聲理論的基本概念。
音色:音色是指聲音在聽覺上產生的某種屬性,聽音者能夠據此判斷兩個以同樣方式呈現、具有相同音高和響度的聲音的不同。
音域:音域有總的音域和個別的人聲或樂器的音域兩種。總的音域指音列的總范圍,即從最低音到最高音的范圍。個別的人聲或樂器的音域指某個人聲或某種樂器在整個音域中所能到達的最低音到最高音的范圍。樂器的音域相對固定,而人聲的音域由于每個人先天的聲帶大小,長短、厚薄不同及后天有無經過系統的聲樂訓練等原因,有著較大的區別。
MIDI(Musical Instrument Digital Interface),是一種數字音樂、樂器的通信標準。MIDI文件可以靈活的記錄歌曲的音高及音長等信息,便于計算機進行音高的分析與處理。
CQT譜,一種音色頻率物理特征,通過中心頻率成指數分布的濾波器組,將樂音信號表示為確定音樂單音的譜能量,濾波器組的品質因子Q保持常數。
個體演唱能力包括演唱者音域范圍的寬窄及在各個音級上的音準控制能力等。發聲能力是演唱能力的基礎,醫學上利用發聲范圍檔案記錄個人的發聲音域及響度動態范圍。專業歌手則通過系統的聲樂訓練方法來提升自身的演唱能力,但普通演唱者一般不會去使用特定的訓練方法。
因此,本申請基于上述分析,利用歌曲簡譜和歌手清唱帶等信息,建立歌曲特征文件庫,提取歌曲的演唱音域和歌手的音色特征。同時利用用戶演唱歌曲時的清唱錄音文件與歌曲的簡譜信息,在音級完成質量高的前提下,提取用戶的演唱音域和音色特征。綜合考慮用戶的演唱音域與曲庫中歌曲音域要求之間的匹配度以及用戶音色與曲庫中歌手音色之間的相似度,計算曲庫中每首歌曲對于該用戶的推薦度,并向用戶推薦推薦度高的歌曲。
發明內容
有鑒于此,本發明的目的是提供一種基于演唱者聲音特質的歌曲推薦方法,對演唱者與歌手之間音域相似度以及音色相似度、歌曲推薦進行分析。
本發明采用以下方案實現:一種基于演唱者聲音特質的歌曲推薦方法,包括如下步驟:
步驟S1:分析曲庫中歌曲的簡譜信息,得到各個歌曲的MIDI音高基準序列,分析出歌曲的音級分布直方圖,得到各個歌曲的演唱音域要求;
步驟S2:采用MELODIA算法分析用戶清唱錄音文件,得到演唱者演唱該歌曲的MIDI音高值序列,取得步驟S1中得到的同一歌曲的MIDI音高基準序列,計算演唱者的基準演唱能力,提取其演唱音域;
步驟S3:對歌手的清唱文件提取時頻信號表征,輸入到深度卷積神經網絡中對網絡進行迭代訓練,得到訓練好的深度卷積神經網絡及人聲音色嵌入空間;
步驟S4:根據歌手的清唱文件提取時頻信號表征,將其輸入到步驟S3中訓練好的深度卷積神經網絡中,網絡的輸出對應于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為原唱歌手的人聲音色表征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710206783.2/2.html,轉載請聲明來源鉆瓜專利網。





