[發(fā)明專利]一種基于演唱者聲音特質(zhì)的歌曲推薦方法在審
| 申請?zhí)枺?/td> | 201710206783.2 | 申請日: | 2017-03-31 |
| 公開(公告)號: | CN106991163A | 公開(公告)日: | 2017-07-28 |
| 發(fā)明(設(shè)計(jì))人: | 余春艷;蘇金池;劉煌;郭文忠 | 申請(專利權(quán))人: | 福州大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G10L25/48 |
| 代理公司: | 福州元創(chuàng)專利商標(biāo)代理有限公司35100 | 代理人: | 蔡學(xué)俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 演唱者 聲音 特質(zhì) 歌曲 推薦 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及歌唱領(lǐng)域的音頻信號處理方法,特別是涉及一種基于演唱者聲音特質(zhì)的歌曲推薦方法。
背景技術(shù)
音樂推薦系統(tǒng)重在向用戶推薦其可能喜歡聽的歌曲,采用的推薦技術(shù)主要可以分為基于內(nèi)容的推薦和基于協(xié)同過濾的推薦。基于內(nèi)容的推薦算法主要根據(jù)音樂自身的音頻特征進(jìn)行推薦,包括MFCC等底層特征或者旋律、節(jié)奏、流派、情感等特征。基于協(xié)同過濾的推薦算法主要根據(jù)用戶之間的點(diǎn)播行為或者播放記錄,以用戶之間的相似性為基礎(chǔ)進(jìn)行推薦。
近年來,在移動互聯(lián)網(wǎng)應(yīng)用的快速發(fā)展和各檔大型真人音樂選秀類節(jié)目的雙重刺激下,音樂推薦系統(tǒng)從為用戶推薦喜歡聽的歌曲這一傳統(tǒng)應(yīng)用場景逐漸遷移,進(jìn)而滲透進(jìn)入為用戶推薦喜歡唱的歌曲等新興應(yīng)用場景。
然而,應(yīng)用場景的遷移并沒有伴隨著音樂推薦方法的同步遷移。以唱吧APP為例,APP中的推薦功能推薦的歌曲以當(dāng)前熱門歌曲為主。但是,熱門歌曲并不適合所有用戶演唱。有可能歌曲音調(diào)太高了,由于用戶自身演唱音域范圍及演唱能力的限制導(dǎo)致高音部分唱不上去;也有可能歌曲適合用粗獷的、有爆發(fā)力的聲音去演繹,而用戶卻是個聲音甜美的女生。
顯然,新的推薦應(yīng)用場景需要新的推薦模式。在K歌的應(yīng)用場景下,用戶不僅僅是聽歌曲,更重要的是能最大程度地演繹好歌曲。這是一個雙向匹配的過程,一方面,需要考慮用戶自身聲音的特質(zhì),例如用戶實(shí)際的演唱音域及聲音的音色等;另一方面,需要考慮歌曲對演唱能力的要求,例如歌曲要求的音域范圍及怎樣的音色更適合演繹該歌曲的情感等。
為了更好的介紹基于演唱者聲音特質(zhì)的歌曲推薦的概念,介紹一些相關(guān)音樂、人聲理論的基本概念。
音色:音色是指聲音在聽覺上產(chǎn)生的某種屬性,聽音者能夠據(jù)此判斷兩個以同樣方式呈現(xiàn)、具有相同音高和響度的聲音的不同。
音域:音域有總的音域和個別的人聲或樂器的音域兩種。總的音域指音列的總范圍,即從最低音到最高音的范圍。個別的人聲或樂器的音域指某個人聲或某種樂器在整個音域中所能到達(dá)的最低音到最高音的范圍。樂器的音域相對固定,而人聲的音域由于每個人先天的聲帶大小,長短、厚薄不同及后天有無經(jīng)過系統(tǒng)的聲樂訓(xùn)練等原因,有著較大的區(qū)別。
MIDI(Musical Instrument Digital Interface),是一種數(shù)字音樂、樂器的通信標(biāo)準(zhǔn)。MIDI文件可以靈活的記錄歌曲的音高及音長等信息,便于計(jì)算機(jī)進(jìn)行音高的分析與處理。
CQT譜,一種音色頻率物理特征,通過中心頻率成指數(shù)分布的濾波器組,將樂音信號表示為確定音樂單音的譜能量,濾波器組的品質(zhì)因子Q保持常數(shù)。
個體演唱能力包括演唱者音域范圍的寬窄及在各個音級上的音準(zhǔn)控制能力等。發(fā)聲能力是演唱能力的基礎(chǔ),醫(yī)學(xué)上利用發(fā)聲范圍檔案記錄個人的發(fā)聲音域及響度動態(tài)范圍。專業(yè)歌手則通過系統(tǒng)的聲樂訓(xùn)練方法來提升自身的演唱能力,但普通演唱者一般不會去使用特定的訓(xùn)練方法。
因此,本申請基于上述分析,利用歌曲簡譜和歌手清唱帶等信息,建立歌曲特征文件庫,提取歌曲的演唱音域和歌手的音色特征。同時利用用戶演唱歌曲時的清唱錄音文件與歌曲的簡譜信息,在音級完成質(zhì)量高的前提下,提取用戶的演唱音域和音色特征。綜合考慮用戶的演唱音域與曲庫中歌曲音域要求之間的匹配度以及用戶音色與曲庫中歌手音色之間的相似度,計(jì)算曲庫中每首歌曲對于該用戶的推薦度,并向用戶推薦推薦度高的歌曲。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的是提供一種基于演唱者聲音特質(zhì)的歌曲推薦方法,對演唱者與歌手之間音域相似度以及音色相似度、歌曲推薦進(jìn)行分析。
本發(fā)明采用以下方案實(shí)現(xiàn):一種基于演唱者聲音特質(zhì)的歌曲推薦方法,包括如下步驟:
步驟S1:分析曲庫中歌曲的簡譜信息,得到各個歌曲的MIDI音高基準(zhǔn)序列,分析出歌曲的音級分布直方圖,得到各個歌曲的演唱音域要求;
步驟S2:采用MELODIA算法分析用戶清唱錄音文件,得到演唱者演唱該歌曲的MIDI音高值序列,取得步驟S1中得到的同一歌曲的MIDI音高基準(zhǔn)序列,計(jì)算演唱者的基準(zhǔn)演唱能力,提取其演唱音域;
步驟S3:對歌手的清唱文件提取時頻信號表征,輸入到深度卷積神經(jīng)網(wǎng)絡(luò)中對網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練,得到訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)及人聲音色嵌入空間;
步驟S4:根據(jù)歌手的清唱文件提取時頻信號表征,將其輸入到步驟S3中訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)的輸出對應(yīng)于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為原唱歌手的人聲音色表征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710206783.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種網(wǎng)頁上的節(jié)省網(wǎng)絡(luò)資源的動畫效果的實(shí)現(xiàn)方法
- 下一篇:基于區(qū)塊鏈的用于金融數(shù)據(jù)處理的方法、裝置及電子設(shè)備
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種基于腦機(jī)接口技術(shù)的人格特質(zhì)測量方法及設(shè)備
- 一種防燙干鍋
- 一種基于神經(jīng)響應(yīng)的人格測量方法及系統(tǒng)
- 一種特質(zhì)玻璃原料制造攪拌機(jī)
- 一種基于網(wǎng)絡(luò)行為的人格特質(zhì)預(yù)測方法及系統(tǒng)
- 一種防止大面積筏板基礎(chǔ)產(chǎn)生裂縫的設(shè)備及其使用方法
- 一種膠條快換式伸縮縫結(jié)構(gòu)
- 一種粘結(jié)玻璃真空鍍膜后沒有膠影的單面膠帶
- 一種人格特質(zhì)引導(dǎo)的新用戶行為反饋預(yù)測方法
- 一種基于少兒教育的教學(xué)研發(fā)方法及平臺





