[發(fā)明專利]一種基于旋律特征聚類與優(yōu)化的哼唱檢索方法在審
| 申請?zhí)枺?/td> | 202110773772.9 | 申請日: | 2021-07-08 |
| 公開(公告)號: | CN113377994A | 公開(公告)日: | 2021-09-10 |
| 發(fā)明(設計)人: | 王寧;陳德運;季超群;陳晨;何勇軍 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G06F16/632 | 分類號: | G06F16/632;G06F16/65;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150080 黑龍江省哈*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 旋律 特征 優(yōu)化 哼唱 檢索 方法 | ||
1.一種基于旋律特征聚類與優(yōu)化的哼唱檢索方法,其特征在于,包括以下幾個步驟:
S1、對歌曲庫MIDI文件提取音高向量;
S2、利用基于優(yōu)化初始聚類中心的k-means算法,對步驟S1中提取的音高向量進行聚類,獲取聚類標簽;
S3、利用步驟S1中提取的音高向量及步驟S2中獲取的聚類標簽訓練DBN模型;
S4、利用步驟S3中得到的DBN模型,提取步驟S1中音高向量所對應的高層旋律特征及其類別信息,利用這些信息構成歌曲特征庫;
S5、對哼唱WAV文件提取音高向量;
S6、利用步驟S3中得到的DBN模型,提取步驟S5中音高向量所對應的高層旋律特征及其類別信息;
S7、利用步驟S6中得到的類別信息,將步驟S6中提取的高層旋律特征與步驟S4歌曲特征庫中同類別的高層旋律特征進行匹配,最終得到匹配結(jié)果。
2.根據(jù)權利要求1所述的一種基于旋律特征聚類與優(yōu)化的哼唱檢索方法,其特征在于,所述步驟S1包括:
S11、MIDI文件由不同音符值pi持續(xù)ti時間所構成的音符序列(p1,t1),...,(pi,ti)表示,音符持續(xù)時間ti又可以轉(zhuǎn)換為持續(xù)幀數(shù)Fi,因此可以根據(jù)幀移數(shù)將時間音符序列轉(zhuǎn)換為幀移音符序列(p1,F1),...,(pi,Fi);
S12、所有的二維幀移音符序列均可由一維音高序列來表示:
其中,pi表示任意音符,F(xiàn)i表示音符持續(xù)幀數(shù);
S13、每個MIDI文件由不同音符值pw構成一維音高序列(p1,...,pw,...,pW),對其提取音高向量時,需要選取一個h秒的窗,在窗內(nèi)提取一個固定時間間隔的高維音高向量,然后移動窗去提取下一個音高向量,以此類推,最終即可獲得全部音高向量,表示為:
x=(p1,...,pw+T,...,pW+T(D-1))
其中,x為音高向量,T為采樣間隔,D為音高向量維數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經(jīng)哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110773772.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





