[發明專利]音樂主旋律提取系統有效
| 申請號: | 201810390420.3 | 申請日: | 2018-04-27 |
| 公開(公告)號: | CN108595648B | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 張維維;陳喆;殷福亮 | 申請(專利權)人: | 大連民族大學 |
| 主分類號: | G06F16/683 | 分類號: | G06F16/683;G06F16/635 |
| 代理公司: | 大連智高專利事務所(特殊普通合伙) 21235 | 代理人: | 劉斌 |
| 地址: | 116600 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音樂 主旋律 提取 系統 | ||
音樂主旋律提取系統,屬于音樂信息檢索領域,為了解決主旋律提取方法中提高音高估計準確性的問題,要點是存儲有多條指令,所述指令適于處理器加載并執行:計算音樂信號的常Q變換;計算基于粒子濾波的主旋律音高序列的粗略估計;計算主旋律音高序列平滑估計序列;計算最終主旋律音高序列估計,效果是提高了旋律提取準確性。
技術領域
本發明屬于音樂信息檢索領域,涉及一種音樂主旋律提取系統。
背景技術
音樂信息檢索領域中的主旋律提取即從音樂信號中估計出主旋律音高序列,其主要依據是音樂中主旋律成分的顯著性和時序連續性。傳統的主旋律提取方法大多把主旋律提取問題分解成多音高估計和旋律輪廓構建兩個子問題,導致無法同時兼顧兩個特性,在多音高估計階段沒有考慮到連續幀音高的高度相關性。Jo等提出采用貝葉斯濾波框架建模主旋律提取問題,并借助粒子濾波方法估計參數,但該方法在粒子濾波之前仍然需要進行多音高估計,且具有較多的參數需要估計(S.Jo,C.D.Yoo,and A.Doucet,Melody trackingbased on sequential Bayesian model,IEEE Journal of Selected Topics in SignalProcessing,2011,5(6):1216–1227.)。
此外,音樂信號非常復雜,具有典型非平穩性的本質特點,即某些短時強伴奏音功率可能超過主旋律成分,且主旋律音高頻率分布較廣,包含幾個八度范圍,導致現有方案在主旋律提取中來自于伴奏音的錯誤音高和八度誤差廣泛存在。
發明內容
為了解決主旋律提取方法中提高音高估計準確性的問題,本發明提出如下方案:
為了解決降低短時強伴奏的影響及八度誤差的問題,本發明提出如下方案:
一種音樂主旋律提取系統,存儲有多條指令,所述指令適于處理器加載并執行:
計算音樂信號的常Q變換;
計算基于粒子濾波的主旋律音高序列的粗略估計;
計算主旋律音高序列平滑估計序列;
計算最終主旋律音高序列估計。
作為技術方案的補充,計算音樂信號的常Q變換基于如下方式實現:對非平穩的音樂信號進行分幀,然后利用常Q變換計算按照對數分布的各頻率點的幅度值,每八度范圍具有36個按對數分布的頻率點。
作為技術方案的補充,計算基于粒子濾波的主旋律音高序列的粗略估計基于如下方式實現:
初始化:其中表示第i個粒子的初始音高服從[110Hz,1200Hz]范圍內均勻分布,Np為粒子數,表示第i個粒子權重;
迭代求解:
(1)按轉移概率,預測第t幀旋律音高頻率:
根據實際音樂中音高轉移概率統計分析結果,將音高轉移概率建模為logistic分布,其概率密度函數為:
其中x=f0,t/f0,t-1,f0,t為第t幀旋律音高頻率,且μ=1.00003,s=0.0055045。
(2)計算粒子權重
其中P和S分別代表了第t幀第i個粒子的功率和諧波平滑性因子,分別定義為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連民族大學,未經大連民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810390420.3/2.html,轉載請聲明來源鉆瓜專利網。





