[發明專利]一種架子鼓樂譜識別方法及裝置在審
| 申請號: | 202210730185.6 | 申請日: | 2022-06-24 |
| 公開(公告)號: | CN115146649A | 公開(公告)日: | 2022-10-04 |
| 發明(設計)人: | 姚俊峰;及宇軒;許梅燕 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/279;G06F40/151;G06N3/04;G06N3/08 |
| 代理公司: | 廈門市新華專利商標代理有限公司 35203 | 代理人: | 朱凌 |
| 地址: | 361000 福建*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 架子鼓 樂譜 識別 方法 裝置 | ||
1.一種架子鼓樂譜識別方法,其特征在于,包括:
步驟10、將一行架子鼓樂譜轉化為架子鼓樂譜文本序列以及與所述文本序列一一對應的圖片文件;對大量架子鼓樂譜進行處理,獲得架子鼓樂譜數據集;
步驟20、生成架子鼓樂譜語義字典,所述語義字典包括架子鼓樂譜文本序列中所有可能出現的語義項,用于語義項與數字序列之間的相互轉換;
步驟30、進行架子鼓樂譜識別模型訓練,通過所述語義字典將所述數據集中的架子鼓樂譜文本序列轉化為樂譜數字序列,再將該數字序列轉換為標準的二維變量并用指定符號對沒有彈奏的音進行填充,然后將架子鼓樂譜文本序列以及它對應的架子鼓樂譜圖片作為卷積循環神經網絡模型的輸入,將對應的二維變量作為模型的輸出,對模型進行訓練直至完成;
步驟40、將待識別的架子鼓樂譜圖片輸入訓練好的模型,得到對應的二維變量,將該二維變量中的指定符號刪除轉化為數字序列,再通過所述語義字典轉化為架子鼓樂譜文本序列。
2.根據權利要求1所述的方法,其特征在于:所述步驟10具體包括:
步驟11、將.mxl轉換成.musicxml文件,具體通過在MuseScore中使用插件-BatchConvert Resize Height進行轉換;
步驟12、運行removecredits.py文件,處理.musicxml文件,消除信用性文本,從而對.musicxml文件進行清理;
步驟13、將清理后的.musicxml文件轉換成.mscz文件,具體通過在MuseScore中使用“插件-Batch Convert Orig”進行轉換;
步驟14、將.mscz文件轉化成.musicxml和.png文件,具體通過在MuseScore中使用“插件-Batch Convert Orig”進行轉換,所述.png文件即與所述文本序列一一對應的圖片文件;
步驟15、用genlabels.py文件將.musicxml文件轉換成.semantic文件,所述.semantic文件即架子鼓樂譜文本序列。
3.一種架子鼓樂譜識別裝置,其特征在于,包括:數據集生成模塊、語義字典模塊、訓練模塊以及識別模塊;
所述數據集生成模塊,用于將一行架子鼓樂譜轉化為架子鼓樂譜文本序列以及與所述文本序列一一對應的圖片文件;對大量架子鼓樂譜進行處理,獲得架子鼓樂譜數據集;
所述語義字典模塊,用于生成架子鼓樂譜語義字典,所述語義字典包括架子鼓樂譜文本序列中所有可能出現的語義項,用于語義項與數字序列之間的相互轉換;
所述訓練模塊,用于進行架子鼓樂譜識別模型訓練,通過所述語義字典將所述數據集中的架子鼓樂譜文本序列轉化為樂譜數字序列,再將該數字序列轉換為標準的二維變量并用指定符號對沒有彈奏的音進行填充,然后將架子鼓樂譜文本序列以及它對應的架子鼓樂譜圖片作為卷積循環神經網絡模型的輸入,將對應的二維變量作為模型的輸出,對模型進行訓練直至完成;
所述識別模塊,用于將待識別的架子鼓樂譜圖片輸入訓練好的模型,得到對應的二維變量,將該二維變量中的指定符號刪除轉化為數字序列,再通過所述語義字典轉化為架子鼓樂譜文本序列。
4.根據權利要求3所述的裝置,其特征在于:所述步驟數據集生成模塊具體用于執行如下步驟:
步驟11、將.mxl轉換成.musicxml文件,具體通過在MuseScore中使用插件-BatchConvertResize Height進行轉換;
步驟12、運行removecredits.py文件,處理.musicxml文件,消除信用性文本,從而對.musicxml文件進行清理;
步驟13、將清理后的.musicxml文件轉換成.mscz文件,具體通過在MuseScore中使用“插件-Batch Convert Orig”進行轉換;
步驟14、將.mscz文件轉化成.musicxml和.png文件,具體通過在MuseScore中使用“插件-Batch Convert Orig”進行轉換,所述.png文件即與所述文本序列一一對應的圖片文件;
步驟15、用genlabels.py文件將.musicxml文件轉換成.semantic文件,所述.semantic文件即架子鼓樂譜文本序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210730185.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:滌綸深染織物的制備方法及滌綸深染母粒
- 下一篇:一種擦拭無紡布及其制造方法





