[發(fā)明專利]基于人工智能的音樂轉(zhuǎn)樂譜的方法及裝置在審
| 申請?zhí)枺?/td> | 202011603739.3 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112669796A | 公開(公告)日: | 2021-04-16 |
| 發(fā)明(設(shè)計)人: | 何限;程飛 | 申請(專利權(quán))人: | 西交利物浦大學 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00;G10L25/51 |
| 代理公司: | 蘇州謹和知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32295 | 代理人: | 葉棟 |
| 地址: | 215123 江蘇省蘇州市*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 音樂 樂譜 方法 裝置 | ||
本申請涉及一種基于人工智能的音樂轉(zhuǎn)樂譜的方法及裝置,屬于計算機技術(shù)領(lǐng)域,該方法包括:將音樂文件輸入預(yù)先訓練的音樂識別模型,得到中間文件;音樂識別模型是使用多組樣本數(shù)據(jù)對人工智能模型訓練得到的,每組樣本數(shù)據(jù)包括樣本音樂文件和樣本音樂文件對應(yīng)的數(shù)字樂譜;中間文件包括用于指示音樂文件對應(yīng)的音樂信息的特征向量;獲取期望樂譜格式;調(diào)用預(yù)設(shè)的文件轉(zhuǎn)換工具將中間文件的文件格式轉(zhuǎn)換為期望樂譜格式,得到音樂文件對應(yīng)的樂譜文件;可以解決現(xiàn)有的音樂轉(zhuǎn)樂譜方式得到的midi文件,往往缺乏聲部劃分,需經(jīng)過劃分方可轉(zhuǎn)錄入樂譜;且缺失調(diào)號、演奏法、踏板等信息,需經(jīng)過識別方可被轉(zhuǎn)錄入樂譜的問題;無需機器翻譯即可被理解。
技術(shù)領(lǐng)域
本申請涉及一種基于人工智能的音樂轉(zhuǎn)樂譜的方法及裝置,屬于計算機技術(shù)領(lǐng)域。
背景技術(shù)
音樂轉(zhuǎn)樂譜技術(shù)是指將音樂轉(zhuǎn)換為可閱讀、可演奏的樂譜的技術(shù)。目前,音樂轉(zhuǎn)樂譜技術(shù)可以通過計算機設(shè)備實現(xiàn)。
在一種典型的音樂轉(zhuǎn)樂譜方法中,可以將音樂轉(zhuǎn)換為數(shù)字樂器接口(midi)文件。然而,midi文件往往缺乏聲部劃分,需經(jīng)過劃分方可轉(zhuǎn)錄入樂譜;且缺失調(diào)號、演奏法、踏板等信息,需經(jīng)過識別方可被轉(zhuǎn)錄入樂譜。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N基于人工智能的音樂轉(zhuǎn)樂譜的方法及裝置,可以解決現(xiàn)有的音樂轉(zhuǎn)樂譜方式得到的midi文件,往往缺乏聲部劃分,需經(jīng)過劃分方可轉(zhuǎn)錄入樂譜;且缺失調(diào)號、演奏法、踏板等信息,需經(jīng)過識別方可被轉(zhuǎn)錄入樂譜的問題。本申請?zhí)峁┤缦录夹g(shù)方案:
第一方面,提供了一種基于人工智能的音樂轉(zhuǎn)樂譜的方法,所述方法包括:
將音樂文件輸入預(yù)先訓練的音樂識別模型,得到中間文件;所述音樂識別模型是使用多組樣本數(shù)據(jù)對人工智能模型訓練得到的,每組樣本數(shù)據(jù)包括樣本音樂文件和所述樣本音樂文件對應(yīng)的數(shù)字樂譜;所述中間文件包括用于指示所述音樂文件對應(yīng)的音樂信息的特征向量;
獲取期望樂譜格式;
調(diào)用預(yù)設(shè)的文件轉(zhuǎn)換工具將所述中間文件的文件格式轉(zhuǎn)換為所述期望樂譜格式,得到所述音樂文件對應(yīng)的樂譜文件。
可選地,所述音樂識別模型是在獲取到所述樣本數(shù)據(jù)后,使用所述文件轉(zhuǎn)換工具將每組樣本數(shù)據(jù)中的數(shù)字樂譜轉(zhuǎn)換為對應(yīng)的樣本中間文件;并基于每組樣本數(shù)據(jù)中的樣本音樂文件和每個樣本音樂文件對應(yīng)的樣本中間文件對所述人工智能模型進行訓練得到的。
可選地,所述音樂識別模型是在獲取到所述樣本數(shù)據(jù)后,使用所述文件轉(zhuǎn)換工具將每組樣本數(shù)據(jù)中的數(shù)字樂譜轉(zhuǎn)換為對應(yīng)的樣本中間文件;將每組樣本數(shù)據(jù)中的樣本音樂文件轉(zhuǎn)換為頻譜文件,并將所述頻譜文件劃分為多個音樂片段;并基于每個樣本音樂文件對應(yīng)的多個音樂片段和樣本中間文件對所述人工智能模型進行訓練得到的。
可選地,所述音樂信息包括:樂曲的樂器、調(diào)號、節(jié)拍、速度、音符、休止符、音高、音長、節(jié)拍變換、速度變換、調(diào)號變換、小節(jié)劃分、聲部劃分、譜號分配、演奏法、變音記號和裝飾音。
可選地,所述期望樂譜格式包括第一格式類型和/或第二格式類型;
所述第一格式類型是指存儲音樂文件對應(yīng)的人類可讀的音樂符號的文件的格式類型;
所述第二格式類型是指存儲音樂文件對應(yīng)的計算機程序可讀的音樂信息的文件的格式類型。
可選地,所述第一格式類型包括以下幾種中的至少一種:圖片格式、便攜式文件格式;
所述第二格式類型包括以下幾種中的至少一種:MIDI格式和MXL格式。
可選地,所述調(diào)用預(yù)設(shè)的文件轉(zhuǎn)換工具將所述中間文件的文件格式轉(zhuǎn)換為所述期望樂譜格式,得到所述音樂文件對應(yīng)的樂譜文件,包括:
確定所述期望樂譜格式對應(yīng)的文件轉(zhuǎn)換工具;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西交利物浦大學,未經(jīng)西交利物浦大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011603739.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





