[發明專利]歌曲標注檢測方法、裝置和系統及存儲介質在審
| 申請號: | 202011122814.4 | 申請日: | 2020-10-20 |
| 公開(公告)號: | CN112231512A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 崔君君;李秀林 | 申請(專利權)人: | 標貝(北京)科技有限公司 |
| 主分類號: | G06F16/68 | 分類號: | G06F16/68;G06F16/683;G06F16/835 |
| 代理公司: | 北京睿邦知識產權代理事務所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亞南 |
| 地址: | 100192 北京市海淀區西小口路66號中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 歌曲 標注 檢測 方法 裝置 系統 存儲 介質 | ||
本發明提供一種歌曲標注檢測方法、裝置和系統及存儲介質。方法包括:獲取拼音字典、針對同一待標注歌曲所標注的MusicXML文件和Interval文件;從MusicXML文件中提取第一歌詞特征,該特征包括MusicXML文件中記錄的每個歌詞的拼音;基于拼音字典和第一歌詞特征提取第一音素序列,該序列包括MusicXML文件中記錄的每個歌詞的每個音素;從Interval文件中提取第二歌詞特征,該特征包括第二音素序列,該序列包括Interval文件中記錄的每個音素;將第一音素序列中的第一音素與第二音素序列中的第二音素一一對應地進行比較;對于任一音素對,在該音素對中的音素不一致的情況下,輸出第一錯誤反饋信息。可以自動檢測MusicXML文件和Interval文件的歌曲標注結果是否一致,有助于提高歌曲標注的效率和準確度。
技術領域
本發明涉及語音處理技術領域,具體地,涉及一種歌曲標注檢測方法、裝置和系統及存儲介質。
背景技術
歌曲合成作為語音合成的一個分支,具有較為廣闊的發展前景。歌曲合成采用的算法模型在訓練時需要大量的標注數據。對于歌曲標注來說,既需要標注歌曲的詞譜信息,也需要標注歌曲中每個發音的聲韻母時長信息。
歌曲標注的質量對于歌曲合成至關重要,現有的歌曲標注一般采用標準的音樂擴展標記語言(Music Extensible Markup Language,MusicXML)文件記錄歌曲的歌詞以及歌曲的譜、調、節奏等樂譜信息,采用音程(Interval)文件來記錄歌曲中每個音素發音的時長,這兩個文件的標注瑣碎容易出錯,且是分別標注,會有標注不一致或者漏標錯標等問題。現有的歌曲標注結果幾乎都是靠人工手動查詢的,沒有系統的檢測工具,導致歌曲標注效率低下,且錯誤率高。
發明內容
為了至少部分地解決現有技術中存在的問題,提供一種歌曲標注檢測方法、裝置和系統及存儲介質。
根據本發明一個方面,提供一種歌曲標注檢測方法,包括:獲取拼音字典、針對同一待標注歌曲所標注的MusicXML文件和Interval文件,其中,MusicXML文件記錄有待標注歌曲的歌詞的拼音,Interval文件記錄有待標注歌曲的音素;從MusicXML文件中提取第一歌詞特征,第一歌詞特征包括MusicXML文件中記錄的每個歌詞的拼音;基于拼音字典和第一歌詞特征提取第一音素序列,第一音素序列包括MusicXML文件中記錄的每個歌詞的每個音素;從Interval文件中提取第二歌詞特征,第二歌詞特征包括第二音素序列,第二音素序列包括Interval文件中記錄的每個音素;將第一音素序列中的第一音素與第二音素序列中的第二音素一一對應地進行比較;對于任一音素對,在該音素對中的音素不一致的情況下,輸出與該音素對相對應的第一錯誤反饋信息,第一錯誤反饋信息用于指示對應音素對的標注不一致,其中,每個音素對包括一組相互對應的第一音素和第二音素。
示例性地,第二歌詞特征還包括第二音素序列中的每個第二音素的起始時間和結束時間,第一錯誤反饋信息包括對應音素對的起始時間和結束時間,其中,每個音素對的起始時間和結束時間用該音素對中的第二音素的起始時間和結束時間表示。
示例性地,在從MusicXML文件中提取第一歌詞特征之后,歌曲標注檢測方法還包括:基于拼音字典和第一歌詞特征提取與第一音素序列中的每個第一音素相對應的上下文音素集合,上下文音素集合包括位于對應的第一音素前后的預設數目的第一音素;其中,第一錯誤反饋信息包括與對應音素對中的第一音素相對應的上下文音素集合。
示例性地,在將第一音素序列中的第一音素與第二音素序列中的第二音素一一對應地進行比較之前,歌曲標注檢測方法還包括:對于待標注歌曲的第i句歌詞,將第一音素序列中的該第i句歌詞所對應的第一音素和第二音素序列中的該第i句歌詞所對應的第二音素一一對應地提取到第i個合并文件中,其中,0<i≤N,其中,N為待標注歌曲的歌詞總句數;將第一音素序列中的第一音素與第二音素序列中的第二音素一一對應地進行比較包括:對于第i個合并文件,將該合并文件中的第一音素和第二音素一一對應地進行比較。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于標貝(北京)科技有限公司,未經標貝(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011122814.4/2.html,轉載請聲明來源鉆瓜專利網。





