[發明專利]音樂風格識別方法、裝置、存儲介質和電子設備在審
| 申請號: | 202111401282.2 | 申請日: | 2021-11-19 |
| 公開(公告)號: | CN114141270A | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 鄧陽;李承鑫;曹偲;劉華平;趙翔宇;黃安麒 | 申請(專利權)人: | 杭州網易云音樂科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 孫寶海;袁禮君 |
| 地址: | 310052 浙江省杭州市蕭山區錢江世*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音樂風格 識別 方法 裝置 存儲 介質 電子設備 | ||
本公開的實施方式涉及音頻處理技術領域,更具體地,涉及音樂風格識別方法、裝置、存儲介質和電子設備。音樂風格識別方法包括:對待識別音頻進行分段處理,獲得多個音頻片段;提取每個音頻片段的音頻特征,輸入訓練好的基于卷積神經網絡的音樂風格識別模型中,識別每個音頻片段是否屬于目標音樂風格;其中,音樂風格識別模型包括具有多種卷積層數的多組卷積;根據識別為屬于目標音樂風格的音頻片段在多個音頻片段中的占比,獲得待識別音頻的目標音樂風格置信度;根據目標音樂風格置信度及置信度區間與音樂風格分類結果的目標對應關系,獲得待識別音頻的音樂風格識別結果。本公開能夠準確、高效地對音頻文件進行基于目標音樂風格的自動識別。
技術領域
本公開的實施方式涉及音頻處理技術領域,更具體地,本公開的實施方式涉及音樂風格識別方法、裝置、存儲介質和電子設備。
背景技術
本部分旨在為權利要求中陳述的本公開的實施方式提供背景或上下文,此處的描述不因為包括在本部分中就承認是現有技術。
人工識別音樂風格,需要對歌曲進行全曲聆聽才能確定具體類別。目前的音樂風格研究中,對于如何準確定義一類特定的音樂風格并高效地自動識別該類音樂風格存在困難。
發明內容
目前的音樂風格研究中,僅對音樂風格進行了寬泛的分類。而隨著現代音樂的發展,越來越多細分的音樂風格出現,依賴人工進行識別分類需要耗費大量的人力成本和時間成本。
以Rap(說唱,其表現形式為簡單的旋律和固定的節奏配以韻律化的口白演唱)這一音樂風格為例,隨著現代音樂的發展,作為Hip Hop(嘻哈)的重要元素之一的Rap已逐漸趨于流行化。但是,目前的音樂風格研究中基本沒有考慮Rap,僅圍繞著Hip hop進行展開。相較于Hip Hop,Rap沒有復雜的節奏和反復的旋律,以Hip Hop來定義Rap顯然過于寬泛,不夠準確。而目前的音樂風格研究還未對Rap進行準確地定義,也未有針對Rap進行自動識別的算法,無法實現準確高效地進行Rap這一音樂風格的自動識別。
為此,需要一種音樂風格識別方案,能夠實現對一類特定的音樂風格,尤其是對Rap等音樂風格進行準確、高效地識別。
本公開的實施方式即期望提供一種音樂風格識別方法、裝置、存儲介質和電子設備,以準確、高效地對音頻文件進行基于Rap等特定的目標音樂風格的自動識別。
根據本公開的一個方面,提供一種音樂風格識別方法,包括:對待識別音頻進行分段處理,獲得多個音頻片段;提取每個音頻片段的音頻特征,輸入訓練好的基于卷積神經網絡的音樂風格識別模型中,識別每個所述音頻片段是否屬于目標音樂風格;其中,所述音樂風格識別模型包括具有多種卷積層數的多組卷積;根據識別為屬于所述目標音樂風格的音頻片段在所述多個音頻片段中的占比,獲得所述待識別音頻的目標音樂風格置信度;根據所述待識別音頻的目標音樂風格置信度、及置信度區間與音樂風格分類結果的目標對應關系,獲得所述待識別音頻的音樂風格識別結果。
在本公開的一示例性實施例中,所述多組卷積包括:至少一組第一卷積,每組所述第一卷積具有第一卷積層數,且每組所述第一卷積的每相鄰兩層卷積層之間設有激活函數;至少一組第二卷積,每組所述第二卷積具有第二卷積層數,所述第二卷積層數不同于所述第一卷積層數,所述第二卷積和所述第一卷積分別用于提取所述音頻特征的不同深度的特征。
在本公開的一示例性實施例中,所述音樂風格識別模型的卷積部分還包括:數據處理層,與所述多組卷積連接,用于對每組所述卷積輸出的特征向量進行處理并輸出;向量拼接層,與所述數據處理層連接,用于對所述數據處理層輸出的對應所述多組卷積的特征向量進行拼接并輸出。
在本公開的一示例性實施例中,所述數據處理層設有激活函數和降維機制;以及,在所述音樂風格識別模型的訓練過程中,所述數據處理層還設有Dropout機制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州網易云音樂科技有限公司,未經杭州網易云音樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111401282.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新能源汽車充電頭防落灰機構
- 下一篇:一種雙蛋白薩拉米香腸及其制作方法





