[發明專利]一種樂器音位識別模型建立方法及樂器音位識別方法有效
| 申請號: | 202010031551.X | 申請日: | 2020-01-13 |
| 公開(公告)號: | CN111210841B | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 覃建博 | 申請(專利權)人: | 杭州矩陣之聲科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51 |
| 代理公司: | 哈爾濱市文洋專利代理事務所(普通合伙) 23210 | 代理人: | 解瑩明 |
| 地址: | 310013 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 樂器 音位 識別 模型 建立 方法 | ||
1.一種樂器音位識別模型建立方法,其特征在于,包括以下步驟:
S1:獲取演奏者演奏的各個音位音頻演奏數據;
S2:獲取所述S1步驟得到的各個音位音頻演奏數據的演奏點,以演奏點為起始點分割所述音位音頻演奏數據,得到各個音位固定長度的音頻片段,所述音頻片段中演奏點之外的其他部分為余音;
S3:確定目標音位;
S4:將除目標音位之外的各個音位的固定長度音頻片段按照指定規則進行依次疊加數據增強,得到疊加片段;
S5:將所述目標音位的固定長度片段按照指定規則疊加至所述S4步驟得到的疊加片段上進行最終疊加數據增強,得到多個目標音位的最終疊加片段;
S6:截取所述S5步驟得到的具有目標音位的最終疊加片段的指定區域的音頻片段,將截取結果作為訓練樣本;
S7:將生成的樣本輸入分類器中進行訓練,得到準確識別目標音位類別的識別模型;
所述指定規則為:進行疊加時,各個音位的演奏點距離不同,先疊加的音位的演奏點位于后疊加的音位的演奏點之前;
所述疊加數據增強方法包括以下步驟:
1)將每個音位的音頻片段按照固定子長度分割為多個子片段;
2)對多個音位的固定長度音頻片段的子片段分別進行賦值,賦予每個音位的演奏點的子片段附近的數值為第一數值,余音部分的子片段數值為第二數值,所述第一數值大于所述第二數值;
3)按照指定規則依次疊加時,后疊加的音位的演奏點之前的子片段均補充數值零,所補充的片段長度為后疊加的音位的演奏點與前一疊加的音位的演奏點之間的固定子長度。
2.根據權利要求1所述的一種樂器音位識別模型建立方法,其特征在于,所述S6步驟中的指定區域為經過疊加數據增強后數值最大的多個固定子片段組成的區域。
3.根據權利要求1所述的一種樂器音位識別模型建立方法,其特征在于,所S2步驟中分割得到的各個音位的音頻片段的固定長度為相同或不相同。
4.根據權利要求1所述的一種樂器音位識別模型建立方法,其特征在于,所述各個音位的音頻片段的固定子長度的長度相同。
5.根據權利要求1所述的一種樂器音位識別模型建立方法,其特征在于,所述S1步驟中的各個音位音頻演奏數據通過外部硬件設備獲取。
6.一種基于根據權利要求1-5任一所述模型建立方法所建立模型的分類器的樂器音位識別方法,其特征在于,包括以下步驟:
A1:獲取演奏者演奏樂曲音頻數據;
A2:獲取所述S1步驟得到的音頻演奏數據的演奏點,以演奏點為起始點分割所述音位音頻數據,得到各個音位固定長度的音頻片段;
A3:將所述S2步驟得到的音頻片段輸入所述分類器中,利用已經訓練好的具有基于數據增強的樂器音位識別模型的分類器識別各個音位;
A4:分類器直接輸出音位類別。
7.根據權利要求6所述的一種樂器音位識別方法,其特征在于,所述S1步驟中的音頻數據通過外部硬件設備獲取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州矩陣之聲科技有限公司,未經杭州矩陣之聲科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010031551.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電平放大電路
- 下一篇:一種數字開關電源輸出的恒功率調節方法





