[發(fā)明專利]一種樂器音位識別模型建立方法及樂器音位識別方法有效
| 申請?zhí)枺?/td> | 202010031551.X | 申請日: | 2020-01-13 |
| 公開(公告)號: | CN111210841B | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設計)人: | 覃建博 | 申請(專利權)人: | 杭州矩陣之聲科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51 |
| 代理公司: | 哈爾濱市文洋專利代理事務所(普通合伙) 23210 | 代理人: | 解瑩明 |
| 地址: | 310013 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 樂器 音位 識別 模型 建立 方法 | ||
本發(fā)明提供一種樂器音位識別模型建立方法及樂器音位識別方法,其中模型建立方法包括以下步驟:獲取演奏者演奏的各個音位音頻演奏數(shù)據(jù);獲取各個音位音頻演奏數(shù)據(jù)的演奏點,以演奏點開始分割音位音頻演奏數(shù)據(jù),得到各個音位固定長度的音頻片段,按照指定規(guī)則依次對各個音位的音頻片段疊加數(shù)據(jù)增強,將目標片段最后疊加數(shù)據(jù)增強;截取具有目標音位的最終疊加片段的指定區(qū)域的音頻片段,將截取結果作為訓練樣本;輸入分類器中進行訓練,得到準確識別目標音位類別的識別模型。利用建立好的模型可以根據(jù)演奏者演奏的樂曲直接輸入后得到各個音位的類別,無需再根據(jù)較長的音頻片段估計音高后確定音位,提高了模型訓練樣本的基數(shù)和音位識別的準確度。
技術領域
本發(fā)明屬于樂器音位識別方法技術領域,具體涉及一種樂器音位識別模型建立方法及樂器音位識別方法。
背景技術
任何樂器上都有一套能決定音高的機制,它可以位于樂器的發(fā)音部位,也可以位于樂器不發(fā)音的部位。它是為人的演奏運作所編排的音高信息的界面,是通過人的演奏來決定音高的操作系統(tǒng)。
音位作為樂器上的音高的信息界面,通常是看得見的。例如,琵琶、吉他上的“品”,弦是它們的發(fā)音體,除了空弦音,須在某弦上用手指按某個品才能獲取所需音高。又如,鋼琴鍵盤不是樂器的發(fā)音部位,而是音位的操作界面,需按下某個鍵,才能激發(fā)機械擊弦發(fā)出所需音高,連續(xù)按動不同的鍵,才能造成旋律。我國琵琶譜和古琴譜都屬音位譜,演奏者是依照樂譜指定的音位而彈奏發(fā)音的。
樂器上的音位無論多或少,都有自己的特有形態(tài)和位置,形成了特有的音高信息界面,音位是溝通人與樂器演奏運作的不可缺少的環(huán)節(jié)。演奏是人使樂器音位發(fā)生音高變換而實施的運行過程。
為了判斷演奏者是否演奏正確,需要獲取樂器發(fā)音的準確的音位,現(xiàn)有技術中獲取音位的方法包括以下四個步驟:1)獲取音頻片段;2)使用節(jié)拍檢測算法檢測可能的演奏位置;3)使用基音檢測算法檢測此區(qū)域的音高;4)對照因為表,計算出最后可能的音位。現(xiàn)有技術中所使用的基音檢測算法包括yin算法、yinfft算法、fcomb算法和schmitt算法,但是使用上述步驟進行音位的識別具有以下缺點:
1)檢測可能的演奏位置所使用的基音檢測算法為通用算法,并未對樂器每個音都具有固定特有的音高這一特性進行優(yōu)化,不能突出識別這一音位;
2)上述檢測方法需要獲取較長的音頻片段才可以較為準確的估計出這一音位的音高;
3)部分樂器具有同一種音高的也可能是不同的音位,使用上述基音檢測方法確定出具有某一音高的音位可能不是正確的音位,導致音位識別錯誤。
發(fā)明內(nèi)容
本發(fā)明針對上述缺陷,提供一種能夠建立擁有任意多個音位不同組合的、經(jīng)過按照指定規(guī)則疊加數(shù)據(jù)增強后得到的足夠多的的訓練樣本數(shù)據(jù)的分類器的方法,以及基于此分類器可以不需要先估計出音高,然后對比音位表計算出音位位置,直接屬于演奏者演奏的樂曲音頻片段后直接輸出音位類別的樂器識別方法。
本發(fā)明提供如下技術方案:一種樂器音位識別模型建立方法,包括以下步驟:
S1:獲取演奏者演奏的各個音位音頻演奏數(shù)據(jù);
S2:獲取所述S1步驟得到的各個音位音頻演奏數(shù)據(jù)的演奏點,以演奏點為起始點分割所述音位音頻演奏數(shù)據(jù),得到各個音位固定長度的音頻片段,所述音頻片段中演奏點之外的其他部分為余音;
S3:確定目標音位;
S4:將除目標音位之外的各個音位的固定長度音頻片段按照指定規(guī)則進行依次疊加數(shù)據(jù)增強,得到疊加片段;
S5:將所述目標音位的固定長度片段按照指定規(guī)則疊加至所述S4步驟得到的疊加片段上進行最終疊加數(shù)據(jù)增強,得到多個目標音位的最終疊加片段;
S6:截取所述S5步驟得到的具有目標音位的最終疊加片段的指定區(qū)域的音頻片段,將截取結果作為訓練樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州矩陣之聲科技有限公司,未經(jīng)杭州矩陣之聲科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010031551.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





