[發明專利]一種基于動態時間規整的哼唱音準評價方法有效
| 申請號: | 202210332565.4 | 申請日: | 2022-03-30 |
| 公開(公告)號: | CN114758560B | 公開(公告)日: | 2023-06-06 |
| 發明(設計)人: | 吳清強;黃澤斌;姚俊峰;曾祥健;劉震;仁望龍 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | G09B15/00 | 分類號: | G09B15/00;G10L25/51 |
| 代理公司: | 廈門市新華專利商標代理有限公司 35203 | 代理人: | 朱凌 |
| 地址: | 361000 福建*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 動態 時間 規整 哼唱 音準 評價 方法 | ||
1.一種基于動態時間規整的哼唱音準評價方法,其特征在于:包括如下步驟:
步驟S10、獲取大量的哼唱數據,并對各所述哼唱數據進行預處理;
步驟S20、提取預處理后的所述哼唱數據中的音頻特征;
步驟S30、對各所述音頻特征進行預處理;
步驟S40、基于動態時間規整算法創建一音準評價模型,利用預處理后的所述音頻特征對音準評價模型進行訓練;
步驟S50、利用訓練后的所述音準評價模型對待評價音頻進行評價,生成評價結果;
所述步驟S20具體包括:
步驟S21、預判預處理后的所述哼唱數據的音頻時長是否短于預設的實際時長,若否,說明不存在漏唱,進入步驟S22;若是,說明存在漏唱,進入步驟S23;
步驟S22、利用Python編程語言提取所述哼唱數據中每一個字出現的時間點,基于各所述時間點將哼唱數據分割為若干個第一音頻片段,利用Python編程語言的依賴庫提取各所述第一音頻片段的頻率并求取第一平均值,將所述第一平均值作為音頻特征;
步驟S23、利用Python編程語言的依賴庫對所述哼唱數據進行分幀,以一幀為單位將所述哼唱數據分割為若干個第二音頻片段,利用依賴庫提取各所述第二音頻片段的頻率并求取第二平均值,將所述第二平均值作為音頻特征;
所述步驟S40中,所述音準評價模型用于求取音頻特征與標準頻率之間的最優路徑和距離矩陣,基于擬合函數對所述最優路徑上的頻率值進行擬合得到擬合值,將各所述擬合值求取第三平均值作為音準值;
基于專家評分對所述音準值進行誤差計算得到誤差值,基于所述誤差值進行再次擬合,直至所述誤差值滿足預設的收斂條件;
所述步驟S50具體為:
對待評價音頻進行預處理后提取待評價音頻特征,對各所述待評價音頻特征進行預處理后輸入訓練后的音準評價模型,生成包括若干個音頻片段、對應音準值以及總音準值的評價結果,并輸出顯示所述評價結果。
2.如權利要求1所述的一種基于動態時間規整的哼唱音準評價方法,其特征在于:所述步驟S10具體為:
獲取大量的哼唱數據,并對各所述哼唱數據依次進行格式轉換、去除伴奏、去除首尾無聲段以及降噪的預處理。
3.如權利要求2所述的一種基于動態時間規整的哼唱音準評價方法,其特征在于:所述格式轉換具體為:轉換為wav格式,并設定音頻采樣率為44100、聲道數為2。
4.如權利要求1所述的一種基于動態時間規整的哼唱音準評價方法,其特征在于:所述步驟S30具體為:
將各所述音頻特征與對應的標準頻率進行做差比較,進而對各所述音頻特征進行音高標記,進而完成各所述音頻特征的預處理。
5.如權利要求4所述的一種基于動態時間規整的哼唱音準評價方法,其特征在于:所述音高為高八度或者低八度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210332565.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種對甘薯小象甲進行RNAi的方法及裝置
- 下一篇:一種鋼絲繩扭力釋放器





