[發明專利]音樂大數據檢索的專業聲樂旋律特征提取方法在審
| 申請號: | 202211216510.3 | 申請日: | 2022-09-30 |
| 公開(公告)號: | CN115527514A | 公開(公告)日: | 2022-12-27 |
| 發明(設計)人: | 鐘國健 | 申請(專利權)人: | 恩平市奧科電子科技有限公司 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00;G10H1/02;G10L19/02;G10L19/26 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 529400 廣東省江門市恩平*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音樂 數據 檢索 專業 聲樂 旋律 特征 提取 方法 | ||
本申請提出一種采用基于音高輪廓聲樂計量特征與整面域優化的旋律提取方法,基于專業聲樂旋律特征分為頻率分解、顯著性計算、建立音高輪廓以及旋律生成四個步驟,大幅提高了對專業聲樂特征提取的準確性;采用等響度濾波器優化處理使得信號的頻率分布更符合人類聽覺,改進信號相位信息緩解傅里葉變換存在的分辨率問題;利用類比諧波加權求和的方式計算譜峰顯著性,使得顯著性更加符合聽覺原理;緩解濁音幀被誤過濾的問題;采用基于音高輪廓聲樂計量特征的方式優化旋律生成階段,采用顯著性加權的方式對旋律參考線進行不斷調整,獲得具有更高魯棒性,能更好表征音頻數據,并具有更強普適性和專業性的特征。
技術領域
本申請涉及一種音頻大數據特征檢索提取方法,特別涉及一種音樂大數據檢索的專業聲樂旋律特征提取方法,屬于聲音大數據處理技術領域。
背景技術
隨著網絡技術的發展,音頻信息呈現爆炸式的增長,在海量數據中進行有效檢索的難度日益增加。音樂的存儲、訪問、分發和消費的方式在過去的幾十年內發生了根本性的變化,如今,大型的音樂數據庫中的記錄可能存儲在作為分銷商、數字圖書館的服務器及個人計算機上,數以千萬計的的音樂數據集合可以從世界各地訪問。對于如此大量的容易獲得的音樂信息,需要更加高效和專業的檢索策略來引導用戶輕松快速的獲得感興趣的內容。
然而,傳統的音頻檢索策略依賴于人為標注的描述音樂信息的文本元數據信息,大多數搜索引擎依賴于元數據以及基于內容的文本注釋,編輯元數據通常包括藝術家、標題以及其它相關信息。盡管與這種基于文本注釋的檢索策略相關的新技術的不斷涌現,但一方面基本上還是受制于文本檢索技術;另一方面當音樂數據量變得非常大時,要保持一致的描述信息非常困難。這種方式已經逐漸無法滿足人們的檢索需求,因為這種注釋信息通常是模糊、不準確、不足以描述音樂數據的復雜性和專業性的,而且帶有一定的主觀性。
僅基于元數據的檢索系統的一個缺點是用戶需要明確的知道他要尋找的音頻的相關信息,即基于元數據的檢索方式僅僅允許搜索已知的內容。為了克服這些限制,有利用基于音樂內容的一般表達和注釋,即標簽來對檢索系統進行優化。為了進一步的降低建立標簽系統的難度,有的系統采用用戶標注的方式來獲得標簽,但以這種途徑獲得的標簽,通常不太準確,且帶有有非常嚴重的的主觀性,并且會存在噪聲,即這種方式獲得的標簽在不同的用戶之間表現出高度的可變性,當系統規模逐漸擴大時,這種方式建立的標簽系統甚至會變得不可用。依賴于大量用戶創建可靠注釋的發發發,雖然對于較為流行的音樂而言不存在較大問題,但對于一些剛剛發布,或不太熱門的音樂而言,基本上不存在可靠的標記。
為了克服上述系統的種種劣勢,現有技術提出了基于內容的檢索,因為這種系統基本上不依賴于任何手動創建的數據來引導檢索過程,而是基于音樂數據內容,可再現的方式獲得的覆蓋整個音樂數據的特征,通常獲得的特征具有很強的客觀性。通過輸入一段音樂數據或樂譜信息,然后獲得與輸入相同的或在某種程度上具有一定相似性(例如風格、藝術家)的數據。用戶可以很方便的實現檢索目的,并且這種技術有助于推薦方法、分類技術的發展,從而進一步提升檢索系統的性能。
基于內容的音頻檢索的需求會越來越大,且將具有廣泛的應用前景。但如何獲得具有更高魯棒性,能更好的表征音頻數據,并具有更強的普適性和專業性的特征,已成為研發重點。另外,在大規模檢索系統中,如何更加快速、更加精確的獲得結果,也是亟需解決的問題。
綜上,現有技術的音樂大數據檢索特征提取仍然存在若干問題和缺陷,本申請需要解決的問題和關鍵技術難點包括:
(1)現有技術一大類的音頻檢索策略依賴于人為標注的描述音樂信息的文本元數據信息,大多數搜索引擎依賴于元數據以及基于內容的文本注釋,盡管與這種基于文本注釋的檢索策略相關的新技術的不斷涌現,但一方面基本上還是受制于文本檢索技術;另一方面當音樂數據量變得非常大時,要保持一致的描述信息非常困難,這種方式已經逐漸無法滿足人們的檢索需求,因為這種注釋信息通常是模糊、不準確、不足以描述音樂數據的復雜性和專業性的,而且帶有一定的主觀性,特別是對于專業聲樂旋律特征嚴重依賴文本注釋,魯棒性差,并且結果的精確無法保證,面對海量音頻數據標注的工作量太大。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恩平市奧科電子科技有限公司,未經恩平市奧科電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211216510.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





