[發明專利]一種音樂檢索方法及裝置有效
| 申請號: | 201510918496.5 | 申請日: | 2015-12-10 |
| 公開(公告)號: | CN105608114B | 公開(公告)日: | 2019-08-30 |
| 發明(設計)人: | 姚光超;唐文琦 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F16/632 | 分類號: | G06F16/632;G06F16/635 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王玲;王寶筠 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音樂 檢索 方法 裝置 | ||
技術領域
本發明實施例涉及數據處理技術領域,具體涉及一種音樂檢索方法及裝 置。
背景技術
基于內容的音頻檢索(英文全稱為ContentBasedMusicInformation Retrieval,英文簡稱為CBMIR)是一種新的音樂檢索方式,不同于傳統的文 本檢索方式,基于內容的音頻檢索利用音樂本身的特征對其進行自動分類和匹 配,從而取代文本描述的方式檢索音樂,給用戶帶來更多的便利和更好的用戶 體驗。哼唱檢索(英文全稱為QueryBySinging/Humming,英文簡稱為QBSH) 是一種基于內容的音頻檢索方式,其通過用戶哼唱音樂片段的方式進行檢索, 是對傳統文本檢索的擴展,給用戶帶來了很大的便利。
然而,為了達到較高的準確率,哼唱檢索通常采用復雜度非常高的相似度 計算方法,導致檢索所需要的時間較長,用戶等待的時間也相應較長。同時, 由于算法的復雜度較高,其能夠處理的音樂信息庫規模也非常有限。這是因為 音樂信息庫規模越大,處理時間越長,對系統的資源耗費也越多,對系統的性 能和計算能力都提出了挑戰。為了快速準確地響應用戶請求,同時處理盡可能 大的音樂信息庫,需要對哼唱檢索采用的相似度計算方法進行優化。現有技術 中,通常采用硬件優化的手段,例如可以采用GPU對相似度匹配算法進行并 行化,也可以采用分布式計算將大的音樂信息庫分散到不同的服務器上,減輕 單個服務器的計算量,。采用上述硬件優化的手段,當應對海量音樂信息時, 存在系統資源耗費大的問題。
發明內容
本發明實施例提供了一種音樂檢索方法及裝置,可以提高音樂檢索的效 率,減少用戶等待時間,降低系統資源耗費,提高系統處理能力。
為此,本發明實施例提供如下技術方案:
一方面,本發明實施例提供了一種音樂檢索方法,所述方法包括:
獲取哼唱旋律對應的基頻序列;
對所述基頻序列進行快速傅里葉變換,將變換后的基頻序列與預存在音樂 信息庫中的音樂進行比較,根據比較結果獲得第一候選音樂集合;
利用分段平均近似距離PAA方法對所述第一候選音樂集合中的音樂進行 過濾,獲得第二候選音樂集合;
對所述第二候選音樂集合中的各音樂進行處理,獲得并顯示音樂檢索結 果。
另一方面,本發明實施例提供了一種音樂檢索裝置,所述裝置包括:
基頻序列獲取單元,用于獲取哼唱旋律對應的基頻序列;
快速傅里葉變換單元,用于對所述基頻序列進行快速傅里葉變換,將變換 后的基頻序列與預存在音樂信息庫中的音樂進行比較,根據比較結果獲得第一 候選音樂集合;
分段平均近似距離PAA過濾單元,用于利用分段平均近似距離PAA方法 對所述第一候選音樂集合中的音樂進行過濾,獲得第二候選音樂集合;
檢索結果獲得單元,用于對所述第二候選音樂集合中的各音樂進行處理, 獲得并顯示音樂檢索結果。
再一方面,本發明實施例提供了一種用于音樂檢索的裝置,包括有存儲器, 以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中, 且經配置以由一個或者一個以上處理器執行所述一個或者一個以上程序包含 用于進行以下操作的指令:
獲取哼唱旋律對應的基頻序列;
對所述基頻序列進行快速傅里葉變換,將變換后的基頻序列與預存在音樂 信息庫中的音樂進行比較,根據比較結果獲得第一候選音樂集合;
利用分段平均近似距離PAA方法對所述第一候選音樂集合中的音樂進行 過濾,獲得第二候選音樂集合;
對所述第二候選音樂集合中的各音樂進行處理,獲得并顯示音樂檢索結 果。
本發明實施例提供的音樂檢索方法及裝置,首先對哼唱旋律對應的基頻序 列進行快速傅里葉變換,可以快速過濾掉大部分與哼唱旋律不相似的音樂,而 后再對獲取的候選音樂集合執行PAA過濾,從而過濾掉剩余的大部分不相似 的音樂,并據此獲取最終的音樂檢索結果。由于在執行哼唱旋律的基頻序列與 音樂信息庫中的音樂的匹配過濾時,使用了FFT和PAA方法過濾掉大部分不 相近似的音樂,從而有效提高了音樂檢索的效率,減少用戶等待時間,降低系 統資源耗費,提高了系統的處理能力。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510918496.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據獲取方法與裝置
- 下一篇:圖像添加方法、圖像添加裝置和終端





