[發明專利]構建音頻指紋庫及檢索音頻指紋的方法和設備在審
| 申請號: | 201510079596.3 | 申請日: | 2015-02-13 |
| 公開(公告)號: | CN104636474A | 公開(公告)日: | 2015-05-20 |
| 發明(設計)人: | 王磊 | 申請(專利權)人: | 王磊 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鼎宏元正知識產權代理事務所(普通合伙) 11458 | 代理人: | 李波;武媛 |
| 地址: | 100000 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 構建 音頻 指紋 檢索 方法 設備 | ||
技術領域
本發明涉及信息技術領域,尤其涉及一種構建音頻指紋庫及檢索音頻指紋的方法和設備。
背景技術
音頻指紋識別(俗稱“聽音識曲”)是一種新興的音樂搜索技術,該技術通過分析音頻文件的頻譜,提取稱為“音頻指紋”的數字特征,并使用數字特征構建“海量音頻指紋庫”,部署于網絡服務器上,客戶端可將錄制的未知音頻片段發送到服務器,服務器使用相同的算法提取“音頻指紋”,然后通過搜索算法在海量音頻指紋庫中查找相似特征,并根據找到的若干特征推測目標音頻文件,將結果返回給客戶端即完成了整個識別過程。
音頻指紋識別是一種兼具數據密集型和計算密集型的應用:海量音頻指紋庫必須包含足夠多的音頻文件的特征,才能保證應用的識別率,該規模通常為千萬級;搜索算法的計算量巨大,為了保證搜索速度,通常完全使用內存存儲海量音頻指紋庫并進行計算。
可知,音頻指紋識別對內存容量的要求很高(TB級),是目前單臺服務器無法滿足的?,F有的解決方案通常是拆分曲庫,使用大量服務器分別構建音頻指紋庫,同時搜索所有服務器,這種方案會造成不必要的搜索,浪費資源。因此,如何構建資源利用率最優的海量音頻指紋庫系統成為了業界的一個難題。
發明內容
為此,本發明提出了一種可以解決上述問題的至少一部分的新音頻指紋存儲及檢索的方法和設備。
根據本發明的一個方面,提供了一種構建音頻指紋庫的方法,包括:提取音頻指紋與音頻指紋的key值;建立具有相同key值的音頻指紋與所述key值的對應關系;把所述key值及其對應的音頻指紋分配到服務器中;創建所述key值與所述服務器的對應關系,從而構建音頻指紋庫。
可選地,根據本發明的構建音頻指紋庫的方法,其中,建立具有相同key值的音頻指紋與所述key值的對應關系包括:將具有相同key值的音頻指紋劃分為同一數組。
可選地,根據本發明的構建音頻指紋庫的方法,進一步包括:計算所述數組的被搜索次數;根據所述搜索次數,將所述數組分配到所述服務器中,以使的所述服務器的負載差別最小化。
可選地,根據本發明的構建音頻指紋庫的方法,其中,計算所述數組的被搜索次數包括:計算所述數組中key值的被搜索頻率;確定所述數組中音頻指紋的數量;計算所述被搜索頻率與所述音頻指紋的數量的乘積,以得到所述數組的被搜索次數。
可選地,根據本發明的構建音頻指紋庫的方法,其中,使的所述服務器的負載差別最小化包括:通過貪婪算法將所述數組分配到所述服務器中。
根據本發明的另一個方面,還提供了一種在服務器中檢索音頻指紋的方法,其中,所述服務器中存儲有所述音頻指紋及其對應的key值,所述key值與所述服務器相對應,所述方法包括:提取待檢索音頻指紋與所述待檢索音頻指紋的待檢索key值;查找所述待檢索key值對應的服務器;在所述服務器中,檢索與待檢索音頻指紋相應的音頻指紋。
可選地,根據本發明的在服務器中檢索音頻指紋的方法,進一步包括:利用檢索到的音頻指紋,生成音頻信息。
根據本發明的另一個方面,還提供了一種構建音頻指紋庫的設備,包括:提取裝置、分析裝置、分配裝置和保存裝置,其中,提取裝置,用于提取音頻指紋與音頻指紋的key值;分析裝置,用于建立具有相同key值的音頻指紋與所述key值的對應關系;分配裝置,用于把所述key值及其對應的音頻指紋分配到服務器中;保存裝置,用于創建所述key值與所述服務器的對應關系,從而構建音頻指紋庫。
可選地,根據本發明的構建音頻指紋庫的設備,進一步包括:計算裝置和重新分配裝置,其中計算裝置,用于計算所述數組的被搜索次數;重新分配裝置,用于根據所述搜索次數,將所述數組分配到所述服務器中,以使的所述服務器的負載差別最小化。
根據本發明的另一個方面,還提供了一種在服務器中檢索音頻指紋的設備,其中,所述服務器中存儲有所述音頻指紋及其對應的key值,所述key值與所述服務器相對應,所述設備包括:獲取裝置,用于提取待檢索音頻指紋與所述待檢索音頻指紋的待檢索key值;查找裝置,用于查找所述待檢索key值對應的服務器;匹配裝置,用于在所述服務器中,檢索與待檢索音頻指紋相應的音頻指紋。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王磊;,未經王磊;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510079596.3/2.html,轉載請聲明來源鉆瓜專利網。





