[發明專利]一種構建在線實時更新海量音頻指紋庫的方法和設備有效
| 申請號: | 201510079627.5 | 申請日: | 2015-02-13 |
| 公開(公告)號: | CN104679847B | 公開(公告)日: | 2019-03-15 |
| 發明(設計)人: | 王磊 | 申請(專利權)人: | 高第網絡技術(北京)有限公司 |
| 主分類號: | G06F16/61 | 分類號: | G06F16/61 |
| 代理公司: | 北京市中倫律師事務所 11410 | 代理人: | 石寶忠 |
| 地址: | 102208 北京市昌平區回龍*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 構建 在線 實時 更新 海量 音頻 指紋 方法 設備 | ||
本發明提供一種構建在線實時更新音頻指紋庫的方法和設備,解決現有技術中海量音頻指紋庫不方便在線實時更新的技術問題。其中,構建在線實時更新音頻指紋庫的方法,包括:建立具有相同key值的音頻指紋與所述key值的對應關系;建立包含每個key值與其對應音頻指紋的索引列表,使索引列表中的每一個key值均以指針的形式指向其對應的音頻指紋;以及將具有相同key值的音頻指紋連續存儲。本發明可使在線服務引擎支持實時添加、刪除歌曲指紋,而且不會影響搜索服務,避免了離線建庫、重啟服務所帶來的繁瑣和耗時的工作,同時保證了海量音頻指紋庫的數據時效性,實現了秒級的數據更新需求響應能力。
技術領域
本發明涉及音頻指紋識別技術領域,具體涉及一種構建在線實時更新海量音頻指紋庫的方法和設備。
背景技術
音頻指紋識別(俗稱“聽音識曲”)是一種新興的音樂搜索技術,該技術通過分析音頻文件的頻譜,提取稱為“音頻指紋”的數字特征,并使用數字特征構建“海量音頻指紋庫”,部署于網絡服務器上,客戶端可將錄制的未知音頻片段發送到服務器,服務器使用相同的算法提取“音頻指紋”,然后通過搜索算法在海量音頻指紋庫中查找相似特征,并根據找到的若干特征推測目標音頻文件,將結果返回給客戶端即完成了整個識別過程。音頻指紋識別是一種兼具數據密集型和計算密集型的應用:海量音頻指紋庫必須包含足夠多的音頻文件的特征,才能保證應用的識別率,該規模通常為千萬級;搜索算法的計算量巨大,為了保證搜索速度,通常首先離線構建指紋庫,并進行序列化處理生成一個文件,以使數據連續存儲,避免過多指針跳轉操作,然后將索引文件完全加載到內存中提供檢索服務。
現有技術中海量音頻指紋庫的更新方法,由于索引數據連續存儲在一塊內存中,通常的解決方案很難支持在線添加、刪除音頻指紋索引數據,故每次更新均需將服務器重啟。圖1所示,現有的解決方案一般將海量音頻指紋索引庫劃分為多個固定小的音頻指紋庫(塊1、塊2……塊n),積攢一定數量的新數據后,需要離線重建最后一個不滿的音頻指紋庫(塊n),然后重新啟動服務(重啟服務更新塊n),將最新的音頻指紋庫替換到線上。由此可知,離線建庫,重啟服務的索引數據更新方法具有操作繁瑣、更新不及時等固有缺陷,無法提供及時的新歌搜索服務,因此,研發一種在線實時更新海量音頻指紋庫索引數據的方法成為一種必需。
發明內容
為此,本發明提供一種構建在線實時更新音頻指紋庫的方法和設備,解決現有技術中海量音頻指紋庫不方便在線實時更新的技術問題。
為此,本發明提供一種構建在線實時更新音頻指紋庫的方法,包括:建立具有相同key值的音頻指紋與所述key值的對應關系;建立包含每個key值與其對應音頻指紋的索引列表,使索引列表中的每一個key值均以指針的形式指向其對應的音頻指紋;以及將具有相同key值的音頻指紋連續存儲。
根據本發明的一個實施方式,其中,建立具有相同key值的音頻指紋與所述key值的對應關系包括:將具有相同key值的音頻指紋劃分為同一數組;并且其中,建立包含每個key值與其對應音頻指紋的索引列表包括:使所述索引列表包括數量與key值數量相同的數組。
根據本發明的一個實施方式,其中,進一步包括:在線添加音頻指紋,包括:將待添加音頻指紋按照其對應key值進行分組,每組中的所述待添加音頻指紋具有相同的對應key值;在所述索引列表中查找與所述對應key值相同的key值,以定位待更新音頻指紋;復制所述待更新音頻指紋;將具有相同key值的待更新音頻指紋和所述待添加音頻指紋連續存放,以獲得新音頻指紋;將所述索引列表中指向所述待更新音頻指紋的key值的指針,指向所述新音頻指紋;將所述待更新音頻指紋延遲刪除。
根據本發明的一個實施方式,其中,若所述待添加音頻指紋中的key值不包含在所述索引列表中,則將其視為新建key值;將所述新建key值連續添加至所述索引列表中后,將與所述新建key值相對應的音頻指紋連續存放在所述待更新音頻指紋中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于高第網絡技術(北京)有限公司,未經高第網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510079627.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種播放列表創建方法及終端設備
- 下一篇:數據訪問處理方法和裝置





