[發明專利]音頻文件的處理方法、介質、裝置和計算設備在審
| 申請號: | 201810989723.7 | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN110866141A | 公開(公告)日: | 2020-03-06 |
| 發明(設計)人: | 劉華平;鄭淵中 | 申請(專利權)人: | 杭州網易云音樂科技有限公司 |
| 主分類號: | G06F16/61 | 分類號: | G06F16/61;G06F16/63 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 呂雁葭 |
| 地址: | 310052 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻文件 處理 方法 介質 裝置 計算 設備 | ||
本發明的實施方式提供了一種音頻文件的處理方法,包括:獲取音頻文件的指紋數據,所述指紋數據包括第一數量個比特位;對所述指紋數據進行哈希轉換,得到索引數據,所述索引數據包括第二數量個比特位,第二數量小于第一數量,一個索引數據對應一個或多個指紋數據;以所述索引數據為索引建立所述音頻文件的指紋庫。本方法通過將長度較大的指紋數據轉換為長度較小的索引數據,在可接受的程度內優化音頻文件的索引分布,令所需要的存儲空間大大減小,提高資源利用率,使得對音頻文件的操作變得更加省時、高效。本發明的實施方式還提供了一種音頻文件的處理裝置、介質和計算設備。
技術領域
本發明的實施方式涉及計算機技術領域,更具體地,本發明的實施方式涉及音頻文件的處理方法、介質、裝置和計算設備。
背景技術
本部分旨在為權利要求書中陳述的本發明的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
音頻指紋是可以代表一段音頻文件的重要聲學特征的基于內容的緊致數字簽名,其主要目的是建立一種有效機制來比較兩個音頻數據的感知聽覺質量,可以廣泛應用于歌曲識別、內容監播、內容去重等領域。一個音頻指紋系統通常包括一個計算重要聽覺特征的指紋提取算法和一個在指紋庫中進行有效搜索的比對算法。
現有技術中所能獲取的音頻指紋雖然具有準確性高、魯棒性高等特點,但音頻指紋的長度較大,所需存儲空間巨大,在基于音頻指紋所構建的指紋庫中進行搜索、查找等操作需要耗費較多的時間和資源,效率低下。
發明內容
但是,出于現有技術中所能獲取的音頻指紋的長度較大的原因,現有技術的音頻指紋所需的存儲空間巨大,基于音頻指紋進行音頻文件的操作需要占用大量的時間和資源。
因此在現有技術中,想要減小音頻指紋所需的存儲空間、提高基于音頻指紋對音頻文件的操作效率,這是非常令人煩惱的過程。
為此,非常需要一種改進的音頻文件的處理方法,以進一步減小音頻指紋所需的存儲空間,提高基于音頻指紋對音頻文件的操作效率。
在本上下文中,本發明的實施方式期望提供一種音頻文件的處理方法和裝置。
在本發明實施方式的第一方面中,提供了一種音頻文件的處理方法,包括:獲取音頻文件的指紋數據,所述指紋數據包括第一數量個比特位;對所述指紋數據進行哈希轉換,得到索引數據,所述索引數據包括第二數量個比特位,第二數量小于第一數量,一個索引數據對應一個或多個指紋數據;以所述索引數據為索引建立所述音頻文件的指紋庫。
在本發明的一個實施例中,上述對所述指紋數據進行哈希轉換,得到索引數據包括:將所述指紋數據與指定乘數相乘,得到第一中間結果;將第一中間結果從后向前第一數量個比特位開始的部分作為第二中間結果;截取第二中間結果中第二數量個比特位的部分,得到第二數量個比特位的索引數據。
在本發明的另一實施例中,上述對所述指紋數據進行哈希轉換,得到索引數據還包括:基于第一數量和黃金分割法則生成指定乘數。
在本發明的又一實施例中,第一數量為不小于16且不大于64的整數,第二數量為小于第一數量的正整數。
在本發明的再一實施例中,上述獲取音頻文件的指紋數據包括:利用指紋提取算法提取音頻文件的指紋數據。
在本發明的再一實施例中,在以所述索引數據為索引建立所述音頻文件的指紋庫之后,上述方法還包括:基于所述指紋庫對所述音頻文件執行存儲操作、查找操作、過濾操作、和/或匹配操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州網易云音樂科技有限公司,未經杭州網易云音樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810989723.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電刺激裝置系統及其控制方法
- 下一篇:一種慶大霉素C1a的純化方法





