[發(fā)明專利]一種音頻指紋匹配方法以及音頻指紋匹配裝置有效
| 申請?zhí)枺?/td> | 201910171672.1 | 申請日: | 2019-03-07 |
| 公開(公告)號: | CN109829515B | 公開(公告)日: | 2020-08-28 |
| 發(fā)明(設計)人: | 姜衛(wèi)平;張家斌;縱瑞芳;趙敏 | 申請(專利權)人: | 北京市博匯科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/683 |
| 代理公司: | 北京弘權知識產(chǎn)權代理事務所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 100094 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 指紋 匹配 方法 以及 裝置 | ||
1.一種音頻指紋匹配方法,其特征在于,包括:
獲取第一音頻段包含的至少兩個音頻幀中每個音頻幀的頻譜幅值;
根據(jù)所述第一音頻段包含的至少兩個音頻幀中每個音頻幀的頻譜幅值,確定每個音頻幀在至少兩個音調(diào)頻率子帶中每個音調(diào)頻率子帶上的平均譜能量;
根據(jù)每個音頻幀在至少兩個音調(diào)頻率子帶中每個音調(diào)頻率子帶上的平均譜能量,確定每個音頻幀的平均譜能量峰值在所述至少兩個音調(diào)頻率子帶中所屬的目標音調(diào)頻率子帶;
根據(jù)所述每個音頻幀的平均譜能量峰值在所述至少兩個音調(diào)頻率子帶中所屬的目標音調(diào)頻率子帶,生成所述至少兩個音頻幀的平均譜能量峰值位置點圖像;
利用分類器對所述平均譜能量峰值位置點圖像中的平均譜能量峰值位置點進行量化,并根據(jù)量化結(jié)果獲取所述至少兩個音頻幀中每個音頻幀的音頻指紋;
確定第二音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋;
根據(jù)所述第一音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間以及所述第二音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間,獲取所述第一音頻段中至少兩個音頻幀與所述第二音頻段中至少兩個音頻幀對應音頻幀的指紋距離的平均值;
在所述平均值小于或者等于第一預設閾值的情況下,確定所述第一音頻段與所述第二音頻段相匹配;
在所述平均值大于所述第一預設閾值的情況下,確定所述第一音頻段與所述第二音頻段不匹配。
2.如權利要求1所述的方法,其特征在于,所述根據(jù)所述第一音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間以及所述第二音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間,獲取所述第一音頻段中至少兩個音頻幀與所述第二音頻段中至少兩個音頻幀對應音頻幀的指紋距離的平均值,包括:
根據(jù)所述第一音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間以及所述第二音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間,確定對齊偏移量;
根據(jù)所述對齊偏移量,獲取所述第一音頻段中至少兩個音頻幀與所述第二音頻段中至少兩個音頻幀對應音頻幀的指紋距離的平均值。
3.如權利要求2所述的方法,其特征在于,所述根據(jù)所述第一音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間以及所述第二音頻段包含的至少兩個音頻幀中每個音頻幀的音頻指紋和幀時間,確定對齊偏移量,包括:
確定所述第一音頻段包含的至少兩個音頻幀與所述第二音頻段包含的至少兩個音頻幀中具有相似指紋的音頻幀對,其中,具有相似指紋的音頻幀對中的兩個音頻幀的指紋距離小于第二預設閾值;
計算所述具有相似指紋的音頻幀對中第一音頻幀與第二音頻幀的幀時間差,其中,所述第一音頻幀屬于所述第一音頻段,所述第二音頻幀屬于所述第二音頻段;
獲取具有同一幀時間差的音頻幀對;
在具有目標幀時間差的音頻幀對的數(shù)量最多且該數(shù)量大于第三預設閾值的情況下,確定所述目標幀時間差為所述對齊偏移量。
4.如權利要求1至3中任一項所述的方法,其特征在于,所述分類器包含第一區(qū)域和第二區(qū)域,所述利用分類器對所述平均譜能量峰值位置點圖像中的平均譜能量峰值位置點進行量化,并根據(jù)量化結(jié)果獲取所述至少兩個音頻幀中每個音頻幀的音頻指紋,包括:
確定所述平均譜能量峰值位置點圖像中位于所述分類器的第一區(qū)域的平均譜能量峰值位置點的第一數(shù)量;
確定所述平均譜能量峰值位置點圖像中位于所述分類器的第二區(qū)域的平均譜能量峰值位置點的第二數(shù)量;
計算所述第一數(shù)量與所述第二數(shù)量的差值;
根據(jù)所述差值獲取所述至少兩個音頻幀中每個音頻幀的音頻指紋。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市博匯科技股份有限公司,未經(jīng)北京市博匯科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910171672.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





