[發(fā)明專利]一種音頻指紋生成系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 202011547042.9 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112732972B | 公開(公告)日: | 2023-10-27 |
| 發(fā)明(設(shè)計(jì))人: | 曹杰;申冬琴;王昌輝;劉金良 | 申請(專利權(quán))人: | 云境商務(wù)智能研究院南京有限公司;南京財(cái)經(jīng)大學(xué) |
| 主分類號: | G06F16/683 | 分類號: | G06F16/683;G10L25/54 |
| 代理公司: | 南京瑞弘專利商標(biāo)事務(wù)所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210003 江蘇省南京市鼓樓*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 指紋 生成 系統(tǒng) 方法 | ||
1.一種音頻指紋生成方法,其特征在于,包括以下步驟:
步驟S1、讀取目標(biāo)音頻數(shù)據(jù),將目標(biāo)音頻數(shù)據(jù)分割成若干重疊幀,對所述重疊幀分別進(jìn)行離散傅里葉變換,獲取目標(biāo)音頻的時(shí)頻及信號強(qiáng)度信息;
步驟S2、將所述目標(biāo)音頻的時(shí)頻及信號強(qiáng)度信息組合為對應(yīng)的二維信號強(qiáng)度矩陣;其中信號強(qiáng)度信息即為該矩陣的值,時(shí)頻信息即為該矩陣的標(biāo)簽;在所述二維信號強(qiáng)度矩陣中確定極值和所述極值的時(shí)頻信息;
步驟S3、基于組合錨點(diǎn)原則,對所述極值的時(shí)頻信息進(jìn)行分析,獲取目標(biāo)音頻的音頻指紋;具體地,
步驟S3.1、將所述極值對應(yīng)的時(shí)頻信息按照時(shí)間優(yōu)先原則進(jìn)行排序,轉(zhuǎn)化為有序的一維時(shí)頻序列;
步驟S3.2、對該有序序列應(yīng)用組合錨點(diǎn)原則,將錨點(diǎn)分為奇錨點(diǎn)組和偶錨點(diǎn)組兩組,每個(gè)錨點(diǎn)組由M個(gè)錨點(diǎn)構(gòu)成;
步驟S3.3、確定目標(biāo)區(qū)域;所述目標(biāo)區(qū)域的邊界與最后一個(gè)錨點(diǎn)相距不小于預(yù)設(shè)閾值N;
步驟S3.4、根據(jù)摘要算法,依據(jù)各錨點(diǎn)的頻率和時(shí)間差,生成字符串如下:
錨點(diǎn)1頻率|錨點(diǎn)2頻率…|時(shí)間差1|時(shí)間差2…
對上述字符串進(jìn)行處理生成相應(yīng)的哈希指紋,并對上述字符串加上錨點(diǎn)1的時(shí)間,構(gòu)成如下形式:
(摘要算法(錨點(diǎn)1頻率|錨點(diǎn)2頻率…|時(shí)間差1|時(shí)間差2…),錨點(diǎn)1時(shí)間)
按照上述規(guī)則,對所述有序一維時(shí)頻序列進(jìn)行處理,即可得到目標(biāo)音頻的音頻指紋;
步驟S4、根據(jù)步驟S3中劃分的奇錨點(diǎn)組和偶錨點(diǎn)組,分別創(chuàng)建奇數(shù)據(jù)庫和偶數(shù)據(jù)庫,用于存儲所述目標(biāo)音頻的奇錨點(diǎn)組和偶錨點(diǎn)組音頻指紋。
2.根據(jù)權(quán)利要求1所述的一種音頻指紋生成方法,其特征在于,在對音頻指紋進(jìn)行搜索時(shí),對所述奇偶兩個(gè)數(shù)據(jù)庫進(jìn)行并行查詢,當(dāng)其中一個(gè)數(shù)據(jù)庫的連續(xù)匹配項(xiàng)達(dá)到設(shè)定閾值K后,放棄對另一個(gè)數(shù)據(jù)庫的查詢。
3.根據(jù)權(quán)利要求2所述的一種音頻指紋生成方法,其特征在于,所述預(yù)設(shè)閾值K的取值優(yōu)選為5。
4.根據(jù)權(quán)利要求1所述的一種音頻指紋生成方法,其特征在于,所述步驟S1中對目標(biāo)音頻數(shù)據(jù)的處理過程具體如下:
對原始音頻數(shù)據(jù)進(jìn)行加窗操作,窗口函數(shù)選取漢明窗,窗口大小設(shè)為4096;每次加窗操作后進(jìn)行離散傅里葉變換,得到一列固定時(shí)間下,不同頻率下的信號強(qiáng)度數(shù)據(jù);對整個(gè)目標(biāo)音頻數(shù)據(jù)進(jìn)行上述操作,最后得到多列時(shí)頻和信號強(qiáng)度信息;其中離散傅里葉變化公式如下:
5.根據(jù)權(quán)利要求1所述的一種音頻指紋生成方法,其特征在于,所述步驟S2中確定極值和所述極值的時(shí)頻信息具體方法如下:
取一個(gè)n*n的輔助矩陣,以輔助矩陣的中心為標(biāo)記,在二維信號強(qiáng)度矩陣中按行移動,當(dāng)位于輔助矩陣中心的點(diǎn)的值比其他在輔助矩陣范圍內(nèi)點(diǎn)的值都大時(shí),將該點(diǎn)確定為極值點(diǎn),該點(diǎn)的時(shí)頻信息即為極值的時(shí)頻信息。
6.根據(jù)權(quán)利要求1所述的一種音頻指紋生成方法,其特征在于,所述步驟S3中每個(gè)錨點(diǎn)組的錨點(diǎn)個(gè)數(shù)M大于1。
7.一種基于權(quán)利要求1-6中任一項(xiàng)所述音頻指紋生成方法的音頻指紋生成系統(tǒng),其特征在于,包括:數(shù)據(jù)采集模塊、顏色圖像生成模塊、信號強(qiáng)度極值模塊、組合錨點(diǎn)分析模塊和數(shù)據(jù)庫添加單元;
所述數(shù)據(jù)采集模塊采集目標(biāo)音頻數(shù)據(jù),并對目標(biāo)音頻數(shù)據(jù)進(jìn)行離散傅里葉變換,獲取目標(biāo)音頻的時(shí)頻及信號強(qiáng)度信息;所述顏色圖像生成模塊根據(jù)特定時(shí)間頻率下信號強(qiáng)度的數(shù)據(jù)組合為對應(yīng)的色差信息圖像;信號強(qiáng)度極值模塊用于在所述二維信號強(qiáng)度矩陣中確定極值和所述極值的時(shí)頻信息;所述組合錨點(diǎn)分析模塊包括排序單元和音頻指紋生成單元;所述排序單元用于對極值對應(yīng)的時(shí)間頻率信息進(jìn)行預(yù)設(shè)優(yōu)先原則進(jìn)行排序,生成一維有序的時(shí)間頻率序列;所述音頻指紋生成單元用于將所述一維有序的時(shí)間頻率序列分為奇錨點(diǎn)組和偶錨點(diǎn)組,取相應(yīng)錨點(diǎn)的頻率和時(shí)間差值生成目標(biāo)音頻的音頻指紋;所述數(shù)據(jù)庫添加單元根據(jù)劃分好的奇錨點(diǎn)組和偶錨點(diǎn)組分別創(chuàng)建奇數(shù)據(jù)庫和偶數(shù)據(jù)庫,用于存儲所述目標(biāo)音頻的奇錨點(diǎn)組和偶錨點(diǎn)組音頻指紋。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云境商務(wù)智能研究院南京有限公司;南京財(cái)經(jīng)大學(xué),未經(jīng)云境商務(wù)智能研究院南京有限公司;南京財(cái)經(jīng)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011547042.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





