[發(fā)明專利]基于量子Grover算法的音頻指紋檢索方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011412302.1 | 申請(qǐng)日: | 2020-12-04 |
| 公開(公告)號(hào): | CN112528069A | 公開(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 李陽(yáng)陽(yáng);毛鶴亭;劉睿嬌;楊丹青;趙逸群;趙裴翔;焦李成;李玲玲 | 申請(qǐng)(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號(hào): | G06F16/61 | 分類號(hào): | G06F16/61;G06F16/683;G06K9/62 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 田文英;張問芬 |
| 地址: | 710071*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 量子 grover 算法 音頻 指紋 檢索 方法 | ||
1.一種基于量子Grover算法的音頻指紋檢索方法,其特征在于,計(jì)算待檢測(cè)音頻的音頻指紋與音頻指紋集合中每個(gè)音頻指紋之間的相似度,利用量子Grover算法搜索所有相似度中的最大相似度的索引,該方法的具體步驟包括如下:
(1)生成音頻指紋集合:
(1a)采集至少100段音頻,每段音頻的時(shí)長(zhǎng)不等且小于3min;
(1b)使用整數(shù)倍數(shù)降采樣算法,降采樣率fs=16000Hz,對(duì)每段音頻進(jìn)行降采樣;
(1c)提取降采樣后每段音頻的音頻指紋,將所有采集的音頻的音頻指紋組成音頻指紋集合;
(2)提取待檢索音頻的音頻指紋:
采用與步驟(1b)、步驟(1c)相同的方法,對(duì)待檢索音頻進(jìn)行降采樣后提取該待檢索音頻的音頻指紋;
(3)計(jì)算待檢索音頻指紋與音頻指紋集合中所有指紋之間的相似度:
(3a)從音頻指紋集合中依次選取一個(gè)音頻指紋;
(3b)計(jì)算待檢索音頻指紋與所選音頻指紋之間的編輯距離;
(3c)按照下式,計(jì)算待檢索音頻指紋與所選音頻指紋之間的相似度:
其中,S表示待檢索音頻指紋與所選音頻指紋之間的相似度,C表示待檢索音頻指紋與所選取音頻指紋之間的編輯距離,max表示取最大值操作,L表示待檢索音頻指紋的長(zhǎng)度,M表示所選音頻指紋的長(zhǎng)度;
(3d)重復(fù)執(zhí)行步驟(3a)、步驟(3b)、步驟(3c),直到選取完指紋集合中所有指紋,得到待檢索音頻指紋與音頻指紋集合中每個(gè)指紋之間的相似度;
(4)使用Grover算法搜索最大相似度的索引:
(4a)將所有相似度按照音頻指紋采集順序組成一個(gè)音頻指紋相似度向量;
(4b)利用對(duì)應(yīng)函數(shù),建立音頻指紋相似度向量的每個(gè)元素與制備的量子位的每個(gè)量子狀態(tài)之間的映射關(guān)系;
(4c)從音頻指紋相似度向量中隨機(jī)取出一個(gè)元素,利用匹配函數(shù)分別計(jì)算所選元素與量子位產(chǎn)生的每個(gè)量子狀態(tài)映射的元素匹配值,再使用翻轉(zhuǎn)函數(shù)將映射的元素與所選元素匹配后的每個(gè)量子狀態(tài)的概率幅進(jìn)行翻轉(zhuǎn);
(4d)重復(fù)執(zhí)行步驟(4c)次,從量子位產(chǎn)生的所有量子狀態(tài)中找出概率幅最大的量子狀態(tài),將該概率幅最大的量子狀態(tài)映射元素的索引作為音頻指紋相似度向量中最大相似度的索引,其中,N表示音頻指紋相似度向量的長(zhǎng)度。
2.根據(jù)權(quán)利要求1所述的基于量子Grover算法的音頻指紋檢索方法,其特征在于,步驟(1b)中所述的使用整數(shù)倍數(shù)降采樣算法的步驟如下:
第一步,使用截止頻率低于0.5fs的低通濾波器對(duì)每段音頻進(jìn)行濾波;
第二步,每隔f/fs從濾波后的每段音頻中抽取一個(gè)采樣點(diǎn),將所有采樣點(diǎn)組成降采樣后的音頻,其中,f表示每段音頻對(duì)應(yīng)的采樣率。
3.根據(jù)權(quán)利要求1所述的基于量子Grover算法的音頻指紋檢索方法,其特征在于,步驟(1c)中所述提取降采樣后每段音頻的音頻指紋的步驟如下:
第一步,按照下式,對(duì)每段降采樣后音頻進(jìn)行分幀:
Xu(l)=x(u)·w(l)
其中,Xu(l)表示第u段降采樣音頻分幀后的第l幀,u=1,2,...,v,v表示降采樣后音頻的總段數(shù),x(u)表示第u段降采樣后音頻,w(·)表示漢明窗函數(shù);
第二步,對(duì)每段降采樣后音頻的每一幀進(jìn)行傅里葉變換,得到該幀對(duì)應(yīng)的頻域信號(hào);
第三步,從每一幀頻域信號(hào)中選取頻率為300Hz到2000Hz間的所有信號(hào)組成該幀頻域信號(hào)的頻帶;
第四步,使用33個(gè)帶通濾波器,將每個(gè)頻帶劃分成33個(gè)子頻帶;
第五步,按照下式,從每個(gè)相鄰子頻帶中提取一個(gè)元素,將提取的所有元素組成一個(gè)子指紋:
其中,f(m)表示第m個(gè)子頻帶與第m+1個(gè)子頻帶中提取的元素,E(m)表示第m個(gè)子頻帶的能量,K表示第m個(gè)子頻帶的結(jié)束頻率,k1表示第m個(gè)子頻帶的起始頻率,Ym(k)表示第m個(gè)子頻帶的第k個(gè)頻率的頻域信號(hào),|·|表示絕對(duì)值操作;
第六步,將每段降采樣后音頻的所有幀的子指紋組成該段音頻對(duì)應(yīng)的音頻指紋。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011412302.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





