[發(fā)明專利]基于量子Grover算法的音頻指紋檢索方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011412302.1 | 申請(qǐng)日: | 2020-12-04 |
| 公開(kāi)(公告)號(hào): | CN112528069A | 公開(kāi)(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 李陽(yáng)陽(yáng);毛鶴亭;劉睿嬌;楊丹青;趙逸群;趙裴翔;焦李成;李玲玲 | 申請(qǐng)(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號(hào): | G06F16/61 | 分類號(hào): | G06F16/61;G06F16/683;G06K9/62 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 田文英;張問(wèn)芬 |
| 地址: | 710071*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 量子 grover 算法 音頻 指紋 檢索 方法 | ||
本發(fā)明提出了一種基于量子Grover算法的音頻指紋檢索方法,其實(shí)現(xiàn)步驟是:(1)生成音頻指紋集合;(2)提取待檢索音頻的音頻指紋;(3)計(jì)算待檢索音頻指紋與音頻指紋集合中所有指紋之間的相似度;(4)使用Grover算法搜索最大相似度的索引;本發(fā)明計(jì)算待檢測(cè)音頻的音頻指紋與音頻指紋集合中每個(gè)音頻指紋之間的相似度,保證檢索準(zhǔn)確率,再利用量子Grover算法搜索所有相似度中的最大相似度的索引,克服了搜索需要的步驟與相似度集合中元素?cái)?shù)量成線性正比關(guān)系的問(wèn)題,使得本發(fā)明提高了音頻指紋檢索的效率。
技術(shù)領(lǐng)域
本發(fā)明屬于音頻處理技術(shù)領(lǐng)域,更進(jìn)一步涉及音頻指紋檢索技術(shù)領(lǐng)域的一種基于量子Grover算法的音頻指紋檢索方法。本發(fā)明利用量子Grover算法檢索音頻指紋,可以獲取待檢索音頻片段所在音頻文件的原始信息。
背景技術(shù)
音頻指紋是指通過(guò)特定的算法從音頻信號(hào)中提取的一段數(shù)字特征,用于表達(dá)與該段音頻信號(hào)中的重要聲學(xué)特征對(duì)應(yīng)的數(shù)字簽名。用音頻指紋作為音頻檢索中音頻原數(shù)據(jù)(如歌曲名,歌手)的索引,能夠大大降低音頻檢索的搜索量,并且可以顯著地提高音頻匹配的效率。音頻指紋檢索主要包括兩個(gè)過(guò)程:音頻指紋特征提取階段和音頻指紋特征匹配階段。首先根據(jù)特定的算法將一段音頻數(shù)據(jù)映射為對(duì)應(yīng)的聲學(xué)特征的數(shù)字簽名信息,并將提取的該數(shù)字簽名信息作為音頻指紋,然后將音頻指紋和對(duì)應(yīng)的音頻的元數(shù)據(jù)存儲(chǔ)到指紋數(shù)據(jù)庫(kù)中。當(dāng)需要查詢?cè)摱我纛l信息時(shí),便將查詢的音頻指紋和數(shù)據(jù)庫(kù)中的指紋進(jìn)行比對(duì),返回?cái)?shù)據(jù)庫(kù)中與查詢音頻最匹配的音頻信息。
湖南大學(xué)在其申請(qǐng)的專利文獻(xiàn)“一種基于音頻指紋的分片音頻檢索方法”(專利申請(qǐng)?zhí)?01710044606.9,申請(qǐng)公布號(hào)CN 106802960 A)中提出了一種基于音頻指紋的分片音頻檢索方法。該方法的實(shí)現(xiàn)過(guò)程為,將大于固定長(zhǎng)度的待檢索音頻片段分片為待處理音頻片段和剩余音頻片段,先提取待處理音頻片段的音頻指紋并將提取到的音頻指紋與數(shù)據(jù)庫(kù)進(jìn)行匹配,然后判斷得到的匹配值是否達(dá)到設(shè)定的閾值,如果已達(dá)到設(shè)定閾值就返回匹配到的音頻信息,如果沒(méi)有達(dá)到則對(duì)剩余音頻片段進(jìn)行切片、指紋提取、和指紋匹配,直到剩余音頻無(wú)法分片,則返回“無(wú)匹配音頻”結(jié)果。該方法存在的不足之處是,由于待檢索音頻指紋與數(shù)據(jù)庫(kù)指紋的每次匹配時(shí),僅使用待檢索音頻切片后的音頻指紋信息的問(wèn)題,導(dǎo)致音頻指紋檢索中的誤檢次數(shù)增多,降低了檢索結(jié)果的準(zhǔn)確率。
王偉等人在其發(fā)表的論文“基于熵的音頻指紋檢索技術(shù)研究與實(shí)現(xiàn)”(計(jì)算機(jī)科學(xué),2017,44(z1):551-556)中提出一種基于熵的音頻指紋檢索技術(shù)研究與實(shí)現(xiàn)方法。該方法的實(shí)現(xiàn)過(guò)程為,采用音頻的熵特征作為音頻的指紋特征,在檢索中使用動(dòng)態(tài)時(shí)間規(guī)整算法計(jì)算待檢測(cè)音頻的音頻指紋與數(shù)據(jù)庫(kù)中的音頻指紋的相似度,最后將最大相似度對(duì)應(yīng)的音頻指紋索引作為返回結(jié)果。該算法存在的不足之處是,由于在檢索過(guò)程中最大相似度的搜索是通過(guò)遍歷逐個(gè)元素并兩兩比較的方法,導(dǎo)致搜索需要的步驟與相似度集合中元素?cái)?shù)量成線性正比關(guān)系,需要大量的檢索時(shí)間才能得到檢索結(jié)果。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)上述已有技術(shù)的不足,提出一種基于量子Grover算法的音頻指紋檢索方法,用于解決現(xiàn)有技術(shù)僅使用待檢索音頻切片后的音頻指紋信息,導(dǎo)致音頻指紋檢索中的誤檢次數(shù)增多的問(wèn)題,以及現(xiàn)有技術(shù)中搜索需要的步驟與相似度集合中元素?cái)?shù)量成線性正比關(guān)系,需要大量的檢索時(shí)間才能得到檢索結(jié)果的問(wèn)題。
實(shí)現(xiàn)本發(fā)明目的的思路是,使用待檢測(cè)音頻的音頻指紋與音頻指紋集合中每個(gè)音頻指紋之間的相似度,解決僅使用待檢索音頻切片后的音頻指紋信息,導(dǎo)致音頻指紋檢索中的誤檢次數(shù)增多的問(wèn)題,提高檢索結(jié)果的準(zhǔn)確率;使用Grover搜索算法,利用量子計(jì)算的并行性特點(diǎn),解決搜索需要的步驟與相似度集合中元素?cái)?shù)量成線性正比關(guān)系的問(wèn)題,提高檢索的效率。
本發(fā)明的具體步驟包括如下:
(1)生成音頻指紋集合:
(1a)采集至少100段音頻,每段音頻的時(shí)長(zhǎng)不等且小于3min;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011412302.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種低復(fù)雜度MIMO FBMC-OQAM系統(tǒng)信號(hào)檢測(cè)方法
- 一種基于云計(jì)算的Grover量子仿真算法優(yōu)化方法
- 一種基于Grover算法的量子群認(rèn)證方法
- 一種基于Grover量子搜索算法的云制造調(diào)度方法
- 一種量子并行搜索方法
- 基于Grover算法的大數(shù)據(jù)集搜索多個(gè)目標(biāo)項(xiàng)的方法
- 基于量子Grover算法的手寫(xiě)文字圖片分類方法
- 基于量子Grover算法的音頻指紋檢索方法
- 一種基于Grover迭代靈活追蹤的仲裁量子簽名設(shè)計(jì)方法
- 一種密鑰獲取方法和裝置





