[發(fā)明專利]基于交叉熵的音頻指紋快速搜索方法無效
| 申請?zhí)枺?/td> | 200910241366.7 | 申請日: | 2009-12-07 |
| 公開(公告)號: | CN101853262A | 公開(公告)日: | 2010-10-06 |
| 發(fā)明(設(shè)計)人: | 歐智堅;林暉 | 申請(專利權(quán))人: | 清華大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京眾合誠成知識產(chǎn)權(quán)代理有限公司 11246 | 代理人: | 朱琨 |
| 地址: | 100084 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 交叉 音頻 指紋 快速 搜索 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于交叉熵的音頻指紋快速搜索方法,可以實現(xiàn)合理的跳躍式比對,達(dá)到從大量音頻數(shù)據(jù)中進(jìn)行高效準(zhǔn)確的搜索的目的。
背景技術(shù)
音頻指紋是指音頻自身的基于內(nèi)容的低維表示(一段音頻被表示成一個低維特征矢量),不同內(nèi)容的音頻有不同的指紋。音頻指紋技術(shù)有著廣泛的應(yīng)用背景,包括基于內(nèi)容的音頻辨識和檢索,版權(quán)管理等領(lǐng)域。
現(xiàn)階段已經(jīng)存在很多不同的算法。這些算法主要在以下幾點有區(qū)別:
1.音頻特征的選取,如音頻短時頻譜的均值、方差、譜中心、基音等。
2.指紋模型的構(gòu)造,如矢量量化碼本,高斯混合模型等。
3.音頻指紋對比所用的距離算法,如歐氏距離,馬氏距離等
4.檢索算法,如線性比對,最近鄰比對等。
優(yōu)秀的音頻指紋搜索方法應(yīng)該能夠在音頻信號由于壓縮、傳輸?shù)仍斐梢欢ǖ氖д嬷?,仍然能夠進(jìn)行正確比對,并且滿足計算的時間復(fù)雜度要求。
發(fā)明目的
本發(fā)明提出了種對失真有更好穩(wěn)健性,對距離度量具有更廣的適應(yīng)性的基于交叉熵的音頻指紋快速搜索方法。
本發(fā)明的特征在于:是在計算機(jī)中依次按以下步驟實現(xiàn)的:
步驟(1)計算機(jī)初始化:
設(shè)置:共分量高斯混合模型生成模塊,基于共分量高斯混合模型的音頻指紋提取模塊,廣義動態(tài)時序比對模塊,其中:
所述共分量高斯混合模型生成模塊,使用事先采集好的約100個小時的音頻數(shù)據(jù),進(jìn)行最大似然參數(shù)估計,創(chuàng)建一個共分量高斯混合模型;
所述音頻指紋提取模塊,基于所述共分量高斯混合模型提取音頻指紋,并且用交叉熵衡量音頻指紋間距離;
所述廣義動態(tài)時序比對模塊,以滑動窗方式將用戶指定音頻段與輸入音頻流進(jìn)行指紋比較,判斷音頻流中是否包含有指定音頻段。
步驟(2)按以下步驟創(chuàng)建一個共分量高斯混合模型:
步驟(2.1)事先采集好約100個小時的音頻數(shù)據(jù)。經(jīng)過短時傅立葉分析,以10毫秒為一幀提取一個倒譜特征矢量。
步驟(2.2)利用步驟(2.1)得到的倒譜特征矢量集,進(jìn)行最大似然參數(shù)估計,創(chuàng)建一個共分量高斯混合模型。該模型包含M個高斯分布作為其分量,以及M個權(quán)重系數(shù),M的取值為512:
{ωi(u),μi(u),∑i(u)}i=1,…,M
其中μi(u),∑i(U)表示第i個高斯分量的均值矢量和協(xié)方差矩陣,ωi(u)表示第i個高斯分量的權(quán)重系數(shù),i=1,…,M,上標(biāo)u標(biāo)識此共分量高斯混合模型。
步驟(3)按以下步驟對用戶指定音頻段進(jìn)行預(yù)處理:
步驟(3.1)向計算機(jī)輸入用戶指定音頻段c,時間長度為幾秒,經(jīng)過短時傅立葉分析,以10毫秒為一幀提取一個倒譜特征矢量。這樣,音頻段c用一個倒譜特征矢最序列{xn(c)}n=1,…,W來表示,W表示音頻段c的幀數(shù),n=1,…,W表示音頻段c的各幀的序號,上標(biāo)c標(biāo)識此音頻段c。
步驟(3.2)按下式計算共分量高斯混合模型的第i個高斯分量在音頻段c的第n幀的權(quán)重系數(shù)ωi,n(c),n=1,…,W:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910241366.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





