[發(fā)明專利]一種基于音頻指紋的兩層廣告音頻檢索方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410655665.6 | 申請(qǐng)日: | 2014-11-17 |
| 公開(公告)號(hào): | CN104317967A | 公開(公告)日: | 2015-01-28 |
| 發(fā)明(設(shè)計(jì))人: | 肖利民;隋東輝;阮利;祝明發(fā);李書攀 | 申請(qǐng)(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G10L25/03 |
| 代理公司: | 北京金恒聯(lián)合知識(shí)產(chǎn)權(quán)代理事務(wù)所 11324 | 代理人: | 李強(qiáng) |
| 地址: | 100191*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 音頻 指紋 廣告 檢索 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種新型的廣告音頻檢索方法,具體涉及一種基于兩種音頻指紋的兩層檢索方法,屬于計(jì)算機(jī)科學(xué)的多媒體信息檢索領(lǐng)域。
背景技術(shù)
音頻指紋是指能夠代表一段音頻特征的基于內(nèi)容的緊致數(shù)字簽名,其目的是計(jì)算一段音頻的基于內(nèi)容的特征,以在音頻特征數(shù)據(jù)庫(kù)中進(jìn)行檢索匹配。音頻指紋是針對(duì)音頻的物理數(shù)據(jù),而不是使用名字、作者等信息.音頻指紋要求具有魯棒性以使音頻檢索具有一定的抗噪性,要求具有區(qū)分性以區(qū)分不同的音頻。
現(xiàn)在,音樂搜索方式除了傳統(tǒng)的按名搜索,基于內(nèi)容的搜索也已經(jīng)得到的廣泛應(yīng)用。廣告匹配領(lǐng)域也開始應(yīng)用音頻指紋技術(shù)。廣告音頻在商業(yè)意義上是一種宣傳或營(yíng)銷手段等,在物理信號(hào)上具有比音樂更復(fù)雜的形式,可能是人聲、樂器、或多者混合而不僅限于音樂,因而單純基于音樂的特殊特征的音頻指紋的方法不適用于廣告音頻檢索。所以研究一種針對(duì)廣告音頻的音頻指紋方法具有重要意義。
發(fā)明內(nèi)容
本發(fā)明的目的是利用廣告音頻的特征提取兩種音頻指紋,并提供一種基于音頻指紋的兩層檢索方法。針對(duì)目前廣告匹配領(lǐng)域的需求,該方法通過對(duì)電視等聲源進(jìn)行錄音,經(jīng)過一系列的操作,提取廣告音頻的音頻指紋,并在服務(wù)器端進(jìn)行兩層的檢索,最終根據(jù)檢索的結(jié)果返回相應(yīng)的廣告服務(wù)。
根據(jù)本發(fā)明的一個(gè)實(shí)施例的基于音頻指紋的兩層廣告音頻檢索方法包括:
(1)步驟S1:基于音頻的頻譜幅度特征,提取兩種不同維度的音頻指紋,具體包括:
a)使用手機(jī)等設(shè)備對(duì)電視等聲源進(jìn)行錄音;
b)對(duì)音頻的data部分進(jìn)行加窗分幀操作,得到257幀數(shù)據(jù)。其中窗函數(shù)為漢寧窗,每一幀的長(zhǎng)度為0.37S,幀之間的重疊為31/32;
c)對(duì)于每一幀數(shù)據(jù)進(jìn)行傅里葉變換,得到相應(yīng)的頻域數(shù)據(jù);
d)對(duì)于每一幀的頻域數(shù)據(jù),對(duì)每一個(gè)數(shù)據(jù)進(jìn)行求模運(yùn)算,得到頻譜幅度;
e)把257幀的頻率在300Hz-5400Hz的頻譜幅度數(shù)據(jù)分別求和,得到257幀的整體頻譜幅度和,稱為SGA(Sum?Of?Global?Aptitude),這樣通過以下公式計(jì)算音頻指紋1(FP1):
f)對(duì)于每一幀頻譜幅度數(shù)據(jù),把頻帶在300Hz-5400Hz數(shù)據(jù)按對(duì)數(shù)間隔,劃分為33個(gè)頻率帶,分別計(jì)算每一幀每一個(gè)頻帶的頻譜幅度和,稱為SBA(Sum?Of?Band?Aptitude),從而通過以下公式計(jì)算音頻指紋2(FP2):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410655665.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





