[發明專利]一種用于廣告音頻特征提取的方法在審
| 申請號: | 201810179397.3 | 申請日: | 2018-03-05 |
| 公開(公告)號: | CN108428150A | 公開(公告)日: | 2018-08-21 |
| 發明(設計)人: | 俞清木 | 申請(專利權)人: | 北京電廣聰信息技術有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;H04N21/233;H04N21/439 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 廣告音頻 特征提取 滑動窗口 時間點 頻譜 點位 向量 短時傅立葉變換 矩陣 音頻格式轉換 正態分布函數 計算復雜度 應用范圍廣 對數坐標 哈希算法 加權平均 頻譜能量 特征搜索 提取特征 小波變換 音頻采集 音頻搜索 最終特征 單聲道 檢測 準確率 存儲 分區 轉換 優化 | ||
1.一種用于廣告音頻特征提取的方法,其特征在于,所述的方法包含:
步驟1,音頻采集存儲;
步驟2,確定特征點位;
步驟3,提取特征;
步驟4,特征搜索;
步驟5,音頻搜索優化。
2.如權利要求1所述的用于廣告音頻特征提取的方法,其特征在于,步驟2所述的點位是指電臺頻率和時間點,以對應廣告播出的開始時間。
3.如權利要求2所述的用于廣告音頻特征提取的方法,其特征在于,所述的步驟2包含:
步驟2.1,音頻格式轉換為單聲道,重采樣為8000Hz;
步驟2.2,對音頻加滑動窗口后計算短時傅立葉變換,轉換為頻譜;
步驟2.3,計算上述頻譜每個時間點特定頻率的能量值,以800Hz為中心,20Hz為σ,5個σ之內按正態分布函數對能量進行加權平均;
步驟2.4,對上述能量值曲線在滑動窗口內取極大值,極大值對應的時間點即為特征點位。
4.如權利要求3所述的用于廣告音頻特征提取的方法,其特征在于,所述的步驟2.4中的滑動窗口的滑動間隔為0.02秒,窗口長度為0.25秒。
5.如權利要求1所述的用于廣告音頻特征提取的方法,其特征在于,所述的步驟3包含:
步驟3.1,從點位時間起計算頻譜短時傅立葉變換的窗口為0.371秒,滑動間隔為0.0116秒,連續128個窗口;
步驟3.2,將頻譜能量范圍按對數坐標刻度分為31個區間;
步驟3.3,每個頻譜對應128×31個二維區域,在頻譜上計算能量得到尺寸為128×31的矩陣;
步驟3.4,對上述矩陣進行小波變換;
步驟3.5,把上述結果中值最大的200個元素置1,其余元素置零得到128×31的0/1矩陣;
步驟3.6,對上述矩陣進行200維最小哈希算法得到200維向量;
步驟3.7,對上述向量的200維按4維一組進行分組得到50組,只取其前48組,每一組按算術編碼進行編碼,并對編碼截斷只取其前一個字節,由此將200維向量縮減為48維字節向量,作為最終特征向量;
步驟3.8,匹配兩個點位,對其相似性使用漢明距離不同的字節個數。
6.如權利要求1所述的用于廣告音頻特征提取的方法,其特征在于,步驟4所述的特征搜索包括逐個比對和快速檢索兩種。
7.如權利要求6所述的用于廣告音頻特征提取的方法,其特征在于,所述的步驟4中的快速檢索是使用局部敏感哈希算法壓縮特征向量,建立可以駐留內存的索引,以實現高速近似搜索。
8.如權利要求1所述的用于廣告音頻特征提取的方法,其特征在于,步驟5所述的音頻搜索優化,是將搜索音頻進行預壓縮和拉伸,以找到相應的廣告播出點位。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京電廣聰信息技術有限公司,未經北京電廣聰信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810179397.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種廣告推送方法、裝置及可讀存儲介質
- 下一篇:一種拼單方法和裝置





