[發明專利]一種基于廣告字樣檢測的廣告定位方法在審
| 申請號: | 201810058412.9 | 申請日: | 2018-01-24 |
| 公開(公告)號: | CN108182420A | 公開(公告)日: | 2018-06-19 |
| 發明(設計)人: | 陳孟孟 | 申請(專利權)人: | 北京中科火眼科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100000 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 廣告 字樣 單幀檢測 檢測 廣告片段 初始訓練樣本 卷積神經網絡 視頻幀集合 定位結果 先驗知識 訓練樣本 應用需求 準確定位 訓練集 幀處理 濾除 誤檢 整合 視頻 保證 | ||
本發明公開了一種基于廣告字樣檢測的廣告定位方法,包括以下步驟:收集包含廣告字樣的初始訓練樣本數據,擴充訓練集,生成擴充后訓練樣本,進行深度卷積神經網絡訓練,生成廣告字樣檢測模型,對播出視頻進行抽幀處理,得到播出視頻幀集合;對每一幀進行廣告字樣檢測,得到初始的單幀檢測結果;利用先驗知識濾除誤檢,得到最終的單幀檢測結果;整合單幀檢測結果,得到最終的廣告片段定位結果。本發明具有可實現廣告片段的準確定位,滿足應用需求,保證識別精度以及速度,提高效率的特點。
技術領域
本發明屬于圖像視頻處理領域,特別是涉及一種基于廣告字樣檢測的廣告定位方法。
背景技術
視頻數據是我們所接觸的數據中最重要的種類之一,因其直觀性和生動性而受到廣泛歡迎。電視節目和網絡視頻通常會因其趣味性而吸引大量的觀眾去觀看,因此節目前后和節目中間成為了插播廣告的絕佳之地,吸引了很多廠商的關注。其中,很多廣告內容具有一定的引導性,若不標明其為廣告,容易造成消費者的誤解。因此,在最新的電視和網絡節目視頻中,廣告片段的畫面角落都會印有“廣告”兩字的水印。正因如此,我們可以通過視頻畫面中的“廣告”字樣快速分辨其是否為廣告片段。然而,視頻數量和體積的龐大使得人工驗證幾乎沒有實施的可能,若能采用技術手段自動檢測視頻畫面中有無“廣告”字樣,則能自動判別當前幀是否為廣告,從而實現廣告片段的定位。
對于視頻中的廣告字樣檢測問題,通常需先對視頻進行關鍵幀提取,然后將其轉化為圖像中的文字識別問題。傳統的文字識別技術首先對圖像進行預處理,包括灰度化、降噪、二值化、字符切分、歸一化等,對校正后的單個文字圖像進行識別;然后,進行特征提取和降維;接著通過分類器識別出特征對應的文字;最后進行后處理,得到最終的識別結果。然而,對于廣告字樣檢測問題,一方面,“廣告”字樣通常在畫面中只占較小的部分,采用傳統識別方法會浪費大量資源,且只有兩個字,進行字符切分的意義也不大;另一方面,人工設計的特征具有一定的局限性,難以同時保障識別精度和速度。
發明內容
發明目的:本發明的目的是為了解決現有技術中的不足,提供一種可實現廣告片段的準確定位,滿足應用需求,保證識別精度以及速度,提高效率的基于廣告字樣檢測的廣告定位方法。
技術方案:本發明一種基于廣告字樣檢測的廣告定位方法,包括以下步驟:
(1)收集包含廣告字樣的初始訓練樣本數據,通過自動化樣本生成模塊擴充訓練集,生成擴充后訓練樣本;
(2)將步驟(1)中生成的擴充后訓練樣本進行深度卷積神經網絡訓練,生成廣告字樣檢測模型;
(3)對播出視頻進行抽幀處理,提取視頻中的圖像幀,得到播出視頻幀集合;
(4)對步驟(3)中得到的播出視頻幀集合中的每一幀進行廣告字樣檢測,得到初始的單幀檢測結果;
(5)利用先驗知識濾除誤檢,得到最終的單幀檢測結果;
(6)整合單幀檢測結果,同時加入生存周期時序約束,得到最終的廣告片段定位結果。
進一步的,步驟(1)在自動化生成樣本時包括“廣告”兩字字樣大小的調整,“廣告”兩字間距的調整以及“廣告”兩字字樣透明度的調整。
進一步的,步驟(2)中深度卷積神經網絡采用基于深度學習的物體識別算法。
進一步的,步驟(5)中的先驗知識包括“廣”和“告”兩字一定一同出現、“廣”和“告”兩字中間間隔不會超過一定閾值以及“廣”和“告”兩字旁邊通常沒有其他文字
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科火眼科技有限公司,未經北京中科火眼科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810058412.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車載人臉識別終端、系統、方法、裝置和存儲介質
- 下一篇:視頻分割方法和裝置





