[發明專利]一種基于深度學習的臺標檢測方法在審
| 申請號: | 201710081113.2 | 申請日: | 2017-02-15 |
| 公開(公告)號: | CN106845442A | 公開(公告)日: | 2017-06-13 |
| 發明(設計)人: | 杭欣;郭偉偉 | 申請(專利權)人: | 杭州當虹科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/34;G06K9/42;G06K9/62;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310012 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 臺標 檢測 方法 | ||
技術領域
本發明涉及一種基于深度學習的臺標檢測方法,尤其涉及一種數字視頻信號處理和圖像識別領域的方法。
背景技術
隨著大量視頻信息涌入人們的現實生活,視頻臺標檢測作為對視頻來源分析的一個有效手段。通過視頻的臺標,可以相對容易的確定視頻的發布者,通過節目中的標識又能定位到具體的節目。通過這些重要語義信息,可以提供精確的視頻搜索。此外,通過檢測視頻節目中的臺標可以去除廣告片段(國外很多電視節目廣告片段中不含有臺標),提高觀賞性。同時,在視頻安全領域,視頻臺標檢測技術可以有效的確定視頻來源,為過濾固定電視臺的節目提供了自動監測手段。
現有的臺標檢測方法有提取臺標的全局特征(顏色特征、紋理特征和梯度特征)和局部特征(SURF特征),并通過SVM模型將這些特征融合,訓練得到一個完整的臺標檢測模型。但是這種傳統的算法處理速度慢、步驟繁多且檢測準確度不高。
發明內容
針對傳統臺標檢測模型算法存在的不足,本發明一種基于深度學習的臺標檢測方法,提出一種通過對包含臺標標志的圖片進行縮放、裁剪、平移、加黑邊等處理后,采用卷積、池化、全連接等技術手段對這些圖片進行反復離線臺標檢測訓練,并采用GPU來完成這一訓練過程,在訓練中不斷調整參數使得訓練收斂,從而獲取最優參數配置并使用該參數集初始化臺標檢測系統進行視頻圖像的在線臺標檢測的基于深度學習的臺標檢測方法。在訓練時對圖像人為進行多種變換處理可有效提高檢測結果的魯棒性,同時采用深度卷積和池化處理手段有效提高檢測的范化能力,加之采用GPU完成離線訓練過程大大提高訓練速度和效率,使得該方法相對傳統檢測方法更具高效、高速、簡單和高精度的優勢。
本發明解決其技術問題所采用的技術方案包括以下步驟:
訓練圖片輸入步驟,向離線訓練系統輸入訓練所需類型的圖片。
優選的,所述所需類型的圖片是指包含臺標標志的圖片。
圖片變換處理步驟,對輸入的圖片按照特定方式進行變換處理生成新的圖片。
優選的,所述特定方式包括對圖片進行縮放、平移、加黑邊和裁剪等,其目的是增強對臺標圖片識別能力的魯棒性。
圖片標注步驟,對圖片的特定信息進行標注。
優選的,所述特定信息包括:臺標的中心點坐標及臺標的寬、高等及類別信息。
離線訓練步驟,向離線訓練系統輸入特定圖片進行檢測訓練直到訓練收斂。
優選的,所述離線訓練系統包括:圖像縮放單元、單卷積及池化單元、多卷積及池化單元、多卷積單元和全連接層單元,所述訓練使用GPU處理完成。
優選的,所述圖像縮放單元負責將輸入圖像的大小縮放為448*448大小。
優選的,所述單卷積采用的卷積核包括:7*7、3*3和1*1三種,所述多卷積單元為多個卷積層形成的卷積單元,本離線訓練系統使用了24個級聯卷積層,單卷積和多卷積處理均為局部連接。
優選的,所述池化處理的作用是增強魯棒性并減少參數輸入、防止過擬合現象發生,其輸入為上一次卷積產生的結果,且不需要參數輸入。
優選的,所述全連接層共兩個,為全網絡連接,負責將本層每個節點和上層的所有節點建立連接以提高特征的范化能力,且第二個全連接層維度較第一個低,作用是降維。
優選的,所述離線訓練步驟中,輸入訓練圖片進行循環檢測訓練,結束條件為:在當前參數配置下,訓練收斂,凍結此時使用的參數集,用于初始化在線臺標檢測模型。
在線檢測步驟,利用離線訓練系統生成的參數集初始化在線檢測系統,并采用該系統對視頻臺標進行在線檢測。
采用上述技術方案,本發明具有以下優點:
本發明涉及一種基于深度學習的臺標檢測方法,通過對包含臺標標志的圖片進行縮放、裁剪、平移、加黑邊等處理后,采用卷積、池化、全連接等技術手段對這些圖片進行反復離線臺標檢測訓練,并使用GPU來完成這一訓練過程,在訓練中不斷調整參數使得訓練收斂,從而獲取最優參數配置并使用該參數集初始化臺標檢測系統進行視頻圖像的在線臺標檢測。在訓練時對圖像人為進行多種變換處理可有效提高檢測結果的魯棒性,同時采用深度卷積和池化處理手段有效提高檢測的范化能力,采用GPU完成離線訓練過程大大提高訓練速度和效率,使得該方法相對傳統檢測方法更具高效、高速、簡單和高精度的優勢。
附圖說明
圖1為本發明較佳實施方式的一種基于深度學習的臺標檢測方法的步驟示意圖。
圖2為本發明較佳實施方式的一種基于深度學習的臺標檢測方法的詳細流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州當虹科技有限公司,未經杭州當虹科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710081113.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于圖像識別航空蓄電池電量充滿預測方法
- 下一篇:一種易裝拆式LED燈具





