[發明專利]基于深度卷積神經網絡的互聯網直播色情圖像檢測方法在審
| 申請號: | 201810025167.1 | 申請日: | 2018-01-11 |
| 公開(公告)號: | CN108154134A | 公開(公告)日: | 2018-06-12 |
| 發明(設計)人: | 周建政;明建華;鄧豪 | 申請(專利權)人: | 天格科技(杭州)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;H04N21/24 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 鄭海峰 |
| 地址: | 310005 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 互聯網直播 色情圖像 直播 檢測 預處理 樣本圖像數據 高速增長 監管模式 監管效率 聯合測試 模型配置 人力成本 色情內容 算法模型 圖像內容 訓練模型 在線圖像 自動檢測 準確率 迭代 截取 裁剪 視頻 巡查 圖像 學習 運營 審查 監管 優化 | ||
1.一種基于深度卷積神經網絡的互聯網直播色情圖像檢測方法,其包括如下步驟:
1) 視頻直播樣本圖像預處理;
對負樣本和少量正樣本進行圖像大小處理,利用卷積神經網絡進行模型訓練,得到初始訓練模型;對正樣本圖像進行設定步長的滑塊裁剪處理,從而得到大量裁剪完成的特定尺寸備用樣本圖像;利用初始訓練模型針對備用樣本圖像進行色情類別檢測,由于初始訓練模型存在一定的錯誤識別率,需對錯誤識別的樣本再次篩選,得到大量待訓練正樣本圖像,投入到下一次的模型訓練,并對正樣本繼續進行設定步長的滑塊裁剪處理、色情類別檢測,對錯誤識別的樣本再次篩選,直至得到所需數量的正樣本;
2) 基于深度學習的卷積神經網絡模型訓練;
利用負樣本和步驟1)得到的正樣本對步驟1)訓練后的卷積神經網絡模型進行多種網絡模型訓練,直至訓練模型收斂;
3) 基于多模型多裁剪的圖像識別測試;
利用測試樣本集對模型進行正確識別率檢測,若模型的正確識別率低于實際場景的識別率門限要求,則繼續進行模型優化訓練,直至達到要求識別率;
4) 視頻直播場景的內容檢測與應用;
完成深度卷積神經網絡模型的訓練和測試后,將模型應用到實際的視頻直播場景中,對待檢測直播視頻進行在線圖像動態截取,并通過多網絡模型進行色情類別檢測。
2.根據權利要求1所述的一種基于深度卷積神經網絡的互聯網直播色情圖像檢測方法,其特征在于:所述的利用測試樣本集對模型進行正確識別率檢測的方法具體為:
1)針對每一張測試樣本圖像,進行特定大小的圖像裁剪,得到20張裁剪后的圖像,若不同模型的輸入圖像大小要求不同,則分別裁剪出不同大小的20張圖像;
2)按照設定步長進行圖像滑塊裁剪,最終獲得20張圖像塊,用于模型測試;
3)將裁剪完成的20張圖像塊送入訓練好的模型中進行分類測試,得到每個圖像塊判定為色情內容和非色情內容的概率,并將20張圖像塊判定為色情內容概率的最大值作為這張圖像判定為色情內容的概率值;
4)采用步驟3)的方法,利用多個網絡模型進行相同方法的測試,得到每個模型判定為色情內容的概率值,并進行平均處理,作為本張圖片判定為色情內容的最終概率;
5)若最終概率大于色情判定門限值,則判定本張圖片為色情圖像,若小于門限值,則判定為非色情圖像;
6)將這張圖片的最終判定類別與本張圖片的真實標簽進行比較,若標簽值相同,則表示訓練模型判定正確,若不同,表示訓練模型判定錯誤;
7)重復1)-6)的步驟,對每一張測試樣本圖像進行類別判定,直到所有測試樣本測試完畢,統計訓練模型在測試樣本的正確識別率;
8)若模型的正確識別率低于實際場景的識別率門限要求,則收集模型錯誤分類的樣本圖像,分析錯誤分類概率高的圖像類型;對于模型錯誤分類概率高的訓練樣本圖像,從驗證樣本集中再次挑選相同類型的圖像樣本投入到訓練樣本集中,返回步驟2)進行模型優化訓練;若達到要求識別率,則停止訓練。
3.根據權利要求1所述的一種基于深度卷積神經網絡的互聯網直播色情圖像檢測方法,
其特征在于:所述的步驟4)具體為:利用步驟3)訓練好的模型進行檢測,若當前圖像幀判定為色情圖像,則縮短后臺自動截圖時間為:N/2秒,連續2次均判定為色情圖像,則認為是色情圖像的直播;若當前幀圖像判定為非色情圖像,并且連續2次均判定為非色情圖像,則延長后臺自動截取時間為:2N秒,其中N為原截圖時間間隔;對于每一個視頻直播,直播時間每達到設定分鐘,將系統圖像自動截取時間歸置為基準時間,并重新計算連續次數。
4.根據權利要求3所述的一種基于深度卷積神經網絡的互聯網直播色情圖像檢測方法,
其特征在于:所述利用步驟3)訓練好的模型進行檢測的具體步驟為:針對后臺截取的圖像,進行滑塊預處理,生成不同模型需要的20個待分類圖像塊,送入卷積神經網絡模型進行類別判定;分別針對20張待分類圖像,利用卷積神經網絡模型進行類別判定,輸出判定為色情圖像塊概率的最大值,作為本張圖片的當前模型的色情類別概率;利用多個模型重復以上測試,對輸出判定結果進行平均,得到本張圖像判定為色情圖像的最終概率;若判定為色情圖像的最終概率大于0.5,則判定本張圖像為色情圖像,若小于0.5,則判定本張圖像為非色情圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天格科技(杭州)有限公司,未經天格科技(杭州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810025167.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于非對稱聯合學習的人臉畫像-照片識別方法
- 下一篇:一種手指中線提取方法





