[發明專利]移動互聯網上的低俗圖片自動識別與內容過濾方法有效
| 申請號: | 202011084050.4 | 申請日: | 2020-10-12 |
| 公開(公告)號: | CN112395442B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 秦飛巍;涂岱鍵;姚金良;樊謹;沈夢欣;黃甌涵 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F16/535 | 分類號: | G06F16/535;G06F16/54;G06F16/55;G06F16/583;G06F16/9535;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/764;G06V10/82 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 移動 互聯網 低俗 圖片 自動識別 內容 過濾 方法 | ||
1.移動互聯網上的低俗圖片自動識別與內容過濾方法,其特征在于包括如下步驟:
步驟1.基于兩大開源數據集,建立用于訓練和測試四分類低俗圖像數據集,同時對數據集中各個類別的樣本進行計算;
所述的兩大開源數據集為NSFW數據集和NPDI數據集;
步驟2.進行數據預處理:數據歸一化以及數據增廣;
步驟3.構建多階段注意力機制的神經網絡架構,包括對基礎的注意力機制單元和深度神經網絡的拓撲結構的設計;
步驟4.基于自建的四分類低俗圖像數據集,對多階段注意力機制的神經網絡架構進行訓練,獲得注意力機制模型;
步驟5.將訓練過后的注意力機制模型用數據的測試集進行測試,以驗證模型的準確率等指標;
步驟6.將最優的注意力機制模型用于數據的可視化,以熱力圖的形式展現出圖像的高權重重點區域;
步驟4具體實現如下:
首先通過ImageNet預訓練模型,然后保留特征提取部分的參數并微調模型;最初使用的損失函數如下所示:
其中,N代表訓練數據總數,C代表數據集的類別總數;當屬于第n個的數據的預測屬于其正確類別i時等于1,否則等于0;表示模型預測第n個數據屬于其正確類別i的概率,這是通過Softmax函數來激活的;
為了更好地優化決策過程,增加一個懲罰項來降低模型對自身預測結果的自信度,改進的損失函數如下所示:
其中,α0是一個用于降低模型自信程度的超參數;然而當模型認為數據大概率屬于某個特定類別時,預測結果之間的交叉墑會相對增大,這會導致Loss的值的增加;最終將損失函數進一步改為如下所示:
其中β代表L2懲罰參數,Θ代表模型的權重。
2.根據權利要求1所述的移動互聯網上的低俗圖片自動識別與內容過濾方法,其特征在于步驟1所述的基于兩大開源數據集包括NSFW數據集和NPDI數據集;四分類低俗圖像數據集共包含四個類別:正常、輕微敏感、高度敏感、色情,每個類別中對性別、種族、身型、外貌特征都較為均勻地分布。
3.根據權利要求1或2所述的移動互聯網上的低俗圖片自動識別與內容過濾方法,其特征在于步驟3所述的構建多階段注意力機制的網絡架構包括多個注意力階段;每個注意力階段包含基礎的注意力機制單元和深度神經網絡的拓撲結構,其中每個注意力階段的拓撲結構包含兩個部分:通道域和空間域;且每個注意力階段輸出的特征圖作為下一個注意力階段的輸入圖像。
4.根據權利要求3所述的移動互聯網上的低俗圖片自動識別與內容過濾方法,其特征在于在通道域中,輸入圖像經過連續的兩個基礎的注意力機制單元處理后得到特征圖F(x);在空間域中,輸入圖像先通過多個池化層進行下采樣,再通過上采樣將圖像恢復原來的尺寸,從而在采樣后的圖像中提取出關鍵信息得到特征圖M(x),此處通過Sigmoid函數正則化;為了防止出現梯度消失問題在通道域和空間域中增加了一條捷徑,最終在注意力階段輸出的特征圖為:
F(x)+F(x)×M(x) (1)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011084050.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種便于清理內壁的中藥搗碎裝置
- 下一篇:縫紉機中的驅動結構





