[發(fā)明專利]一種基于深度學習的混合卡通的圖像檢測方法在審
| 申請?zhí)枺?/td> | 202110601966.0 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113298791A | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設計)人: | 鄭炎;陳耿生;鄭行濤 | 申請(專利權(quán))人: | 中電福富信息科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/90;G06T3/40;G06N3/04;G06K9/62 |
| 代理公司: | 福州君誠知識產(chǎn)權(quán)代理有限公司 35211 | 代理人: | 彭東 |
| 地址: | 350000 福建省福州*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學習 混合 卡通 圖像 檢測 方法 | ||
本發(fā)明公開一種基于深度學習的混合卡通的圖像檢測方法,首先準備圖片樣本,準備多種類型的圖像,定義五個分類標簽卡分別對應不同數(shù)值;樣本按比例分隔為訓練集與測試集,然后對圖片縮放到AxB大小,并轉(zhuǎn)為AxBx3的矩陣;將對應的標簽分別轉(zhuǎn)為one?hot編碼形式,通過特征提取層將矩陣轉(zhuǎn)為多維的向量然后接256隱藏層的全連接層以及Dropout層;接上5個輸出神經(jīng)元的全連接層,使用softmax作為激活函數(shù)并采用交叉熵為目標損失函數(shù),經(jīng)由adam優(yōu)化器進行損失優(yōu)化后得到最優(yōu)模型;將待檢測的圖像輸入到訓練出檢測不良圖像的模型中輸出多個分類的概率分布,然后轉(zhuǎn)換為實際的標簽值。本發(fā)明不依賴任何用戶行為數(shù)據(jù),可以檢測任何來源的圖像。
技術(shù)領域
本發(fā)明涉及人工智能,尤其涉及一種基于深度學習的混合卡通的圖像檢測方法。
背景技術(shù)
傳統(tǒng)的不良圖片的檢測方法有以下幾種:
1.皮膚區(qū)域檢測法:該方法主要是采取對像素的顏色通道根據(jù)皮膚顏色區(qū)間進行劃定,然后進行統(tǒng)計。對統(tǒng)計后的值進行閾值判定,大于閾值的認為是不良圖像。這種方法簡單粗暴,但是誤判率很高。很容易將黑白的不良圖片誤判為正常,而像證件照這種臉部在圖像占比較高的圖片誤判為不良。
2.指紋檢測比對法:該方法是在已有不良圖片庫的基礎上,通過與庫里的不良圖片的指紋碼做比較,來檢測出不良圖片。比較常用的指紋碼像MD5這種方式檢測效率很高,所以被百度網(wǎng)盤使用。用戶上傳圖片文件的時候會與被其他用戶舉報過的圖片的MD5值進行比對,比對的MD5值一致的就會被判定為不良。不良的誤判率很低幾乎為零,但是漏判率很高,圖片文件被篡改一個字節(jié),都會繞過不良的判斷,所以更不能應對分辨率不同的情況。所以出現(xiàn)了一種改良后的算法,具體是通過將圖片經(jīng)過縮放到一個相同的像素大小比如16x16,然后通過卷積的方式算出一個16x16的特征矩陣,然后通過與不良圖像庫里的圖片比對特征差,差值越小則相似度越高。但是這種方式還是需要海量的不良圖片特征庫作為基礎,對于與庫里的圖片完全不同的圖像無能為力。
3.數(shù)據(jù)挖掘法:該方法是通過上傳用戶積累的歷史行為進行數(shù)據(jù)挖掘,少數(shù)不良圖片上傳者與大部分正常用戶在行為上往往會有很大的不同。利用這點對用戶的行為進行聚類分析,從而分析得到用戶的行為分類。然后根據(jù)用戶的行為來鑒別其上傳的圖片是否是不良。這種方案需要從海量用戶歷史行為的數(shù)據(jù)中進行分析,對數(shù)據(jù)需要多維度進行分析,從大局上來看是屬于比較可行的方案,但是如果對于給定的單張圖片進行檢測就無能為力。
4.基于特征與機器學習的檢測法:該方法需要人工對不良圖像進行特征分析并得到特征規(guī)則。然后對于輸入的圖片通過特征規(guī)則提取特征信息。然后交與傳統(tǒng)的機器學習分類器,比如SVM進行分類。最后根據(jù)分類結(jié)果鑒別出是否是不良圖片。這種方式雖然比起第一種的皮膚區(qū)域檢測法來說準確率會有較大的提升,也彌補了MD5檢測法對于圖片檢測容錯的無能為力,也解決了數(shù)據(jù)挖掘方式對于海量用戶歷史行為的依賴。但是由于不是端到端的學習模式,所以這種方法也有比較明顯的缺點。第一,需要耗費大量的人工時間進行特征提取。第二,由于特征提取的好壞很大程度影響了不良圖像檢測的準確率,所以對于特征提取的人員需要更加專業(yè)的技術(shù)知識。
所以不同于文字鑒黃,圖像鑒黃目前仍大量依賴人工不良檢測師,一方面存在審核標準的主觀誤差,另一方面也不利于人工不良檢測師這一職業(yè)人員的長期心理健康。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于深度學習的混合卡通的圖像檢測方法。
本發(fā)明采用的技術(shù)方案是:
一種基于深度學習的混合卡通的圖像檢測方法,具體包括以下步驟:
S1,訓練模型:將大量標記好標簽的圖片樣本喂給深度神經(jīng)網(wǎng)絡模型訓練出檢測不良圖像的模型,具體步驟如下:
S1-1,首先準備圖片樣本,準備多種類型的圖像,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中電福富信息科技有限公司,未經(jīng)中電福富信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110601966.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





