[發明專利]一種色情圖像偵測的方法和系統有效
| 申請號: | 201110336168.6 | 申請日: | 2011-10-28 |
| 公開(公告)號: | CN103093180A | 公開(公告)日: | 2013-05-08 |
| 發明(設計)人: | 薛暉 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 色情 圖像 偵測 方法 系統 | ||
技術領域
本申請涉及圖像識別的技術領域,特別是涉及一種色情圖像偵測的方法和系統。
背景技術
隨著互聯網的快速發展,互聯網在為人們認識世界、方便生活、提供幫助的同時,也為有害信息的廣泛傳播提供了便捷的途徑,例如,人們常常會受到含有如色情、暴力等不健康的色情圖像和視頻的侵擾;網絡犯罪活動的現象也日漸增多,如色情小說、色情圖像和錄像的傳播,它們擾亂社會秩序、破壞社會風氣,給人們尤其是青少年帶來了極大的負面影響。
據統計,全球現有色情網站數以百萬,另外,約28%的網站包含成人內容;一個人在互聯網上隨便點擊每七次就有一次可能點擊到色情站點,25%的小網迷曾主動訪問色情網站,20%的人曾被動收到色情信息,全球75%的家長明確表示擔心不良信息對孩子的負面影響;全球電子郵件中有大約55%是垃圾郵件,而其中色情圖像大約占20%左右。
目前,過濾色情圖像信息主要采用以下三種策略:
1、文本關鍵詞過濾;
2、針對包含成人內容的網站建立黑名單,從而根據IP地址進行過濾;
3、基于內容進行圖像識別。
對于第一種文本關鍵詞過濾的方法而言,盡管文本檢索、自然語言處理等技術已經發展地相當成熟,但單純的基于文本過濾的方式,仍然存在著較大的漏殺率。主要原因之一在于文本修改的成本較低,惡意用戶往往可以通過嘗試不同的文字變形(錯別字、象形文字等)來突破單純依賴辭典的關鍵詞過濾手段。另一方面,圖像對人眼的沖擊力往往更大(換言之,色情圖像的危害程度相較文字更大),惡意用戶甚至直接將文字印在圖像上,對于這類情況,文本過濾的方式往往無能為力。
對于第二種根據黑名單網站IP地址進行過濾的方法而言,由于IP過濾的方式是一種靜態防御的方式,無法第一時間發現包含成人內容的網站,而往往依賴其它技術或者人工舉報的方式去維護黑名單。
與上述兩種方法相比,第三種基于內容的圖像識別技術通過分析、提取色情圖像不同于正常圖像的特征,作為機器判斷的依據,提供了更靈活、直接且文字無關的處理手段。
傳統的基于內容的圖像識別技術,基本上單純依賴皮膚顏色檢測,往往會有較為嚴重的誤判問題,即對于某些正常圖像,只要其出現了黃色背景、紡織物、毛發等情況,都有很大概率會被過濾為色情圖像。特別的,對于電子商務網站中存在的大量內衣、首飾等產品圖像,存在十分嚴重的誤殺率。
因此,目前需要本領域技術人員迫切解決的一個技術問題就是:提出一種色情圖像的偵測技術,用以提高色情圖像識別的召回率和準確率。
發明內容
本申請的目的是提供一種色情圖像偵測的方法和系統,用以提高色情圖像識別的召回率和準確率。
為了解決上述問題,本申請公開了一種色情圖像偵測的方法,包括:
檢測目標圖像中的皮膚區域;
若所述皮膚區域在目標圖像整體區域中的占比大于第一預設閾值,則檢測所述目標圖像中的連通域;
判斷所述連通域在皮膚區域中的分布是否滿足預置規則,若是,則判定所述目標圖像為色情圖像。
優選的是,所述檢測目標圖像中的皮膚區域的步驟進一步包括:
對目標圖像進行膚色檢測,獲得候選皮膚區域;
在所述候選皮膚區域在目標圖像整體區域中的占比大于第一預設閾值時,對所述候選皮膚區域進行紋理特征檢測;
確定所述紋理特征強度大于第二預設閾值的候選皮膚區域為皮膚區域。
優選的是,所述判斷連通域在皮膚區域中的分布是否滿足預置規則的步驟進一步包括:
獲取各連通域的面積,判斷其中面積最大的連通域在皮膚區域中的占比是否大于第三預設閾值;
和/或,
獲取各連通域的面積,判斷其中面積大小在前n位的連通域,在皮膚區域中的占比是否大于第四預設閾值,所述n大于1。
優選的是,在所述判定目標圖像為色情圖像的步驟之前,還包括:
檢測目標圖像中的臉部區域;
若所述臉部區域在目標圖像整體區域中的占比小于第五預設閾值,則根據所述臉部區域估算軀干區域,并檢測軀干區域中的皮膚區域;
若所述軀干區域中的皮膚區域在軀干區域中的占比超過第六預設閾值,則判定所述目標圖像為色情圖像。
優選的是,所述第一預設閾值為20%;所述紋理特征檢測采用邊緣提取算法,所述第二預設閾值為5;所述第三預設閾值為5%;所述n為3,所述第四預設閾值為50%;所述第五預設閾值為65%;所述第六預設閾值75%。
本申請還公開了一種色情圖像偵測的方法,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110336168.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種果蔬識別的方法及系統
- 下一篇:便于穿線的縫紉機機頭
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





