[發明專利]用于識別光柵化圖像中電子垃圾的系統及方法有效
| 申請號: | 201110292224.0 | 申請日: | 2011-09-30 |
| 公開(公告)號: | CN102368299A | 公開(公告)日: | 2012-03-07 |
| 發明(設計)人: | 葉夫根尼·P·斯米爾諾夫 | 申請(專利權)人: | 卡巴斯基實驗室封閉式股份公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06Q10/00 |
| 代理公司: | 北京市磐華律師事務所 11336 | 代理人: | 董巍;顧珊 |
| 地址: | 俄羅斯聯*** | 國省代碼: | 俄羅斯;RU |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 光柵 圖像 電子垃圾 系統 方法 | ||
技術領域
本發明總的來講涉及計算機科學領域,且尤其涉及用于識別圖像中電子垃圾(spam)的系統、方法和計算機程序產品。
背景技術
隨著基于非應邀電子郵件(unsolicited?email)的產品和服務廣告日益增加,對通過通信網絡接收到的email消息中的電子垃圾加以識別成為十分緊迫的問題。有許多不同的用于識別普通文本消息中電子垃圾的技術方案,但對于嵌入到圖像中的文本電子垃圾以及垃圾圖像(spam?image),諸如非應邀產品、服務等的圖像來說,識別電子垃圾的任務則困難得多。基于圖像的電子垃圾之所以難以識別,是因為電子垃圾檢測系統必須首先識別圖像中的文本然后才能確定是否可將該文本歸類為電子垃圾。對于圖像中不存在文本的情況,監測系統必須識別圖像本身是否為電子垃圾。已知的用于識別圖像中電子垃圾的方案都有大量缺陷,諸如由算法復雜性和電子垃圾檢測過程中的大量錯誤所導致的執行速度過慢。因此,需要更加高效和有效的機制來檢測圖像中的電子垃圾。
發明內容
本發明披露了用于檢測光柵圖像中電子垃圾的系統、方法和計算機程序產品。
在一個示范性實施例中,該方法包括接收圖像進行處理。如果該圖像為矢量(vector)格式,可將其轉化為光柵格式。如果該圖像為多顏色格式,可將其轉化為灰度格式。隨后,識別所述光柵圖像中的一個或多個對象,包括文本和圖形對象。對于過小的對象,例如直徑很小的像素,可不進行進一步的處理。隨后,跟蹤剩余對象的輪廓??刹捎孟铝蟹绞絹韺崿F輪廓跟蹤:將背景識別為具有第一灰度的多個像素,識別具有第二灰度的一個或多個像素,在具有第二灰度的第一像素處定義對象輪廓,并且沿著與所述背景像素相鄰的、具有第二灰度的像素的方向反復擴展所述對象的輪廓。
一旦所述對象的輪廓跟蹤完成,可生成對象特征。對象特征識別出構成所述輪廓的圖形屬性,例如包括所述輪廓的直線段長度、線段之間的角度、弧線長度、弧線的曲率半徑以及其它圖形要素。這些屬性可以被確定,例如通過在多個所選輪廓點處構建切線、計算該切線相對于水平線的傾角角度并基于計算出的傾角角度確定對象輪廓的屬性。隨后將該對象特征與已知的電子垃圾特征加以比較以確定接收到的圖片是否包含電子垃圾。如果與所述已知電子垃圾特征基本相似的對象特征的數目超過預設的閾值,得到該圖像包含電子垃圾的結論。否則,得到該圖像不包含電子垃圾的結論且圖像處理結束。
以上對本發明示范性實施例的簡要概括用于提供對這類實施例的基本理解。此概括并不是本發明設想的所有方面的寬泛概述,并且既不意圖確定所有實施例的重要或關鍵要素也不意圖限制任何或所有實施例的范圍。其唯一的目的在于簡要地提出一個或多個方面的一些構思來作為下面更為詳細的描述的前序。為了實現前述的以及相關的目的,一個或多個實施例包括將在下面充分描述且在權利要求書中特別指出的特征。下面的描述和附圖詳細地闡述了一個或多個實施例的某些示范性特征。但是,這些特征僅表示其中可以采用各個方面的原理的各種方式中的一些,并且此描述意圖包括所有這樣的方面及其等同物。
附圖說明
附圖并入說明書中并構成說明書的一部分,示出了本發明的一個或多個示范性實施例,與詳細描述一起用于解釋本申請實施例的原理和實施方式。
附圖中:
圖1示出了一種示例性計算機系統,用于實現本發明所披露的用于圖像電子垃圾檢測的技術;
圖2為根據一個示范性實施例,用于圖像電子垃圾檢測的算法流程圖;
圖3示出了包含電子垃圾的圖像的示例;
圖4顯示了偏暗閾值選定后,一幅包含電子垃圾的圖像的變色示例;
圖5顯示了圖4所示圖像的局部放大;
圖6顯示了偏亮閾值選定后,一幅包含電子垃圾的圖像的變色示例;
圖7顯示了圖6所示圖像的局部放大;
圖8a和圖8b示出了光柵變色為黑白以及使用附帶輪廓清晰度選擇的灰度圖像的示例;
圖9示出了構建對象周圍輪廓的示例;
圖10顯示了根據一個示范性實施例的用于跟蹤對象輪廓的算法;
圖11顯示了圖10中算法的執行示例;
圖12為一個示例,示出了一定數量的形狀,這些形狀將被認為是同一形狀;
圖13示出了所生成的圖像特征與已知垃圾圖像對象特征的比較;
圖14示出了包含電子垃圾的圖形圖像的示例;
圖15顯示了同一圖像,其中使用本申請所披露的技術來檢測其電子垃圾對象。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于卡巴斯基實驗室封閉式股份公司,未經卡巴斯基實驗室封閉式股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110292224.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:利用固體催化劑一鍋法制備氨基甲酸酯
- 下一篇:快裝三通接頭
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





