[發明專利]一種圖像處理方法及裝置有效
| 申請號: | 201610533632.3 | 申請日: | 2016-07-07 |
| 公開(公告)號: | CN107590491B | 公開(公告)日: | 2021-08-06 |
| 發明(設計)人: | 金炫 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06F16/583 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 李輝 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 處理 方法 裝置 | ||
本申請公開了一種圖像處理方法及裝置,所述方法包括:獲取樣本圖片的標注信息、圖像維度特征和文字維度特征;其中,所述標注信息至少包括所述圖片的內容屬性;所述樣本圖片的圖像維度特征與所述樣本圖片包含的文本區域相關聯;利用所述樣本圖片的標注信息、所述圖像維度特征和所述文字維度特征,建立圖片識別模型;所述圖片識別模型用于識別待處理圖片的內容屬性。本申請有效提高了圖片識別的準確率。
技術領域
本申請涉及數據處理技術領域,尤其涉及一種圖像處理方法及裝置。
背景技術
隨著互聯網的發展,用戶可以使用互聯網方便地傳播、交流各種信息。用戶在享受互聯網傳播、獲取信息的便利的同時,也飽受垃圾信息的困擾。其中,圖片形式的垃圾信息在各種電子商務平臺、論壇社區中泛濫,例如廣告圖片、詐騙圖片等。用戶在瀏覽、搜索圖片信息時,大量存在的垃圾圖片,降低了用戶獲取有效信息的效率,嚴重影響了用戶體驗。因此,如何標識圖片的可信性成為一個重要的問題。
現有技術中,在標識圖片信息的可信性時,主要是通過檢測垃圾圖片例如廣告圖片的方式來標識非法圖片。具體地,現有技術存在一種使用CNN深度學習模型進行分類的圖片識別方法,利用深度學習自主提取圖片特征以對圖片進行分類,進而判斷是否垃圾圖片。然而,這種方式非常依賴于樣本圖片的標注數據,對區別于樣本圖片特征的其他圖片無法進行準確識別,因此存在準確性較低、靈活性不強的缺陷。
發明內容
有鑒于此,本申請提供了一種圖像處理方法及裝置,用以解決現有技術對圖像處理的準確性較低的技術問題。
為解決上述技術問題,本申請實施例的第一方面,提供了一種圖像處理方法,包括:分別對樣本圖片和待處理圖片進行特征提取處理,獲取所述樣本圖片的圖像維度特征、文字維度特征以及所述待處理圖片的圖像維度特征、文字維度特征,其中,所述樣本圖片和所述待處理圖片均包括文本區域,所述圖像維度特征與所述文本區域相關聯;比較所述待處理圖片的圖像維度特征與所述樣本圖片的圖像維度特征的距離以及所述待處理圖片的文字維度特征與樣本圖片的文字維度特征的距離,獲得比較結果;根據所述比較結果、所述樣本圖片的內容屬性確定所述待處理圖片的內容屬性。
可選的,所述圖像維度特征通過以下方式得到:將所述圖片劃分為多個顏色通道,提取每個顏色通道對應的文字區域;對所述每個顏色通道對應的文字區域進行合并處理,獲取文本行區域;基于獲取的所述文本行區域提取所述圖片的圖像維度特征。
可選的,所述圖像維度特征包括所述文本行區域的個數、所述文本行區域與非文字區域面積的比值、文本行區域中心位置水平偏移方差及文本行區域中心位置豎直偏移方差中的一個或任意組合。
可選的,所述文字維度特征通過以下方式得到:對圖片進行文字識別處理,獲得文字識別結果;將所述文字識別結果與預先存儲的關鍵詞庫中的關鍵詞進行匹配,獲得匹配結果;根據所述匹配結果獲取所述圖片的文字維度特征;其中,所述圖片的文字維度特征包括與所述文字識別結果匹配的關鍵詞的個數,和/或,與所述文字識別結果匹配的關鍵詞的置信度的和值。
為解決上述技術問題,本申請實施例的第二方面,提供了一種圖像處理方法,包括:獲取樣本圖片的標注信息、圖像維度特征和文字維度特征;其中,所述標注信息至少包括所述圖片的內容屬性;所述樣本圖片的圖像維度特征與所述樣本圖片包含的文本區域相關聯;利用所述樣本圖片的標注信息、所述圖像維度特征和所述文字維度特征,建立圖片識別模型;所述圖片識別模型用于識別待處理圖片的內容屬性。
可選的,獲取所述樣本圖片的圖像維度特征包括:將所述樣本圖片劃分為多個顏色通道,提取每個顏色通道對應的文字區域;對所述每個顏色通道對應的文字區域進行合并處理,獲取文本行區域;基于獲取的所述文本行區域提取所述樣本圖片的圖像維度特征。
可選的,所述樣本圖片的圖像維度特征包括所述文本行區域的個數、所述文本行區域與非文字區域面積的比值、文本行區域中心位置水平偏移方差及文本行區域中心位置豎直偏移方差中的一個或任意組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610533632.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種含有杉木的墻板基材及其制備方法
- 下一篇:一種模壓門板
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





