[發明專利]文字合成圖像的識別方法及裝置、圖像識別方法在審
| 申請號: | 201710146424.2 | 申請日: | 2017-03-13 |
| 公開(公告)號: | CN108573255A | 公開(公告)日: | 2018-09-25 |
| 發明(設計)人: | 金炫 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46;G06K9/62 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 合成 圖像 文字合成 圖像識別 文字區域 非合成 預設 原始圖像 申請 | ||
本申請公開了一種文字合成圖像的識別方法及裝置、圖像識別方法。其中,該方法包括:獲取待識別合成圖像中的合成文字區域,其中,待識別合成圖像為將文字合成至原始圖像所得到的圖像;獲取合成文字區域的第一特征值,該第一特征值用于反映合成文字對待識別合成圖像的影響程度;獲取待識別合成圖像的預設類型,以及與預設類型對應的第二特征值,其中,第二特征值用于反映合成文字和/或非合成文字對待識別合成圖像的影響程度;基于第一特征值和第二特征值共同確定待識別合成圖像的識別結果。本申請解決了相關技術中無法在對非合成文字的圖像進行排除的同時,識別結果表示文字合成圖像中合成文字的影響程度的技術問題。
技術領域
本申請涉及圖像識別領域,具體而言,涉及一種文字合成圖像的識別方法及裝置、圖像識別方法。
背景技術
目前為止,各個購物平臺商家展示的圖像多為人為修改圖像,即在拍攝圖像上打印文字進行宣傳,也稱之為文字合成圖像。此類圖像嚴重影響平臺的美觀與潔凈,同時也有可能帶來一些圖像的侵權問題。在一些交互平臺等評論區域時,圖像中的各種引流信息以及廣告影響著平臺的正常運營。
目前,針對文字合成圖像識別有兩種方案,一種是基于文本檢測的文字合成圖像識別方法:提取圖像中文本區域,然后判斷圖像中的文本對于圖像中物體的影響程度,然后給出文字合成圖像的評估模型;一種是基于圖像分類的文字合成圖像識別方法:直接對于圖像進行二分類標注,標注為文字合成圖像以及非文字合成圖像,利用深度學習模型進行訓練,得到分類模型對圖像進行打分。
但是,使用基于文本檢測的文字合成圖像識別方法主要難以解決非合成文字的圖像的排除,基于文本檢測的方法很難區分圖像中的文字為合成文本還是自然場景文本,因此對于自然場景中含有大量文字的圖像容易嘗試誤檢;而基于分類的方法較為依賴樣本,不同場景往往很難用單一模型覆蓋,擴展成本較高,另一方面模型分數并不能表示合成文字的影響程度,只能夠反應與樣本的相似性。
針對上述的問題,目前尚未提出有效的解決方案。
發明內容
本申請實施例提供了一種文字合成圖像的識別方法及裝置、圖像識別方法,以至少解決相關技術中無法在對非合成文字的圖像進行排除的同時,識別結果表示文字合成圖像中合成文字的影響程度的技術問題。
根據本申請實施例的一個方面,提供了一種文字合成圖像的識別方法,包括:獲取待識別合成圖像中的合成文字區域,其中,待識別合成圖像為將文字合成至原始圖像所得到的圖像;獲取合成文字區域的第一特征值,該第一特征值用于反映合成文字對待識別合成圖像的影響程度;獲取待識別合成圖像的預設類型,以及與預設類型對應的第二特征值,其中,第二特征值用于反映合成文字和/或非合成文字對待識別合成圖像的影響程度;基于第一特征值和第二特征值共同確定待識別合成圖像的識別結果。
根據本申請實施例的另一方面,還提供了一種文字合成圖像的識別裝置,包括:第一獲取單元,用于獲取待識別合成圖像中的合成文字區域,其中,待識別合成圖像為將文字合成至原始圖像所得到的圖像;第二獲取單元,用于獲取合成文字區域的第一特征值,該第一特征值用于反映合成文字對待識別合成圖像的影響程度;第三獲取單元,用于獲取待識別合成圖像的預設類型,以及與預設類型對應的第二特征值,其中,第二特征值用于反映合成文字和/或非合成文字對待識別合成圖像的影響程度;確定單元,用于基于第一特征值和第二特征值共同確定待識別合成圖像的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710146424.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車牌字符灰度圖的生成方法
- 下一篇:一種變電站壓板設備狀態識別方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





