[發明專利]圖像處理方法、裝置及系統在審
| 申請號: | 202110206738.3 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN114973218A | 公開(公告)日: | 2022-08-30 |
| 發明(設計)人: | 龍如蛟;王鵬飛;楊志博;王永攀 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V10/764;G06V10/82;G06V30/19;G06N3/04;G06N3/08 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 謝湘寧;張文華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 裝置 系統 | ||
本申請公開了一種圖像處理方法、裝置及系統。其中,該方法包括:獲取文本圖像;利用結構檢測模型對文本圖像進行識別,得到文本圖像的識別結果,其中,識別結果包括:文本圖像包含的文字的屬性,以及文字在文本圖像中的位置;其中,結構檢測模型包括:第一分支模型和第二分支模型,第一分支模型用于識別文本圖像,得到文字在文本圖像中的位置,第二分支模型用于識別文本圖像,得到文字的屬性,結構檢測模型是依次利用第一訓練樣本和第二訓練樣本進行訓練得到。本申請解決了相關技術中結構檢測模型的訓練成本較高的技術問題。
技術領域
本申請涉及圖像處理領域,具體而言,涉及一種圖像處理方法、裝置及系統。
背景技術
在信息時代,數據往往是不缺的,缺的是結構化的數據。各個廠家都有大量的非結構化數據,但是這些數據往往無法直接使用。目前,可以通過標注將非結構化數據轉化為結構化數據,但是需要花費大量的人力和物力;還可以通過標注一部分數據用于訓練結構化檢測算法從而對剩余非結構化數據實現結構化,但是訓練一個好的結構化算法模型對于每一種數據依然需要上千張圖片,即,現有的結構檢測模型訓練成本較高。
針對上述的問題,目前尚未提出有效的解決方案。
發明內容
本申請實施例提供了一種圖像處理方法、裝置及系統,以至少解決相關技術中結構檢測模型的訓練成本較高的技術問題。
根據本申請實施例的一個方面,提供了一種圖像處理方法,包括:獲取文本圖像;利用結構檢測模型對文本圖像進行識別,得到文本圖像的識別結果,其中,識別結果包括:文本圖像包含的文字的屬性,以及文字在文本圖像中的位置;其中,結構檢測模型包括:第一分支模型和第二分支模型,第一分支模型用于識別文本圖像,得到文字在文本圖像中的位置,第二分支模型用于識別文本圖像,得到文字的屬性,結構檢測模型是依次利用第一訓練樣本和第二訓練樣本進行訓練得到。
根據本申請實施例的另一方面,還提供了一種圖像處理方法,包括:顯示文本圖像;在文本圖像上標記文本圖像的識別結果,其中,識別結果利用結構檢測模型對文本圖像進行識別得到,識別結果包括:文本圖像包含的文字的屬性,以及文字在文本圖像中的位置;其中,結構檢測模型包括:第一分支模型和第二分支模型,第一分支模型用于識別文本圖像,得到文字在文本圖像中的位置,第二分支模型用于識別文本圖像,得到文字的屬性,結構檢測模型是依次利用第一訓練樣本和第二訓練樣本進行訓練得到。
根據本申請實施例的另一方面,還提供了一種圖像處理方法,包括:獲取第一訓練樣本和第二訓練樣本;利用第一訓練樣本對初始模型進行訓練,得到初始結構檢測模型;利用第二訓練樣本對初始結構檢測模型進行訓練,得到結構檢測模型,其中,結構檢測模型包括:第一分支模型和第二分支模型,第一分支模型用于識別文本圖像,得到文本圖像包含的文字在文本圖像中的位置,第二分支模型用于識別文本圖像,得到文字的屬性。
根據本申請實施例的另一方面,還提供了一種圖像處理方法,包括:獲取證件圖像;利用結構檢測模型對證件圖像進行識別,得到證件圖像的識別結果,其中,識別結果包括:證件圖像包含的文字的屬性,以及文字在證件圖像中的位置;其中,結構檢測模型包括:第一分支模型和第二分支模型,第一分支模型用于識別證件圖像,得到文字在證件圖像中的位置,第二分支模型用于識別證件圖像,得到文字的屬性,結構檢測模型是依次利用第一訓練樣本和第二訓練樣本進行訓練得到。
根據本申請實施例的另一方面,還提供了一種圖像處理方法,包括:接收客戶端上傳的文本圖像;利用結構檢測模型對文本圖像進行識別,得到文本圖像的識別結果,其中,識別結果包括:文本圖像包含的文字的屬性,以及文字在文本圖像中的位置;輸出識別結果至客戶端;其中,結構檢測模型包括:第一分支模型和第二分支模型,第一分支模型用于識別文本圖像,得到文字在文本圖像中的位置,第二分支模型用于識別文本圖像,得到文字的屬性,結構檢測模型是依次利用第一訓練樣本和第二訓練樣本進行訓練得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110206738.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





