[發明專利]處理文本圖像的方法、裝置、設備和計算機可讀介質在審
| 申請號: | 202010586636.4 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111898597A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 張博熠;劉設偉 | 申請(專利權)人: | 泰康保險集團股份有限公司;泰康在線財產保險股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/20;G06K9/00 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 郭晗;趙迪 |
| 地址: | 100031 北京市西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 處理 文本 圖像 方法 裝置 設備 計算機 可讀 介質 | ||
本發明公開了處理文本圖像的方法、裝置、設備和計算機可讀介質,涉及計算機技術領域。該方法的一具體實施方式包括:在文本圖像的標注數據中,獲取文本圖像中文本框的對角點坐標;根據所述文本圖像中文本框的對角點坐標,檢測所述文本圖像的起始坐標;基于所述文本圖像的所述起始坐標,調整所述文本框的角坐標點,并輸出調整后文字圖像的標注數據以校正所述文本圖像的標注方向。該實施方式能夠統一各種復雜文本圖像的標注方向,進而提高訓練深度學習模型的準確率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種處理文本圖像的方法、裝置、設備和計算機可讀介質。
背景技術
在文本檢測技術發展的今天,利用大量的數據訓練深度學習模型已經成為一種有效的手段。然而數據的干凈程度,對深度學習模型處理各種復雜文本圖像起著決定性作用。
在實現本發明過程中,發明人發現現有技術中至少存在如下問題:由于各種復雜文本圖像的標注方向不同,導致訓練深度學習模型的準確率低。
發明內容
有鑒于此,本發明實施例提供一種處理文本圖像的方法、裝置、設備和計算機可讀介質,能夠統一各種復雜文本圖像的標注方向,進而提高訓練深度學習模型的準確率。
為實現上述目的,根據本發明實施例的一個方面,提供了一種處理文本圖像的方法,包括:
在文本圖像的標注數據中,獲取文本圖像中文本框的對角點坐標;
根據所述文本圖像中文本框的對角點坐標,檢測所述文本圖像的起始坐標;
基于所述文本圖像的所述起始坐標,調整所述文本框的角坐標點,并輸出調整后文字圖像的標注數據以校正所述文本圖像的標注方向。
所述在文本圖像的標注數據中,獲取文本圖像中文本框的對角點坐標,包括:
在文本圖像的標注數據中,獲取兩組坐標作為所述文本圖像中文本框的對角點坐標,所述兩組坐標間隔一組坐標。
所述根據所述文本圖像中文本框的對角點坐標,檢測所述文本圖像的起始坐標,包括:
根據所述文本圖像中文本框的左上角橫坐標與所述文本框的右下角橫坐標的比較結果,以及所述左上角縱坐標與所述文本框的右下角縱坐標的比較結果,檢測所述文本圖像的起始坐標。
所述檢測所述文本圖像的起始坐標之前,包括:
將所述文本框的右上角坐標和所述文本框的左下角坐標,分別轉換為所述文本框的左上角坐標和所述文本框的右下角坐標。
所述根據所述文本圖像中文本框的左上角橫坐標與所述文本框的右下角橫坐標的比較結果,以及所述左上角縱坐標與所述文本框的右下角縱坐標的比較結果,檢測所述文本圖像的起始坐標,包括:
所述左上角橫坐標大于所述右下角橫坐標,且所述左上角縱坐標小于所述右下角縱坐標,所述文本圖像的起始坐標是所述文本框的右上角坐標;
所述左上角橫坐標小于所述右下角橫坐標,且所述左上角縱坐標大于所述右下角縱坐標,所述文本圖像的起始坐標是所述文本框的左下角坐標;
所述左上角橫坐標大于所述右下角橫坐標,且所述左上角縱坐標大于所述右下角縱坐標,所述文本圖像的起始坐標是所述文本框的右下角坐標;
所述左上角橫坐標小于所述右下角橫坐標,且所述左上角縱坐標小于所述右下角縱坐標,所述文本圖像的起始坐標是所述文本框的左上角坐標。
所述基于所述文本圖像的所述起始坐標,調整所述文本框的角坐標點,包括:
基于所述文本圖像的所述起始坐標,調整所述文本框的角坐標點以左上角坐標為起始點,并順時針設置右上角坐標、右下角坐標和左下角坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泰康保險集團股份有限公司;泰康在線財產保險股份有限公司,未經泰康保險集團股份有限公司;泰康在線財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010586636.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種大力量電磁閥結構
- 下一篇:一種配置產品流程的方法和裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





