[發明專利]檢測傾斜圖像中同行文字的方法及其相關設備在審
| 申請號: | 202011607621.8 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112651399A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 劉海倫 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 傾斜 圖像 同行 文字 方法 及其 相關 設備 | ||
1.一種檢測傾斜圖像中同行文字的方法,其特征在于,包括下述步驟:
接收文字圖片,將所述文字圖片輸入至預先訓練的文本框檢測模型中,獲得多個待判斷文本框;
獲取每個所述待判斷文本框與標準方向的夾角,將所述夾角大于預設的夾角閾值的所述待判斷文本框作為傾斜矩形,得到多個傾斜矩形,并將每個所述傾斜矩形與標準方向的夾角作為對應的傾斜角,確定每個所述傾斜矩形的中心點坐標;
基于所述傾斜角和所述中心點坐標分別計算每個所述傾斜矩形的傾斜距離;
基于不同的傾斜矩形對應的傾斜距離,確定出處于同行的傾斜矩形,并將處于同行的傾斜矩形對應的文字片段,作為同行文字。
2.根據權利要求1所述的檢測傾斜圖像中同行文字的方法,其特征在于,所述將所述文字圖片輸入預先訓練的文本框檢測模型,獲得多個待判斷文本框的步驟包括:
將所述文字圖片輸入至所述文本框檢測模型的圖像分割模型中,獲得二值掩碼圖;
對所述二值掩碼圖進行連通域分析,形成連通域像素塊;
確定所述連通域像素塊的最小外接矩形,作為所述待判斷文本框。
3.根據權利要求2所述的檢測傾斜圖像中同行文字的方法,其特征在于,所述將所述文字圖片輸入至所述文本框檢測模型的圖像分割模型中,獲得二值掩碼圖的步驟包括:
將所述文字圖片依次經過所述圖像分割模型的每個卷積層,獲得每個卷積層輸出的圖片特征;
上采樣所述圖片特征,獲得上采樣特征,并基于所述上采樣特征經過的卷積層的數目,反卷積所述上采樣特征,獲得反卷積特征;
融合所述反卷積特征,獲得所述二值掩碼圖。
4.根據權利要求1所述的檢測傾斜圖像中同行文字的方法,其特征在于,所述基于所述傾斜角和所述中心點坐標分別計算每個所述傾斜矩形的傾斜距離的步驟包括:
基于如下公式計算所述傾斜矩形的傾斜距離:
l=y×cosθ+x×sinθ
其中,所述l表示所述傾斜矩形的傾斜距離,x表示所述中心點坐標的橫坐標,y表示所述中心點坐標的縱坐標,θ表示所述傾斜角。
5.根據權利要求1所述的檢測傾斜圖像中同行文字的方法,其特征在于,所述基于不同的傾斜矩形對應的傾斜距離,確定出處于同一行的傾斜矩形的步驟包括:
計算不同的傾斜矩形對應的傾斜距離之間的差值;
判斷所述差值是否符合預設的同行條件,將符合同行條件的差值對應的傾斜矩形作為同一行的傾斜矩形。
6.根據權利要求5所述的檢測傾斜圖像中同行文字的方法,其特征在于,所述判斷所述差值是否符合預設的同行條件,將符合同行條件的差值對應的傾斜矩形作為同一行的傾斜矩形的步驟包括:
判斷所述差值的絕對值是否小于差值閾值,在所述差值的絕對值小于差值閾值的時,將所述差值對應的傾斜矩形作為同一行的傾斜矩形。
7.根據權利要求1所述的檢測傾斜圖像中同行文字的方法,其特征在于,所述基于不同的傾斜矩形對應的傾斜距離,確定同行的傾斜矩形的步驟包括:
從所述多個傾斜矩形中選擇任意一個傾斜矩形作為第一待判斷矩形,確定與所述待判斷矩形距離最近的傾斜矩形,作為第二待判斷矩形,并計算所述第一待判斷矩形與所述第二待判斷矩形,對應的傾斜距離之間的差值,獲得待判斷差值;
確定所述待判斷差值是否符合同行條件,在所述待判斷差值符合同行條件時,確定所述第一待判斷矩形和所述第二待判斷矩形為同一行的傾斜矩形;
確定與所述第二待判斷矩形距離最近的傾斜矩形,作為第三待判斷矩形,并計算所述第二待判斷矩形與所述第三待判斷矩形,對應的傾斜距離之間的差值,直至所述差值不符合同行條件,獲得所有當前行的傾斜矩形;
從所述多個傾斜矩形中選擇未計算過的傾斜矩形作為第四待判斷矩形,重復執行所述同行傾斜矩形的判斷過程,直至完成對所有傾斜矩形的計算,獲得所述同行的傾斜矩形。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011607621.8/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





