[發(fā)明專利]檢測傾斜圖像中同行文字的方法及其相關設備在審
| 申請?zhí)枺?/td> | 202011607621.8 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112651399A | 公開(公告)日: | 2021-04-13 |
| 發(fā)明(設計)人: | 劉海倫 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34 |
| 代理公司: | 深圳市世聯(lián)合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區(qū)益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 傾斜 圖像 同行 文字 方法 及其 相關 設備 | ||
本申請實施例屬于人工智能領域,應用于智慧政務領域中,涉及一種檢測傾斜圖像中同行文字的方法及其相關設備,包括接收文字圖片,將文字圖片輸入至預先訓練的文本框檢測模型中,獲得多個待判斷文本框;獲取待判斷文本框與標準方向的夾角,將夾角大于夾角閾值的待判斷文本框作為傾斜矩形,得到多個傾斜矩形,將每個傾斜矩形與標準方向的夾角作為傾斜角,確定每個傾斜矩形的中心點坐標;基于傾斜角和中心點坐標分別計算每個傾斜矩形的傾斜距離;基于不同的傾斜矩形對應的傾斜距離,確定出處于同行的傾斜矩形,并將處于同行的傾斜矩形對應的文字片段,作為同行文字。傾斜距離的計算公式可存儲于區(qū)塊鏈中,本申請能夠快速確定出處于同行的傾斜矩形。
技術領域
本申請涉及人工智能技術領域,尤其涉及檢測傾斜圖像中同行文字的方法及其相關設備。
背景技術
隨著深度學習技術的快速發(fā)展,文字識別算法的精度越來越高,逐漸應用在許多的場景中。計算機在進行文字識別中,需要先判斷出屬于同一行的文字,才能準確的抽取需要的信息。在實際應用中,由于拍照角度等原因,導致文本圖像中的文字往往是傾斜的,增加了計算機對于文字同行的判斷難度。
現(xiàn)有的判斷文字片段是否同行的方法是先根據圖像中的信息,判斷文本傾斜的角度,并將圖像旋轉至標準方向,再進行文字是否同行的判斷以及文檔結構分析。這種方式需要對圖像進行旋轉操作,大大增加了計算復雜度,在時效性要求較高的場景下難以使用。
發(fā)明內容
本申請實施例的目的在于提出一種檢測傾斜圖像中同行文字的方法及其相關設備,快速確定處于同行的傾斜矩形,提高計算機的處理速度。
為了解決上述技術問題,本申請實施例提供一種檢測傾斜圖像中同行文字的方法,采用了如下所述的技術方案:
一種檢測傾斜圖像中同行文字的方法,包括下述步驟:
接收文字圖片,將所述文字圖片輸入至預先訓練的文本框檢測模型中,獲得多個待判斷文本框;
獲取每個所述待判斷文本框與標準方向的夾角,將所述夾角大于預設的夾角閾值的所述待判斷文本框作為傾斜矩形,得到多個傾斜矩形,并將每個所述傾斜矩形與標準方向的夾角作為對應的傾斜角,確定每個所述傾斜矩形的中心點坐標;
基于所述傾斜角和所述中心點坐標分別計算每個所述傾斜矩形的傾斜距離;
基于不同的傾斜矩形對應的傾斜距離,確定出處于同行的傾斜矩形,并將處于同行的傾斜矩形對應的文字片段,作為同行文字。
進一步的,所述將所述文字圖片輸入預先訓練的文本框檢測模型,獲得多個待判斷文本框的步驟包括:
將所述文字圖片輸入至所述文本框檢測模型的圖像分割模型中,獲得二值掩碼圖;
對所述二值掩碼圖進行連通域分析,形成連通域像素塊;
確定所述連通域像素塊的最小外接矩形,作為所述待判斷文本框。
進一步的,所述將所述文字圖片輸入至所述文本框檢測模型的圖像分割模型中,獲得二值掩碼圖的步驟包括:
將所述文字圖片依次經過所述圖像分割模型的每個卷積層,獲得每個卷積層輸出的圖片特征;
上采樣所述圖片特征,獲得上采樣特征,并基于所述上采樣特征經過的卷積層的數目,反卷積所述上采樣特征,獲得反卷積特征;
融合所述反卷積特征,獲得所述二值掩碼圖。
進一步的,所述基于所述傾斜角和所述中心點坐標分別計算每個所述傾斜矩形的傾斜距離的步驟包括:
基于如下公式計算所述傾斜矩形的傾斜距離:
l=y(tǒng)×cosθ+x×sinθ
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011607621.8/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





