[發明專利]文件圖像分割方法、裝置、計算機設備和存儲介質有效
| 申請號: | 201910977072.4 | 申請日: | 2019-10-15 |
| 公開(公告)號: | CN110728687B | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 龔澤熙 | 申請(專利權)人: | 卓爾智聯(武漢)研究院有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/136;G06T5/40 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 曹瀚青 |
| 地址: | 432200 湖北省武漢市黃陂區盤龍城經*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文件 圖像 分割 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種文件圖像分割方法,所述方法包括:
獲取文件圖像;
對所述文件圖像進行二值化處理和預設二維坐標系下的垂直方向投影,得到對應的垂直直方圖;
記錄所述垂直直方圖的波谷在所述預設二維坐標系中對應的坐標信息;
識別所述坐標信息對應所述文件圖像中的起始字符信息,若所述起始字符信息為目標類型信息,則保留所述坐標信息對應的分割點;
根據所述分割點將所述文件圖像分割成多個區域圖像,得到所述預設二維坐標系下坐標與區域圖像的分割關系,所述分割關系用于將待分析圖像分割為多個待分析區域圖像;
采用光學字符識別技術,將所述區域圖像攜帶的文字信息轉化為文本字符;
對所述文本字符進行標注、分割以及關鍵詞提取,得到所述區域圖像對應的提取信息,所述提取信息包括坐標范圍對應的類別信息和所屬領域。
2.根據權利要求1所述的文件圖像分割方法,其特征在于,所述獲取文件圖像包括:
獲取初始文件圖像;
根據所述初始文件圖像的文件數據,將所述初始文件圖像進行分割和垂直排列重組,以使文件中攜帶的內容在同一圖像上顯示,得到所述文件圖像。
3.根據權利要求1所述的文件圖像分割方法,其特征在于,所述對所述文件圖像進行二值化處理和預設二維坐標系下的垂直方向投影,得到對應的垂直直方圖包括:
將所述文件圖像轉換為HSV域圖像;
采用Yen算法,計算所述HSV域圖像中V通道的門限值;
根據所述V通道的門限值,調整黑色像素閾值范圍;
基于所述調整后的黑色像素閾值范圍,得到二值化圖像;
對所述二值化圖像進行垂直方向投影,得到對應的垂直直方圖。
4.根據權利要求1所述的文件圖像分割方法,其特征在于,所述根據所述分割點將所述文件圖像分割成多個區域圖像之后,還包括:
獲取待分析文件圖像;
根據所述待分析文件圖像的文件數據,將所述待分析文件圖像進行分割和垂直排列重組,以使文件中攜帶的內容在同一圖像上顯示,得到分割重組后的待分析文件圖像;
將所述分割重組后的待分析文件圖像映射到所述預設坐標系中、并根據所述預設坐標系下的坐標與區域圖像的分割關系,將所述分割重組后的待分析文件圖像分割為多個待分析區域圖像;
識別所述待分析區域圖像的符號標記,若所述符號標記為目標符號標記類型時,則提取所述待分析區域圖像的信息。
5.根據權利要求4所述的文件圖像分割方法,其特征在于,提取所述待分析區域圖像的信息包括:
采用光學字符識別技術,將所述待分析區域圖像攜帶的文字信息轉換為文本字符;
根據所述區域圖像對應的提取信息,提取出所述待分析區域圖像的對應的文本字符。
6.根據權利要求4所述的文件圖像分割方法,其特征在于,所述將所述分割重組后的待分析文件圖像映射到所述預設坐標系中之前,還包括:
對所述待分析文件圖像進行字符識別或標識碼識別,識別所述分割重組后的待分析文件圖像的所屬用戶;
所述識別所述待分析區域圖像的符號標記,若所述符號標記為目標符號標記類型時,則提取所述待分析區域圖像的信息之后,還包括:
將所述所屬用戶與所述待分析區域圖像的信息進行綁定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于卓爾智聯(武漢)研究院有限公司,未經卓爾智聯(武漢)研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910977072.4/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





