[發明專利]圖片信息提取方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202011288930.3 | 申請日: | 2020-11-17 |
| 公開(公告)號: | CN112396048B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 劉東煜;陳樂清;張濤;曾增烽 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06V30/414 | 分類號: | G06V30/414 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 信息 提取 方法 裝置 計算機 設備 存儲 介質 | ||
本申請實施例屬于人工智能技術領域,涉及一種圖片信息提取方法及相關設備,可應用于智慧政務領域,包括:獲取目標圖片,檢測目標圖片中每個元素的信息邊界框;根據信息邊界框對元素進行粗排序,得到粗排序元素表,基于粗排序元素表獲取目標圖片的高置信度行;計算高置信度行中每個元素的中心坐標,根據中心坐標計算高置信度行的斜率;獲取目標圖片中所有元素的中心坐標,根據中心坐標和斜率確定元素屬于同一行的行片段,以及元素屬于同一列的列片段;按照行片段和列片段對所有元素重新進行排序,得到目標圖片對應的結構化信息表。此外,本申請還涉及區塊鏈技術,結構化信息表可存儲于區塊鏈中。本申請實現了對圖片信息的準確提取。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種圖片信息提取方法、裝置、計算機設備及存儲介質。
背景技術
當前,圖像識別的方式有多種,為得到圖像中的表格信息,主要通過OCR圖像識別對目標圖像進行識別,得到帶有坐標的原始字符串列表。然而,通過OCR圖像識別無法直接根據這些初始的無序信息直接得到有效信息。
因此,如果想要得到圖片中的有效信息,則首先需要知道圖片中各個片段的相對位置關系,根據圖片的結構化信息,將OCR識別結果以列表的形式進行恢復。然而,當圖片發生旋轉時,普通的結構化方法將出現行、列錯亂的問題。由此導致圖片信息識別錯誤的問題。
發明內容
本申請實施例的目的在于提出一種圖片信息提取方法、裝置、計算機設備及存儲介質,旨在解決圖片信息識別錯誤的技術問題。
為了解決上述技術問題,本申請實施例提供一種圖片信息提取方法,采用了如下所述的技術方案:
一種圖片信息提取方法,包括以下步驟:
獲取目標圖片,檢測所述目標圖片中每個元素的信息邊界框;
根據所述信息邊界框對所述元素進行粗排序,得到粗排序元素表,基于所述粗排序元素表獲取所述目標圖片的高置信度行;
計算所述高置信度行中每個所述元素的中心坐標,根據所述中心坐標計算所述高置信度行的斜率;
獲取所述目標圖片中所有所述元素的所述中心坐標,根據所有所述中心坐標和所述斜率確定在所述目標圖片中所述元素屬于同一行的行片段,并根據所有所述中心坐標和所述斜率確定在所述目標圖片中所述元素屬于同一列的列片段;
按照所述行片段和所述列片段對所有所述元素重新進行排序,得到所述目標圖片對應的結構化信息表。
進一步的,所述檢測所述目標圖片中每個元素的信息邊界框的步驟包括:
按照x軸從小到大掃描所述目標圖片的信息內容,識別所述目標圖片中每個所述元素的邊界坐標;
根據所述邊界坐標確定每個所述元素對應的所述信息邊界框。
進一步的,所述基于所述粗排序元素表獲取所述目標圖片的高置信度行的步驟包括:
獲取所述粗排序元素表中每行的所述信息邊界框的個數;
將所述個數大于等于預設閾值的行確定為高置信度行。
進一步的,所述根據所有所述中心坐標和所述斜率確定在所述目標圖片中所述元素屬于同一行的行片段的步驟包括:
根據所述中心坐標和所述斜率,計算所述目標圖片中每個所述元素與y軸的第一交點坐標;
計算不同所述元素之間的所述第一交點坐標的第一差值,將所述第一差值小于等于第一預設誤差值的元素作為同一行的行元素,組合所述同一行的行元素為一個所述行片段。
進一步的,所述根據所有所述中心坐標和所述斜率確定在所述目標圖片中所述元素屬于同一列的列片段的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011288930.3/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





