[發明專利]一種基于深度學習和OCR的檢驗、體檢報告單結果提取方法在審
| 申請號: | 202011617132.0 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN113553892A | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 陳超;宋彪;羅祎斐 | 申請(專利權)人: | 內蒙古衛數數據科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06K9/72;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 010010 內蒙古自治區呼和浩特市新城*** | 國省代碼: | 內蒙古;15 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 ocr 檢驗 體檢 報告 結果 提取 方法 | ||
1.一種基于深度學習和OCR的檢驗、體檢報告單結果提取方法,其特征在于,包括以下步驟:
步驟1:獲取受試者的檢驗、體檢報告單圖片;
步驟2:對原始檢驗、體檢報告單圖片進行預處理;
步驟3:利用OCR技術識別圖片中的文字大小、位置信息,以及文本內容;
步驟4:利用深度學習模型,基于識別出來的文字大小、位置信息,對各文本進行分類,分為表格的表頭、表格主體數據、其他文本數據;
步驟5:基于文本的位置信息和分類結果,指定需要提取的表頭,將對應的表格主體數據提取為結構化數據。
2.根據權利要求1所述的一種基于深度學習和OCR的檢驗、體檢報告單結果提取方法,其特征在于,所述步驟2中,對原始檢驗、體檢報告單圖片進行預處理的方法包括:邊緣檢測、霍夫直線檢測、圖片內容提取、透視變換、文字方向檢測、圖片方向旋轉。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于內蒙古衛數數據科技有限公司,未經內蒙古衛數數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011617132.0/1.html,轉載請聲明來源鉆瓜專利網。





