[發明專利]一種化驗報告單自動識別方法在審
| 申請號: | 202010567397.8 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111797729A | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 霍紅建;孟凡強;陳階 | 申請(專利權)人: | 翰博瑞強(上海)醫藥科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06F21/62;G16H15/00 |
| 代理公司: | 貴州貴達律師事務所 52111 | 代理人: | 張佳佳 |
| 地址: | 201424 上海市奉賢*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 化驗 報告 自動識別 方法 | ||
本發明公開了一種化驗報告單自動識別方法,涉及文本識別技術領域。方法步驟為:先獲取受試者的化驗報告單;然后將化驗報告單掃描為PDF或圖片格式的標準文本,并遮蓋受試者個人信息;接著基于標準文本中文字及圖形分布特征建立模板模型,利用模板模型調整標準文本的待識別區域;再利用OCR技術識別待識別區域中的數據;最后對標準文本命名并根據標準文本名稱將其存入對應的文件夾中。本方法根據化驗報告單的特征,對不同化驗報告單建立相應的模板模型,利用模板模型調整OCR識別區域以準確識別每一項不同格式的化驗報告單數據,對化驗報告單的識別準確率高,也提高了化驗報告單數據的收集效率,解決了直接通過OCR技術進行數據采集的識別準確率低的問題。
技術領域
本發明涉及文本識別技術領域,具體涉及一種化驗報告單自動識別方法。
背景技術
臨床醫學及臨床試驗中,化驗報告單是臨床原始數據的重要組成部分。特別是在很多臨床實驗中,化驗報告單數據占60-80%的信息量。在目前的化驗報告單數據收集中,與醫院信息系統的數據對接是常見方式,但也面臨著很多困難。出于對受試者信息保密性的考慮,國內幾乎所有臨床試驗機構還不能直接分享化驗報告單電子數據。在臨床試驗的執行中,所有臨床協調員CRC都需要通過醫院信息系統把受試者的每一個化驗報告單打印出來,再將化驗報告單中的數據寫入對應受試者的相關文件中。在這個過程中,存在幾點缺陷:1、在謄寫過程中,出錯的概率為3%~10%;2、臨床數據收集效率很低;3、由于目前普遍采用EDC系統,當謄寫數據出現錯誤后,系統會自動彈出對此數據的質疑,導致研究者或申辦方誤認為試驗質量嚴重降低。為了準確收集化驗報告單中數據,研究者/申辦方不得不采用原數據核查的方法(即SDV)對每一張相關的化驗報告單中的每一個數據逐項審核,而該操作將大大地增加相關費用,花費的時間也長。
目前,可以對化驗報告單進行拍照,再運用OCR技術來采集化驗報告單中的數據。但OCR技術對于要識別的照片要求很高,包括圖片分辨率、顏色、字體,若圖片質量不高,將嚴重影響識別效果。同時,由于化驗報告單的格式多種多樣,直接通過OCR技術進行數據采集的識別準確率很低,影響化驗報告單數據收集效率。
發明內容
本發明的目的在于:為解決直接通過OCR技術收集化驗報告單中數據的識別準確率低的問題,提供一種化驗報告單自動識別方法。本方法根據化驗報告單的特征,對不同化驗報告單建立相應的模板模型,利用建立的模板模型調整OCR識別區域,實現準確識別每一項不同格式的化驗報告單數據,本方法既保證了化驗報告單的識別準確率,又提高了化驗報告單數據的收集效率。
本發明采用的技術方案如下:
一種化驗報告單自動識別方法,包括以下步驟:
步驟1:獲取受試者的化驗報告單;
步驟2:將化驗報告單掃描為PDF或圖片格式的標準文本,并遮蓋受試者個人信息;
步驟3:基于標準文本內容的文字及圖形分布特征建立模板模型,根據化驗報告單匹配的模板模型調整其對應的標準文本的待識別區域;
步驟4:利用OCR技術將待識別區域識別為可編輯內容,再基于受試者編號和醫院編號對標準文本命名,根據標準文本名稱將其存入對應的文件夾中。
進一步的,所述步驟1中,對于受試者個人信息的遮蓋,直接將有敏感信息的部分使用膠紙或其他遮擋物遮蓋,或者將受試者個人信息遮蓋為該受試者對應的唯一編碼,該編碼包括受試者編號和醫院編號信息。
本方法利用專業掃描儀進行掃描,掃描時直接遮擋受試者敏感信息部分,整個過程均不采集敏感信息,阻斷一個敏感信息傳遞途徑,為防止敏感信息泄露,無法根據受試者編號等信息反推受試者個人信息,做化驗報告單掃描和標準文本命名的操作人員保留受試者編號等相關信息,設計合理,符合法規。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于翰博瑞強(上海)醫藥科技有限公司,未經翰博瑞強(上海)醫藥科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010567397.8/2.html,轉載請聲明來源鉆瓜專利網。





