[發明專利]醫學化驗單的文本識別方法和計算機可讀存儲介質在審
| 申請號: | 202010829924.8 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN111967391A | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 吳及;張丹陽 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 孫寶海;袁禮君 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫學 化驗單 文本 識別 方法 計算機 可讀 存儲 介質 | ||
1.一種醫學化驗單的文本識別方法,其特征在于,包括:
通過基于錨的卷積神經網絡對待識別化驗單的文本框進行字段定位,錨的水平寬度是根據待識別化驗單的文本框的水平寬度預設確定的,卷積神經網絡的下采樣比例由錨的水平寬度確定;
將所述字段定位的特征圖輸入至文本識別模塊,所述文本識別模塊的輸出層包含前向-后向神經網絡層,以獲取待識別化驗單的第一字符識別結果,所述前向-后向神經網絡層中引入注意力機制。
2.根據權利要求1所述的醫學化驗單的文本識別方法,其特征在于,所述卷積神經網絡包括多個卷積塊;在通過基于錨的卷積神經網絡對所述待識別化驗單的文本框進行特征提取前,還包括:
根據所述錨的寬度調整所述卷積塊的池化層的核寬度,以調整所述卷積神經網絡的下采樣比例。
3.根據權利要求1所述的醫學化驗單的文本識別方法,其特征在于,
所述卷積神經網絡包括第一卷積塊、第二卷積塊、第三卷積塊、第四卷積塊和第五卷積塊,
所述第一卷積塊、所述第二卷積塊、所述第三卷積塊和所述第四卷積塊包含的池化層分別為第一池化層、第二池化層、第三池化層和第四池化層,
所述第一池化層的核寬度、第二池化層的核寬度、第三池化層的核寬度和調整后的第四池化層的核寬度的乘積結果與所述錨的寬度相等。
4.根據權利要求1至3中任一項所述的醫學化驗單的文本識別方法,其特征在于,
所述前向-后向神經網絡層的下一級網絡為長短期記憶網絡層,所述醫學化驗單的文本識別方法還包括:
確定所述長短期記憶網絡層在獲取所述第一字符識別結果的前一時刻的內部隱藏狀態值;
根據所述內部隱藏狀態值確定所述第一字符識別結果對應的注意力權重;
采用所述注意力權重對所述第一字符識別結果進行加權處理,以得到第二字符識別結果;
將所述第二字符識別結果輸入所述長短期記憶網絡層;
將所述長短期記憶網絡層的輸出結果依次進行線性層和柔性最大化處理,以得到所述文本框包含的字符串的概率分布。
5.根據權利要求1至3中任一項所述的醫學化驗單的文本識別方法,其特征在于,還包括:
計算所述待識別化驗單中的左右相鄰的兩個文本框之間的高度交并比;
根據所述高度交并比確定所述文本框所屬的文本行;
逐行遍歷所述文本行包含的字符串;
計算所述字符串與所述表頭標識字符之間的相似度;
根據所述相似度確定所述待識別化驗單的表格區域;
根據所述待識別化驗單的檢查項字典,對所述表格區域內的文本框的字符進行糾錯;
根據糾錯結果輸出所述待識別化驗單的結構化識別結果,所述結構化識別結果包括檢查項編號、檢查項名稱、檢查項數值、數值參考范圍、檢查項英文縮寫和所述檢查項數值的量綱中的至少一種。
6.根據權利要求1至3中任一項所述的醫學化驗單的文本識別方法,其特征在于,還包括:
對所述待識別化驗單進行網格劃分,并確定劃分后的網格;
確定所述網格對應的多個訓練錨;
確定所述待識別化驗單的文字區域面積占所述訓練錨的面積的比例;
將所述比例小于或等于預設比例的訓練錨確定為負訓練錨;
采用所述負訓練錨對所述卷積神經網絡進行訓練。
7.根據權利要求1至3中任一項所述的醫學化驗單的文本識別方法,其特征在于,還包括:
確定所述卷積神經網絡的訓練錨與所述文本框之間的交并比;
將所述交并比大于預設交并比的訓練錨確定為正訓練錨;
采用所述正訓練錨對所述卷積神經網絡進行訓練。
8.根據權利要求1至3中任一項所述的醫學化驗單的文本識別方法,其特征在于,
所述卷積神經網絡的訓練錨的中心點與所述網格的中心點重合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010829924.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鑄造用砂箱
- 下一篇:一種適用于自行車的二速自動變速器





