[發明專利]紙質病歷數字化及目標檢測模型訓練方法、裝置、存儲介質在審
| 申請號: | 202010568144.2 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111768820A | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 張少典;顧根 | 申請(專利權)人: | 上海森億醫療科技有限公司 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G06F40/14;G06F40/279;G06K9/00;G06K9/32 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 倪靜 |
| 地址: | 201213 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 紙質 病歷 數字化 目標 檢測 模型 訓練 方法 裝置 存儲 介質 | ||
1.一種基于人工智能的紙質病歷數字化方法,其特征在于,包括:
利用預訓練的目標檢測模型對病例文檔進行分塊檢測,以得到多個文檔子模塊;
分別將所述多個文檔子模塊轉換成對應的文本信息;
初始化病例文檔的結構樹根節點,并遍歷每個文檔子模塊所對應的文本信息的行內容;
若當前行內容被識別為段落標題,則初始化一個葉節點,并設置該葉節點的段落名為當前行內容,并設置該葉節點的段落內容暫時為空;
若當前行內容被識別為非段落標題,則繼續識別其是否為內容段落;
若當前行內容被識別為內容段落,則將當前行更新至當前葉節點的內容列表中;
若當前行內容被識別為非內容段落,則繼續下一行內容的識別,直至在所述病例文檔被處理完成后,返回整個文檔樹。
2.根據權利要求1所述的紙質病歷數字化方法,其特征在于,所述目標檢測模型包括YOLO模型、Faster R-CNN模型或者SSD模型。
3.根據權利要求1所述的紙質病歷數字化方法,其特征在于,所述方法包括:
根據病例文檔結構對病例文檔分為多個文檔子模塊;所述文檔子模塊包括病例文本類型模塊、患者基本信息模塊、主訴模塊、個人史模塊、現病史模塊、家族病史模塊以及體格檢查模塊中的任意一種及多種的組合。
4.根據權利要求1所述的紙質病歷數字化方法,其特征在于,所述分別將所述多個文檔子模塊轉換成對應的文本信息,包括:分別將所述多個文檔子模塊輸入光學字符識別工具,并輸出對應的txt文本。
5.根據權利要求1所述的紙質病歷數字化方法,其特征在于,所述文檔樹的結構包括如下任一種:
結構1)初始化一個根節點,在該根節點下延伸出多個葉節點;每個葉節點對應所述病例文檔中的一個段落,包括段落名和段落內容;
結構2)初始化一個根節點,在該根節點下延伸出與所述多個文檔子模塊一一對應的多個次根節點;每個所述次根節點延伸出一或多個葉節點;每個葉節點對應該文檔子模塊中的一個段落,包括段落名和段落內容。
6.根據權利要求1所述的紙質病歷數字化方法,其特征在于,在初始化病例文檔的結構樹根節點之前,所述方法還包括:
對轉換后的文本信息進行噪聲濾波處理;所述噪聲濾波處理包括濾除空行、多余空格、頁眉及頁腳中的任意一種或多種的組合。
7.一種應用于紙質病歷數字化的目標檢測模型訓練方法,其特征在于,包括:
獲取多類型的圖片格式的紙質病歷文檔;
根據病歷文檔結構對各病歷文檔進行分割標記;
利用帶有標記的病歷文檔來訓練目標檢測模型,以得到用于對病歷文檔進行分塊檢測的預訓練模型。
8.一種基于人工智能的紙質病歷數字化裝置,其特征在于,包括:
分塊檢測模塊,用于利用預訓練的目標檢測模型對病例文檔進行分塊檢測,以得到多個文檔子模塊;
文本轉換模塊,用于分別將所述多個文檔子模塊轉換成對應的文本信息;
根節點設置模塊,用于初始化病例文檔的結構樹根節點;
信息遍歷模塊,用于遍歷每個文檔子模塊所對應的文本信息的行內容;
葉節點設置模塊和識別模塊;
其中,所述識別模塊用于識別當前行內容是否為段落標題;若當前行內容被識別為段落標題,則令所述葉節點設置模塊初始化一個葉節點,并設置該葉節點的段落名為當前行內容,并設置該葉節點的段落內容暫時為空;若識別當前行內容為非段落標題,則繼續識別其是否為內容段落;若識別當前行內容為內容段落,則令所述葉節點設置模塊將當前行更新至當前葉節點的內容列表中;若識別當前行內容為非內容段落,則則繼續下一行內容的識別,直至在所述病例文檔被處理完成后,返回整個文檔樹。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海森億醫療科技有限公司,未經上海森億醫療科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010568144.2/1.html,轉載請聲明來源鉆瓜專利網。





