[發明專利]一種電子病歷數據處理方法及系統在審
| 申請號: | 202110281535.0 | 申請日: | 2021-03-16 |
| 公開(公告)號: | CN112863628A | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 陳峰;劉升平;梁家恩 | 申請(專利權)人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G06F16/35;G06N3/08;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電子 病歷 數據處理 方法 系統 | ||
本發明涉及一種電子病歷數據處理方法及系統,該方法包括:按照預設的映射規則將病歷文書中的名稱進行映射;對無法按照預設的所述映射規則進行映射的病歷文書,通過預先訓練的深度學習模型進行分類。本發明通過規則結合模型方式可以減少人工查看每種類型文書的工作量,尤其是綜合醫院文書類型比較多或者專科醫院文書名字比較特殊情況下節省工作量的效果更為明顯。
技術領域
本發明涉及深度學習領域,具體涉及一種電子病歷數據處理方法及系統。
背景技術
電子病歷為非結構化病歷,而且不同醫院的病歷內容結構和文書名字的差異,需要對病歷文書做標準化映射。一般通用的做法是根據文書的名字結合病歷內容中標題或者關鍵字進行映射。
由于不同醫院的病歷在內容結構上和名字命名上存在差異,單從文件名字或者關鍵字去映射,可能對病歷劃分比較細的專科醫院或者一些長尾的病歷不能映射完全,而且在對新醫院文書映射時,需要查看所有不同類型文書名字和內容存在較大工作量。
發明內容
本發明提供一種電子病歷數據處理方法及系統,能夠解決查看所有不同類型文書名字和內容存在較大工作量的技術問題。
本發明解決上述技術問題的技術方案如下:
一種電子病歷數據處理方法,包括:
按照預設的映射規則將病歷文書中的名稱進行映射;
對無法按照預設的所述映射規則進行映射的病歷文書,通過預先訓練的深度學習模型進行分類。
本發明的有益效果是:
通過規則結合模型方式可以減少人工查看每種類型文書的工作量,尤其是綜合醫院文書類型比較多或者專科醫院文書名字比較特殊情況下節省工作量的效果更為明顯。
進一步,所述通過深度學習模型進行分類,具體包括:
對病歷文書進行編碼,將編碼的結果通過深度學習模型映射到預先定義的類別空間,得到所述病歷文書的類別。
上述進一步方案的有益效果是:對無法通過規則映射方式處理的病歷文書,進行編碼后通過深度學習模型進行類別的確定。
進一步,所述類別空間包括N個文書類別和一個其他類,所述通過深度學習模型進行分類,具體還包括:
對分類到所述其他類的病歷文書進行拒識。
上述進一步方案的有益效果是:通過設置的其他類來確定無法通過深度學習模型來確定類型的病歷文書。
進一步,還包括:當所述深度學習模型的訓練數據中增加新的電子病歷數據時,對所述深度學習模型進行增量訓練。
上述進一步方案的有益效果是:對新增的電子病歷數據進行增量訓練方式,可以豐富模型訓練數據。
進一步,對所述深度學習模型進行增量訓練,具體包括:
按照加入新的電子病歷數據后的訓練數據中病歷文書的名稱的類型進行歸類統計;分別將相同類型的病歷文書以批量形式送入所述深度學習模型進行預測,得到該批量數據中各個病歷文書的預測類及對應的概率;如果預測得到的最大概率大于或等于預設閾值,則將預測類與所述最大概率對應的預測類不同的病歷文書的類型修改為所述最大概率對應的預測類后加入到所述訓練數據中;如果預測得到的最大概率小于所述預設閾值,則從該批量數據中隨機抽取一部分人工進行標注后加入到訓練數據中,繼續訓練模型,直至預測得到的最大概率大于或等于所述預設閾值。
上述進一步方案的有益效果是:對新醫院的病歷采用基于模型預測的結果進行統計,根據統計結果對部分病歷文書標注,進行增量訓練,適應新醫院文書類型同時減少人工工作量。
一種電子病歷數據處理系統,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110281535.0/2.html,轉載請聲明來源鉆瓜專利網。





