[發明專利]一種基于深度學習的相似病歷查找方法與系統有效
| 申請號: | 202010412253.5 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111613339B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 崔立真;姜濤;鹿旭東;郭偉 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F16/36;G06N3/08 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 董雪 |
| 地址: | 250100 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 相似 病歷 查找 方法 系統 | ||
1.一種基于深度學習的相似病歷查找方法,其特征在于,包括:
構建能夠表示醫學概念之間關系的知識圖譜;
對獲取的病歷樣本信息進行預處理后,提取病歷樣本信息的主題作為病歷的特征信息,并存儲至數據庫;
對于輸入的電子病歷信息,提取病歷特征信息;在所述知識圖譜中獲取包含與該電子病歷相關的醫療常識的子圖向量;
將當前病歷的特征信息、子圖向量和病歷信息樣本數據庫中病歷的特征信息輸入到訓練好的神經網絡模型中,計算當前病歷和數據庫中每個病歷的相似度;按照相似度的大小,輸出設定數量的相似病例;
所述神經網絡模型的訓練過程,包括:
調取數據庫中的兩個病歷樣本的特征信息,分別在知識圖譜數據庫中匹配相應的子圖;
將獲取到的子圖輸入到圖形注意力模型中,圖形注意力模型獲取病歷主題在圖中的特征,并將該子圖映射到一個子圖向量中,所述向量包含電子病歷相關的醫療常識;
將兩個病歷樣本的特征信息以及對應的子圖向量分別輸入到神經網絡模型,所述神經網絡模型使用共享權重的孿生神經網絡去計算兩個病歷樣本信息的相似度;
重復上述過程,優化所述神經網絡模型的參數,得到訓練好的用于判斷兩個病歷信息是否相似的神經網絡模型。
2.如權利要求1所述的一種基于深度學習的相似病歷查找方法,其特征在于,構建醫療領域的知識圖譜,所述知識圖譜中的實體表示醫學概念,知識圖譜中的邊表示醫學概念之間的關系。
3.如權利要求1所述的一種基于深度學習的相似病歷查找方法,其特征在于,在構建醫療領域的知識圖譜之后,還包括:
訓練BERT+CRF模型,使得所述模型能夠識別醫學文本中的實體和關系;
使用所述模型預測沒有標注的醫療文本數據集,識別出醫療文本中的醫學概念和醫學概念之間的關系;
人工去除噪音數據,將最終得到的知識圖譜存儲到數據庫。
4.如權利要求1所述的一種基于深度學習的相似病歷查找方法,其特征在于,所述病歷信息至少包括:病人姓名,住院時間、電子病歷和醫療診斷結果;根據病人的姓名構建唯一的ID標識。
5.如權利要求1所述的一種基于深度學習的相似病歷查找方法,其特征在于,對獲取到的病歷信息進行預處理,包括:刪除信息不完整的病歷信息、去除停用詞以及分詞處理。
6.如權利要求1所述的一種基于深度學習的相似病歷查找方法,其特征在于,提取病歷信息的主題作為病歷的特征信息,具體為:
使用訓練后的文本主題模型得到主題的詞分布概率,根據每個主題的詞分布判斷每個主題的實際含義;
通過上述的文本主題模型得到每個病歷文本中每個詞的主題分布;
根據主題分布選取每個病歷文本的主題,作為病歷的特征信息。
7.一種基于深度學習的相似病歷查找系統,其特征在于,包括:
用于構建能夠表示醫學概念之間關系的知識圖譜的裝置;
用于對獲取的病歷樣本信息進行預處理后,提取病歷樣本信息的主題作為病歷的特征信息,并存儲至數據庫的裝置;
用于對于輸入的電子病歷信息,提取病歷特征信息;在所述知識圖譜中獲取包含與該電子病歷相關的醫療常識的子圖向量的裝置;
用于將當前病歷的特征信息、子圖向量和病歷信息樣本數據庫中病歷的特征信息輸入到訓練好的神經網絡模型中,計算當前病歷和數據庫中每個病歷的相似度;按照相似度的大小,輸出設定數量的相似病例的裝置;
所述神經網絡模型的訓練過程,包括:
調取數據庫中的兩個病歷樣本的特征信息,分別在知識圖譜數據庫中匹配相應的子圖;
將獲取到的子圖輸入到圖形注意力模型中,圖形注意力模型獲取病歷主題在圖中的特征,并將該子圖映射到一個子圖向量中,所述向量包含電子病歷相關的醫療常識;
將兩個病歷樣本的特征信息以及對應的子圖向量分別輸入到神經網絡模型,所述神經網絡模型使用共享權重的孿生神經網絡去計算兩個病歷樣本信息的相似度;
重復上述過程,優化所述神經網絡模型的參數,得到訓練好的用于判斷兩個病歷信息是否相似的神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010412253.5/1.html,轉載請聲明來源鉆瓜專利網。





