[發明專利]一種基于醫學知識圖譜的語義相似病例檢索方法及設備有效
| 申請號: | 202010221246.7 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111414393B | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 武學鴻;李建華;費耀平 | 申請(專利權)人: | 湖南科創信息技術股份有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F16/2457;G06F16/31;G06F16/36;G16H50/70 |
| 代理公司: | 長沙智嶸專利代理事務所(普通合伙) 43211 | 代理人: | 劉宏 |
| 地址: | 410009 湖南省長*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 醫學知識 圖譜 語義 相似 病例 檢索 方法 設備 | ||
1.一種基于醫學知識圖譜的語義相似病例檢索方法,其特征在于,包括步驟:
獲取符合病例內容規范要求的電子病例;
對所述電子病例文本進行結構化處理,并結合醫學知識圖譜對其得到具有統一規范術語的結構化電子病例;
結合內容匹配程度及規模相近程度計算出所述結構化電子病例與庫中病例的相似度;
根據所計算的相似度高低對庫中病例進行排序并輸出;
所述根據內容匹配程度及規模相近程度計算出所述結構化電子病例與庫中病例的相似度具體包括步驟:
計算所述結構化電子病例與庫中病例的內容匹配度,所述內容匹配度由結構化電子病例與庫中病例的實體匹配分數除以結構化電子病例的實體總分數所得:
其中,M代表內容匹配度,S1表示結構化病例與庫中病例的實體匹配分數,S2表示結構化電子病例的實體總分數,w代表實體類別權重,m代表實體類型總數,i表當前遍歷的實體類型序數,n代表第i個實體類型對應的實體總數,j表當前遍歷的實體序數,f為匹配因子,代表實體匹配的結果,取值為0~1,完全匹配成功則匹配因子等于1,完全匹配失敗則匹配因子為0,其中,任意兩個實體之間的匹配因子f基于醫學知識圖譜中實體與實體之間的從屬關系而形成的樹狀結構計算得到:
fab=1/(1+n)
其中,n是從實體a往根節點尋找到b或者從實體b往根節點尋找到a的距離,若未找到則表示距離n無窮大,則實體a與實體b之間匹配因子為0,若a就是b,則距離n為0,則匹配因子為1;
計算所述結構化電子病例與庫中病例的規模相近度,計算公式為:
C=N1/N2,N2≥N1
其中C代表規模相近度,N1代表實體個數較少的病例實體總數,N2代表實體個數較多的病例實體總數;
計算得出所述結構化電子病例與庫中病例的相似度,計算公式為
2.根據權利要求1所述基于醫學知識圖譜的語義相似病例檢索方法,其特征在于,所述符合病例內容規范要求的電子病例包括患者基本信息及基本健康信息,所述患者基本信息包括患者姓名、性別、年齡及婚姻情況,所述基本健康信息包括主訴、現病史、既往史、個人史、家族史、體格檢查。
3.根據權利要求2所述基于醫學知識圖譜的語義相似病例檢索方法,其特征在于,所述結合醫學知識圖譜對所述電子病例文本進行結構化處理,得到具有統一規范術語的結構化電子病例具體包括步驟:
利用實體提取模型從患者基本健康信息中提取出醫學實體;
將所提取的醫學實體與所述醫學知識圖譜進行對齊與標準化,將非專業術語表達與專業術語表達對齊,得到具有標準術語的醫學實體;
根據預設的實體類別對所述具有標準術語的醫學實體進行分類,得到具有統一規范術語的結構化電子病例。
4.根據權利要求3所述基于醫學知識圖譜的語義相似病例檢索方法,其特征在于,所述實體提取模型采用命名實體識別模型bilstm-crf,并基于電子病例文本進行訓練學習;所述將所提取的醫學實體與所述醫學知識圖譜進行對齊與標準化時采用基于編解碼技術的翻譯模型bilstm-attention,并基于醫學知識圖譜中統一規范的醫學術語體系進行訓練學習。
5.根據權利要求4所述基于醫學知識圖譜的語義相似病例檢索方法,其特征在于,所述預設的實體類別通過若干類醫學臨床特征并根據實體的不同來源及實體的陰性陽性進行分類所得,包括:主訴癥狀、主訴體征、非主訴癥狀、非主訴體征、當前疾病、歷史疾病、當前誘因、歷史誘因、家族疾病、當前用藥、歷史用藥、當前手術、歷史手術、當前檢查項目、歷史檢查項目、當前檢查結果、歷史檢查結果、當前檢驗項目、歷史檢驗項目、當前檢驗結果、歷史檢驗結果、當前體格檢查、歷史體格檢查、當前職業、歷史職業、體質、身體狀態,所述若干類醫學臨床特征包括主訴癥狀、主訴體征、非主訴癥狀、非主訴體征、疾病、誘因、手術、用藥、身體狀態、體質、職業、體格檢查、檢查項目、檢查結果、檢驗項目、檢驗結果,所述實體的陰性陽性表示實體的有無情況,陽性表示有,陰性表示無。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南科創信息技術股份有限公司,未經湖南科創信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010221246.7/1.html,轉載請聲明來源鉆瓜專利網。





