[發明專利]一種應用于多數據源的醫療患者主索引發現方法有效
| 申請號: | 202110344519.1 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN113111063B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 陳杰;聶小明;張志強;趙睿 | 申請(專利權)人: | 中電健康云科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G16H10/60;G16H50/70 |
| 代理公司: | 成都弘毅天承知識產權代理有限公司 51230 | 代理人: | 孟仕杰 |
| 地址: | 610000 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 多數 醫療 患者 索引 發現 方法 | ||
1.一種應用于多數據源的醫療患者主索引發現方法,其特征在于,包括如下步驟:
步驟一、獲取醫療記錄;
步驟二、計算兩兩醫療記錄之間的相似度;
步驟三、基于相似度構建有權無向圖;
步驟四、基于有權無向圖計算各醫療記錄的記錄主索引支持度,
各醫療記錄的記錄主索引支持度計算方式如下:
計算與某節點有連接的鏈路權重之和,即得到每條記錄的相似度總分數si,計算公式為:
定義記錄主索引支持度MI為每條醫療記錄作為主索引記錄候選的評分,初始化每個節點的MI值為1,迭代更新各節點的MI值,直到MI值收斂或計算超過最大迭代次數,其計算公式為:
其中,MIi(n)為第n次迭代醫療記錄i的MI值,α為常數0.85;
步驟五、標準化記錄主索引支持度,確定主索引記錄。
2.根據權利要求1所述的一種應用于多數據源的醫療患者主索引發現方法,其特征在于:所述步驟1具體包括:
獲取多數據源的醫療記錄后對其去重,將各字段完全一樣的記錄視為同一患者。
3.根據權利要求1所述的一種應用于多數據源的醫療患者主索引發現方法,其特征在于:計算兩兩醫療記錄之間的相似度,并形成相似度矩陣,其計算公式為:
其中,lij表示兩兩醫療記錄之間的相似度,L表示醫療記錄的相似度矩陣,sq為醫療記錄i和醫療記錄j對于第q個字段精確匹配檢索后的相似度,wq為醫療記錄i和醫療記錄j對于第q個字段在投票時占據的權重,m表示字段數量。
4.根據權利要求3所述的一種應用于多數據源的醫療患者主索引發現方法,其特征在于:篩選出相似度大于等于設定閾值的記錄對,形成三元組表,基于三元組表構建有權無向圖。
5.根據權利要求4所述的一種應用于多數據源的醫療患者主索引發現方法,其特征在于:在有權無向圖中,每一個節點為某一條醫療記錄,鏈路權重為兩條醫療記錄間的相似度。
6.根據權利要求1所述的一種應用于多數據源的醫療患者主索引發現方法,其特征在于:標準化記錄主索引支持度MI值后,選擇MI值最大的節點作為主索引記錄,若MI值相同則選擇ID最小的醫療記錄。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中電健康云科技有限公司,未經中電健康云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110344519.1/1.html,轉載請聲明來源鉆瓜專利網。





