[發明專利]一種應用于多數據源的醫療患者主索引發現方法有效
| 申請號: | 202110344519.1 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN113111063B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 陳杰;聶小明;張志強;趙睿 | 申請(專利權)人: | 中電健康云科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G16H10/60;G16H50/70 |
| 代理公司: | 成都弘毅天承知識產權代理有限公司 51230 | 代理人: | 孟仕杰 |
| 地址: | 610000 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 多數 醫療 患者 索引 發現 方法 | ||
本發明涉及醫療互聯互通領域,具體是一種應用于多數據源的醫療患者主索引發現方法,包括如下步驟:步驟一、獲取醫療記錄;步驟二、計算兩兩醫療記錄之間的相似度;步驟三、基于相似度構建有權無向圖;步驟四、基于有權無向圖計算各醫療記錄的記錄主索引支持度;步驟五、標準化記錄主索引支持度,確定主索引記錄;旨在提高主索引準確性,克服現有技術在大數據場景下出現的數據冗余和高成本的缺陷,提供一種新的主索引發現算法。
技術領域
本發明涉及醫療互聯互通領域,具體是指一種應用于多數據源的醫療患者主索引發現方法。
背景技術
為了在區域范圍內實現各醫療機構的數據共享或業務協同,有效地保存、分類、歸檔、查閱大批量的醫療信息,實現醫療記錄在各個信息系統中的互聯互通,需要針對患者建立統一的身份機制,該機制使得區域范圍內,同一患者在多家醫療機構注冊的多條醫療記錄能夠被識別為同一個人,并對患者的所有醫療信息建立關聯關系,為此,患者需要一條最為準確的記錄來標識其區別于其他患者存在的唯一性,進而保證分布在多個系統中的同一患者擁有完整、準確的個人信息采集結果,患者主索引(Master?Patient?Index,MPI)是指在一個區域范圍內用以標識該域內每個患者實例并保持其唯一性的編碼,而企業級患者主索引(Enterprise?Master?Patient?Index,EMPI)系統則將來自多個系統的患者標識進行關聯,實現同一病人多業務ID的關聯和患者信息的統一或關聯,確?;颊咝畔⒂成?、應用的準確性。
在這一應用場景下,現有技術大致可以劃分為三類:一、基于概率的匹配算法,對關鍵字段進行索引匹配得到基礎分數,然后在匹配結果中對候選記錄的其余參考字段分別計算相似性分數,最后利用基礎分數及各參考分數進行投票,篩選出總分超過設定閾值的結果集;二、在數據量小的情況下,操作者也可以憑經驗和供以參考的患者信息,人工判斷多條索引記錄是否描述同一人;三、考慮到計算成本、數據安全等因素,直接將每一條記錄都當作主索引。
上述方法在應對主索引發現任務時,僅考慮了字段間的直接關系,缺乏對全局信息以及隱含信息的捕捉和利用,這導致計算結果極大地依賴于相似度計算的精度,依據先驗知識選擇匹配字段后計算的投票結果并不理想,如果采用人工方法,無論是直接判斷還是校驗評估都相當的費時費力,而將每條數據都當作主索引則會造成大量的數據冗余,增加數據的存儲和后續應用計算成本,效率低下。
發明內容
基于以上問題,本發明提供了一種應用于多數據源的醫療患者主索引發現方法,旨在提高主索引準確性,克服現有技術在大數據場景下出現的數據冗余和高成本的缺陷,提供一種新的主索引發現算法。
為解決以上技術問題,本發明采用的技術方案如下:
一種應用于多數據源的醫療患者主索引發現方法,包括如下步驟:
步驟一、獲取醫療記錄;
步驟二、計算兩兩醫療記錄之間的相似度;
步驟三、基于相似度構建有權無向圖;
步驟四、基于有權無向圖計算各醫療記錄的記錄主索引支持度;
步驟五、標準化記錄主索引支持度,確定主索引記錄。
進一步,所述步驟1具體包括:
獲取多數據源的醫療記錄后對其去重,將各字段完全一樣的記錄視為同一患者。
進一步,計算兩兩醫療記錄之間的相似度,并形成相似度矩陣,其計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中電健康云科技有限公司,未經中電健康云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110344519.1/2.html,轉載請聲明來源鉆瓜專利網。





