[發明專利]一種患者身份識別與匹配的方法無效
| 申請號: | 201110186618.8 | 申請日: | 2011-07-05 |
| 公開(公告)號: | CN102314478A | 公開(公告)日: | 2012-01-11 |
| 發明(設計)人: | 陳誠;浮光紀;肖筱華 | 申請(專利權)人: | 萬達信息股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩;柏子雵 |
| 地址: | 201112 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 患者 身份 識別 匹配 方法 | ||
技術領域
本發明涉及一種醫療數據庫中患者身份信息的識別和匹配的方法。
背景技術
隨著互聯網技術的不斷發展、信息技術的逐漸成熟以及病患就醫記錄的不斷增加,使得各家醫療機構需要對原有的患者信息進行整合,在整合過程中需要將同一患者的不同醫療信息進行合并。目前,醫療健康領域開展患者身份信息整合時,一般都是采用ETL手段建立一個集中的患者身份庫,然后取代原系統中患者身份庫。ELT是Extraction-Transformation-Loading的縮寫,中文名稱為數據提取、轉換和加載,ETL負責將分布的、異構數據源中的數據如關系數據、平面數據文件等抽取到臨時中間層后進行清洗、轉換、集成,最后加載到數據倉庫或數據集市中。這樣做的弊端是:對原有系統沖擊較大,也容易造成單點故障。
發明內容
本發明的目的是提供一種對原有系統沖擊較小的整合患者數據的方法。
為了達到上述目的,本發明的技術方案是提供了一種患者身份識別與匹配的方法,其特征在于,步驟為:
步驟1、定義用來作為患者身份識別和匹配的信息項,根據信息項的重要程度為每個信息項分配一個權重,所有信息項的權重的和必須等于1;
步驟2、從待匹配的身份信息庫中取出第???????????????????????????????????????????????條待匹配的身份信息,并從基準庫中取出第條基準信息,若身份信息或基準信息中的某些信息項缺失,則判斷缺失的信息項的權重是否較重,若較重則直接判定為不相似,否則將該信息項的權重按比例分配到其他未缺失的信息項上后進入步驟3;
步驟3、計算待匹配的身份信息庫中的第條待匹配的身份信息與基準庫中的第條基準信息之間的相似度,,其中,為信息項的總數,為第個信息項所對應的權重,指第條待匹配的身份信息與基準庫中的第條基準信息的第個信息項之間的相似度,該相似度事先通過人工設定;
步驟4、若相似度等于1,則直接將第條待匹配的身份信息與基準庫中的第條基準信息合并,若相似度小于0.5,則兩條信息具備相關性,不進行匹配,在其他情況下,在人工干預下將兩條信息進行匹配。
本發明提供的一種方法不用完全取代原系統中患者身份庫,因此對原有系統沖擊較小,不易造成單點故障。
具體實施方式
以下結合實施例來具體說明本發明。
實施例
本發明提供了一種患者身份識別與匹配的方法,步驟為:
步驟1、定義用來作為患者身份識別和匹配的信息項,根據信息項的重要程度為每個信息項分配一個權重,所有信息項的權重的和必須等于1,其中,所述的信息項包括姓名、姓名拼音、性別、出生日期、身份證號、居住地址、電話號碼及手機號碼,居住地址采用多級停用詞進行劃分,其步驟為:
步驟1.1、定義地址信息框架,地址信息框架由地址信息項組成,地址信息項包括:省、市、區/縣、鎮/鄉/街道、村/路/街/巷、弄/隊、戶/號/幢及室;
步驟1.2、將醫院采集的患者地址信息通過至少一級停用詞劃分為不同的地址信息段,停用詞是指在需要分割的文本中經常出現,可作為詞語之間的間隔標識的詞;
步驟1.3、根據地址信息段的停用詞和地址信息框架各個地址信息項的對應關系,將地址信息段中的非停用詞部分填入相應的地址信息項中;
步驟2、對待匹配的身份信息庫及基準庫中的身份信息采用關鍵信息項排序的方法進行分組,其步驟為:若相似的身份信息所包含的某個信息項ItemA一定是相等的,則按信息項ItemA對身份信息進行排序,排序完成后具有相同信息項ItemA的身份信息聚集成若干個組,然后在各個組內再進行身份信息的兩兩比對即可;
步驟3、從待匹配的身份信息庫中取出第條待匹配的身份信息,并從基準庫中取出第條基準信息,若身份信息或基準信息中的某些信息項缺失,則判斷缺失的信息項的權重是否較重,若較重(例如權重超過0.5)則直接判定為不相似,否則將該信息項的權重按比例分配到其他未缺失的信息項上后進入步驟4;
步驟4、計算待匹配的身份信息庫中的第條待匹配的身份信息與基準庫中的第條基準信息之間的相似度,,其中,為信息項的總數,為第個信息項所對應的權重,指第條待匹配的身份信息與基準庫中的第條基準信息的第個信息項之間的相似度,該相似度事先通過人工設定;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于萬達信息股份有限公司,未經萬達信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110186618.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:中小企業信息化應用集群平臺
- 下一篇:一種銫鎢青銅粉體及其制備方法





