[發明專利]一種病人主索引數據的清洗方法有效
| 申請號: | 201710056719.0 | 申請日: | 2017-01-25 |
| 公開(公告)號: | CN107066803B | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 王興強 | 申請(專利權)人: | 濟南德健信息技術有限公司 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G16H50/70 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250000 山東省濟*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 人主 索引 數據 清洗 方法 | ||
1.一種病人主索引數據的清洗方法,其特征在于,它包括主索引關鍵詞分類、主索引相似度計算和病人身份主索引表;
所述的主索引關鍵詞分類,是將病人主索引信息中的關鍵詞,按其不同屬性,分為具有身份唯一性屬性、具有排他性屬性和具有強相似性屬性三類;
所述的主索引相似度計算,是將當前主索引數據中的關鍵詞數據與其它主索引數據中的相應關鍵詞數據進行相似性計算;
第一類具有身份唯一性屬性的關鍵詞不參與計算,第二類具有排他性屬性的關鍵詞和第三類具有強相似性屬性的關鍵詞參與計算;
第二類具有排他性屬性的關鍵詞wi相似性系數計算公式如下:
其中,Ek,i為第k條主索引數據中第二類具有排他性屬性的關鍵詞wi的相似性系數,w0,i為當前主索引數據中的關鍵詞wi的值,wk,i為第k條主索引數據中的關鍵詞wi的值;i的取值范圍為0im,m為第二類具有排他性屬性的關鍵詞的數量;
第三類具有強相似性屬性的關鍵詞wj相似性系數計算,采用關鍵詞字符串匹配后長度比加權的方式,計算公式如下:
其中,Sk,j為第k條主索引數據中第三類具有強相似性屬性的關鍵詞wj的相似性系數,w0,j為當前主索引數據中的關鍵詞wj的值,wk,j為第k條主索引數據中的關鍵詞wj的值,match()為字符串匹配函數,len()為取字符串長度函數,cj為第三類具有強相似性屬性的關鍵詞wj的加權系數;j的取值范圍為0jn,n為第三類具有強相似性屬性的關鍵詞的數量;
當前主索引數據與第k條主索引數據相似度Vk的計算公式如下:
所述的病人身份主索引表,是能夠確立病人身份唯一性的索引表,是病人主索引的索引表,由身份證號和病人ID為主鍵,病人主索引清洗后的數據存入該表中;
所述清洗方法的步驟如下:
1)開始;
2)檢索當前病人主索引信息;
3)判斷當前病人主索引信息中身份證號是否為有效的一代或二代身份證,如果是跳到步驟4),否則跳到步驟7);
4)如果當前病人身份證號為一代身份證,則轉換成二代身份證,如果當前病人身份證號為二代身份證,則轉換成一代身份證;
5)按照當前病人一代和二代身份證號檢索病人主索引表中的病人ID;
6)將當前病人二代身份證號和檢索的病人ID,添加保存至病人身份主索引表中;
7)檢索病人主索引表中的第二類具有排他性屬性的關鍵詞和第三類具有強相似性屬性的關鍵詞列表;
8)根據關鍵詞列表計算當前病人主索引數據與其它主索引數據相似度V,剔除相似度小于預定閾值V0的數據,并按照相似度V由大到小的順序對主索引列表排序;
9)就診病人確認排序的主索引列表中本人的信息;
10)將當前病人二代身份證號和經過就診病人確認過的病人ID,添加保存至病人身份主索引表中;
11)結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南德健信息技術有限公司,未經濟南德健信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710056719.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種面向基因數據計算的異構平臺
- 下一篇:一種智能健康監控扶手及健康監控方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





