[發明專利]基于電子病歷的疾病癥狀關聯分析方法有效
| 申請號: | 201810619124.6 | 申請日: | 2018-06-15 |
| 公開(公告)號: | CN108806767B | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 李芳芳;段昱;毛星亮 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G16H50/70;G06F16/28;G06F16/2455 |
| 代理公司: | 長沙永星專利商標事務所(普通合伙) 43001 | 代理人: | 周詠;米中業 |
| 地址: | 410083 *** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 電子 病歷 疾病 癥狀 關聯 分析 方法 | ||
1.一種基于電子病歷的疾病癥狀關聯分析方法,包括如下步驟:
S1.獲取電子病歷的數據,對電子病歷進行預處理并轉換為結構化數據;
S2.構建不平衡數據集的分類器;具體為采用如下步驟構建分類器:
(1).獲取電子病歷中的訓練數據,得到訓練數據的候選頻繁項集;具體為對訓練數據采用Apriori算法,同時設置最小支持度閾值,從而得到滿足最小支持度閾值的候選頻繁項集;
(2).對步驟(1)得到的候選頻繁項集進行過濾;
(3).將候選關聯規則分類至相應類別的規則集合中;
(4).衡量規則前件和后件的相關性,從而得到各類別相關的分類關聯規則;
(5).以規則強度作為衡量指標對步驟(4)得到的分類關聯規則進行過濾和排序,從而得到分類器;具體為采用如下步驟進行過濾、排序并得到分類器:
ⅰ.采用如下公式計算分類關聯規則的規則強度:
式中RS(A→B)為規則A→B的規則強度,sup p為規則A→B的支持度,conf為規則A→B的置信度,er為規則A→B的增比率,lift為規則A→B的的興趣度;
ⅱ.對于任意規則Rp和Rn,若Rp是Rn的泛化規則且RS(Rp)>RS(Rn),則認定規則Rn是冗余并將規則Rn刪除;
ⅲ.對最終的規則按類別進行排序,從而形成最終的分類器;
S3.根據步驟S2得到的分類器,對疾病癥狀進行關聯分析。
2.根據權利要求1所述的基于電子病歷的疾病癥狀關聯分析方法,其特征在于步驟S1所述的對電子病歷進行預處理并轉換為結構化數據,具體為采用如下步驟進行預處理和轉換:
A.確定電子病歷中的疾病特征;
B.對電子病歷中的缺失值進行填充;
C.對電子病歷中的連續特征進行離散化處理。
3.根據權利要求2所述的基于電子病歷的疾病癥狀關聯分析方法,其特征在于步驟(2)所述的對候選頻繁項集進行過濾,具體為設置最小增比率閾值,然后采用如下規則進行過濾:
若頻繁項集的增比率低于最小增比率閾值,則將該頻繁項集過濾;
若頻繁項集的增比率大于或等于最小增比率閾值,則將該頻繁項集保留;
若頻繁項集的增比率無窮大,則該頻繁項集的增比率定義為該類別相關的所有頻繁項集的增比率的均值。
4.根據權利要求3所述的基于電子病歷的疾病癥狀關聯分析方法,其特征在于所述的增比率,具體為采用如下算式計算頻繁項集的增比率:
式中ER(x→C)為規則x→C的增比率,CSup(x→C)為類支持度且CSup(x→C)=N(x∪C)/N(C),N(x∪C)表示x和C同時出現在事務集D中的次數,N(C)表示類C在事務集中出現的次數,x表示規則前件,表示類C的補類。
5.根據權利要求4所述的基于電子病歷的疾病癥狀關聯分析方法,其特征在于步驟(3)所述的將候選關聯規則分類至相應類別的規則集合,具體為設置增比置信度閾值,然后采用如下規則進行分類:
若候選關聯規則的增比置信度大于或等于增比置信度閾值,則將該關聯規則加入到對應類別的規則集合中;
若候選關聯規則的增比置信度小于增比置信度閾值,則將該關聯規則刪除。
6.根據權利要求5所述的基于電子病歷的疾病癥狀關聯分析方法,其特征在于所述的候選關聯規則的增比置信度,具體為采用如下算式計算增比置信度:
ERC(x→C)=ER(x→C)*Confidence(x→C)
式中ERC(x→C)為規則x→C的增比置信度,ER(x→C)為規則x→C的增比率,Confidence(x→C)為規則x→C的置信度,x為規則前件,C為規則后件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810619124.6/1.html,轉載請聲明來源鉆瓜專利網。





