[發明專利]一種基于中文電子病歷的輔助診斷決策方法在審
| 申請號: | 201810324593.5 | 申請日: | 2018-04-12 |
| 公開(公告)號: | CN108597614A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 閆鳳麒;曲藝;陸明名 | 申請(專利權)人: | 上海熙業信息科技有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16H10/60 |
| 代理公司: | 上??坡蓪@硎聞账?特殊普通合伙) 31290 | 代理人: | 葉鳳 |
| 地址: | 201802 上海市嘉定區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子病歷 輔助診斷 疾病 關聯規則 中文 特征選擇 癥狀特征 決策 臨床決策支持系統 決策樹分類器 分類結果 活躍應用 基分類器 疾病分類 精準分類 特征向量 癥狀信息 數據集 置信度 挖掘 高維 維度 排序 事務 清洗 預測 | ||
輔助診斷決策方法是臨床決策支持系統(Clinical decision support system,CDSS)中的一個非常活躍應用分支。目前的輔助診斷決策方法都沒能很好的利用中文電子病歷數據集、無法有效的挖掘中文電子病歷中癥狀與疾病的關聯規則、無法很好地降低癥狀特征維度、無法很準確地在高維癥狀特征空間中進行多種疾病的精準分類。針對這些問題,本發明給出了一種基于中文電子病歷的輔助診斷決策方法。首先將中文電子病歷集中的疾病與癥狀信息進行清洗,然后挖掘疾病與癥狀事務的關聯規則,本發明根據疾病與癥狀事務關聯規則的置信度進行排序,并且以基分類器分類結果為基準從中進行特征選擇,根據特征選擇出的特征向量運用決策樹分類器進行疾病分類,實現了對疾病的預測。
技術領域
本發明涉及數據挖掘領域,具體涉及特征選擇算法,分類算法。
背景技術
最早的輔助診斷決策方法主要都集中在基于知識的CDSS研究與實現,其系統結構大體由人機接口、知識庫和推理機三部分組成。知識庫是由來自醫學文獻的規則、臨床指南等來構建,并根據這些知識轉化成的規則并運用一定的推理機制通過人機交互界面提供決策支持服務。但是,醫學和醫學知識始終在發展,在變更,要使知識庫中知識能夠跟上發展的腳步需要巨大的投入和消耗。所以基于非知識的CDSS,即基于電子病歷的輔助診斷決策方法的研究逐漸變成了當前診斷決策支持系統研究的熱點與主流方向。
與基于知識的CDSS不同,基于電子病歷的輔助診斷決策方法通過對大規模電子病歷數據集的進行關聯規則挖掘、分類、回歸等操作能夠不斷發現新的知識來幫助醫生在疾病診斷過程中做出更好的決策。隨著2011年衛生部制定了電子病歷的基本規范,并在全國范圍內110家醫院開展電子病歷的試點工作。經過幾年的發展,電子病歷系統已成為衡量醫院信息化建設水平的一個重要標準,電子病歷系統也積累了相當可觀的數據量,并且這些數據都是患者的真實數據,這對疾病的診療和醫學研究等都具有巨大的價值和廣闊的發展前景,特別是以電子病歷為基礎的應用在CDSS的疾病診斷過程中發揮了重要作用,并且進一步推進了國內疾病診斷系統的研究與發展。
基于中文電子病歷的輔助診斷決策方法研究仍處于起步階段,在國內,周志華,姜遠等人將機器學習模型用于疾病預測分析但是均為單病種疾病預測模型,很難直接適用于多特征多類別醫學數據集的預測中。雖然大量的人工神經網絡已經用于醫療診斷,但是神經網絡模型需要從大量的樣本中提取特征以訓練診斷預測模型,很難直接用于構建少數類醫學疾病診斷模型。2007年,蔣琳等采用SVM技術,對436個病例的14個特征建立了2型糖尿病預測模型,為提高預測性能,提出了一種最優特征子集選擇方法,最終選出4種特征,這四個特征對應指標最高(敏感度86.66%、特異性64.22%、準確率70.14%)。同時,還采用決策樹、多層感知機方法進行了試驗,結果表明支持SVM的效果最好。
現有研究主要針對基于知識的輔助診斷決策方法,同時在中文電子病歷數據集中因為存在大量的特征屬性,導致特征屬性維數高引發矩陣運算量大、訓練樣本稀疏和過擬合等問題一直限制著傳統分類器的分類質量,所以特征選擇是疾病分類問題中不可忽略的一項重要工程。
發明內容
本發明給出一種基于中文電子病歷的輔助診斷決策方法,利用Apriori關聯規則算法(已屬于現有算法)進行病癥規則的挖掘,將病癥規則的置信度作為標準進行特征排序,然后再依據基分類器的分類效果為標準進行特征子集的序列向前選擇劃分,選擇出最優特征子集后再運用決策樹分類器對中文電子病歷進行訓練,最終將訓練好的分類器完成輔助診斷決策任務。
通過以下技術方案來實現:
一種基于中文電子病歷的輔助診斷決策方法,其特征在于,包括如下步驟,一種對中文電子病歷數據集中疾病與癥狀信息進行數據清洗的數據預處理方法,一種基于疾病與癥狀進行關聯規則挖掘的方法,一種基于病癥關聯規則進行特征選擇的方法,一種基于關聯規則的特征選擇方法在選擇出特征向量后進行疾病預測的分類器;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海熙業信息科技有限公司,未經上海熙業信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810324593.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:動靜脈血管網絡模型
- 下一篇:一種輕度認知障礙患者癡呆轉化的篩選參考方法





