[發(fā)明專利]一種連續(xù)性腎臟替代治療過程中肝素劑量的預(yù)測方法有效
| 申請?zhí)枺?/td> | 201810656262.1 | 申請日: | 2018-06-24 |
| 公開(公告)號: | CN108831556B | 公開(公告)日: | 2021-06-18 |
| 發(fā)明(設(shè)計)人: | 王東;趙巧鳳;連捷;王偉 | 申請(專利權(quán))人: | 大連理工大學 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H50/70;G06N3/12 |
| 代理公司: | 大連星海專利事務(wù)所有限公司 21208 | 代理人: | 王樹本;徐雪蓮 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 連續(xù)性 腎臟 替代 治療 過程 肝素 劑量 預(yù)測 方法 | ||
1.一種連續(xù)性腎臟替代治療過程中肝素劑量的預(yù)測方法,其特征在于包括以下步驟:
步驟1、安裝相關(guān)軟件及庫,安裝Sublime Text 3軟件及一個開源的Python 3.5,另外安裝科學計算基礎(chǔ)庫即numpy、數(shù)據(jù)分析庫即pandas、2D繪圖庫即matplotlib和缺失數(shù)據(jù)可視化庫即missingno,具體安裝步驟為,在windows 10系統(tǒng)下,首先安裝Python 3.5,按win+R鍵快速啟動命令窗口,輸入cmd,點擊確定,輸入pip install+所需要的庫,按enter鍵,進行相關(guān)庫的安裝,pip install matplotlib,按enter鍵,進行matplotlib庫的安裝,然后下載Sublime Text3軟件;
步驟2、分析和了解由醫(yī)院收集的數(shù)據(jù)集的相關(guān)信息,了解每個數(shù)據(jù)代表的含義及各自變量所占權(quán)重,分析自變量與目標變量即首劑劑量之間的關(guān)系,分析首劑劑量的類型,判斷其是帶分類標簽的離散數(shù)據(jù)還是連續(xù)數(shù)據(jù),以此作為選擇回歸模型還是分類模型的依據(jù);
步驟3、數(shù)據(jù)預(yù)處理,首先對完全相同的行數(shù)據(jù)進行去重,其次分析各屬性的數(shù)值是不是存在缺失值的情況,如果存在缺失值,要先進行處理,常見的缺失值處理方法有:個案剔除法即Listwise Deletion、均值替換法即Mean Imputation、熱卡填充法即Hotdecking、聚類填充法即Clustering imputation、多重替代法即Multiple Imputation,然后采用z-score算法和范圍縮放方法相結(jié)合的方式,對自變量進行標準化和歸一化處理,z-score算法通過公式(1)進行描述,
式中x為樣本的某一屬性的值,u為該屬性的均值,σ為該屬性的標準差,X為標準化后的該屬性值,范圍縮放方法通過公式(2)進行描述,
式中min為該屬性的最小值,max為該屬性的最大值,Y為歸一化后的該屬性值;
步驟4、特征提取,利用隨機森林和遺傳算法相結(jié)合的方法進行特征提取,隨機森林利用自助法重采樣技術(shù)和節(jié)點隨機分支技術(shù),構(gòu)建多棵決策樹,通過投票得到最終分類結(jié)果,遺傳算法是一種借鑒生物界自然選擇和生物體遺傳機制的隨機搜索算法,其基本原理是進化機制和自然選擇法則,其特點是采用簡單的二進制編碼技術(shù)表示復(fù)雜結(jié)構(gòu),即遺傳算法中的個體由0和1組成,其中,對應(yīng)個體為1的屬性是要提取的屬性,對應(yīng)個體為0的屬性是要舍棄的屬性,選取18列屬性做為自變量;
步驟5、劃分訓練集和測試集及不平衡數(shù)據(jù)的處理,具體包括以下子步驟:
(a)利用機器學習技術(shù)領(lǐng)域中的10折交叉驗證法劃分訓練集和測試集,具體做法為,將給定的數(shù)據(jù)集C,劃分成k個大小相似的互斥子集,然后進行k次訓練,每次訓練將k-1個子集的并集作為訓練集,余下的作為測試集,最終返回k個測試結(jié)果的均值,在10折交叉驗證法中k取值為10;
(b)利用集成學習中的EasyEnsemble算法處理不平衡數(shù)據(jù),具體做法為,從多數(shù)樣本集中,進行n次有放回的隨機采樣,每次選取與少數(shù)類數(shù)目近似相等的樣本集,于是得到n個樣本集合,記作{S1,S2,...,Sn},然后將其中的每一個樣本集合與少數(shù)類樣本集合,結(jié)合組成n個樣本集合,記作{C1,C2,...,Cn},之后用這n個樣本集合分別進行訓練和測試,得到n個模型,最后取由這n個模型預(yù)測出的值的均值;
步驟6、模型預(yù)測及評估,在選擇模型之前,先對首劑劑量取ln變換,具體做法是,用python語言np.log()對首劑劑量進行取ln變換,然后用np.exp()對預(yù)測出的首劑劑量進行逆變換,以此來保證數(shù)據(jù)的不變性,在選擇模型時,分別對決策樹回歸模型和梯度提升回歸模型進行訓練,并采用平均絕對誤差MAE、均方誤差MSE和R2評估模型,這些評價指標分別用Python語言實現(xiàn)方式是:mean_absolute_error(y_test,y_pred),mean_squared_error(y_test,y_pred),clf.score(X_test,y_test),其中y_test為測試集的實際首劑劑量,y_pred為利用訓練模型預(yù)測的首劑劑量,X_test為訓練集的自變量,平均絕對誤差MAE通過公式(3)進行描述,
均方誤差MSE通過公式(4)進行描述,
R2評估模型通過公式(5)進行描述,
式(3)、(4)和(5)中,n是測試集的樣本集數(shù)量,yi是測試集的真實值,fi是測試集的預(yù)測值,是測試集的均值,R2大于0.4時,模型擬合效果好,就可以采用此模型預(yù)測肝素劑量的首劑劑量,MSE和MAE的取值越小越好,決策樹回歸模型MSE的取值為0.045-0.095,MAE的取值為0.126-0.213,梯度提升回歸模型MSE的取值為0.053-0.087,MAE的取值為0.166-0.212,在評價回歸模型中,主要依據(jù)是R2評估模型,依據(jù)這些評價指標,通過對比決策樹回歸模型和梯度提升回歸模型,最終選擇梯度提升回歸模型做為預(yù)測肝素劑量的首劑劑量模型;
步驟7、預(yù)測值的異常值處理,對用梯度提升回歸模型預(yù)測出的12個數(shù)值進行異常值處理,具體做法是,一、將異常值看作缺失值處理,常見的缺失值處理方法見步驟3,二、剔除異常數(shù)據(jù),常用方法有,(1)拉依達準則,此算法適用于大數(shù)據(jù)樣本集,(2)肖維勒準則,此算法適用于小數(shù)據(jù)樣本集,(3)格拉布斯準則,此算法使用普遍,(4)狄克遜準則,此算法適用于小數(shù)據(jù)樣本集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學,未經(jīng)大連理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810656262.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:手診專家及手診自測體檢管理方法
- 下一篇:一種保健管理方法





