[發明專利]一種基于XGBoost的眼屈光矯正多源數據自動分類方法有效
| 申請號: | 202010234736.0 | 申請日: | 2020-03-30 |
| 公開(公告)號: | CN111414972B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | 王雁;馬嬌楠;孟祥冰 | 申請(專利權)人: | 王雁 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/2415;G06F18/243;G06N20/00;G16H20/40;G16H50/70 |
| 代理公司: | 天津盛理知識產權代理有限公司 12209 | 代理人: | 陳娟 |
| 地址: | 300020*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 xgboost 眼屈光 矯正 數據 自動 分類 方法 | ||
1.一種基于XGBoost的眼屈光矯正多源數據自動分類方法,具體包含以下步驟:
步驟1:對原始數據進行預處理,包含數據的篩選、數值化、標簽化以及訓練集、測試集的劃分操作;
步驟2:根據醫生的經驗和統計策略挑選出與眼屈光矯正數據分類相關的屬性特征作為訓練所用的最原始的特征;
步驟3:基于篩選之后的數據,利用XGBoost進一步進行特征篩選,選取與目標最為相關的屬性特征;
步驟4:基于選取的訓練樣本,訓練XGBoost模型對眼屈光數據進行分類,訓練過程中根據樣本的數量為樣本設置不同的權重,以降低樣本不均衡導致的誤差,設計目標函數f(x)為:
式中,wi為樣本權重,|Di|num為數據分類i的數量,其中|Dmax|num為數量最多的數據類別的數量,f(x)為目標損失函數;xi為樣本中的特征變量;yi為樣本的數據分類結果,γ為模型中待優化參數,Q為訓練樣本總數,L為均方根誤差;
訓練過程中采用early?stopping的策略防止訓練過擬合,并利用AUC作為earlystopping的驗證方案;訓練XGBoost模型選擇該模型的決策樹;
步驟4利用貝葉斯優化結合K折交叉驗證的方案選取基于訓練集的最優參數;
挑選出的特征按重要性排序包含:S、Ss、RMS.LOA.CF、AC.Volume、IOP、Pupil、UDVA、AC.Depth、C、Ast7mm、HC.Deflection.Amp、Age、Peak.Dist、Z.3.-3(CF)、Z.4.0(CF)、A2.Deformation.Amp、Z.3.-3(Cornea)、Axs7mm、Ast9mm、A1.Deflection.Length、AC.Angle、Z.4.0(CB)、Ast3mm、A2.Deflection.Area、Z.3.-1(Cornea)、A、Z.3.-1(CF)、A1.Deflection.Amp、Cor.Vol、Sag11mm、dArcLengthMax、ISV、HC.Deflection.Length、Radius、Z.4.0(Cornea)、Axs9mm、A1.Deformation.Amp、Whole.Eye.Movement.Max、A2.Deflection.Length、RMS.HOA(CF)、Ast11mm、Pachy.Apex、HC.dArc.Length、PupilY、A1.Deflection.Area、A2.Velocity、RMS.LOA(Cornea)、PachyMinY、DA.Ratio.Max(2mm)、ARTh、Sag7mm、Axs3mm、A1.Time、Z.3.-3(CB)、Z.3.3(CB)、Z.3.-1(CB)、Pachy.Pupil;
步驟1中樣本特征選擇上考慮患者的病史、眼部屈光狀態、角膜形態學參數,結合全面的角膜受力后的形變參數;
步驟2、3中特征篩選的流程方案,首先根據根據醫生經驗和卡方檢驗進行特征初選,然后基于XGBoost的特征重要性參數進行更為精細的選擇;
步驟2中采用以人為單位進行數據集劃分;
步驟4不同類別的樣本采用不同權重的損失函數;
步驟4中采用樣本加權的方案處理樣本失衡的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王雁,未經王雁許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010234736.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于物聯網的智慧停車場交通管理系統及其實現方法
- 下一篇:一種電子設備





