[發(fā)明專利]基于改進的邏輯回歸模型的健康管理方法在審
| 申請?zhí)枺?/td> | 201910896405.0 | 申請日: | 2019-09-20 |
| 公開(公告)號: | CN110957044A | 公開(公告)日: | 2020-04-03 |
| 發(fā)明(設(shè)計)人: | 張毅駿;譚翔 | 申請(專利權(quán))人: | 上海派拉軟件股份有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16H50/30 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 徐俊;柏子雵 |
| 地址: | 200120 上海市浦東新區(qū)中國(上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 改進 邏輯 回歸 模型 健康 管理 方法 | ||
1.一種基于改進的邏輯回歸模型的健康管理方法,其特征在于,包括以下步驟:
步驟1、建立訓練數(shù)據(jù)集,訓練數(shù)據(jù)集中的每個數(shù)據(jù)對應一個個體,包括自變量字段及決策目標字段,其中,自變量字段包括個體的身體指標數(shù)據(jù)及遺傳病史數(shù)據(jù),決策目標字段包括個體是否認為自己健康;
步驟2、提取訓練數(shù)據(jù)集中的數(shù)值字段,對所有數(shù)值字段進行劃分,其中,對當前數(shù)值字段進行劃分包括以下步驟:
步驟201、將劃分次數(shù)變量n的初始化為0;
步驟202、將當前數(shù)值字段劃分為K類,n=n+1;
步驟203、若n>m,進入步驟207,否則進入步驟204,m為預先設(shè)定的閾值;
步驟204、計算當前劃分下每一類的證據(jù)權(quán)重,其中,當前劃分下第k類的證據(jù)權(quán)重為WOE(k),則有:WOE(k)=ln(r(k)),式中,k=1,2,…,K;P(k,1)為第k類下的目標變量為1的概率,P(k,0)為第k類下的目標變量為0的概率;
步驟205、采用以下公式計算當前劃分下當前數(shù)值字段的信息值:
步驟206、若步驟205計算得到的信息值大于等于設(shè)定的閾值一,且K在2到5之間,且每個分類下的數(shù)量占比都大于設(shè)定的閾值二,則進入步驟207,否則重新設(shè)定K的值返回步驟202;
步驟207、找到信息最大值是對應的劃分,記錄當前數(shù)值字段的當前劃分,返回當前數(shù)值字段的劃分結(jié)果;
步驟3、將劃分后的數(shù)值字段與訓練數(shù)據(jù)集中的其他字段輸入邏輯回歸模型,對邏輯回歸模型進行訓練,訓練數(shù)據(jù)集的決策目標字段作為建模目標字段,邏輯回歸模型輸出的p值最小的M個字段組成模型結(jié)果;
步驟4、建立測試數(shù)據(jù)集,利用步驟2相同的方法對測試數(shù)據(jù)集中的數(shù)值字段進行劃分,將劃分后的數(shù)值字段與測試數(shù)據(jù)集中的其他字段一起輸入訓練后的邏輯回歸模型中,得到邏輯回歸模型輸出的p值最小的M個字段組成模型結(jié)果,若邏輯回歸模型輸出的模型結(jié)果與測試數(shù)據(jù)集中決策目標字段的實際值相同的概率大于設(shè)定的閾值三,則進入步驟5,否則建立新的訓練數(shù)據(jù)集,返回步驟1重新對邏輯回歸模型進行訓練;
步驟5、實時獲得某個個體的身體指標數(shù)據(jù)及遺傳病史數(shù)據(jù),利用步驟2的方法對身體指標數(shù)據(jù)及遺傳病史數(shù)據(jù)中的數(shù)值字段進行劃分,將劃分后的數(shù)值字段與剩余的其他字段一起輸入訓練好的邏輯回歸模型中,得到邏輯回歸模型輸出的p值最小的M個字段組成的模型結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海派拉軟件股份有限公司,未經(jīng)上海派拉軟件股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910896405.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:半導體裝置
- 下一篇:調(diào)色劑補給裝置、顯影裝置以及圖像形成裝置





