[發明專利]一種基于ɑ-RIPPER分類器的國民體質健康分析方法在審
| 申請號: | 201910632232.1 | 申請日: | 2019-07-13 |
| 公開(公告)號: | CN110335680A | 公開(公告)日: | 2019-10-15 |
| 發明(設計)人: | 朱容波 | 申請(專利權)人: | 朱容波;丹陽市遠波醫療科技有限公司 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 212300 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 國民體質 沖突率 分類器 算法 分類模型 規則沖突 計算規則 評價指標 生長階段 生長狀況 數學問題 分析 比特位 成長期 剪枝 健康 綜合分析 構建 前件 體質 分類 引入 轉換 優化 | ||
1.一種基于ɑ-RIPPER分類器的國民體質健康分析方法,其特征在于:將國民體質健康分析轉換為數學問題,利用優化的RIPPER算法,構建ɑ-RIPPER分類模型,實現對以地域劃分的成長期兒童或青少年不同生長階段各項重要體質評價指標的歸類并結合評價結果綜合分析兒童或青少年的生長狀況。
2.根據權利要求1所述的基于ɑ-RIPPER分類器的國民體質健康分析方法,構建一種基于ɑ-RIPPER分類器的國民健康分析方法,其特征在于:將兒童青少年體質健康分析轉換為數學問題,構建ɑ-RIPPER分類模型,實現對以地域劃分的成長期兒童或青少年不同生長階段各項重要體質評價指標的歸類并結合評價結果綜合分析兒童或青少年的生長狀況。
請見圖1,通過對入庫的青少年兒童的相關基本信息進行整理,提取成長期青少年兒童的健康信息包括年齡、性別、所在地域、身高體重、父親身高、母親身高、立定跳遠、引體向上、俯臥撐、仰臥起坐、肺活量、體前屈、折返跑、實心球、握力、體脂、血壓、視力、聽力等生長期關鍵信息作為模型的輸入X,即X={x1,x2,x3,x4,...,xi};對成長期兒童青少年不同年齡階段各項指標的檢測并結合特定地域內兒童青少年男女生生長指標等級進行劃分,其中地域內成長的各項指標包括身高、體重等發育指標,且上述指標通常根據當地飲食氣候、遺傳等因素進行綜合評估,最終得到成長期兒童青少年當前各項重要生長指標的等級Y,且Y={y1,y2,y3,...,ym};將其作為模型輸出,構分析預測模型。
3.根據權利要求2所述的構建一種基于ɑ-RIPPER分類器的國民健康分析方法,其特征在于,步驟2的具體實現見圖2,包括以下子步驟:
步驟3.1:通過α-IREP*算法獲得輸入數據集D的規則集Rule,執行α-IREP*算法:
請見圖3,具體實現包括以下子步驟:
步驟3.1.1:對輸入數據集合Dataset進行分割,得到正例集Pos和反例集Neg;
步驟3.1.2:初始化集合Rule、nR,其中Rule存放剪枝后的規則,nR存放單條規則;
步驟3.1.3:判斷Pos集合是否為空,若是執行步驟3.1.10,否則執行步驟3.1.4;
步驟3.1.4:將數據集正反例按比例分割成訓練集Grow和剪枝集Prune,初始化集合nR;
步驟3.1.5:調用FindLiteral尋找合適的邏輯字加入集合nR,并更新訓練集Grow;
在IREP*算法中PruneR遵循的策略是“準而短”,即生成一條規則后,不斷減少規則前件直到ɑ最大,即覆蓋的真正例率最高為止。對于FindLiteral算法,具體做法為:首先依據輸入數據元組的屬性生成候選文字集P,將P中文字分別與已生成的規則前件進行組合析取,分別計算信息增益Gain(表達式見式1),選擇信息增益較高的邏輯文字加入其中。
Gain(pi)=Cover·(log2t′-log2t) (1)
Cover(pi)表示添加pi后該條規則覆蓋的正例數,t、t'分別為加入pi前后規則覆蓋數據中正例的比例。
步驟3.1.6:判斷訓練集中反例是否為空,若是執行步驟3.1.7,否則跳轉到步驟3.1.5;
步驟3.1.7:對生成的單條規則nR進行Prune剪枝;
步驟3.1.8:判斷加入nR后的規則集描述長度是否比目前獲得的最小規則集描述長度大d(默認64bit)bit,若是則執行步驟3.1.9,否則執行步驟3.1.12,更新規則集的最大長度。
步驟3.1.9:計算新生成規則nR與Rule規則集中各規則間的沖率Cr;
步驟3.1.10:判斷Cr是否大于閾值ɑ,若是則執行步驟3.1.11,否則執行步驟3.1.12;
步驟3.1.11:對沖突率大于閾值的規則進行剪枝,執行步驟3.1.10;
步驟3.1.12:將Pos與Neg中被nR覆蓋的元組刪除,更新Pos、Neg,將nR加入到Rule,返回3.1.3;
步驟3.2:初始化循環次數i=0;
步驟3.3:對Rule進行后處理優化PostOpt,獲得最優規則集RuleSet;
PostOpt具體實現包括以下子步驟:
步驟2.3.1:針對規則集Rule中的每一條規則ri利用α-IREP*產生兩個候選規則r'、r:(1)在r'生成過程中,以規則ri覆蓋的樣例集作為α-IREP*的剪枝集Pos',剪枝時在整個剪枝集Pos進行覆蓋準確率度量;(2)r生成時,以規則ri覆蓋的樣例集作為α-IREP*的增長集Grow',對ri增加邏輯文字,直至不能增加為止,然后進行剪枝,得到規則集r。
步驟2.3.2:將規則集R中的ri分別用r'、r替換形成R'、R,通過比較規則集R、R'、R三者在數據集D上的覆蓋準確率選擇其中質量最高的規則集作為后處理優化后的Ruleset。
步驟3.4:將數據集D中未被規則集RuleSet覆蓋的數據Di作為輸入,通過α-IREP*算法獲得規則集Ri
步驟3.5:將Ri加入到RuleSet,更新i=i+1,Rule=Ruleset;
步驟3.6:判斷i是否等于設定值,若是執行步驟3.7,否則執行步驟3.3;
步驟3.7:輸出規則集Rule。
4.根據權利要求3所述的改進的RIPPER分類器分析方法,其特征在于:步驟3.1.9-3.1.11中,在RIPPER算法規則集增長階段,設置一個沖突率閾值α,每增加一條規則對規則集在訓練數據上各項規則間的沖突率δi進行計算并將其與α比較,當δi>α時,對產生沖突的規則進行剪枝操作直至低于閾值。上述操作從控制沖突率的角度進行沖突消解同時依照MDL原則對規則集描述長度進行控制,使規則的描述更加精練、準確,同時在一定程度上增強了算法泛化能力。其中沖突率閾值α的確定方法如下:
當完成一條規則的生成及初步剪枝后,在加入規則集前對該條規則與其他規則的沖率進行計算得到δ={δ1,δ2,…,δn},n為當前規則集中規則的條數,取沖突率的平均值作為α的值,表達式如下所示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于朱容波;丹陽市遠波醫療科技有限公司,未經朱容波;丹陽市遠波醫療科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910632232.1/1.html,轉載請聲明來源鉆瓜專利網。





