[發明專利]一種基于特征權重的LARS糖尿病預測方法在審
| 申請號: | 201910340600.5 | 申請日: | 2019-04-25 |
| 公開(公告)號: | CN110060781A | 公開(公告)日: | 2019-07-26 |
| 發明(設計)人: | 高秀娥;陳波;陳世峰;桑海濤;胡玲艷 | 申請(專利權)人: | 嶺南師范學院 |
| 主分類號: | G16H50/50 | 分類號: | G16H50/50;G06F17/18;G06F17/16 |
| 代理公司: | 廣州市南鋒專利事務所有限公司 44228 | 代理人: | 李慧 |
| 地址: | 524000 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量 糖尿病 特征權重 殘差 糖尿病預測模型 回歸系數向量 相關度 擬合 自變量 數據集矩陣 糖尿病預防 醫療信息化 最大相關度 單位向量 關鍵特征 初始化 歸一化 容忍度 數據集 指標集 預測 范數 篩選 重復 更新 治療 | ||
1.一種基于特征權重的LARS糖尿病預測方法,其特征在于,包括如下步驟:
步驟1,歸一化糖尿病數據集矩陣,初始化當前擬合值向量和殘差向量;
步驟2,計算自變量特征權重向量和原始相關度向量;
步驟3,計算角平分向量、回歸系數向量、新相關度向量和最大相關度;
步驟4,更新回歸系數向量,擬合值向量、殘差向量和指標集;
步驟5,判斷殘差向量的L2范數是否小于容忍度,若是則結束,否則重復步驟3至步驟5。
2.根據權利要求1所述基于特征權重的LARS糖尿病預測方法,其特征在于,所述步驟1的糖尿病數據集特征之間差值大,需對每個特征值進行歸一化;所述當前擬合值為當前迭代的預測值,殘差為真實值與當前預測值的差,其計算方式(1)為:
式中,μ為當前擬合值向量;y為真實值向量。
3.根據權利要求1所述基于特征權重的LARS糖尿病預測方法,其特征在于,所述步驟2中計算原始特征自變量與y的相關度公式(2)為:c=XTy
所述計算特征自變量的特征權重的公式(3)為:
式中,為特征方程的特征值,
特征方程中R為糖尿病數據集矩陣的協方差矩陣,其計算公式(4)為:
式中,θi為第i個特征的均值。
4.根據權利要求3所述基于特征權重的LARS糖尿病預測方法,其特征在于,所述步驟3中,計算新相關度的計算公式(5)為:C=cTβ
式中,c=XT(y-μA),μA為前一步的擬合值;β為求得各特征自變量的特征權重向量,其相關度最大值公式(6)為:C_max=max{|C|}
當前最大相關時,則A自變量與y的相關度都為最大。
回歸系數向量和角平分的計算公式(7)分別為:
其中,是一個指標集,XA為X從中取出的A指標集里的列向量,并使其與y同向,則公式(8)分別為:
5.根據權利要求4所述基于特征權重的LARS糖尿病預測方法,其特征在于,所述步驟4中,更新回歸系數向量,擬合值向量,殘差向量的計算公式分別為:
ωA=ωA+γωA (9)
μA=μA+γuA (10)
隨著γ的減小,殘差增大,進而與各自變量的相關度也增大,得a=XTuA,因此算法沿uA方向的前進長度公式(12)為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于嶺南師范學院,未經嶺南師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910340600.5/1.html,轉載請聲明來源鉆瓜專利網。





