[發明專利]一種基于樸素貝葉斯算法的預測模型的建立方法在審
| 申請號: | 201811020809.5 | 申請日: | 2018-09-03 |
| 公開(公告)號: | CN109036568A | 公開(公告)日: | 2018-12-18 |
| 發明(設計)人: | 王庚;石興磊;高傳貴 | 申請(專利權)人: | 浪潮軟件集團有限公司 |
| 主分類號: | G16H50/50 | 分類號: | G16H50/50;G16H50/20 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預測模型 貝葉斯 算法 皮爾森相關系數 診斷和治療 參考數據 傳統算法 定量數據 定性數據 高斯模型 加權特征 評價指標 特征數據 衛生事業 因素數據 預測結果 綜合考慮 腦卒中 滑動 預測 加權 界定 權重 轉化 醫生 分析 | ||
1.一種基于樸素貝葉斯算法的預測模型的建立方法,其特征在于:收集與腦卒中相關的因素數據組成特征集合B,并對相關的數據進行預處理,將定性數據轉化為定量數據,利用皮爾森相關系數法計算各個特征與目標值的相關系數,將相關系數值定量轉化為權重wi;將傳統算法結合多項式及高斯模型來分別處理離散和連續的特征數據,采用加權特征分析方法提升重要特征對預測結果的影響;引入精確率precision,召回率recall,模型綜合評價指標F_measure以及ROC曲線來完成對預測模型的綜合評估,進而得到高預測精確率的預測模型。
2.根據權利要求1所述的基于樸素貝葉斯算法的預測模型的建立方法,其特征在于:對離散的特征數據采用拉普拉斯修正對概率計算結果進行平滑處理,對于特征集合B中任意特征b,它的取值個數為m,在計算特征b對腦卒中影響概率時,在分母上加m,在分子上加1完成對計算結果平滑的修正;
根據性別及其類似的離散特征得到的預測概率公式表示為:
其中,P(B(j)=b(j)|A=ck)是條件概率的表示方法,其含義是在分類為ck的前提下,特征b取值為b(j)時的概率,在條件上有先后順序的要求;P(B(j)=b(j),A=ck)是經典概率的表示方式,其含義是分類A取值為ck,同時特征b取值為b(j)的概率值。
3.根據權利要求1所述的基于樸素貝葉斯算法的預測模型的建立方法,其特征在于:根據BMI以及其類似的連續特征得到的預測概率公式表示為:
其中,σ是在ck分類下的標準差,u為均值,x為相應特征的具體值。
4.根據權利要求1所述的基于樸素貝葉斯算法的預測模型的建立方法,其特征在于:采用加權特征分析方法提升重要特征對預測結果的影響;特征Bi的權重為wi,對所有特征進行處理后特征的權重向量W表示為W=(w1;w2;w3;...;wi),通過權重向量W可以直觀的反映出各特征在模型預測中的重要程度,其中i為自然數;基于經典的條件概率公式樸素貝葉斯算法的預測模型表示為:
其中,P(B|A)的原計算公式為在加入權重向量W之后調整為根據以上推論加權的樸素貝葉斯算法的預測模型表示為:
其中,B是特征集合,A為是否患腦卒中的分類;P(A|B)是在已知特征集合的情況下判斷是否患有腦卒中的條件概率,叫做后驗概率;P(B)是先驗概率,也叫做標準化常量,是指通過事件發生次數對概率的主觀判斷;Pw(B|A)是已知是否患有腦卒中后對應的特征集合的條件概率,叫做似然函數,似然函數是對某件事發生可能性的判斷,與條件概率正好相反,通過事件已經發生的概率推算事件可能性的概率;Pw(B|A)/P(B)是調整因子,也被稱作標準似然度,調整因子是似然函數與先驗概率的比值,這個比值相當于一個權重,用來調整后驗概率的值,使后驗概率更接近真實概率;P(A)是否患有腦卒中的概率。
5.根據權利要求1所述的基于樸素貝葉斯算法的預測模型的建立方法,其特征在于:所述精確率precision是模型預測為腦卒中患者且正確的數量在模型預測為腦卒中患者的數量中所占的比值,用P表示;所述召回率recall模型預測為腦卒中患者且正確的數量在樣本中標記為腦卒中患者的數量中所占的比值,用R表示;P與R的數值越趨近于1,查準率或查全率就越高;當P與R數值出現矛盾時,和分別用P和R表示,通過模型綜合評價指標F_Measure作加權調和平均。
6.根據權利要求5所述的基于樸素貝葉斯算法的預測模型的建立方法,其特征在于:所述模型綜合評價指標F_Measure表示為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件集團有限公司,未經浪潮軟件集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811020809.5/1.html,轉載請聲明來源鉆瓜專利網。





