[發明專利]基于機器學習可解釋性的人體指標-腦卒中關系分析系統有效
| 申請號: | 202011336107.5 | 申請日: | 2020-11-25 |
| 公開(公告)號: | CN112447292B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 張雷;于凌霜;羅翀;張曉雯;沈俊東;余成;王崇駿 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H10/60;G06N20/00;G06K9/62 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 機器 學習 解釋性 人體 指標 腦卒中 關系 分析 系統 | ||
1.一種基于機器學習可解釋性的人體指標-腦卒中關系分析系統,其特征在于:包括數據輸入模塊、數據預處理模塊、機器學習模塊、相關性分析模塊、指標近鄰尋找模塊、新樣本制造模塊、新樣本預測統計模塊,其中:
所述數據輸入模塊用于輸入已患腦卒中和未患腦卒中的人體各項指標數據,并對是否患腦卒中進行標簽,并將輸入已患腦卒中和未患腦卒中的人體各項指標數據和標簽推送給數據預處理模塊;
所述數據預處理模塊用于對數據輸入模塊推送的已患腦卒中和未患腦卒中的人體各項指標數據和標簽進行缺失值補充處理,得到處理后的帶標簽數據的數據集;
所述機器學習模塊用于根據數據集中的數據對機器學習模型進行訓練,得到訓練好的機器學習模型,所述機器學習模型是一種用于人體各項指標來預測是否患病的模型;
所述相關性分析模塊根據數據集中人體各項指標運用皮爾森系數法進行相關性分析,找出與每個指標具有相關性的指標,得到指標關系數據;
所述指標近鄰尋找模塊用于根據要研究指標a,將數據集中的所有樣本按照要研究指標a的值分為等距的n個樣本組;同時根據等距的n個樣本組選取要研究樣本M,去掉要研究樣本M的指標a值,在等距的n個樣本組中根據指標關系數據分別找到k個最近鄰;
所述新樣本制造模塊用于對要研究樣本M中的要研究指標a的值在最大值和最小值之間擾動,取到所有的值,制造出一系列新樣本,同時新樣本中與要研究指標a相關的指標也隨著要研究指標a的改變而改變,改變方式如下:根據要研究指標a的值在相應的樣本組里根據指標關系數據找到要研究樣本M的k個近鄰,隨機選取一個近鄰,與要研究指標a相關的指標值由要研究樣本M的原有值和近鄰的值線性組合生成;
c=α×example+(1-α)×neighbor
其中,c為新生成的指標值,α為0和1之間的隨機數,example為要研究樣本M的指標值,neighbor為近鄰指標值;
所述新樣本預測統計模塊用于將得到的新樣本放入到已訓練好的機器學習模型進行是否患腦卒中預測,并對預測的結果進行統計,統計結果得到對于要研究指標a的每個值,要研究樣本M患腦卒中的概率,以及要研究樣本M患腦卒中概率隨要研究指標a的變化情況。
2.根據權利要求1所述基于機器學習可解釋性的人體指標-腦卒中關系分析系統,其特征在于:所述機器學習模型為隨機森林模型或深度學習模型。
3.根據權利要求2所述基于機器學習可解釋性的人體指標-腦卒中關系分析系統,其特征在于:指標關系數據中相關系數的絕對值大于0.2時,認為兩變量呈弱相關。
4.根據權利要求3所述基于機器學習可解釋性的人體指標-腦卒中關系分析系統,其特征在于:選取樣本的最近鄰時采用sklearn庫提供的BallTree方法。
5.根據權利要求4所述基于機器學習可解釋性的人體指標-腦卒中關系分析系統,其特征在于:所述數據預處理模塊中對人體各項指標數據中的離散特征進行編碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011336107.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于區塊鏈的眾包服務管理系統及方法
- 下一篇:一種多用途變徑扳手





