[發明專利]疾病概率的檢測方法和裝置在審
| 申請號: | 201710095020.5 | 申請日: | 2017-02-20 |
| 公開(公告)號: | CN107622801A | 公開(公告)日: | 2018-01-23 |
| 發明(設計)人: | 李菲菲;徐亮;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所44287 | 代理人: | 胡海國 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 疾病 概率 檢測 方法 裝置 | ||
技術領域
本發明涉及疾病信息處理領域,尤其涉及一種疾病概率的檢測方法和裝置。
背景技術
傳統的疾病概率檢測,如癌癥患病率的檢測,是基于生物學、基因組學、以及體檢化驗結果等復雜方式實現的。這種方法需要精準的數據源,并且在獲取到數據源之后,還需要花費較長的時間進行分析處理,以得到檢測結果,再加上數據源獲得途徑較復雜,對疾病檢所花費的成本也較高。因此,現有的疾病概率檢測方式,既無法快速對疾病概率進行檢測,而且疾病概率檢測的成本也較高。
發明內容
本發明的主要目的在于提供一種疾病概率的檢測方法和裝置,旨在解決現有技術對疾病概率的檢測,不僅檢測的時間較長,而且花費成本也較高的技術問題。
為實現上述目的,本發明提供一種疾病概率的檢測方法,所述疾病概率的檢測方法包括:
采集用戶關聯的各個數據,并對采集的各個數據進行特征處理;
根據特征處理后的各個數據構造多維度數據集;
對所述多維度數據集進行隨機抽樣,以劃分出測試集和訓練集;
基于所述訓練集搭建模型,得到回歸決策樹;
根據所述測試集對所述回歸決策樹進行測試,以計算用戶的疾病概率。
優選地,所述對采集的各個數據進行特征處理的步驟包括:
對采集的各個數據進行特征分析,以確定各個數據的特征類型;
在數據為缺失值數據時,對缺失值數據進行均值插補處理或多重插補處理;
在數據為異常值數據時,對異常值數據進行篩選,以篩選出異常值小于預設閾值的數據,并將篩選出的數據作為缺失值數據進行處理。
優選地,所述均值插補處理的方式包括:采用平均值進行插補處理,或采用眾數進行插補處理。
優選地,所述根據特征處理后的各個數據構造多維度數據集的步驟包括:
確定特征處理后的各個數據對應的特征飽和度;
根據特征飽和度對各個數據進行篩選,以篩選出特征飽和度達到預設飽和度的各個數據;
根據篩選出的各個數據構造多維度數據集。
優選地,所述根據所述測試集對所述回歸決策樹進行測試,以計算用戶的疾病概率的步驟包括:
將所述測試集的數據輸入到所述回歸決策樹中,以根據所述回歸決策樹中樹的數量得到對應數量的各個數值;
將各個數值與所述回歸決策樹中各個樹的權重值進行加權平均,得到所述回歸決策樹的總值;
將所述總值作為用戶的疾病概率。
此外,為實現上述目的,本發明還提供一種疾病概率的檢測裝置,所述疾病概率的檢測裝置包括:
處理模塊,用于采集用戶關聯的各個數據,并對采集的各個數據進行特征處理;
構造模塊,用于根據特征處理后的各個數據構造多維度數據集;
劃分模塊,用于對所述多維度數據集進行隨機抽樣,以劃分出測試集和訓練集;
搭建模塊,用于基于所述訓練集搭建模型,得到回歸決策樹;
計算模塊,用于根據所述測試集對所述回歸決策樹進行測試,以計算用戶的疾病概率。
優選地,所述處理模塊包括:
特征分析單元,用于對采集的各個數據進行特征分析,以確定各個數據的特征類型;
插補處理單元,用于在數據為缺失值數據時,對缺失值數據進行均值插補處理或多重插補處理;
篩選處理單元,用于在數據為異常值數據時,對異常值數據進行篩選,以篩選出異常值小于預設閾值的數據,并將篩選出的數據作為缺失值數據進行處理。
優選地,所述均值插補處理的方式包括:采用平均值進行插補處理,或采用眾數進行插補處理。
優選地,所述構造模塊包括:
確定單元,用于確定特征處理后的各個數據對應的特征飽和度;
篩選單元,用于根據特征飽和度對各個數據進行篩選,以篩選出特征飽和度達到預設飽和度的各個數據;
構造單元,用于根據篩選出的各個數據構造多維度數據集。
優選地,所述計算模塊包括:
輸入單元,用于將所述測試集的數據輸入到所述回歸決策樹中,以根據所述回歸決策樹中樹的數量得到對應數量的各個數值;
計算單元,用于將各個數值與所述回歸決策樹中各個樹的權重值進行加權平均,得到所述回歸決策樹的總值;
處理單元,用于將所述總值作為用戶的疾病概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710095020.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:非易失性存儲器的驅動電路
- 下一篇:一種彈性導線及其制備方法





