[發明專利]一種基于大數據提取糖尿病發病數據的方法在審
| 申請號: | 202110841704.1 | 申請日: | 2021-07-26 |
| 公開(公告)號: | CN113539507A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 劉玉蓉 | 申請(專利權)人: | 重慶真逆思維科技有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F17/18 |
| 代理公司: | 重慶天成卓越專利代理事務所(普通合伙) 50240 | 代理人: | 王宏松 |
| 地址: | 402160 重慶市*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 提取 糖尿病 發病 方法 | ||
1.一種基于大數據提取糖尿病發病數據的方法,其特征在于,包括如下步驟:
S1,獲取患者病例數據,對病例數據中的文本數據和數值數據分別進行提取,將提取的文本數據和數值數據進行特征抽樣;
S2,將特征抽樣數據建立指標數據集,對指標數據集建立目標函數,根據目標函數進行數據篩選;
S3,對數據篩選后通過聚類算法進行患者病例數據指標判斷。
2.根據權利要求1所述的基于大數據提取糖尿病發病數據的方法,其特征在于,所述S1包括:
S1-1,獲取病例數據中患者檢查項,針對文本數據和數值數據進行歸一化處理,計算條件概率Dij,
其中,Vi為病例數據的文本數據集,Vj為病例數據的數值數據集,Mij為病例類別權重;b是搜索文字關鍵詞的二值化頁面參數,C是調節因子,dk為選擇的病例關鍵詞,其中Vi·(b|dk)+Vj·β是獲取的文本數據集Vi和數值數據集Vj的匹配度,β為數值有效性權重。
3.根據權利要求2所述的基于大數據提取糖尿病發病數據的方法,其特征在于,所述S1還包括:
S1-2,將歸一化處理的數據集,進行數據相似度判斷,提取文本數據分布函數Ei和數值數據分布函數Ej度量數據相似性,Ws為病例評測的權重集合,s∈{1,2,…n};
計算高斯分布
將B的平滑部分和高斯混合模型的似然估計進行線性組合,獲得高斯分布。
4.根據權利要求3所述的基于大數據提取糖尿病發病數據的方法,其特征在于,所述S1還包括:
S1-3,形成的文本數據和數值數據數據節點,通過B的高斯分布進行特征抽樣,根據抽樣后的節點特征A進行閾值判斷,從而對抽樣的節點進行收斂,防止回溯,
其中,u+v是抽樣后的文本數據和數值數據數據節點總數量,class(u)是文本數據抽樣u的級別,class(v)是數值數據抽樣v的級別,α文本數據擾動因子,|L|為相似文本數據的間隔長度的絕對值,μ為數值數據擾動因子;
u和v的鄰居節點并不重合,當u和v的級別都到達最小時,調節相應的擾動因子,讓u和v的鄰居節點數唯一,當u和v的級別都到達最大時,對抽樣的節點進行收斂形成指標數據集。
5.根據權利要求1所述的基于大數據提取糖尿病發病數據的方法,其特征在于,所述S2包括:對于指標數據集通過目標函數將抽樣后文本數據和數值數據進行分割,分別為Iu和Iv,
I=Iu+Iv
其中,Q(u)為抽取文本數據的狀態分布,Q(v)為抽取數值數據的狀態分布,Ψ為數值數據的狀態比率,q為計算抽樣數據的均值;
針對λ的文本數據提取算子,將等式求導設為
設得到
通過均值計算后,對抽樣數據進行數據篩選,從而得到病例數據中數值數據的異常樣本。
6.根據權利要求1所述的基于大數據提取糖尿病發病數據的方法,其特征在于,所述S3包括:
根據聚類算法預測公式
獲取異常數據信息,
其中,σ為時間節點間隔調節值,為u和v中的病例發病樣本標簽,xu,v為預測的樣本概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶真逆思維科技有限公司,未經重慶真逆思維科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110841704.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





