[發明專利]一種基于時空聚類統計進行疾病風險評估的方法有效
| 申請號: | 201810995255.4 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109065168B | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 龍華;楊威;杜慶治 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G06F16/28 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時空 統計 進行 疾病 風險 評估 方法 | ||
本發明公開了一種基于時空聚類統計進行疾病風險評估的方法,屬于時空事件聚類分析方法領域。本發明首先收集疾病數據生成疾病數據庫;然后根據數據庫中數據,給數據庫中每個區域和時間周期內的數據添加輔助數據;再通過時空凝聚式聚類算法和混合泊松對數線性模型進行處理;最后通過決策規則判斷風險。本發明與現有技術相比,本發明使用時空凝聚式聚類算法和混合泊松對數線性模型對數據進行處理,并通過決策規則對處理結果進行判斷,減少了疾病風險圖的過度平滑對估計結果的影響,提高了估計結果的準確性。
技術領域
本發明涉及一種基于時空聚類統計進行疾病風險評估的方法,屬于時空事件聚類分析方法領域。
背景技術
在當今社會,各類疾病的檢查及其預防中,時空聚類統計方法通常被用作各類疾病爆發的早期風險評估中,許多研究人員通過該方法在海量的數據中挖掘隱藏在數據背后的關聯性,通過對于這些數據之間關聯性的解讀,得到區域單位數據的疾病風險圖,該風險圖通常是通過具有局部空間平滑的泊松混合模型來估計的,然而,該模型存在的缺陷是,局部不連續點通常不被模擬,熱或冷點區域聚類被屏蔽,導致疾病風險圖的過度平滑,造成預警準確性的下降。
發明內容
為了克服現有技術的不足,本發明的目的在于一種基于時空聚類統計進行疾病風險評估的方法。本發明是在提升疾病預警時空統計聚類的結果準確率上,主要為提高時空統計聚類結果的準確性,使用時空凝聚式聚類算法以及混合的泊松對數線性模型對疾病數據進行處理從而提升疾病風險評估的準確性。
本發明采用的技術方案是:一種基于時空聚類統計進行疾病風險評估的方法,包括如下步驟:
Step1:收集疾病數據生成疾病數據庫;
Step2:獲取數據庫中數據,并給數據庫中每個區域和時間周期內的數據添加輔助數據;
Step3:對Step2中經過處理的數據,使用時空凝聚式聚類算法進行處理;
Step4:對Step3中處理過的數據,利用混合泊松對數線性模型進行分析;
Step5:對Step4中的分析結果利用決策規則判斷風險;
Step6:根據Step5中的判別結果對疾病風險進行估計。
進一步地,所述步驟Step2中,添加的輔助數據是來自具有類似時空風險模式的疾病。
進一步地,所述步驟Step3中,時空凝聚式聚類算法的具體實施步驟是:
S1:構造一個初始聚類配置,Ch={Ch(1),...,Ch(nT)},其中h=nT,每個區域時間段Ait是一種單獨的時空聚類。
S2:計算h×h矩陣中聚類之間的距離,聚類中至少包含元素Ait和Ajs中的一副元素,Ait和Ajs是空間鄰近地區在同一時間(i~j and t=s),或同一地區相鄰時間點(i~jand|t-s|=1)的元素;
S3:將兩個具有最小距離聚類的時空單元合并,形成一個新的聚類結構Ch-1;
S4:重復進行S2與S3步驟;
S5:當所有的時空單元被合并在一個新的時空聚類中時,算法結束;
進一步地,所述步驟Step4中,混合泊松對數線性模型既有固定聚類效應,也有隨機聚類效應,根據給定的時空聚類配置Ck={Ck(1),...,Ck(k)},基于模型選擇標準選擇最好的聚類結構。
進一步地,所述固定聚類效應為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810995255.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:老年人運動風險評估方法
- 下一篇:一種養老院看護信息系統





