[發明專利]基于精準聚類的胃食管反流疾病危險因素提取方法及系統在審
| 申請號: | 201811589375.0 | 申請日: | 2018-12-25 |
| 公開(公告)號: | CN109685139A | 公開(公告)日: | 2019-04-26 |
| 發明(設計)人: | 劉萬里;徐雷;黃玉珍;姚瀾;李榮臻;夏吉安 | 申請(專利權)人: | 劉萬里 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G16H50/20 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 杜陽陽 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 胃食管反流疾病 聚類 危險因素 矩陣 量化數據 層次聚類 患者信息 樹狀圖 類簇 層次聚類算法 聚類處理 聚類算法 數據量化 樣本點 構建 發病率 篩選 | ||
本發明公開了一種基于精準聚類的胃食管反流疾病危險因素提取方法及系統。首先構建包含胃食管反流疾病危險因素的初始患者信息集;其次對初始患者信息集中的因素進行數據量化處理,得到量化數據矩陣;然后采用層次聚類算法對量化數據矩陣中的每個樣本點進行聚類處理,得到層次聚類樹狀圖;再者根據層次聚類樹狀圖確定聚類數目,并將聚類數目與K?Means聚類算法結合,對量化數據矩陣中的元素進行聚類,得到多個類簇;最后計算每個類簇中各個元素間的相關指數,并將相關指數最大的元素確定為胃食管反流疾病危險因素。本發明將兩種聚類方法相結合,高效的篩選出引發胃食管反流疾病的危險因素,降低發病率。
技術領域
本發明涉及聚類與醫學技術領域,特別是涉及一種基于精準聚類的胃食管反流疾病危險因素提取方法及系統。
背景技術
胃食管反流疾病作為一種世界范圍內普遍存在的消化系統疾病,其發病率呈現出逐年上升的趨勢。因此,胃食管反流疾病的治療應當引起我們的足夠重視。由于胃食管反流疾病的發生與生活方式、情緒變化、飲食習慣等密切相關,病情極易發生變化,因此通過采集大量數據并分析數據特征對研究該疾病及預防有重要作用。
目前在胃食管反流疾病診斷技術中主要是采用聚類算法提取危險因素,但是其聚類數目和聚類中心的選取比較困難,往往因為聚類數目和聚類中心選擇錯誤導致危險因素提取精確率較低。
發明內容
本發明的目的是提供一種基于精準聚類的胃食管反流疾病危險因素提取方法及系統,以解決現有技術中因聚類數目和聚類中心選擇錯誤導致危險因素提取精確率較低的問題。
為實現上述目的,本發明提供了如下方案:
一種基于精準聚類的胃食管反流疾病危險因素提取方法,所述方法包括:
構建初始患者信息集;所述初始患者信息集為M行N列的數據集;所述初始患者信息集中的第i行第1列的因素為患者問卷ID號,且不同行中第1列的因素表示為不同的患者問卷ID號;所述初始患者信息集中的第1行第j列的因素為調查問卷的問題,且不同列中第1行的因素表示為不同的問題;所述初始患者信息集中的第i行第j列的因素為第i患者問卷ID號對第j問題的答案;其中,2≤i≤M,2≤j≤N;
對所述初始患者信息集中的答案進行數據量化處理,得到量化數據矩陣;所述量化數據矩陣為M行N列的矩陣;所述量化數據矩陣中的第i行第1列的元素為患者問卷ID號,且不同行中第1列的元素表示為不同的患者問卷ID號;所述量化數據矩陣中的第1行第j列的元素為調查問卷的問題,且不同列中第1行的元素表示為不同的問題;所述量化數據矩陣中的第i行第j列的元素為第i患者問卷ID號第j問題答案的數據量化結果果;其中,2≤i≤M,2≤j≤N;
采用層次聚類算法對所述量化數據矩陣中的每個樣本點進行聚類處理,得到層次聚類樹狀圖;第z個所述樣本點代表所述量化數據矩陣中的第z行數據;所述樣本點的個數與所述量化數據矩陣的列數相同,其中,2≤z≤M;
根據所述層次聚類樹狀圖確定聚類數目;
根據所述聚類數目和K-Means聚類算法,對所述量化數據矩陣中的元素進行聚類,得到多個類簇;
計算每個所述類簇中各個元素間的相關指數,并將相關指數最大的元素確定為胃食管反流疾病危險因素;所述相關指數為相關系數平方的平均數。
可選的,所述采用層次聚類算法對所述量化數據矩陣中的每個樣本點進行聚類處理,得到層次聚類樹狀圖,具體包括:
采用凝聚層次聚類算法對所述量化數據矩陣中的每個樣本點進行聚類處理,得到層次聚類樹狀圖。
可選的,所述采用凝聚層次聚類算法對所述量化數據矩陣中的每個樣本點進行聚類處理,得到層次聚類樹狀圖,具體包括:
步驟1,計算兩兩樣本點之間的距離;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉萬里,未經劉萬里許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811589375.0/2.html,轉載請聲明來源鉆瓜專利網。





