[發明專利]用于病歷檔案整理的層次聚類系統在審
| 申請號: | 201710597708.3 | 申請日: | 2017-07-20 |
| 公開(公告)號: | CN107436933A | 公開(公告)日: | 2017-12-05 |
| 發明(設計)人: | 童永安;鄺洋輝;勞敏 | 申請(專利權)人: | 廣州慧揚健康科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F19/00;G06Q50/24 |
| 代理公司: | 深圳市合道英聯專利事務所(普通合伙)44309 | 代理人: | 廉紅果 |
| 地址: | 510000 廣東省廣州市黃埔區茅崗村坑*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 病歷 檔案 整理 層次 系統 | ||
技術領域
本發明涉及醫療技術領域,特別是指一種用于病歷檔案整理的層次聚類系統。
背景技術
由于不同的病歷檔案之間既有個性又有共性,因此可以在同一批病歷檔案之中根據病歷檔案之間的不同特征,將相似的病歷分為多個類。通過對病歷檔案進行聚類分析,能夠將數量龐大的電子病歷分為若干類,從而發現某個群體共有的特征,從而在臨床問題的發現環節乃至于對臨床實踐都有相當的指導意義。例如對于消化道疾病的研究而言,通過對不同人群的腸道菌落、飲食習慣進行聚類分析,能夠將一批人群分為若干類別,從而為進一步的研究提供分組方法。
聚類分析是統計學中的一種分析方法。聚類分析的目標就是在相似的基礎上收集數據來分類,從而將一個樣本分為若干類別。聚類分析常用的方法包括層次聚類與非層次聚類,但是由于這些聚類方法對于變量類型具有一定限制,并且常用于單變量分析,難以應用于病歷檔案的分類上。
因此需要開發一種用于病歷檔案整理的層次聚類系統,用于病歷檔案的整理分類。
發明內容
針對背景技術中存在的問題,本發明的目的是提供一種用于病歷檔案整理的層次聚類系統,采用層次聚類的思想對病歷檔案特征進行分析,從而得出不同病歷檔案之間聚類的方法,應用于病歷檔案的整理分類,從而為臨床科研的進一步開展提供分組方法或確立研究方向。
本發明的技術方案是這樣實現的:一種用于病歷檔案整理的層次聚類系統,包括病歷導入模塊、向量處理模塊、夾角余弦計算模塊以及聚類分析模塊,其中,所述病歷導入模塊:用于對用戶所導入的病歷檔案進行初步的處理,使用數據接口對導入的病歷檔案進行轉換,從而將導入的病歷檔案中的各個變量進行規范化,便于下一步向量處理模塊對不同變量的抽象化處理;所述向量處理模塊:用于對需要分析的變量進行變量類型與比例的轉換,包含連續型變量轉換、邏輯型變量轉換以及文本型變量轉換;完成向量轉換之后,將各個個體的空間向量坐標存放于空間向量庫當中,用于下一步的夾角余弦統計量計算:所述夾角余弦計算模塊:兩個空間向量的相似系數用兩個空間向量Xi和Xj的夾角余弦值cosθij來表示,
每兩個空間向量都對應有一個相似系數,將任何兩個空間向量的相似系數計算出來并排列為相似矩陣;所述聚類分析模塊:用于根據不同個體之間的相似系數進行聚類分析,根據聚類分析結果制作聚類圖,用戶根據聚類圖,選擇需要在哪一層進行分類,或者選擇相似系數閾值,根據選擇的標準將各個病歷檔案分入不同的類當中。
在上述技術方案中,所述文本型變量轉換包含特殊轉換與普通轉換,其中,所述特殊轉換指在向量處理模塊中預設有轉換標準,根據該轉換標準轉換為具體的數值;所述普通轉換指用戶在導入病歷時,對該文本型變量設定不同文本與數值之間的映射關系,向量轉換模塊根據設定值與映射關系,賦予對應的數值,作為空間向量中的一個維度。
在上述技術方案中,所述聚類分析的步驟為:
a.將相似矩陣簡化為三角函數的表;
b.在相似矩陣中找到相似系數的最大值,將該最大值代表的兩個向量所處的類連結起來,每個向量所屬的最小的類就是它本身,如果該向量此前未被劃分到任何一個類中,則其本身所處的類與另一向量所處的類聯結起來,聯結后劃掉該相似系數所在的行與列;
c.在表中尋找最大的相似系數,重復上一個步驟,直到所有相似系數都被劃掉,得到的聚類結果;
d.根據該聚類結果作出聚類圖。
本發明用于病歷檔案整理的層次聚類系統,包括病歷導入模塊、向量處理模塊、夾角余弦計算模塊以及聚類分析模塊,病歷導入模塊用于對導入的病歷檔案中的各個變量進行規范化;向量處理模塊用于對需要分析的變量進行變量類型與比例的轉換,將各個個體的空間向量坐標存放于空間向量庫當中;夾角余弦計算模塊用于計算任意兩個空間向量的相似系數并排列為相似矩陣;聚類分析模塊根據相似系數進行聚類分析,根據聚類分析結果制作聚類圖,用戶根據聚類圖,選擇分類層或相似系數閾值,將各個病歷檔案分入不同的類當中。如此應用于病歷檔案的整理分類,從而為臨床科研的進一步開展提供分組方法或確立研究方向。
附圖說明
圖1為本發明用于病歷檔案整理的層次聚類系統內模塊連接圖;
圖2為本發明中聚類分析模塊的聚類圖;
圖3為本發明中聚類分析模塊的流程圖;
圖4為本發明中一實例的聚類圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州慧揚健康科技有限公司,未經廣州慧揚健康科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710597708.3/2.html,轉載請聲明來源鉆瓜專利網。





