[發明專利]基于社區發現的醫療團隊組成方法在審
| 申請號: | 201810276035.6 | 申請日: | 2018-03-30 |
| 公開(公告)號: | CN108511078A | 公開(公告)日: | 2018-09-07 |
| 發明(設計)人: | 毛璐;金博 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F17/30 |
| 代理公司: | 大連格智知識產權代理有限公司 21238 | 代理人: | 劉琦 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫療團隊 社區發現 迭代 醫生 社區 抓取 計算機軟件 構造關系 科學指導 社區結構 網絡爬蟲 醫療資源 最終結果 可視化 構建 診療 集合 采集 團隊 合并 分割 醫學 配置 優化 分析 合作 | ||
本發明公開了一種基于社區發現的醫療團隊組成方法,包括如下步驟:通過網絡爬蟲,從萬方醫學網中抓取的關于醫生合作論文信息,從掛號網中采集的全國三甲醫院中醫生團隊信息,使用并查集重新劃分合并醫生的ID集合,并構造關系圖;選用SC,GN,FN,Walk Trap任一方法,用于發覺數據中的社區結構,并對社區進行劃分;在劃分的每個社區滿足五度分割理論的前提下,對每一次的迭代應選擇使得迭代劃分后的社區更穩定的結果,最后用Gephi將最終結果可視化。本發明是使用計算機軟件分析完成的,對構建醫療團隊具有有益的科學指導作用,有利于解決當前國內存在看病難等問題,優化醫療資源配置,提高就醫及診療效率。
技術領域
本發明涉及機器學習;人工智能;社區發現;數據挖掘;社交網絡,更具體地說,涉及一種基于社區發現的醫療團隊組成。
背景技術
FN(FastNewman)是目前使用最廣泛的社區發現算法之一。FN可以解決關系網絡子圖劃分問題。它的根本思想是基于模塊度進行社區劃分使得同一社區內部的連邊盡量多,不同社區之間的連邊盡量少。這樣,基于最大模塊度,就可以取得整體最好的子圖劃分效果。但這一特征也容易造成過度重視模塊度而忽略了將節點單獨劃分而造成出現許多散點的情況,而顯然這種結果對于關系網絡子圖的劃分并不是有代表性的理想的結果。但是已有技術中還存在的一些缺陷或問題,比如說算法復雜度比較大,只能對中小規模的關系網絡進行社區劃分,不適用于大規模關系網絡的社區發現。社區發現算法是無監督的,所以終止條件成為一個重要的課題。而僅以模塊度作為終止條件不僅容易產生散點問題,也不符合許多實際的應用需求。
發明內容
本發明給出一種基于社區發現的醫療團隊組成建議。
為了達到上述目的,本發明提供一種基于社區發現的醫療團隊組成方法,包括如下步驟:
S1、數據采集與預處理
通過網絡爬蟲,初步抓取兩個數據集:
數據集A是從萬方醫學網中抓取的關于醫生合作論文信息,主要包括醫生id、合作者id以及合作論文數;
數據集B是從掛號網中采集的全國三甲醫院中醫生團隊信息,主要包括醫生名、醫院名、團隊名;
數據預處理
根據數據集A中的醫生id從萬方醫學數據庫中醫生信息表獲取醫生姓名和所在醫院,將信息保存,得到數據集C,其主要包括醫生id、合作者id、合作論文數、醫生姓名以及醫院名;
將數據集B和數據集C進行關聯,關聯規則包括兩個:一是兩個數據集醫生姓名相同,二是兩個數據集醫院名相同,根據上述規則,可將醫生合作論文信息和醫生團隊信息整合在一起,將信息保存,最終得到包括醫生ID,姓名,所在醫院,合作論文篇數的醫生合作數據對;
最后使用并查集重新劃分合并醫生的ID集合,使得每個集合包含兩個ID號,表示兩個相互協作的醫生;
S2、構造關系圖
基于上述最終數據,以醫生的ID作為結點;以醫生是否有合作論文的關系作為邊關系,即有論文合作,則兩個節點之間有一條邊,無論文合作則無邊;以醫生合作論文的數量作為邊的權重構造基本關系圖;
S3、社區劃分方法
選用SC,GN,FN,Walk Trap任一方法,用于發覺數據中的社區結構,并對社區進行劃分;
S4、社區劃分結果及應用
在劃分的每個社區滿足五度分割理論的前提下,對每一次的迭代應選擇使得迭代劃分后的社區更穩定的結果,最后用Gephi將最終結果可視化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810276035.6/2.html,轉載請聲明來源鉆瓜專利網。





