[發明專利]基于異質醫療數據挖掘的甲狀腺癌風險預測方法有效
| 申請號: | 201810163600.8 | 申請日: | 2018-02-27 |
| 公開(公告)號: | CN108428478B | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 岳琳;殷明浩;趙曉威;陳煒通 | 申請(專利權)人: | 東北師范大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 長春眾邦菁華知識產權代理有限公司 22214 | 代理人: | 朱紅玲 |
| 地址: | 130000 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 醫療 數據 挖掘 甲狀腺癌 風險 預測 方法 | ||
1.基于異質醫療數據挖掘的甲狀腺癌風險預測方法,該方法由以下步驟實現:
步驟一、收集醫療數據,并構建異質病歷信息網絡模型;
設定樣本集合和標簽集合,所述樣本集合包括n個患者S={s1,...,sl,sl+1,...sn},為患者i的ni條記錄,rij為元組(xij,tij),其中為在時間tij的一個d維向量;標簽集合為C={1,...c},前l個患者si(i≤l)被標記為yi∈C,剩余u=n-l個患者sl+1,...,sl+u為未標記數據,通常lu;目標是為未標記的患者si預測標記
步驟一一、二進制化:將所有檢查類別里的各條目值進行編碼,即二進制轉化,1和0分別用來表示具體檢查類別下的某一條目值存在和不存在;
步驟一二、節點插入:在二進制轉化步驟中,所有被標記為1的條目,在節點插入步驟中都將被插入到異質數據圖中,相應的檢查條目名稱作為此數據圖中相應節點名稱,與檢查條目關聯的不同記錄也將作為節點插入,并且以相應的邊進行關聯;
步驟一三、節點編輯:節點編輯將插入后的節點根據檢查類別及具體條目進行類型編輯,異質患者數據信息網絡中包括表示患者記錄不同年份的節點及相應的檢查類別節點,上述節點最終被進一步抽象為變異網絡,檢查條目對應具體的檢查類別,健康檢查記錄被抽象為兩個層次,即基本的異質信息網絡和一個抽象的變異結構;
步驟一四、連接插入:把每條數據記錄與不同檢查類別下相應條目之間的連接權重插入數據圖,即通過設置連接權重函數為相應的邊賦以權重;
連接權重函數:
在某患者的某條記錄中,類型為v的節點中的某個條目,被表示為患者該條記錄節點和檢查類別下對應的條目節點之間的連接,對于異質圖中節點之間的連接權重,根據記錄年份遠近,對其重要性加以區別,具體計算公式如下:
g(t)=(t-startTime+1)/windowLength
其中,t為當前記錄所示時間,windowLength為時間長度窗口,startTime為時間窗口的開始時間,最終生成的變異網絡結構描述了患者記錄與不同類型節點之間最終生成連接,獲得任意兩類節點所構成稀疏矩陣的集合;
標準化權重:對輸出矩陣進行標準化處理,公式如下:
其中,D為對角矩陣;
步驟二、建立基于未知類別發現的學習模型;實現對未標記醫療數據的學習;
步驟二一、在步驟一中的標簽集合中加入c+1類別標記,為步驟一的網絡模型提供預測未知類別的機制;
定義
其中,為類型為v的節點標簽,xvp為類型為v的節點p的類別標簽;
當xvp已被標記,令
其中,為向量yvp的第k個類別對應的元素;
xvp未被標記時,令
步驟二二、設定計算標簽作為軟標簽,計算導致高風險的相關疾病或致病相關因素的可能性;
令為m個節點類型的計算的軟標簽,其中,為表示xvp屬于任意c+1個類別的可能性的向量,xvp的類別標簽由計算得到;
當輸入為n個患者的系列檢查記錄,輸出為優化的F,根據F的值預測風險。
2.根據權利要求1所述的基于異質醫療數據挖掘的甲狀腺癌風險預測方法,其特征在于,還包括步驟三,基于定性Bayesian的醫學推理模型;構建區間定性網絡作為醫療推理模型,驗證步驟二得出的預測結論;
步驟三一、定性影響,定性貝葉斯網絡中兩個變量間的直接關系,包括正影響、負影響、零影響、不確定影響四種;將四種影響標注在網絡的有向邊上,定義出現的變量均為二元隨機變量,計算網絡中隨機變量A對隨機變量B的初始定性影響,定義在定性貝葉斯網絡上的區間概率函數值描述影響的不確定性;在區間定性網絡中,若存在有向邊,則應根據知識庫中已有的條件概率或其估算結果推出初始定性影響;
步驟三二、定性協作,對于多于兩個影響參與復合性協作,先合成所有相同的影響,最后將此結果合成。
3.根據權利要求1所述的基于異質醫療數據挖掘的甲狀腺癌風險預測方法,其特征在于,計算軟標簽F的過程為:
A、采用患者記錄構建異質圖得到相應矩陣;
B、計算標準化的權重;
C、對于節點類型初始化;
D、迭代計算更新軟標簽的值,直到各個標簽值不再變化,算法收斂。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北師范大學,未經東北師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810163600.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





