[發(fā)明專利]一種多組學(xué)數(shù)據(jù)的聚類分析方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110644202.X | 申請日: | 2021-06-09 |
| 公開(公告)號: | CN113392894A | 公開(公告)日: | 2021-09-14 |
| 發(fā)明(設(shè)計)人: | 懷曉晨;穆紅章 | 申請(專利權(quán))人: | 瓴域影諾(北京)科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 北京知呱呱知識產(chǎn)權(quán)代理有限公司 11577 | 代理人: | 陳晨 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多組學(xué) 數(shù)據(jù) 聚類分析 方法 系統(tǒng) | ||
本申請實施例公開了一種多組學(xué)數(shù)據(jù)的聚類分析方法和系統(tǒng),通過采用神經(jīng)網(wǎng)絡(luò)對MR影像信息進行分割,根據(jù)各部分分割信息,提取高通量影像超參數(shù);對臨床數(shù)據(jù)、人口學(xué)數(shù)據(jù)和實驗室檢查數(shù)據(jù)進行處理,生成不同維度的向量表示;將所述高通量影像數(shù)據(jù)和所述不同維度的向量表示進行多源數(shù)據(jù)融合,得到融合后的多源異構(gòu)數(shù)據(jù);構(gòu)建多源異構(gòu)數(shù)據(jù)集,通過訓(xùn)練并測試多源圖聚類模型,得到最優(yōu)模型;將MR影像信息輸入到所述最優(yōu)模型中,分析不同類別差異性和同一類別相似性。采用圖結(jié)構(gòu)的方式,直觀表達數(shù)據(jù)之間的關(guān)聯(lián)情況,捕捉不同的特征,模型更魯棒,實現(xiàn)基于圖神經(jīng)網(wǎng)絡(luò)模型的高效聚類算法,具有很高的實用價值。
技術(shù)領(lǐng)域
本申請實施例涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,具體涉及一種多組學(xué)數(shù)據(jù)的聚類分析方法和系統(tǒng)。
背景技術(shù)
近年來,多組學(xué)分析已廣泛應(yīng)用于醫(yī)學(xué)亞型分析上,高通量數(shù)據(jù)融合,準(zhǔn)確定義亞型,已成為精準(zhǔn)醫(yī)療的重要話題。目前多組學(xué)融合面臨著很多問題,如數(shù)據(jù)龐雜、數(shù)據(jù)稀疏、數(shù)據(jù)異質(zhì)等。數(shù)據(jù)融合的方法可分為相似性方法、基于降維方法、基于統(tǒng)計的方法。
基于相似性的方法是使用樣本之間的相似度來聚類數(shù)據(jù),由于在當(dāng)前的多組學(xué)數(shù)據(jù)中,樣本數(shù)量遠遠小于特征數(shù)量,基于相似性的方法在樣本量不足的情況下,很難有較好的效果。基于譜聚類的算法沒有利用節(jié)點路徑信息,影響了聚類的準(zhǔn)確性。
發(fā)明內(nèi)容
為此,本申請實施例提一種多組學(xué)數(shù)據(jù)的聚類分析方法和系統(tǒng),采用圖結(jié)構(gòu)的方式,直觀表達數(shù)據(jù)之間的關(guān)聯(lián)情況,捕捉不同的特征,模型更魯棒,實現(xiàn)基于圖神經(jīng)網(wǎng)絡(luò)模型的高效聚類算法,具有很高的實用價值。
為了實現(xiàn)上述目的,本申請實施例提供如下技術(shù)方案:
根據(jù)本申請實施例的第一方面,提供了一種多組學(xué)數(shù)據(jù)的聚類分析方法,所述方法包括:
采用神經(jīng)網(wǎng)絡(luò)對MR影像信息進行分割,根據(jù)各部分分割信息,提取高通量影像超參數(shù);
對臨床數(shù)據(jù)、人口學(xué)數(shù)據(jù)和實驗室檢查數(shù)據(jù)進行處理,生成不同維度的向量表示;
將所述高通量影像數(shù)據(jù)和所述不同維度的向量表示進行多源數(shù)據(jù)融合,得到融合后的多源異構(gòu)數(shù)據(jù);
構(gòu)建多源異構(gòu)數(shù)據(jù)集,通過訓(xùn)練并測試多源圖聚類模型,得到最優(yōu)模型;
將MR影像信息輸入到所述最優(yōu)模型中,分析不同類別差異性和同一類別相似性。
可選地,所述將所述高通量影像數(shù)據(jù)和所述不同維度的向量表示進行多源數(shù)據(jù)融合,得到融合后的多源異構(gòu)數(shù)據(jù),包括:
添加MR定位定量開采的影像組學(xué)超參數(shù),將四種不同類型的數(shù)據(jù)進行預(yù)處理,基于對應(yīng)的每個特征進行歸一化處理;
對預(yù)處理后的四種數(shù)據(jù)進行數(shù)據(jù)對齊;
將對齊后的數(shù)據(jù)進行關(guān)聯(lián),針對每一個組學(xué)樣本分別構(gòu)建關(guān)聯(lián)矩陣,通過局部高斯核構(gòu)建相似性度量指標(biāo),計算每個關(guān)聯(lián)矩陣的相鄰樣本,過濾權(quán)重小于設(shè)定范圍的數(shù)據(jù),得到過濾后的多組學(xué)信息的關(guān)聯(lián)矩陣;
利用隨機游走算法融合不同組學(xué)的關(guān)聯(lián)矩陣。
可選地,所述通過訓(xùn)練并測試多源圖聚類模型,得到最優(yōu)模型,包括:
采用多源圖聚類模型實現(xiàn)聚類分析,對節(jié)點的局部鄰居的特征進行采樣和聚合,生成節(jié)點表示;
利用節(jié)點對的內(nèi)積運算重構(gòu)原始網(wǎng)絡(luò)結(jié)構(gòu),結(jié)合注意力機制學(xué)習(xí)鄰居節(jié)點的權(quán)重,以使得自動學(xué)習(xí)特征;
在模型訓(xùn)練過程中,采用自訓(xùn)練聚類模塊,以實現(xiàn)對圖嵌入的約束和整合,對構(gòu)建的多源圖聚類模型進行訓(xùn)練和驗證,調(diào)整和優(yōu)化網(wǎng)絡(luò)參數(shù),以實現(xiàn)多源圖聚類模型的訓(xùn)練和收斂。
可選地,所述將MR影像信息輸入到所述最優(yōu)模型中,分析不同類別差異性和同一類別相似性,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于瓴域影諾(北京)科技有限公司,未經(jīng)瓴域影諾(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110644202.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于多組學(xué)豐度信息的蛋白質(zhì)二級質(zhì)譜鑒定方法
- 基于病例多組學(xué)變異特征的精準(zhǔn)醫(yī)學(xué)知識搜索系統(tǒng)及實現(xiàn)方法
- 一種多組學(xué)數(shù)據(jù)聯(lián)合分析的方法
- 一種從多組學(xué)數(shù)據(jù)中分析關(guān)聯(lián)變化模式的系統(tǒng)和方法
- 多組學(xué)數(shù)據(jù)擾動云
- 基于D-S證據(jù)理論進行多組學(xué)數(shù)據(jù)集成的癌癥亞型分類方法
- 一種非小細(xì)胞肺癌患者術(shù)后復(fù)發(fā)相關(guān)性因素研究方法
- 一種基于深度學(xué)習(xí)的多組學(xué)智能診斷系統(tǒng)
- 用于癌癥基因組和臨床數(shù)據(jù)綜合分析的多組學(xué)搜索引擎
- 單組學(xué)及多組學(xué)KEGG PATHWAY map表達熱圖個性化展示的方法及應(yīng)用
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





