[發(fā)明專利]基于多源遷移學(xué)習(xí)的多中心協(xié)同癌癥預(yù)后預(yù)測系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010038230.2 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN111261299B | 公開(公告)日: | 2022-02-22 |
| 發(fā)明(設(shè)計)人: | 李勁松;田雨;陳偉國;馬靜 | 申請(專利權(quán))人: | 之江實(shí)驗(yàn)室 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06K9/62 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 劉靜 |
| 地址: | 310023 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 遷移 學(xué)習(xí) 中心 協(xié)同 癌癥 預(yù)后 預(yù)測 系統(tǒng) | ||
本發(fā)明公開了一種基于多源遷移學(xué)習(xí)的多中心協(xié)同癌癥預(yù)后預(yù)測系統(tǒng),該系統(tǒng)包括模型參數(shù)設(shè)置模塊、數(shù)據(jù)篩選模塊和多源遷移學(xué)習(xí)模塊;模型參數(shù)設(shè)置模塊負(fù)責(zé)設(shè)置癌癥預(yù)后預(yù)測模型參數(shù);數(shù)據(jù)篩選模塊布置于臨床中心,管理中心將設(shè)置好的模型參數(shù)傳輸?shù)礁髋R床中心,各臨床中心依據(jù)模型參數(shù)從本地數(shù)據(jù)庫中查詢樣本特征與預(yù)后指標(biāo)數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理;多源遷移學(xué)習(xí)模塊包括源模型訓(xùn)練、遷移權(quán)重計算和目標(biāo)模型計算單元。本發(fā)明利用多源遷移學(xué)習(xí)解決源中心與目標(biāo)中心之間數(shù)據(jù)存在異質(zhì)性的問題及目標(biāo)中心標(biāo)簽數(shù)據(jù)不足問題,在考慮多中心數(shù)據(jù)異質(zhì)性的前提下構(gòu)建更加精準(zhǔn)的預(yù)測模型。同時,模型訓(xùn)練過程中各機(jī)構(gòu)的原始數(shù)據(jù)互補(bǔ)共享,避免患者隱私泄露。
技術(shù)領(lǐng)域
本發(fā)明屬于醫(yī)療領(lǐng)域及機(jī)器學(xué)習(xí)領(lǐng)域,尤其涉及一種基于多源遷移學(xué)習(xí)的多中心協(xié)同癌癥預(yù)后預(yù)測系統(tǒng)。
背景技術(shù)
癌癥死亡率高,隨著其發(fā)病率的不斷攀升,已經(jīng)成為人類死亡的主要原因之一。高質(zhì)量的癌癥預(yù)后預(yù)測可以為醫(yī)生的臨床決策提供依據(jù),對于癌癥的控制和治療意義重大。
傳統(tǒng)預(yù)后預(yù)測基于專家臨床經(jīng)驗(yàn)(如TNM模型),缺乏循證支持。隨著醫(yī)療信息技術(shù),特別是電子病歷、醫(yī)療大數(shù)據(jù)分析挖掘等技術(shù)發(fā)展,數(shù)據(jù)驅(qū)動預(yù)后預(yù)測模型越來越受到關(guān)注。這些預(yù)測模型需要大規(guī)模臨床數(shù)據(jù),但針對單一病種,單家機(jī)構(gòu)往往缺少足夠標(biāo)簽數(shù)據(jù),不足以支撐模型訓(xùn)練,模型效果差,需要多中心協(xié)同構(gòu)建預(yù)后預(yù)測模型。
現(xiàn)有技術(shù)方案通常將多家機(jī)構(gòu)的數(shù)據(jù)進(jìn)行匯總后訓(xùn)練通用模型。因不同機(jī)構(gòu)之間數(shù)據(jù)存在異質(zhì)性(主要體現(xiàn)在邊緣分布、條件概率分布差異性上),訓(xùn)練得到的通用模型的泛化能力較差,當(dāng)目標(biāo)機(jī)構(gòu)數(shù)據(jù)與訓(xùn)練數(shù)據(jù)有較高異質(zhì)性時模型表現(xiàn)往往不佳,只有在目標(biāo)機(jī)構(gòu)中積累一定數(shù)量的有標(biāo)簽樣本后,利用本地有標(biāo)簽樣本對通用模型進(jìn)行校準(zhǔn)才能獲得較好的性能。目前尚缺乏將模型訓(xùn)練與應(yīng)用環(huán)境有機(jī)整合的機(jī)制。
無論是直接利用本地有標(biāo)簽樣本訓(xùn)練模型還是利用本地有標(biāo)簽樣本對通用模型進(jìn)行校正都對本地有標(biāo)簽樣本的數(shù)量有一定要求。在缺少本地標(biāo)簽的情況下,現(xiàn)有方法難以應(yīng)用。且大規(guī)模數(shù)據(jù)需要多家機(jī)構(gòu)共同參與,存在患者隱私泄露風(fēng)險。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供一種基于多源遷移學(xué)習(xí)的多中心協(xié)同癌癥預(yù)后預(yù)測系統(tǒng),主要解決如下技術(shù)問題:
1.單一機(jī)構(gòu)電子病歷數(shù)據(jù)資源有限,雖然患者規(guī)模以及病歷數(shù)據(jù)總量較大,但是面向特定疾病預(yù)后研究需要,單一機(jī)構(gòu)中有明確預(yù)后結(jié)局事件(如死亡、復(fù)發(fā)等)的患者數(shù)量有限,從而限制了特定疾病構(gòu)建高質(zhì)量預(yù)后預(yù)測模型的建立;
2.缺乏對于模型泛化能力的研究,現(xiàn)有方法構(gòu)建的模型(特別是統(tǒng)計模型)在與訓(xùn)練數(shù)據(jù)集具有相近似特征分布的數(shù)據(jù)集上可以得到較好的預(yù)測性能表現(xiàn),但是在與訓(xùn)練環(huán)境具有不同邊緣概率分布、條件概率分布差異的數(shù)據(jù)集上的表現(xiàn)往往不佳。
本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的:一種基于多源遷移學(xué)習(xí)的多中心協(xié)同癌癥預(yù)后預(yù)測系統(tǒng),該系統(tǒng)包括:模型參數(shù)設(shè)置模塊、數(shù)據(jù)篩選模塊和多源遷移學(xué)習(xí)模塊。
所述模型參數(shù)設(shè)置模塊:布置于管理中心,負(fù)責(zé)設(shè)置癌癥預(yù)后預(yù)測模型參數(shù),包括癌癥類別(如結(jié)直腸癌)、源中心與目標(biāo)中心、樣本特征(如年齡、性別、結(jié)直腸癌分級、組織學(xué)分類等)、樣本數(shù)據(jù)預(yù)處理方法、預(yù)后指標(biāo)(如五年生存狀態(tài));
所述管理中心對各臨床中心的資源進(jìn)行協(xié)調(diào)管理,接受用戶訪問;
所述源中心為針對特定癌癥類別,擁有有標(biāo)簽樣本的臨床中心,負(fù)責(zé)源癌癥預(yù)后預(yù)測模型訓(xùn)練;
所述目標(biāo)中心為針對特定癌癥類別,擁有無標(biāo)簽樣本的臨床中心,負(fù)責(zé)目標(biāo)癌癥預(yù)后預(yù)測模型訓(xùn)練;
所述臨床中心為實(shí)際持有臨床數(shù)據(jù)的機(jī)構(gòu),負(fù)責(zé)樣本數(shù)據(jù)篩選和癌癥預(yù)后預(yù)測模型訓(xùn)練。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于之江實(shí)驗(yàn)室,未經(jīng)之江實(shí)驗(yàn)室許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010038230.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





