[發明專利]基于因果推斷的競爭風險生存分析方法在審
申請號: | 202210085862.3 | 申請日: | 2022-01-25 |
公開(公告)號: | CN114418420A | 公開(公告)日: | 2022-04-29 |
發明(設計)人: | 黃正行;洪草根;易帆 | 申請(專利權)人: | 浙江大學 |
主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 杭州裕陽聯合專利代理有限公司 33289 | 代理人: | 高明翠 |
地址: | 310012 浙江省杭州*** | 國省代碼: | 浙江;33 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 基于 因果 推斷 競爭 風險 生存 分析 方法 | ||
本發明公開了一種基于因果推斷的競爭風險生存分析方法,包含:根據競爭風險生存分析模型搭建結構化因果模型;根據結構化因果模型識別競爭風險生存分析模型中存在的混淆因子以及混淆因子產生的后門路徑;通過后門調整對競爭風險生存分析模型進行因果干預以去除模型中的混淆因子;定義競爭風險生存分析模型的損失函數,并對其進行修正得到因果干預后的損失函數;對因果干預后的損失函數進行最小化以實現對競爭風險生存分析模型的訓練優化。本發明的基于因果推斷的競爭風險生存分析方法,通過用結構化因果模型從因果角度來修正現有的競爭風險生存分析模型,采用因果推斷的方式,通過后門調整公式來學習一個去偏差的生存模型。
技術領域
本發明屬于數據處理領域,具體涉及一種基于因果推斷的競爭風險生存分析方法。
背景技術
生存分析是一系列數據分析技術的集合,其目標是分析協變量與感興趣事件的命中時間之間的關系。生存分析方法包括統計方法到機器學習,以及近年來的深度學習方法。各種生存分析方法如今已廣泛應用于各個領域,包括醫學、推薦系統和經濟學等。
傳統的統計生存分析方法,例如Cox比例風險模型(CPH),雖然取得了巨大的成功,但缺乏處理競爭風險問題的能力,即存在多個感興趣事件的環境。競爭風險是一類事件,它要么阻礙對感興趣事件的觀察,要么改變該事件發生的可能性,因此在估計生存時間中起著至關重要的作用。為了解決生存分析中的競爭風險問題,Fine和Gray首先于1999年提出了基于競爭風險的統計學生存分析模型,Fine-Gray模型,和近年來提出的深度學習模型,例如DeepHit模型及其基于動態生存分析的變體(Dynamic DeepHit),并且相關文獻已經證明了這些模型在下游任務中的可行性。
盡管取得了很多進展,但現有的競爭風險的生存分析模型存在一個重大缺陷,即競爭風險是混雜因素,在捕獲協變量和感興趣事件之間因果關系時,會誤導生存分析模型學習協變量X和事件Y之間的虛假相關性,導致模型的性能降低。盡管混雜因素有利于通過模型計算P(Y|X)捕獲X和Y之間的基本關系,但它可能會錯誤地提取與事件無關,以及不提取與事件相關的協變量。
發明內容
本發明提供了一種基于因果推斷的競爭風險生存分析方法解決上述提到的技術問題,具體采用如下的技術方案:
一種基于因果推斷的競爭風險生存分析方法,包含:
根據競爭風險生存分析模型搭建結構化因果模型;
根據結構化因果模型識別競爭風險生存分析模型中存在的混淆因子以及混淆因子產生的后門路徑;
通過后門調整對競爭風險生存分析模型進行因果干預以去除模型中的混淆因子;
定義競爭風險生存分析模型的損失函數,并對其進行修正得到因果干預后的損失函數;
對因果干預后的損失函數進行最小化以實現對競爭風險生存分析模型的訓練優化。
進一步地,搭建結構化因果模型的具體方法為:
將協變量X、競爭風險R、潛在表征C、發生事件Y和發生時間T作為節點,通過帶有箭頭的線段連接上述節點,其中,箭頭的方向表示節點間的因果關系。
進一步地,在結構化因果模型中:
X→C表征學習過程;
X→Y←C表示生存分析過程;
X→R←Y表示后門路徑;
R→X表示競爭風險R導致相應對象的協變量X發生變化;
R→Y表示最終發生的事件來自競爭風險R。
進一步地,混淆因子為競爭風險R,競爭風險R為競爭事件的集合其表示研究對象i的一組競爭風險,每個表示對象i的一個競爭風險。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210085862.3/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理