[發明專利]面向缺失數據的基于凹對偶融合補償項的亞組識別方法在審
| 申請號: | 202011168201.4 | 申請日: | 2020-10-28 |
| 公開(公告)號: | CN112349422A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 趙子鳴;耿子衿;陳清華 | 申請(專利權)人: | 北京師范大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100875 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 缺失 數據 基于 對偶 融合 補償 識別 方法 | ||
1.面向缺失數據的基于凹對偶融合補償項的亞組識別方法,其特征在于,包括如下步驟:
(1-1)利用Logistic回歸模型估計缺失概率;
(1-2)建立一般平均項的fused-LASSO凹對偶逆概率加權最小二乘補償損失函數,通過極小化該損失函數獲得參數的估計,使得同一亞組個體的一般平均項的估計相等;
(1-3)基于K-Means聚類方法對帶有缺失數據的樣本進行亞組識別,該方法在樣本量較大、缺失概率適中的情況下有很好的效果。
2.如權利要求1所述方法,其特征在于,所述模型具體包括:
(2-1)選取一項顯型指標作為響應變量Y,一族可觀測到的協變量X,建立線性模型,由于不可抗力因素的干擾,響應變量Y常常會出現缺失情況,一般符合缺失部分僅依賴于未缺失數據變量的隨機缺失機制;
(2-2)缺失變量δ刻畫響應變量Y是否缺失,若Y缺失,則δ=0,反之δ=1;即有:在隨機機制下,Y的缺失僅依賴于對其有顯著影響的協變量X,則缺失變量δ的分布也僅依賴于X,其中為協變量X的已知函數;
(2-3)假設{xi,yi,δi,i=1,2,…,n}為來自回歸總體(X,Y,δ)的不完全樣本,響應變量Y的缺失概率具有已知的參數結構,且一般假設其來自Logistic模型,則在給定協變量向量xi之后,即有:
其中α為Logistic模型中的待估參數;
(2-4)通過極大似然估計方法計算估計量由于
則響應變量Y的概率分布函數可刻畫為:
于是估計量可通過極大化下式得到:
令則可以得到第i個響應變量yi的缺失概率的估計量
(2-5)在估計出響應變量yi,i=1,2,…,n的缺失概率之后,為得到模型中參數的估計,使用逆概率加權凹對偶融合補償的最小二乘估計方法;令μ=(μ1,μ2,…,μn)T,則此時,最小二乘補償函數可寫為:
其中p(·,λ)為凹補償函數,λ調協參數,且滿足λ≥0;
(2-6)通過直接求導計算參數是十分困難的,因為μi是不易分離的;此時,引入一個新的參數ηij,令ηij=μi-μj,尋找下式問題的最優解:
且滿足μi-μj-ηij=0;通過增廣的拉格朗日乘子法,參數的估計的問題就等價于最小化下式:
其中對偶變量ν={νij,i<j}T為拉格朗日乘子,θ為補償參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京師范大學,未經北京師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011168201.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種動態合并網頁表格的方法
- 下一篇:一種膠帶切割快速分離的制作流程
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





