[發(fā)明專利]面向缺失數(shù)據(jù)的基于凹對偶融合補(bǔ)償項(xiàng)的亞組識別方法在審
| 申請?zhí)枺?/td> | 202011168201.4 | 申請日: | 2020-10-28 |
| 公開(公告)號: | CN112349422A | 公開(公告)日: | 2021-02-09 |
| 發(fā)明(設(shè)計(jì))人: | 趙子鳴;耿子衿;陳清華 | 申請(專利權(quán))人: | 北京師范大學(xué) |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100875 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 缺失 數(shù)據(jù) 基于 對偶 融合 補(bǔ)償 識別 方法 | ||
1.面向缺失數(shù)據(jù)的基于凹對偶融合補(bǔ)償項(xiàng)的亞組識別方法,其特征在于,包括如下步驟:
(1-1)利用Logistic回歸模型估計(jì)缺失概率;
(1-2)建立一般平均項(xiàng)的fused-LASSO凹對偶逆概率加權(quán)最小二乘補(bǔ)償損失函數(shù),通過極小化該損失函數(shù)獲得參數(shù)的估計(jì),使得同一亞組個(gè)體的一般平均項(xiàng)的估計(jì)相等;
(1-3)基于K-Means聚類方法對帶有缺失數(shù)據(jù)的樣本進(jìn)行亞組識別,該方法在樣本量較大、缺失概率適中的情況下有很好的效果。
2.如權(quán)利要求1所述方法,其特征在于,所述模型具體包括:
(2-1)選取一項(xiàng)顯型指標(biāo)作為響應(yīng)變量Y,一族可觀測到的協(xié)變量X,建立線性模型,由于不可抗力因素的干擾,響應(yīng)變量Y常常會(huì)出現(xiàn)缺失情況,一般符合缺失部分僅依賴于未缺失數(shù)據(jù)變量的隨機(jī)缺失機(jī)制;
(2-2)缺失變量δ刻畫響應(yīng)變量Y是否缺失,若Y缺失,則δ=0,反之δ=1;即有:在隨機(jī)機(jī)制下,Y的缺失僅依賴于對其有顯著影響的協(xié)變量X,則缺失變量δ的分布也僅依賴于X,其中為協(xié)變量X的已知函數(shù);
(2-3)假設(shè){xi,yi,δi,i=1,2,…,n}為來自回歸總體(X,Y,δ)的不完全樣本,響應(yīng)變量Y的缺失概率具有已知的參數(shù)結(jié)構(gòu),且一般假設(shè)其來自Logistic模型,則在給定協(xié)變量向量xi之后,即有:
其中α為Logistic模型中的待估參數(shù);
(2-4)通過極大似然估計(jì)方法計(jì)算估計(jì)量由于
則響應(yīng)變量Y的概率分布函數(shù)可刻畫為:
于是估計(jì)量可通過極大化下式得到:
令則可以得到第i個(gè)響應(yīng)變量yi的缺失概率的估計(jì)量
(2-5)在估計(jì)出響應(yīng)變量yi,i=1,2,…,n的缺失概率之后,為得到模型中參數(shù)的估計(jì),使用逆概率加權(quán)凹對偶融合補(bǔ)償?shù)淖钚《斯烙?jì)方法;令μ=(μ1,μ2,…,μn)T,則此時(shí),最小二乘補(bǔ)償函數(shù)可寫為:
其中p(·,λ)為凹補(bǔ)償函數(shù),λ調(diào)協(xié)參數(shù),且滿足λ≥0;
(2-6)通過直接求導(dǎo)計(jì)算參數(shù)是十分困難的,因?yàn)棣?Sub>i是不易分離的;此時(shí),引入一個(gè)新的參數(shù)ηij,令ηij=μi-μj,尋找下式問題的最優(yōu)解:
且滿足μi-μj-ηij=0;通過增廣的拉格朗日乘子法,參數(shù)的估計(jì)的問題就等價(jià)于最小化下式:
其中對偶變量ν={νij,i<j}T為拉格朗日乘子,θ為補(bǔ)償參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京師范大學(xué),未經(jīng)北京師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011168201.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像修補(bǔ)方法和圖像修補(bǔ)裝置
- 數(shù)據(jù)處理的方法及裝置
- 缺失數(shù)據(jù)的恢復(fù)方法和裝置
- 用于生成信息的方法和裝置
- 圖像補(bǔ)全方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 一種腫瘤復(fù)雜克隆結(jié)構(gòu)的缺失變異識別及克隆計(jì)數(shù)方法
- 基于缺失數(shù)據(jù)的樣本分析方法、裝置、電子設(shè)備及介質(zhì)
- 一種MES背景下的數(shù)據(jù)庫數(shù)據(jù)缺失的填補(bǔ)方法及系統(tǒng)
- 一種缺失字/詞的補(bǔ)全方法及電子設(shè)備
- 一種基于泊松曲面重建算法修復(fù)三維模型缺失信息的方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





