[發(fā)明專利]一種含有缺失數(shù)據(jù)的數(shù)據(jù)保距性降維方法在審
| 申請?zhí)枺?/td> | 201911059239.5 | 申請日: | 2019-11-01 |
| 公開(公告)號(hào): | CN110852366A | 公開(公告)日: | 2020-02-28 |
| 發(fā)明(設(shè)計(jì))人: | 從銀川;謝鯤;歐陽與點(diǎn);文吉?jiǎng)?/a> | 申請(專利權(quán))人: | 湖南大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 長沙正奇專利事務(wù)所有限責(zé)任公司 43113 | 代理人: | 馬強(qiáng);曾利平 |
| 地址: | 410082 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 含有 缺失 數(shù)據(jù) 保距性降維 方法 | ||
1.一種含有缺失數(shù)據(jù)的數(shù)據(jù)保距性降維方法,其特征在于,包括以下步驟:
步驟1:獲取樣本數(shù)據(jù)集,將樣本數(shù)據(jù)集分為訓(xùn)練樣本集和測試樣本集,將樣本數(shù)據(jù)集中的所有樣本向量化形成樣本矩陣;根據(jù)所述樣本矩陣生成與樣本矩陣一一對應(yīng)的缺失數(shù)據(jù)矩陣,所述缺失數(shù)據(jù)矩陣中每個(gè)元素的值為1或0,1表示樣本矩陣中該位置數(shù)據(jù)正常,0表示樣本矩陣中該位置數(shù)據(jù)缺失;
步驟2:構(gòu)建自動(dòng)編碼器,選擇自動(dòng)編碼器的激活函數(shù)與初始化方法;
步驟3:根據(jù)步驟1中的缺失數(shù)據(jù)矩陣設(shè)計(jì)步驟2中自動(dòng)編碼器的損失函數(shù);
步驟4:從步驟1的訓(xùn)練樣本集中選擇樣本向量作為自動(dòng)編碼器的輸入,計(jì)算步驟3中損失函數(shù)的值;
步驟5:更新所述自動(dòng)編碼器中編碼器的權(quán)重矩陣,使編碼器權(quán)重矩陣的更新具有隨機(jī)投影特性;且判斷是否達(dá)到預(yù)設(shè)訓(xùn)練次數(shù),如果訓(xùn)練次數(shù)小于或等于預(yù)設(shè)訓(xùn)練次數(shù),則轉(zhuǎn)入步驟4,否則轉(zhuǎn)入步驟6;
步驟6:采用訓(xùn)練后的自動(dòng)編碼器對測試樣本集中的樣本矩陣進(jìn)行降維處理。
2.如權(quán)利要求1所述的數(shù)據(jù)保距性降維方法,其特征在于,所述步驟2中,自動(dòng)編碼器的網(wǎng)絡(luò)結(jié)構(gòu)為輸入層-第一隱藏層-第二隱藏層-第三隱藏層-輸出層,自動(dòng)編碼器的編碼器的網(wǎng)絡(luò)結(jié)構(gòu)為輸入層-第一隱藏層-第二隱藏層,自動(dòng)編碼器的解碼器的網(wǎng)絡(luò)結(jié)構(gòu)為第二隱藏層-第三隱藏層-輸出層。
3.如權(quán)利要求1所述的數(shù)據(jù)保距性降維方法,其特征在于,所述步驟3中,自動(dòng)編碼器的損失函數(shù)L(We,Wd,bd)為:
其中,||★||表示向量的二范數(shù),⊙表示兩個(gè)向量中的元素逐個(gè)相乘,xt為自動(dòng)編碼器第t個(gè)輸入向量,為xt作為自動(dòng)編碼器輸入時(shí)的輸出向量,rt為與輸入向量xt對應(yīng)的缺失數(shù)據(jù)向量,xt∈X,rt∈R,X為樣本矩陣,R為與樣本矩陣X對應(yīng)的缺失數(shù)據(jù)矩陣,表示k個(gè)樣本向量且每個(gè)樣本向量的長度為m,s為一個(gè)批量的大小,D(★;Wd,bd)表示解碼器,E(★;We)表示編碼器,We為編碼器的權(quán)重矩陣,Wd為解碼器的權(quán)重矩陣,bd表示解碼器的偏置項(xiàng)。
4.如權(quán)利要求1所述的數(shù)據(jù)保距性降維方法,其特征在于,所述步驟5中,采用權(quán)重標(biāo)準(zhǔn)化處理更新?lián)p失函數(shù)中編碼器的權(quán)重矩陣,使更新后編碼器權(quán)重矩陣的均值為0、方差為1,具體的權(quán)重標(biāo)準(zhǔn)化處理公式為:
其中,wei為BP算法更新后權(quán)重標(biāo)準(zhǔn)化處理前編碼器第i個(gè)權(quán)重矩陣,w′ei為權(quán)重矩陣wei權(quán)重標(biāo)準(zhǔn)化處理后的矩陣,μei為wei的均值,σei為wei的方差,Eei為元素全為1的矩陣。
5.如權(quán)利要求1所述的數(shù)據(jù)保距性降維方法,其特征在于,在所述步驟3中損失函數(shù)的基礎(chǔ)上增加正則化項(xiàng),根據(jù)增加正則化項(xiàng)后損失函數(shù)的值更新編碼器的權(quán)重矩陣。
6.如權(quán)利要求5所述的數(shù)據(jù)保距性降維方法,其特征在于,所述正則化項(xiàng)Lr的表達(dá)式為:
增加正則化項(xiàng)后的損失函數(shù)的表達(dá)式為:
LC=L+αLr
其中,wei為編碼器第i個(gè)權(quán)重矩陣,σei為權(quán)重矩陣wei的方差,μei為權(quán)重矩陣wei的均值,c為編碼器權(quán)重矩陣的數(shù)量,L為未增加正則化項(xiàng)的損失函數(shù),LC為增加正則化項(xiàng)后的損失函數(shù),α為超參數(shù)。
7.如權(quán)利要求5所述的數(shù)據(jù)保距性降維方法,其特征在于,所述正則化項(xiàng)Lr的表達(dá)式為:
增加正則化項(xiàng)后的損失函數(shù)的表達(dá)式為:
LC=L+αLr
其中,||★||F為矩陣的F范數(shù),wei為編碼器第i個(gè)權(quán)重矩陣,為權(quán)重矩陣wei的轉(zhuǎn)置,I為單位矩陣,c為編碼器權(quán)重矩陣的數(shù)量,L為未增加正則化項(xiàng)的損失函數(shù),LC為增加正則化項(xiàng)后的損失函數(shù),α為超參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南大學(xué),未經(jīng)湖南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911059239.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 圖像修補(bǔ)方法和圖像修補(bǔ)裝置
- 數(shù)據(jù)處理的方法及裝置
- 缺失數(shù)據(jù)的恢復(fù)方法和裝置
- 用于生成信息的方法和裝置
- 圖像補(bǔ)全方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種腫瘤復(fù)雜克隆結(jié)構(gòu)的缺失變異識(shí)別及克隆計(jì)數(shù)方法
- 基于缺失數(shù)據(jù)的樣本分析方法、裝置、電子設(shè)備及介質(zhì)
- 一種MES背景下的數(shù)據(jù)庫數(shù)據(jù)缺失的填補(bǔ)方法及系統(tǒng)
- 一種缺失字/詞的補(bǔ)全方法及電子設(shè)備
- 一種基于泊松曲面重建算法修復(fù)三維模型缺失信息的方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 基于保內(nèi)積降維技術(shù)的模式識(shí)別方法
- 隨機(jī)結(jié)構(gòu)保形哈希信息檢索方法
- 一種降維映射的大數(shù)據(jù)可視化方法
- 一種木材孔洞缺陷超聲檢測特征提取方法
- 基于時(shí)域擾動(dòng)的高低軌雙基SAR保相成像方法
- 一種消防維保處理的方法及系統(tǒng)
- 一種含有缺失數(shù)據(jù)的數(shù)據(jù)保距性降維方法
- 核保信息處理方法、裝置、計(jì)算機(jī)存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種電梯按需維保工作質(zhì)量評價(jià)方法
- 基于子空間降維的高維數(shù)據(jù)多變點(diǎn)檢測方法、系統(tǒng)、設(shè)備及介質(zhì)





