[發(fā)明專利]基于圖神經(jīng)網(wǎng)絡(luò)與譜聚類的高維數(shù)據(jù)特征選擇方法有效
| 申請?zhí)枺?/td> | 202011108087.6 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112232413B | 公開(公告)日: | 2023-07-21 |
| 發(fā)明(設(shè)計(jì))人: | 栗偉;謝維冬;王林潔;覃文軍;馮朝路;閔新;于鯤 | 申請(專利權(quán))人: | 東北大學(xué) |
| 主分類號: | G06F18/2113 | 分類號: | G06F18/2113;G06F18/23213;G06F18/2411;G06N3/048;G06N3/084;G16B40/00 |
| 代理公司: | 沈陽東大知識產(chǎn)權(quán)代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 神經(jīng)網(wǎng)絡(luò) 譜聚類 數(shù)據(jù) 特征 選擇 方法 | ||
1.一種基于圖神經(jīng)網(wǎng)絡(luò)與譜聚類的高維數(shù)據(jù)特征選擇方法,其特征在于,包括如下步驟:
步驟1:基于先驗(yàn)知識構(gòu)建基因關(guān)系圖,包括:
步驟1.1:利用GPL平臺(tái),將待處理基因微陣列數(shù)據(jù)S中的每個(gè)特征的探針名轉(zhuǎn)換為對應(yīng)的基因ID,其中待處理基因微陣列數(shù)據(jù)S表示為S=X1,X2,...,Xi,...,XN,第i個(gè)樣本Xi表示為每個(gè)樣本均對應(yīng)一個(gè)標(biāo)簽,kij表示第i個(gè)樣本Xi中的第j個(gè)特征值,每個(gè)特征均對應(yīng)一個(gè)探針名,N表示待處理基因微陣列數(shù)據(jù)S中的樣本數(shù),i1,2,,N,m表示每個(gè)樣本中的特征數(shù),j1,2,,m;
步驟1.2:將所有的基因ID輸入到Cytoscape軟件的GeneMANIA插件中,利用邊緣關(guān)系數(shù)據(jù)Physical?Interaction生成所有基因ID之間的關(guān)系矩陣R,其中關(guān)系矩陣R中包含數(shù)據(jù)S中任意兩個(gè)基因ID之間的關(guān)系權(quán)重系數(shù);
步驟1.3:利用得到的權(quán)重矩陣R構(gòu)建基因關(guān)系圖G(v,ε),其中v表示基因關(guān)系圖G中的所有節(jié)點(diǎn),即v(v1,v2,...vj,...,vm),每個(gè)節(jié)點(diǎn)代表一個(gè)基因ID,ε表示基因關(guān)系圖G中的所有邊,即ε(vj,vr)|vj,vr∈v,(vj,vr)表示同一條邊上的兩個(gè)節(jié)點(diǎn),每條邊代表所連接的兩個(gè)基因ID之間的連接權(quán)重系數(shù);
步驟2:利用圖神經(jīng)網(wǎng)絡(luò)構(gòu)建基因關(guān)系圖G中每個(gè)節(jié)點(diǎn)的特征向量;
步驟3:基于圖神經(jīng)網(wǎng)絡(luò)對基因關(guān)系圖G進(jìn)行連接預(yù)測,生成基因關(guān)系圖G中新的邊,得到新的基因關(guān)系圖G*;
步驟4:基于譜聚類在新的基因關(guān)系圖G*中選擇權(quán)重最高的節(jié)點(diǎn)作為特征節(jié)點(diǎn);
所述步驟4包括:
步驟4.1:定義新的基因關(guān)系圖G*中所有節(jié)點(diǎn)為E,即E(e1,e2,,eζ),其中ζ表示基因關(guān)系圖G*中的節(jié)點(diǎn)總數(shù);
步驟4.2:利用公式(8)計(jì)算任意的兩個(gè)節(jié)點(diǎn)(eρ1,eρ2)之間的相似度wρ1,ρ2,并將wρ1,ρ2組成ζ維的相似度矩陣W,
式中,Ω表示用于控制節(jié)點(diǎn)的鄰域?qū)挾龋?/p>
步驟4.3:計(jì)算相似度矩陣W的每行中所有元素的和,得到d1,d2,...,dη,...dζ,其中dη表示第η行中的所有元素之和,利用d1,d2,...,dη,...dζ構(gòu)建維度為ζ的對角矩陣D;
步驟4.4:利用公式(9)計(jì)算拉普拉斯矩陣Lreym,
LreymD-1/2(D-W)D-1/2???????????????????(9)
步驟4.5:計(jì)算拉普拉斯矩陣Lreym的特征值,并將特征值按照從小到大的順序進(jìn)行排序,根據(jù)聚類簇的數(shù)目μ,取前μ個(gè)特征值并計(jì)算對應(yīng)的特征向量χ1,χ2,...,χμ,利用μ個(gè)特征向量χ1,χ2,...,χμ構(gòu)成ζ行μ列的矩陣U,即矩陣U=χ1,χ2,...,χμ;
步驟4.6:利用K-Means聚類算法將矩陣U每行中的特征向量聚類成簇,得到C1,C2,...,Cν,...,Cμ,其中Cν表示第ν行中的特征向量聚類成的簇;
步驟4.7:根據(jù)得到的簇C1,C2,...,Cν,...,Cμ,將新的基因關(guān)系圖G*中的所有節(jié)點(diǎn)分為μ組,得到μ個(gè)子圖,記為G*=[G1,G2,...,Gν,...,Gμ]=[(v′1,ε′1),v′2,ε′2),...,(v′v,ε′v),...,(v′μ,ε′μ)],其中Gν表示第ν個(gè)子圖,將第ν個(gè)子圖表示為(v'v,ε'v),v'v表示子圖Gν中的所有節(jié)點(diǎn)集合,ε'v表示子圖Gν中的所有邊,即ε'v包含在v'v中所有節(jié)點(diǎn)之間的連接;
步驟4.8:利用線性回歸方法對每個(gè)子圖Gν內(nèi)的所有節(jié)點(diǎn)進(jìn)行建模,得到每個(gè)節(jié)點(diǎn)的權(quán)重,將權(quán)重最高的節(jié)點(diǎn)作為每個(gè)子圖中的特征節(jié)點(diǎn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011108087.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 一種基于譜聚類算法的選擇性聚類集成方法
- 一種基于改進(jìn)譜聚類的搜索引擎排序方法與系統(tǒng)
- 基于快速選取地標(biāo)點(diǎn)的圖像譜聚類方法
- 一種基于超像素的模糊譜聚類腦腫瘤圖像自動(dòng)分割方法
- 一種基于譜旋轉(zhuǎn)的一步譜聚類方法
- 一種基于DTW-LASSO-譜聚類的消費(fèi)者聚類方法
- 一種考慮雙尺度相似性的負(fù)荷曲線集成譜聚類方法
- 基于譜聚類的子空間聚類算法的數(shù)據(jù)處理方法及裝置
- 一種譜聚類加速方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種考慮改進(jìn)譜聚類與Bi-LSTM神經(jīng)網(wǎng)絡(luò)的沖擊性負(fù)荷預(yù)測方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





