[發(fā)明專利]基于圖神經(jīng)網(wǎng)絡(luò)的基因模塊挖掘方法、裝置、計(jì)算機(jī)設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 202110854545.9 | 申請(qǐng)日: | 2021-07-26 |
| 公開(公告)號(hào): | CN113611366B | 公開(公告)日: | 2022-04-29 |
| 發(fā)明(設(shè)計(jì))人: | 李君一;葉梟;皮江勝;劉博;王亞東 | 申請(qǐng)(專利權(quán))人: | 哈爾濱工業(yè)大學(xué)(深圳) |
| 主分類號(hào): | G16B40/00 | 分類號(hào): | G16B40/00;G16B25/10;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 深圳市道勤知酷知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44439 | 代理人: | 何兵;呂詩 |
| 地址: | 518000 廣東省深圳市南*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 神經(jīng)網(wǎng)絡(luò) 基因 模塊 挖掘 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
本發(fā)明公開了一種基于圖神經(jīng)網(wǎng)絡(luò)的基因模塊挖掘方法、裝置、計(jì)算機(jī)設(shè)備。其中,所述方法包括:根據(jù)基因表達(dá)譜數(shù)據(jù),構(gòu)造基因共表達(dá)網(wǎng)絡(luò),和基于該構(gòu)造的基因共表達(dá)網(wǎng)絡(luò),通過圖神經(jīng)網(wǎng)絡(luò)方式,配置社區(qū)隸屬度矩陣,以及基于該配置的社區(qū)隸屬度矩陣,通過設(shè)定閾值的方式,生成已知模塊。通過上述方式,能夠?qū)崿F(xiàn)通過圖神經(jīng)網(wǎng)絡(luò)表示學(xué)習(xí)的方式配置社區(qū)歸屬矩陣,再通過設(shè)定閾值的方式生成已知模塊,實(shí)現(xiàn)在基因模塊挖掘結(jié)果上能夠允許有密集連接的多個(gè)基因可歸屬于不同的模塊。
技術(shù)領(lǐng)域
本發(fā)明涉及基因模塊挖掘技術(shù)領(lǐng)域,尤其涉及一種基于圖神經(jīng)網(wǎng)絡(luò)的基因模塊挖掘方法、裝置、計(jì)算機(jī)設(shè)備。
背景技術(shù)
相關(guān)技術(shù)中,隨著高通量生物實(shí)驗(yàn)技術(shù)的快速發(fā)展,特別是基因芯片和新一代測(cè)序技術(shù)的發(fā)展,全基因組范圍內(nèi)的生物數(shù)據(jù)呈爆炸式增長(zhǎng)。通過對(duì)這些實(shí)驗(yàn)數(shù)據(jù)的分析,可以得到一些不同類型的網(wǎng)絡(luò),比如基因表達(dá)調(diào)控網(wǎng)絡(luò),蛋白質(zhì)相互作用網(wǎng)絡(luò),轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。分子生物網(wǎng)絡(luò)在系統(tǒng)層面反映了生物分子的相互作用關(guān)系,因而在相當(dāng)程度上有助于研究者深入理解生物細(xì)胞中各種生物分子是如何相互作用,進(jìn)而行使生物功能的完整處理過程,為探索復(fù)雜生命活動(dòng)提供了有力工具。對(duì)這些不同類型網(wǎng)絡(luò)的分析表明,這些網(wǎng)絡(luò)都具有模塊性,而生物的功能往往也都是通過這些模塊來得以實(shí)現(xiàn)的。對(duì)大型基因表達(dá)數(shù)據(jù)分析的關(guān)鍵步驟是使用模塊檢測(cè)方式將基因劃分為多個(gè)具有相似屬性的模塊,這些模塊可用于推斷后續(xù)的轉(zhuǎn)錄調(diào)控關(guān)系,改善功能基因組的注釋,因此,有必要對(duì)這些模塊的識(shí)別和分析進(jìn)行研究。
聚類方法是模塊分析中最普遍和流行的方法,通過計(jì)算不同基因樣本向量的歐式距離或者用相似度計(jì)算方法度量?jī)蓚€(gè)基因的相似度,將關(guān)系相近的基因劃分為同一個(gè)模塊,目前已經(jīng)有許多聚類方法應(yīng)用于基因表達(dá)譜數(shù)據(jù)分析任務(wù)中,例如k-means(k-meansclustering algorithm,K均值聚類算法),Hierarchical clustering(層次聚類)。也有一些方法通過構(gòu)造基因相似度網(wǎng)絡(luò),然后在網(wǎng)絡(luò)上使用圖聚類的方法挖掘基因模塊。譜聚類通過切圖的方式使得同一個(gè)模塊內(nèi)的點(diǎn)距離盡可能地接近,不同模塊間的點(diǎn)距離盡可能地遠(yuǎn),從而達(dá)到聚類的目的。WGCNA(Weighted correlation network analysis,加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析)引入了軟閾值的概念,通過對(duì)相似度矩陣中的元素取冪次運(yùn)算,使構(gòu)造出來的網(wǎng)絡(luò)具有無標(biāo)度特性,再使用層次聚類挖掘基因模塊,目前WGCNN已經(jīng)被封裝成R包(由社區(qū)開發(fā)的功能和數(shù)據(jù)集的集合)的形式供研究人員使用。
在基因表達(dá)譜數(shù)據(jù)的挖掘任務(wù)中,聚類只關(guān)注了基因在所有樣本中的共表達(dá),而忽視了可能只存在于某些樣本的局部表達(dá)關(guān)系,而且聚類只能將基因劃分到單個(gè)模塊中,但是已經(jīng)有越來越多的證據(jù)表明,單個(gè)基因往往與多種功能或者代謝通路有關(guān)聯(lián),如何挖掘這種重疊的模塊也是基因模塊挖掘的一個(gè)難點(diǎn),導(dǎo)致在基因模塊挖掘結(jié)果上無法實(shí)現(xiàn)允許有密集連接的多個(gè)基因可歸屬于不同的模塊。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提出一種基于圖神經(jīng)網(wǎng)絡(luò)的基因模塊挖掘方法、裝置、計(jì)算機(jī)設(shè)備,能夠?qū)崿F(xiàn)通過圖神經(jīng)網(wǎng)絡(luò)表示學(xué)習(xí)的方式配置社區(qū)歸屬矩陣,再通過設(shè)定閾值的方式生成已知模塊,實(shí)現(xiàn)在基因模塊挖掘結(jié)果上能夠允許有密集連接的多個(gè)基因可歸屬于不同的模塊。
根據(jù)本發(fā)明的一個(gè)方面,提供一種基于圖神經(jīng)網(wǎng)絡(luò)的基因模塊挖掘方法,包括:根據(jù)基因表達(dá)譜數(shù)據(jù),構(gòu)造基因共表達(dá)網(wǎng)絡(luò);基于所述構(gòu)造的基因共表達(dá)網(wǎng)絡(luò),通過圖神經(jīng)網(wǎng)絡(luò)方式,配置社區(qū)隸屬度矩陣;基于所述配置的社區(qū)隸屬度矩陣,通過設(shè)定閾值的方式,生成已知模塊。
其中,所述根據(jù)基因表達(dá)譜數(shù)據(jù),構(gòu)造基因共表達(dá)網(wǎng)絡(luò),包括:根據(jù)基因表達(dá)譜數(shù)據(jù),將每個(gè)基因的表達(dá)值規(guī)范化為均值為0和方差為1的表達(dá)向量,和選擇皮爾遜相似系數(shù)來計(jì)算成對(duì)基因間的關(guān)聯(lián)性,從所述計(jì)算出的成對(duì)基因間的關(guān)聯(lián)性所對(duì)應(yīng)的成對(duì)關(guān)系中選擇預(yù)設(shè)比例的對(duì)應(yīng)最高相關(guān)性的成對(duì)關(guān)系作為共表達(dá)網(wǎng)絡(luò)的邊,和基于所述選擇的預(yù)設(shè)比例的對(duì)應(yīng)最高相關(guān)性的成對(duì)關(guān)系作為共表達(dá)網(wǎng)絡(luò)的邊,構(gòu)建K最近鄰網(wǎng)絡(luò),并根據(jù)所述選擇的預(yù)設(shè)比例的對(duì)應(yīng)最高相關(guān)性的成對(duì)關(guān)系作為共表達(dá)網(wǎng)絡(luò)的邊和所述構(gòu)建的K最近鄰網(wǎng)絡(luò),構(gòu)造基因共表達(dá)網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué)(深圳),未經(jīng)哈爾濱工業(yè)大學(xué)(深圳)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110854545.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種建筑施工電梯用防墜減速裝置
- 下一篇:一種多段組合式螺旋熟化裝置
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 心腦血管疾病易感基因芯片檢測(cè)試劑盒
- 一組用于頭頸部鱗狀細(xì)胞癌分子分型的基因及其應(yīng)用
- 產(chǎn)β-丙氨酸的重組菌及其構(gòu)建方法與應(yīng)用
- 一種檢測(cè)高血壓藥物代謝相關(guān)基因的引物組和試劑盒
- 一組用于腎細(xì)胞癌分子分型的基因及其應(yīng)用
- 一組用于膀胱癌檢測(cè)的基因及其應(yīng)用
- 一組用于髓母細(xì)胞瘤分子分型的基因及其應(yīng)用
- 一種頭發(fā)相關(guān)的基因位點(diǎn)庫及其應(yīng)用
- 馬度米星化合物的生物合成基因簇及其應(yīng)用
- 彌漫性大B細(xì)胞淋巴瘤分子分型試劑盒及分型裝置





