[發(fā)明專利]一種蛋白質(zhì)相互作用網(wǎng)絡(luò)比對方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202211717423.6 | 申請日: | 2022-12-29 |
| 公開(公告)號: | CN116110492A | 公開(公告)日: | 2023-05-12 |
| 發(fā)明(設(shè)計)人: | 陳璟;王子祥;任利軍 | 申請(專利權(quán))人: | 江南大學(xué) |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B15/00;G16B40/00 |
| 代理公司: | 蘇州市中南偉業(yè)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32257 | 代理人: | 楊慧林 |
| 地址: | 214000 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 蛋白質(zhì) 相互作用 網(wǎng)絡(luò) 方法 系統(tǒng) | ||
本發(fā)明涉及一種蛋白質(zhì)相互作用網(wǎng)絡(luò)比對方法和系統(tǒng),方法包括:獲取兩個蛋白質(zhì)相互作用網(wǎng)絡(luò)的結(jié)構(gòu)信息;提取每個網(wǎng)絡(luò)中所有節(jié)點的分層結(jié)構(gòu)特征,并基于分層結(jié)構(gòu)特征計算節(jié)點間的結(jié)構(gòu)得分;基于結(jié)構(gòu)得分構(gòu)造多層的加權(quán)圖,使每個節(jié)點在加權(quán)圖上進(jìn)行隨機(jī)游走生成上下文序列;將兩個網(wǎng)絡(luò)中每個節(jié)點對應(yīng)的上下文序輸入詞向量模型,得到每個節(jié)點對應(yīng)的低維向量,并計算每個節(jié)點對應(yīng)的低維向量之間的距離作為節(jié)點間的拓?fù)湎嗨菩裕粚⒐?jié)點間序列相似性和節(jié)點間的拓?fù)湎嗨菩越Y(jié)合,來計算節(jié)點間的相似性得分,并基于相似性得分構(gòu)建節(jié)點間的相似性矩陣;根據(jù)節(jié)點間的相似性矩陣生成兩個網(wǎng)絡(luò)的節(jié)點比對結(jié)果。本發(fā)明有效提高蛋白質(zhì)相互作用網(wǎng)絡(luò)比對效率。
技術(shù)領(lǐng)域
本發(fā)明涉及蛋白質(zhì)相互作用網(wǎng)絡(luò)比對技術(shù)領(lǐng)域,尤其是指一種蛋白質(zhì)相互作用網(wǎng)絡(luò)比對方法和系統(tǒng)。
背景技術(shù)
高通量技術(shù)和大規(guī)模計算的發(fā)展,大量的蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)數(shù)據(jù)被獲取,而蛋白質(zhì)是細(xì)胞執(zhí)行各種生物功能的基礎(chǔ),分析這些PPI網(wǎng)絡(luò)能夠更好的了解生物組織特征以及發(fā)現(xiàn)重要功能模塊。網(wǎng)絡(luò)比對是分析PPI網(wǎng)絡(luò)的一種更有效的方法,可以用來發(fā)現(xiàn)網(wǎng)絡(luò)中的保守功能模塊和預(yù)測蛋白質(zhì)的未知功能。網(wǎng)絡(luò)比對將不同網(wǎng)絡(luò)根據(jù)其相似性進(jìn)行匹配,進(jìn)而發(fā)現(xiàn)保守的蛋白質(zhì)以及將已經(jīng)被充分研究的物種上的信息轉(zhuǎn)移到研究較少的物種上。如今,已經(jīng)有大量的全局網(wǎng)絡(luò)比對算法被提出。
I?soRank是首個網(wǎng)絡(luò)比對算法,算法根據(jù)PageRank的思想,聚合節(jié)點的鄰居信息特征值并結(jié)合序列相似性計算節(jié)點間的相似性得分,再通過光譜聚類方法生成比對。此算法存在的問題:僅使用鄰居信息,沒有發(fā)掘網(wǎng)絡(luò)中的深層拓?fù)湫畔ⅲ瑢?dǎo)致最終產(chǎn)生的比結(jié)果的拓?fù)滟|(zhì)量和生物功能質(zhì)量都不高。
NAI?GO首先對網(wǎng)絡(luò)進(jìn)行子網(wǎng)劃分,并根據(jù)度標(biāo)簽相似性和GO術(shù)語相似性選取相似性最大的模塊作為種子進(jìn)行拓展,從而得到最終的比對結(jié)果。此算法存在的問題:過度依賴于GO相似性,對于GO未知的網(wǎng)絡(luò)無法進(jìn)行比對,且比對的效率較低。
MAGNA算法將啟發(fā)式算法思想引入網(wǎng)絡(luò)比對,使用遺傳算法進(jìn)行網(wǎng)絡(luò)比對。將每一種比對結(jié)果作為種群中的個體,通過初始種群不斷迭代交叉變異產(chǎn)生具有更高目標(biāo)函數(shù)得分的個體,有效的避免了比對時出現(xiàn)局部最優(yōu)的問題。此算法存在的問題:初始種群一般通過隨機(jī)生成的方式獲取,且比對時為了取得最優(yōu)結(jié)果多次迭代,算法運行時間較長,且初始種群和迭代次數(shù)會影響比對的結(jié)果。
盡管已經(jīng)對網(wǎng)絡(luò)比對進(jìn)行了大量研究,但尋找一種高效且有意義的算法仍是一種挑戰(zhàn)。現(xiàn)有的算法想要獲取更多保守功能信息,往往需要借助網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)信息,而如何更好的量化網(wǎng)絡(luò)的拓?fù)湫畔⑹切枰鎸Φ闹卮筇魬?zhàn)。此外,還需要對比對效率做進(jìn)一步的研究。
發(fā)明內(nèi)容
為此,本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)中蛋白質(zhì)網(wǎng)絡(luò)比對效率較低的問題。
為解決上述技術(shù)問題,本發(fā)明提供了一種蛋白質(zhì)相互作用網(wǎng)絡(luò)比對方法,包括:
步驟S1:獲取任意兩個待比對蛋白質(zhì)相互作用網(wǎng)絡(luò)的結(jié)構(gòu)信息;
步驟S2:對每個蛋白質(zhì)相互作用網(wǎng)絡(luò)中所有節(jié)點的結(jié)構(gòu)特征進(jìn)行分層次提取,得到分層結(jié)構(gòu)特征,并基于所述分層結(jié)構(gòu)特征計算節(jié)點間的結(jié)構(gòu)得分;
步驟S3:構(gòu)造多層的加權(quán)圖,所述加權(quán)圖的每一層為蛋白質(zhì)相互作用網(wǎng)絡(luò)中所有節(jié)點組成的無向完全圖,并將所述節(jié)點間的結(jié)構(gòu)得分作為加權(quán)圖的邊權(quán)重,使每個節(jié)點在所述加權(quán)圖上進(jìn)行隨機(jī)游走生成上下文序列;
將任意兩個待比對蛋白質(zhì)相互作用網(wǎng)絡(luò)中每個節(jié)點對應(yīng)的上下文序列輸入詞向量模型進(jìn)行訓(xùn)練,得到每個節(jié)點對應(yīng)的低維向量,計算每個節(jié)點對應(yīng)的低維向量之間的距離作為節(jié)點間的拓?fù)湎嗨菩裕?/p>
步驟S4:根據(jù)節(jié)點間序列相似性和所述節(jié)點間的拓?fù)湎嗨菩杂嬎愎?jié)點間的相似性得分,并基于所述節(jié)點間的相似性得分構(gòu)建節(jié)點的相似性矩陣;
步驟S5:根據(jù)所述節(jié)點的相似性矩陣生成兩個蛋白質(zhì)相互作用網(wǎng)絡(luò)的節(jié)點比對結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江南大學(xué),未經(jīng)江南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211717423.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





