[發明專利]一種基于圖卷積神經網絡的病毒-宿主相互作用預測方法在審
| 申請號: | 202011154766.7 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112331257A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 劉莘;王飛;張瀟;王亮;耿偉;樸雪;楊婷;吳川;丁暉 | 申請(專利權)人: | 徐州醫科大學 |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B30/00;G16B40/00;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京淮海知識產權代理事務所(普通合伙) 32205 | 代理人: | 劉振祥 |
| 地址: | 221000 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖卷 神經網絡 病毒 宿主 相互作用 預測 方法 | ||
一種基于圖卷積神經網絡的病毒?宿主相互作用預測方法,數據獲?。簭臄祿熘蝎@取HCV和人類蛋白質相互作用的數據;數據表示:為每個蛋白序列創建PSSMs,得到蛋白質PSSM為L*20的PSSM打分矩陣,并得到20*20的矩陣,將其作為特征提取的輸入;特征提?。簩Φ鞍踪|的PSSM矩陣進行特征提?。荒P痛罱ǎ翰捎?層GCN模型進行模型搭建;模型訓練:利用五折交叉驗證進行模型訓練,隨機初始化權重;模型預測:利用訓練后得到的模型對測試數據集進行預測,檢驗算法的泛化能力。該方法不需要構造負數據集,避免假陰性數據的出現,同時考慮HCV?宿主蛋白質相互作用的網絡結構信息,提升預測效果。
技術領域
本發明屬于病毒-宿主相互作用預測技術領域,具體涉及一種基于圖卷積神經網絡的病毒-宿主相互作用預測方法。
背景技術
蛋白質相互作用是指兩個或者兩個以上的蛋白質分子通過直接接觸或者功能關聯的方式形成蛋白質復合體,它可以起到維持生命活動功能的作用。蛋白質相互作用主要參與了人體中DNA的復制、轉錄過程,以及蛋白質的翻譯、修飾、定位和疾病的治療、預防等。例如,病毒可與特定的宿主蛋白質發生相互作用,而感染宿主細胞。病毒性疾病是由各種病毒引起的,每年奪去數百萬人的生命。對于許多病毒性疾病,由于致病機制不明,病毒基因組突變率快,目前尚無有效的疫苗或治療方法。因此,識別病毒與宿主蛋白之間的相互作用對于了解病毒感染的分子機制和識別抗病毒藥物至關重要。
由于傳統的實驗方法昂貴且耗時,因此計算方法在該領域得到了越來越多的關注。近年來,隨著病毒-宿主的相互作用數據的不斷增加,出現了一些用于預測病毒-宿主相互作用的計算方法?;谟嬎惴椒ǖ腍CV-宿主蛋白質相互作用預測研究主要構建不同蛋白質特征表示方法和機器學習模型兩個部分構成。
雖然目前基于計算的HCV-宿主蛋白相互作用模型取得了不錯的成績,然而這些方法仍存在亟待解決的問題。首先,負數據集的構造容易產生假陰性數據,影響預測的準確性;隨著高通量測序技術的發展,HCV-宿主相互作用數據(正數據集)漸漸增加,然而非HCV-宿主相互作用數據(負數據集)仍然是未知的,一般在非相互作用數據集中任意選擇等量的負數據集,這會使得負數據集中存在很多假陰性數據,影響預測準確性。其次,忽視HCV-宿主蛋白質相互作用的網絡結構信息;目前的計算方法均僅考慮蛋白質的特征信息,沒有考慮HCV-宿主蛋白質之間的網絡結構信息,這也是影響預測效果的因素之一。
發明內容
針對上述現有技術存在的問題,本發明提供一種基于圖卷積神經網絡的病毒-宿主相互作用預測方法,該方法不需要構造負數據集,避免假陰性數據的出現,同時考慮HCV-宿主蛋白質相互作用的網絡結構信息,提升預測效果。
本發明提供一種基于圖卷積神經網絡的病毒-宿主相互作用預測方法,包括以下步驟:
S1:數據獲?。簭拇鎯Σ《?宿主相互作用的數據庫中獲取HCV和人類蛋白質相互作用的數據;
S2:數據表示:通過迭代PSI-BLAST搜索方法來發現和搜索序列有關的蛋白質序列,使用位置特異性迭代BLAST為每個蛋白序列創建PSSMs,其中,將代表E的臨界值和最大迭代次數的PSI-BLAST參數h和j分別設為0.001和3,通過公式(1)得到蛋白質PSSM為L*20的PSSM打分矩陣,并利用其轉置矩陣和其進行相乘得到20*20的矩陣,將其作為特征提取的輸入;
式中,L為蛋白質的序列長度,Pi,j表示在進化過程中,序列第i個位置被替換為第j種氨基酸所得到的分數;
S3:特征提?。豪枚S主成分分析方法對蛋白質的PSSM矩陣進行特征提取;
A1:通過公式(2)訓練數據的樣本集;
{Si∈R20*20,i=1,2,...,N} (2);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于徐州醫科大學,未經徐州醫科大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011154766.7/2.html,轉載請聲明來源鉆瓜專利網。





