[發(fā)明專利]基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點預測方法在審
| 申請?zhí)枺?/td> | 202110283782.4 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN113096722A | 公開(公告)日: | 2021-07-09 |
| 發(fā)明(設(shè)計)人: | 胡俊;賈寧欣;曾文武;殷文杰;董明;張貴軍 | 申請(專利權(quán))人: | 浙江工業(yè)大學 |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 內(nèi)積 注意力 神經(jīng)網(wǎng)絡(luò) 蛋白質(zhì) 磷酸化 預測 方法 | ||
1.一種基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點預測方法,其特征在于,所述預測方法包括以下步驟:
1)輸入一個氨基酸殘基數(shù)目為L的待進行磷酸化位點預測的蛋白質(zhì)序列,記作S;
2)使用one-hot編碼方式對組成蛋白質(zhì)的20種常見氨基酸類型進行數(shù)字編碼;
3)利用20種常見氨基酸類型的one-hot編碼,將氨基酸殘基數(shù)目為L的蛋白質(zhì)序列S轉(zhuǎn)換為一個L×20的特征矩陣,記作Mfea中第i行第j列元素Mfea(ij)表示為:
其中,Ti表示蛋白質(zhì)序列S中第i個殘基的類型,Aj表示20種常見氨基酸類型中的第j種殘基類型;
4)對蛋白質(zhì)中的每個殘基,根據(jù)蛋白質(zhì)的特征矩陣Mfea,使用大小為w的滑動窗口,生成一個大小為w×20的特征矩陣,記作M;
5)搭建內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)共有四層,分別為卷積層、內(nèi)積自注意力層、全連接層以及softmax層,每一層的輸出作為下一層的輸入;;
6)從PhosphoSitePlus數(shù)據(jù)庫中收集N條已有磷酸化位點標簽的蛋白質(zhì)序列,Pi表示第i條蛋白質(zhì)序列,i=1,2…,N,將Pi通過步驟2)至4)生成每個目標殘基的特征矩陣M,結(jié)合相應的位點標簽,構(gòu)建訓練數(shù)據(jù)集;
7)利用步驟6)得到的訓練數(shù)據(jù)集,訓練步驟5)搭建的內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò),訓練階段使用二分類交叉熵損失函數(shù)調(diào)整網(wǎng)絡(luò)中的參數(shù);
8)將蛋白質(zhì)序列S中每個殘基的特征矩陣M輸入到步驟7)訓練得到的內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)模型中,輸出預測概率P;根據(jù)模型輸出的預測概率P與判定閾值T的大小關(guān)系,即可判斷目標殘基是否為磷酸化位點,當預測概率值P大于判定閾值T時,殘基即為磷酸化位點。
2.如權(quán)利要求1所述的基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點預測方法,其特征在于,所述步驟5)中,卷積層、內(nèi)積自注意力層、全連接層以及softmax層的描述如下:
5.1)卷積層:將通過步驟4)獲得的特征矩陣M作為輸入,分別與三個大小為3×20的卷積核Wa、Wb、Wc做卷積運算,得到三個大小為(w-2)×1的向量a,b,c作為輸出;
5.2)內(nèi)積自注意力層:首先,將卷積層的輸出向量a和b做內(nèi)積運算,得到數(shù)值λ,數(shù)值λ再與向量c做數(shù)乘,得到一個大小為(w-2)×1的向量,記作d;然后,將卷積層的輸出向量a,b,c與向量d串聯(lián),得到一個大小為(w-2)×4的矩陣,記作M′;其次,通過ReLU激活函數(shù)對矩陣M′做非線性變換;最后,將多維的輸出拉成一個一維向量,實現(xiàn)到全連接層的過渡;
5.3)全連接層:該層由54個神經(jīng)元組成,起到分類器的作用,生成softmax層損失函數(shù)的輸入;
5.4)softmax層:輸出目標殘基是否為磷酸化位點的預測概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學,未經(jīng)浙江工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110283782.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





