[發(fā)明專利]基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110283782.4 | 申請(qǐng)日: | 2021-03-17 |
| 公開(公告)號(hào): | CN113096722A | 公開(公告)日: | 2021-07-09 |
| 發(fā)明(設(shè)計(jì))人: | 胡俊;賈寧欣;曾文武;殷文杰;董明;張貴軍 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G16B15/20 | 分類號(hào): | G16B15/20;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司 33241 | 代理人: | 王利強(qiáng) |
| 地址: | 310014 浙江省*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 內(nèi)積 注意力 神經(jīng)網(wǎng)絡(luò) 蛋白質(zhì) 磷酸化 預(yù)測(cè) 方法 | ||
一種基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)方法,首先輸入氨基酸殘基數(shù)目為L(zhǎng)待進(jìn)行磷酸化位點(diǎn)預(yù)測(cè)的蛋白質(zhì)序列,利用20種常見氨基酸的one?hot編碼表示形式將蛋白質(zhì)序列轉(zhuǎn)換為一個(gè)L×20的特征矩陣Mfea;然后,對(duì)蛋白質(zhì)的每個(gè)殘基,根據(jù)Mfea使用滑動(dòng)窗口獲取一個(gè)大小為w×20的特征矩陣M;其次,從數(shù)據(jù)庫(kù)中獲取已知磷酸化位點(diǎn)標(biāo)簽的蛋白質(zhì)序列構(gòu)建訓(xùn)練集;再次,搭建神經(jīng)網(wǎng)絡(luò)框架,使用訓(xùn)練集訓(xùn)練網(wǎng)絡(luò)并獲取預(yù)測(cè)模型;最終將待預(yù)測(cè)的蛋白質(zhì)序列殘基的特征矩陣輸入到訓(xùn)練的模型中,根據(jù)模型輸出的概率值來(lái)預(yù)測(cè)蛋白質(zhì)序列中目標(biāo)殘基是否為磷酸化位點(diǎn)。本發(fā)明計(jì)算代價(jià)低、預(yù)測(cè)精確性高。
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息學(xué)、深度學(xué)習(xí)與計(jì)算機(jī)應(yīng)用領(lǐng)域,具體而言涉及一種基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)方法。
背景技術(shù)
蛋白質(zhì)磷酸化是一種廣泛存在于真核生物中的翻譯后修飾過(guò)程,它在能量代謝、信號(hào)傳導(dǎo)途徑、神經(jīng)活動(dòng)、細(xì)胞周期和凋亡等多種生物過(guò)程中起著重要作用。蛋白質(zhì)磷酸化位點(diǎn)的準(zhǔn)確鑒定不僅可以幫助我們理解復(fù)雜的蛋白質(zhì)生物系統(tǒng),還可以指導(dǎo)基本生物醫(yī)學(xué)藥物的設(shè)計(jì)。
目前,通過(guò)深度學(xué)習(xí)進(jìn)行蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)的方法有:NetPhos3.0(Blom,N.et al.Prediction of post-translational glycosylation and phosphorylation ofproteins from the amino acid sequence[J].Proteomics,2004:4,1633–1649.即:Blom,N等.NetPhos3.0:從氨基酸序列預(yù)測(cè)蛋白質(zhì)的翻譯后糖基化和磷酸化[J].蛋白質(zhì)組學(xué),2004,4,1633-1649.)、PPSP(Xue,T.et al.PPSP:prediction of PK-specificphosphorylation site with Bayesian decision theory[J].BMC Bioinformatics,2003:7,163.即:Xue,T等.PPSP:貝葉斯決策理論預(yù)測(cè)PK特異性磷酸化位點(diǎn)[J].BMC生物信息學(xué),2003:7,163.)、Musite(Gao,J.et al.Musite:a tool for global prediction ofgeneral and kinase-specific phosphorylation sites[J].Mol.Cell.Proteomics,2010:9,2586–2600.即:Gao,J等.Musite:用于總體預(yù)測(cè)一般和激酶特異性磷酸化位點(diǎn)的工具[J].Mol.Cell.蛋白質(zhì)組學(xué),2010:9,2586-2600.)與MusiteDeep(Wang,D.etal.MusiteDeep:a deep-learning framework for general and kinase-specificphosphorylation site prediction[J].Bioinformatics,2017:33,3909–3916.即:Wang,D等.MusiteDeep:一般和激酶特異性磷酸化位點(diǎn)預(yù)測(cè)的深度學(xué)習(xí)框架[J].生物信息學(xué),2017:33,3909-3916.)等。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,基于深度學(xué)習(xí)的方法能夠自動(dòng)提取蛋白質(zhì)序列中的氨基酸特征和隱藏模式。雖然這些方法取得了不錯(cuò)的效果,但這些方法僅捕獲沿氨基酸殘留維度的特征。因此,該方法可能忽略了隱藏在蛋白質(zhì)序列特征向量維中的一些重要特征,而這些特征可能對(duì)預(yù)測(cè)磷酸化位點(diǎn)有用。
綜上所述,現(xiàn)存的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)方法在計(jì)算代價(jià)、預(yù)測(cè)精確性方面,距離實(shí)際應(yīng)用的要求還有很大差距,迫切地需要改進(jìn)。
發(fā)明內(nèi)容
為了克服現(xiàn)有蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)方法在計(jì)算代價(jià)、預(yù)測(cè)精確性方面的不足,本發(fā)明提出一種計(jì)算代價(jià)低、預(yù)測(cè)精確性高的基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)方法。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:
一種基于內(nèi)積自注意力神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)磷酸化位點(diǎn)預(yù)測(cè)方法,所述方法包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110283782.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- G.723.1編碼器快速計(jì)算自適應(yīng)碼書的貢獻(xiàn)模塊
- 基于壓縮感知的信號(hào)重建方法及裝置
- 觸摸面板控制器、集成電路、觸摸面板裝置和電子設(shè)備
- 一種用于執(zhí)行向量?jī)?nèi)積運(yùn)算的裝置和方法
- 基于核非負(fù)矩陣分解的人臉識(shí)別方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種基于模容錯(cuò)學(xué)習(xí)問(wèn)題的同態(tài)內(nèi)積方法
- 一種用于臺(tái)階爆破深孔的排水方法
- 一種用于執(zhí)行向量?jī)?nèi)積運(yùn)算的裝置和方法
- 一種基于標(biāo)量等式內(nèi)積的高效范圍證明方法
- 一種基于醫(yī)學(xué)檢驗(yàn)的體內(nèi)積液產(chǎn)速檢測(cè)裝置
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





