[發明專利]一種注意力機制預測lncRNA的RBP結合位點的方法在審
| 申請號: | 202011144401.6 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112270955A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 宋金淼;謝凡森;楊紫琪;段曉東;張子晨 | 申請(專利權)人: | 大連民族大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B40/00 |
| 代理公司: | 大連星海專利事務所有限公司 21208 | 代理人: | 楊翠翠 |
| 地址: | 116600 遼寧省大*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 注意力 機制 預測 lncrna rbp 結合 方法 | ||
一種注意力機制預測lncRNA的RBP結合位點的方法,其屬于生物信息學領域。該方法采用一種基于高階統計的編碼方法,利用序列特征進行高維空間表示作為模型輸入。在基準數據集上對Att_Cnn_Caps模型進行評價,取得了比傳統分類器更高的分類精度,采用了基于注意機制、卷積神經網絡的聯合處理層。它能夠針對輸入矩陣的不同位置捕獲不同的注意權重,提取出更高級的特征。由于一個完整的序列包含復雜的信息,使用膠囊網絡來提高預測性能。膠囊網絡采用矢量表示輸入特征,采用動態路由機制更新參數。
技術領域
本發明涉及一種注意力機制預測lncRNA的RBP結合位點的方法,其屬于生物信息學領域。
背景技術
RNA結合蛋白(RBP)在不同的翻譯后階段與靶RNA分子相互作用,包括選擇性剪接、mRNA穩定、定位、翻譯和降解。發現lncrna與蛋白的相互作用,發現RBPs的結合位點,有助于了解轉錄后的調控機制,探索癌癥的發病機制及在其他疾病中的可能作用,并找到潛在的藥物靶點。基因組學由于下一代測序技術的廣泛應用,使人們可以通過大量的實驗獲得RBPs數據,但這些技術往往效率低、周期長、成本高。利用計算方法從序列中預測RBPs結合位點是一種重要的手段。RBPs預測的本質是一個分類問題,序列特征表示方法直接影響分類的精度。常見的RNA序列特征表示包括序列信息、結構信息、理化性質及其組合方法。
近年來,具有強大仿真預測能力的數據驅動深度學習方法得到了廣泛的應用。例如,DeepBind使用微陣列和輸入深卷積神經網絡(CNN)的測序數據來預測序列特異性。IDeepS考慮RBP結合序列的結構信息,訓練兩個獨立的CNN提取序列的特征和二級結構的特征,然后將它們合并到一個長-短期記憶網絡(LSTM)中,得到改進模型預測性能的高級特征。IDeepE考慮到序列的局部和全局特征之間的差異,將局部和全局特征輸入到不同的CNN中,以提高RBP結合位點的預測能力。DeepRiPe提出了一個多任務多模式DNN模型,旨在描述RBP綁定偏好。CircRNA-RBP采用基于密碼子的編碼方案提取序列特征,并訓練卷積神經網絡和遞歸神經網絡(RNN)混合深度學習模型來識別CircRNA結合蛋白的結合偏好。DeepMVF-RBP將多視圖特征表示與深度信任網絡(DBN)方法相結合,用于預測新的候選結合位點和發現潛在的結合模體。MmCNN將序列和結構信息轉換為一個熱編碼和結構表達矩陣,并輸入多個多尺度卷積模塊來檢測RBP結合位點的模體。然而,這些特征表示方法由于維數低、編碼規則簡單、忽略了RBP結合位點短距離內的核苷酸相關性,可能會丟失大量的關鍵序列信息。另外,CNN通過卷積運算從輸入信息中提取深度特征,忽略了特征之間的相關性。此外,由于合并操作會丟失一些信息,這限制了CNN的性能。
因此,本發明提出了一種預測lncRNA的RBP結合位點的方法,采用一種基于高階統計的編碼方法,將用于高維空間表示的序列特征作為模型輸入。在基準數據集上對預測方法進行了評價,取得了比傳統分類器更高的分類精度。
發明內容
本發明的目的在于提供了一種新的預測植物lncRNA的RBP結合位點的方法,采用本方法能在不丟失關鍵序列信息的情況下,準確提高預測效率。
為達到上述效果,本發明的技術方案如下:
一種注意力機制預測植物lncRNA的RBP結合位點的方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連民族大學,未經大連民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011144401.6/2.html,轉載請聲明來源鉆瓜專利網。





