[發明專利]一種基于上下文感知計算的RNA溶劑可及性預測方法在審
| 申請號: | 202111148787.2 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113936741A | 公開(公告)日: | 2022-01-14 |
| 發明(設計)人: | 胡俊;樊學強;唐玉璇;賈寧欣;張貴軍 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B50/30;G06N3/04;G06N3/08 |
| 代理公司: | 浙江千克知識產權代理有限公司 33246 | 代理人: | 趙芳 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 上下文 感知 計算 rna 溶劑 預測 方法 | ||
1.一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,包括:
S1.收集PDB數據庫中所有已注釋三級結構信息的RNA序列組成訓練集合S,并使用POPS工具生成RNA序列對應的溶劑可及性標簽Y;
S2.獲取訓練集合S中堿基個數為LX的RNA序列信息,并將獲取的RNA序列信息記作SX;
S3.使用Infernal工具搜索SX的核苷酸數據庫并生成對應的多序列聯配信息MSA;
S4.對多序列聯配信息MSA進行處理,生成MSA對應的特征矩陣FMSA;
S5.根據獨熱編碼原理將堿基編碼生成SX對應的獨熱編碼矩陣OHE;
S6.使用LinearPartition-V工具生成SX對應的二級結構信息RSS;
S7.構建上下文感知計算神經網絡框架MVCADNN,并使用構建的上下文感知計算神經網絡框架MVCADNN訓練RNA溶劑可及性預測模型,得到訓練后的RNA溶劑可及性預測模型;
S8.將待預測RNA序列通過步驟S3-步驟S6處理后,生成RNA序列對應的特征信息,并生成的特征信息輸入到訓練后的RNA溶劑可及性預測模型中,得到RNA溶劑可及性的預測信息。
2.根據權利要求1所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述步驟S3中多序列聯配信息MSA,表示為:
其中,表示MSA中的第n條序列聯配信息;N表示MSA中的序列聯配信息總數目。
3.根據權利要求2所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述步驟S4中特征矩陣FMSA,表示為:
其中,表示中的第lx個元素;表示中的第ly個元素;Rr表示元素集合R中的第r個元素;表示第x位置上r堿基的概率;表示第y位置上r堿基的概率;σ表示符號函數;表示第x位置和第y位置的堿基特征;表示第x位置和第y位置上的堿基的信息熵值;lx表示第x位置的堿基。
4.根據權利要求3所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述步驟S5中獨熱編碼矩陣OHE,表示為:
其中,表示OHE中的第l個元素的獨熱編碼信息。
5.根據權利要求4所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述步驟S5中的堿基編碼包括OHEA=[1,0,0,0]、OHEU=[0,1,0,0]、OHEG=[0,0,1,0]、OHEC=[0,0,0,1];其中,A表示腺嘌呤、U表示尿嘧啶、G鳥嘌呤、C胞嘧啶。
6.根據權利要求1所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述步驟S7中的上下文感知計算神經網絡框架MVCADNN包括5個管道,第一管道、第二管道和第三管道分別用于挖掘隱含FMSA、OHE與RSS中的鑒別信息;第四管道用于挖掘隱含在FMSA、OHE與RSS的串行組合特征中的鑒別信息;第五管道用于挖掘由第一管道①、第二管道、第三管道和第四管道的輸出經串行組合后的特征中的鑒別信息。
7.根據權利要求6所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述第一管道、第二管道和第三管道均由兩個兩層的雙向長短時記憶循環神經網絡、三個全連接層、兩個注意力機制模塊組成。
8.根據權利要求6所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述第四管道由一個1D膨脹卷積層,三個殘差塊,二個全連接層組成。
9.根據權利要求6所述的一種基于上下文感知計算的RNA溶劑可及性預測方法,其特征在于,所述第五管道由三個全連接層和三個注意力機制模塊組成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111148787.2/1.html,轉載請聲明來源鉆瓜專利網。





