[發明專利]一種lncRNA與目標DNA結合預測方法及系統有效
| 申請號: | 202110065875.X | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112786112B | 公開(公告)日: | 2023-10-20 |
| 發明(設計)人: | 劉義莎;戴智明 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B15/30;G06F18/25;G06F18/24;G06N3/0464;G06N3/0442;G06N3/048;G06N3/045;G06N3/08 |
| 代理公司: | 深圳市創富知識產權代理有限公司 44367 | 代理人: | 高冰 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 lncrna 目標 dna 結合 預測 方法 系統 | ||
本發明公開了一種lncRNA與目標DNA結合預測方法及系統,該方法包括:獲取lncRNA序列和DNA序列;基于卷積神經網絡分別對lncRNA序列和DNA序列進行特征提取處理,得到對應的序列特征;基于lncRNA?DNA融合網絡將對應的序列特征連接并輸出結果;對基于SDG優化器對lncRNA?DNA融合網絡構建二分類交叉熵函數。該系統包括:序列獲取模塊、序列特征提取模塊、融合模塊和損失模塊。通過使用本發明,能夠解決DNA?lncRNA結合預測問題,提高預測效率,減少計算時間。本發明作為一種lncRNA與目標DNA結合預測方法及系統,可廣泛應用于DNA?lncRNA結合預測領域。
技術領域
本發明涉及DNA-lncRNA結合預測領域,尤其涉及一種lncRNA與目標DNA結合預測方法及系統。
背景技術
長鏈非編碼RNA(Long non-coding RNA,lncRNA)是長度大于200個核苷酸的非編碼RNA。非編碼RNA是指不編碼蛋白質的RNA。一部分lncRNA會與DNA基于Hoogsteen堿基配對原則結合形成三聯體,來調控基因的表達,以此來影響生命體的發育、代謝等。例如,TA-U、AT-G、CG-G、GC-U。
現在有生物實驗證明DNA-lncRNA三聯體的存在。但是lncRNA分子量小,表達量較低,結合范圍跨度大,生物實驗較難大量地檢測到lncRNA。例如人類基因組含有約30億個DNA堿基對,而lncRNA的長度大約在200~100000之間,且表達量不及常用的基因表達。lncRNA有41萬種,現在只有非常少的lncRNA被實驗證明且被了解到其具體功能。目前預測方法都是基于統計學分析,大范圍的預測會耗費大量時間。
發明內容
為了解決上述技術問題,本發明的目的是提供一種lncRNA與目標DNA結合預測方法及系統,解決DNA-lncRNA預測問題,提高預測效率,減少計算時間。
本發明所采用的第一技術方案是:一種lncRNA與目標DNA結合預測方法,包括以下步驟:
獲取lncRNA序列和DNA序列;
基于卷積神經網絡分別對lncRNA序列和DNA序列進行特征提取處理,得到對應的序列特征;
基于lncRNA-DNA融合網絡將對應的序列特征連接并輸出結果。
進一步,還包括:
基于SDG優化器對lncRNA-DNA融合網絡構建二分類交叉熵函數。
進一步,所述卷積神經網絡包括一維卷積層、一維最大池化層、批標準化層、雙向GRU層和注意力機制層。
進一步,所述基于卷積神經網絡分別對lncRNA序列和DNA序列進行特征提取處理,得到對應的序列特征這一步驟,其具體包括:
基于lncRNA卷積神經網絡對lncRNA序列進行特征提取處理,得到lncRNA序列特征;
基于DNA卷積神經網絡DNA序列進行特征提取處理,得到DNA序列特征。
進一步,所述基于lncRNA卷積神經網絡對lncRNA序列進行特征提取處理,得到lncRNA序列特征這一步驟,其具體包括:
基于one-hot方法對lncRNA序列進行編碼處理,得到序列特征;
基于一維卷積層對序列特征進行壓縮,得到壓縮后的序列特征;
將壓縮后的序列特征依次經過一維最大池化層、批標準化層、雙向GRU層和注意力機制層,得到最終的lncRNA序列特征。
進一步,所述基于DNA卷積神經網絡DNA序列進行特征提取處理,得到DNA序列特征這一步驟,其具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110065875.X/2.html,轉載請聲明來源鉆瓜專利網。





