[發明專利]一種基于融合神經網絡的LncRNA-疾病關聯預測方法在審
| 申請號: | 202211451740.8 | 申請日: | 2022-11-21 |
| 公開(公告)號: | CN115691817A | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 李巧君;楊偉;李江岱;龐士昱;石晨;馮賢菊 | 申請(專利權)人: | 河南工業職業技術學院 |
| 主分類號: | G16H50/50 | 分類號: | G16H50/50;G06N3/0455;G06N3/0464;G06N3/0442;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 473000 河南*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 融合 神經網絡 lncrna 疾病 關聯 預測 方法 | ||
本發明提供了一種基于融合神經網絡FNN(Fusion Neural Networks,FNN)和棧式自編碼器(Stacked Autoencoder,SAE)的LncRNA?疾病關聯預測方法,屬于LncRNA與疾病關聯預測技術領域。首先,整合LncRNA功能相似性、疾病語義相似性、LncRNA?疾病互作、LncRNA?miRNA相互作用以及miRNA?疾病關聯多源數據構建特征矩陣;其次,基于SAE模塊學習LncRNA?疾病對的低維網絡表示,基于融合神經網絡FNN模塊進行高階特征的提取,學習LncRNA?疾病時間依賴和共享參數的高級特征,兩個模塊都經過全連接層和softmax層,得到LncRNA?疾病的相關可能性即關聯得分;最后,賦予兩個模塊的預測分值不同的權值,對分值進行加權融合得到預測得分,從而篩選出與疾病關聯的潛在LncRNA,為科研人員確定與疾病關聯的候選LncRNA提供輔助決策。
技術領域
本發明屬于LncRNA與疾病關聯預測技術領域,尤其涉及一種基于融合神經網絡的LncRNA與疾病關聯預測方法。
背景技術
長非編碼RNA(Long non-coding RNA,LncRNA)是一種非蛋白編碼RNA,其長度超過200個核苷酸,過去人們普遍認為LncRNA對基因表達幾乎沒有影響。目前,諸多研究表明人類身體各種復雜疾病(如癌癥)的形成發展與LncRNA的突變和失調的病理機制密切相關。LncRNA GMAN或ephrin A1的調節機制在胃腫瘤轉移和發展過程中發揮了重要的調控作用;在癌癥進行免疫治療過程中,命名為LIMIT的癌癥免疫原性LncRNA可能是治療靶點;LncRNA-HOTAIR在不同的癌細胞中扮演著致癌分子的角色,其表達水平是乳腺癌、胃癌、結直腸癌和宮頸癌等癌癥診斷和治療的潛在生物標志物。因此,識別疾病相關的LncRNA將有助于在LncRNA水平上了解人類復雜的疾病機制、疾病診斷和治療。近年來隨著生物技術的發展,實驗發現的LncRNA-疾病關聯數據逐漸增加,研究者整理這些數據并建立了LncRNADisease、Lnc2Cancer、HDMM等LncRNA-疾病關聯數據庫。目前,已知的LncRNA-疾病關聯僅僅只是小部分,而生物實驗驗證耗時長且成本昂貴。隨著人工智能技術的發展和大數據技術的成熟,研究人員利用計算方法分析和處理已知數據,能夠加速發現LncRNA和疾病之間的潛在關聯,已成為生物實驗識別LncRNA-疾病關聯的有效補充?;谟嬎愕腖ncRNA-疾病關聯預測方法分為基于矩陣分解的方法和基于機器學習的方法兩類。目前,由于生物數據的完整性、模型選擇和實驗設計等各個方面仍存在一定的局限性,現有的LncRNA-疾病預測方法仍然面臨著許多挑戰。
發明內容
本發明目的是提供一種預測精準度更高的關聯預測方法,為實現這一目地,本發明基于LncRNA與疾病關聯數據來源類型多,特征提取不夠充分的特點,提出一種基于融合神經網絡和棧式自編碼器的LncRNA與疾病關聯預測方法,整體框架見圖1所示,本發明技術方案的整體步驟如下:
1)整合了LncRNA相似性、疾病相似性、LncRNA-疾病關聯、LncRNA-miRNA相互作用以及miRNA-疾病關聯等多源數據構建特征矩陣,并將構建的特征矩陣分別輸入到方法的兩個模塊,其中LncRNA 和疾病 關聯特征示例見圖2所示;
2)基于棧氏自編碼器SAE的特征提取模塊學習LncRNA-疾病對的低維網絡表示,基于融合神經網絡FNN的特征提取模塊充分利用卷積神經網絡(Convolutional NeuralNetwork,CNN)和長短期記憶遞歸神經網絡(Long Short Term Memory,LSTM)的不同優勢,學習LncRNA-疾病時間依賴和共享參數的高級特征。兩個模塊都經過全連接層和softmax層,得到LncRNA-疾病的相關可能性即關聯得分;
3)最后賦予兩個模塊的預測分值不同的權值,對分值進行加權融合得到預測得分,從而篩選出疾病相關LncRNA。
附圖說明
圖1體系結構圖
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南工業職業技術學院,未經河南工業職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211451740.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于頁巖氣開采的壓裂泵傳動機構
- 下一篇:便于調整的激波報靶系統





