[發明專利]一種基于集成學習的生物醫學網絡關聯預測方法有效
| 申請號: | 202110236007.3 | 申請日: | 2021-03-03 |
| 公開(公告)號: | CN112951320B | 公開(公告)日: | 2023-05-16 |
| 發明(設計)人: | 歐陽樂;盧帆 | 申請(專利權)人: | 深圳大學 |
| 主分類號: | G16B15/30 | 分類號: | G16B15/30;G16B20/20;G16B40/00 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 518061 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 集成 學習 生物醫學 網絡 關聯 預測 方法 | ||
本發明針對現有技術的局限性,提出了一種基于集成學習的生物醫學網絡關聯預測方法,其引入了多個算法的預測結果的信息,據此提取出了兩類生物醫學實體內部的強聯系,并構建了相應的低維特征;通過矩陣分解模型進一步學習兩類低維特征之間的聯系以解釋觀測到的生物醫學關聯,最終模型重構兩部分低維特征,得到集成的預測結果;能夠突破單一方法的局限,綜合各個算法的視角,提供更加準確,更具備魯棒性的預測結果。
技術領域
本發明涉及計算生物學技術領域,具體涉及生物數據挖掘,更具體的涉及一種基于集成學習的生物醫學網絡關聯預測方法。
背景技術
復雜疾病例如癌癥的產生往往不是由單個生物分子的失調和突變導致,而是由生物分子間的相互作用構成的調控網絡的功能異常導致。疾病發生發展過程中,會有一些生物分子出現異常行為,識別與疾病發生有高相關性的異常生物分子將對疾病的預防、診斷、治療非常有幫助。近年來,已經有很多研究通過生物實驗驗證了不同類型生物實體之間的聯系,例如藥物與蛋白質靶標的關聯,疾病與micro?RNA的關聯,疾病與長鏈非編碼RNA(Long?non-coding?RNA,lncRNA)的關聯等。然而,通過生物實驗方法來識別新的生物醫學關聯需要耗費大量時間,并且代價高昂。而在計算機領域中,這類問題可以抽象為一個二分網絡的關聯預測問題。生物醫學二分網絡的概念圖可見圖1。因此,借助計算方法預測潛在的關聯網絡,從而為生物實驗提供參考和建議,這將有助于提升生物醫學關聯識別這項任務的效率并降低成本。
近十年,涌現出了各種應用于生物醫學網絡關聯預測任務的計算方法。根據原理,可以大致分為三類方法:網絡擴散模型、基于特征的分類方法和基于矩陣分解的方法。網絡擴散模型主要是運用基于圖的方法對生物醫學網絡中的關聯進行擴散傳播,從而對網絡中的潛在的關聯進行預測。基于特征的分類方法,是用關聯雙方節點的特征表示每個關聯,然后輸入到機器學習模型中進行訓練。基于矩陣分解的方法,是嘗試通過生物醫學關聯矩陣學習出兩個或多個低維因子矩陣,然后將他們相乘來重構出一個關聯矩陣。然而,面對類型各異的生物醫學關聯網絡,僅僅依賴于單一預測方法的假設可能無法準確地刻畫所有數據。
公開日為2020.04.10,公開號為:CN110993113A的中國發明專利:基于MF-SDAE的lncRNA-疾病關系預測方法及系統,試圖通過利用多個lncRNA數據庫及多個疾病數據庫,提取lncRNA的多種特征以及疾病的多種特征,以提供一種快速有效的方案,但該方案仍有一定的局限性。
發明內容
針對現有技術的局限,本發明提出一種基于集成學習的生物醫學網絡關聯預測方法,本發明采用的技術方案是:
一種基于集成學習的生物醫學網絡關聯預測方法,包括以下步驟:
S1,獲取待預測的兩類生物實體的原始相似度矩陣以及關聯矩陣;分別運用若干個生物醫學網絡關聯預測算法,根據所述原始相似度矩陣以及關聯矩陣對所述生物實體進行關聯預測,獲得各算法的預測結果;
S2,根據各算法的預測結果,分別計算獲得所述生物實體的預測相似度矩陣;對所述預測相似度矩陣進行稀疏化處理后,結合各算法的預測結果,以加權疊加的方式計算獲得所述生物實體的集成相似度矩陣;
S3,運用奇異值分解對所述原始相似度矩陣提取低維特征,結合所述集成相似度矩陣構建自適應加權集成矩陣分解模型;
S4,對所述自適應加權集成矩陣分解模型進行訓練優化直至模型收斂;
S5,運用收斂后的所述自適應加權集成矩陣分解模型重建預測矩陣作為所述生物實體關聯預測的最終結果。
相較于現有技術,本發明引入了多個算法的預測結果的信息,據此提取出了兩類生物醫學實體內部的強聯系,并構建了相應的低維特征;通過矩陣分解模型進一步學習兩類低維特征之間的聯系以解釋觀測到的生物醫學關聯,最終模型重構兩部分低維特征,得到集成的預測結果;能夠突破單一方法的局限,綜合各個算法的視角,提供更加準確,更具備魯棒性的預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳大學,未經深圳大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110236007.3/2.html,轉載請聲明來源鉆瓜專利網。





