[發明專利]基于流生成模型的藥物隱藏靶點預測系統及方法在審
| 申請號: | 202210001817.5 | 申請日: | 2022-01-04 |
| 公開(公告)號: | CN114360635A | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 鄧岳;李鳳基 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B20/30;G16B40/00;G16B15/30;G06K9/62;G06N3/08 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 崔自京 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生成 模型 藥物 隱藏 預測 系統 方法 | ||
本發明公開了基于流生成模型的藥物隱藏靶點預測系統及方法,屬于蛋白藥物靶點分析技術領域。基于流生成模型的藥物隱藏靶點預測系統包括圖像預處理模塊、可逆神經網絡模塊、隱空間編輯模塊和結合位點檢測模塊;通過本發明系統及方法進行藥物隱藏靶點預測擬合能力強、預測速度快,在藥物的發現研究中具有巨大應用前景。
技術領域
本發明屬于蛋白藥物靶點分析技術領域,具體涉及基于流生成模型的藥物隱藏靶點預測系統及方法。
背景技術
蛋白質分子在通過冷凍電鏡等方法進行構象解析與動態結構分析時,需要對低溫狀態下的目標分子進行多角度、高頻率的電鏡成像,再通過基于傅里葉變換的三維重建方法從上萬張瞬時成像中還原蛋白質平均結構,其重建結果為時間采樣均值,相比真實情況下蛋白質動態結構具有一定信息損失。
在藥物發現領域,通過高精度蛋白質結構分析得到藥物作用靶點是設計藥物的重要工序之一,考慮到蛋白質結構的動態多變性,部分未被冷凍電鏡等重建方法捕獲的結構靶點被稱為“隱藏靶點”,通過計算方法還原蛋白質的動態表征,揭示蛋白質表面的隱藏靶點,在醫藥學領域具有重要意義。
目前對蛋白質動態結構的研究、隱藏靶點的預測需要借助于分子動力學模擬、主成分分析等方法。
分子動力學模擬為在牛頓力學層面建立分子級別的力場,通過有限差分方法得到在初始構象附近的可能結構。該方法精確度取決于建立的勢能模型,且大分子中原子數量多,單次迭代考慮的相互作用對數量龐大,為跳出局部能量勢壘所需的迭代次數將帶來巨大的時間開銷。
基于主成分分析方法,可以對不同構象的二維粒子圖進行主成分提取,并進行聚類以生成集中標準構象。在此技術上,可以通過不同構象之間的線性組合表示蛋白質的動態結構;但其表示能力往往有限,易造成隱藏靶點的忽視。
使用生成對抗式網絡訓練的構象生成模型也是發掘隱藏靶點的方法之一;但其訓練需要大量數據支撐且容易造成模式崩塌的問題。
變分自編碼器作為另一種候選方案,使用編碼器-解碼器結構模擬蛋白質構想分布;但缺乏對概率分布的精確評估,結果質量存在風險。
因此,亟待提供一種擬合能力強、預測速度快的隱藏靶點預測方法。
發明內容
本發明公開了基于流生成模型的藥物隱藏靶點預測系統及方法,與傳統藥物靶點預測方法相比,信息利用率高,采樣映射速率快。
為了實現上述目的,本發明采用如下技術方案:
基于流生成模型的藥物隱藏靶點預測系統,包括圖像預處理模塊、可逆神經網絡模塊、隱空間編輯模塊和結合位點檢測模塊;
圖像預處理模塊用于對蛋白質二維粒子圖進行特征提取與建模;
可逆神經網絡模塊包括正向網絡編碼模塊和逆向網絡解碼模塊;
正向網絡編碼模塊使用流生成模型中可逆神經網絡的正向部分將圖像預處理模塊建模獲得的結構屬性參數編碼至高維隱空間;
隱空間編輯模塊用于對高維隱空間進行降維并可視化,獲得低維隱空間,并對低維隱空間進行聚類、編輯;
逆向網絡解碼模塊用于對所述隱空間編輯模塊編輯的低維隱空間采樣,將采樣的低維隱空間還原為高維隱空間,并且使用流生成模型中可逆神經網絡的逆向部分解碼高維隱空間中采樣向量,搜索潛在的三維構象;
結合位點檢測模塊用于對逆向網絡解碼模塊搜索到的三維潛在構象進行解析評估,預測可能成藥的結合口袋,并輸出預測結果。
傳統的隱藏藥物結合位點發現方法搜索構象空間小、仿真計算耗時長,易忽略因蛋白質動態結構帶來的潛在成藥靶點,不精確的靶點預測將對基于結構的藥物設計流程帶來錯誤指引。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210001817.5/2.html,轉載請聲明來源鉆瓜專利網。





