[發明專利]一種藥物作用后差異轉錄表達譜及藥物適應癥的預測方法有效
| 申請號: | 202210257005.7 | 申請日: | 2022-03-16 |
| 公開(公告)號: | CN114360743B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 季序我;彭鑫鑫;余丹陽 | 申請(專利權)人: | 普瑞基準生物醫藥(蘇州)有限公司;普瑞基準科技(北京)有限公司;北京普康瑞仁醫學檢驗所有限公司 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40;G06K9/62;G16B20/00;G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京動力號知識產權代理有限公司 11775 | 代理人: | 董鋼 |
| 地址: | 215000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 藥物 作用 差異 轉錄 表達 適應癥 預測 方法 | ||
1.一種藥物作用后差異轉錄表達譜及藥物適應癥的預測方法,其特征在于,包括:
S1,建立預測藥物作用后差異轉錄表達譜的深度學習模型;
S2,基于所述深度學習模型進行藥物作用后差異轉錄表達譜的預測,所述預測包括在不同細胞系、不同擾動時長與不同藥物劑量條件下的差異轉錄表達譜;以及
S3,將預測獲得的所述藥物作用后差異轉錄表達譜與已有藥物的差異轉錄表達譜進行相似性比較,根據相似性比較結果預測所述藥物的適應癥;
所述S1,建立預測藥物作用后差異轉錄表達譜的深度學習模型包括:
S11,獲得建立所述深度學習模型的樣本,對樣本進行預處理獲得樣本數據;以及
S12,構建所述深度學習模型;
所述S11包括:
S111,從基因表達綜合數據庫中獲取特定數據庫,并采集其中特定級別的數據;
S112,對特定級別的數據進行數據清理,包括:保留基因表達綜合數據庫中測序平臺直接測量的多個基因數據作為初始基因數據;刪除無法使用rdkit以及語法變異自動編碼器無法讀取的藥物數據后獲得初始藥物數據;刪除所述特定級別的數據中平均皮爾森相關系數小于第一閾值的差異轉錄表達譜實驗數據獲得初始差異轉錄表達譜實驗數據;刪除出現次數小于第二閾值的細胞系數據獲得初始細胞系數據;所述初始基因數據、初始藥物數據、初始差異轉錄表達譜實驗數據以及初始細胞系數據構成所述深度學習模型的樣本數據;
所述S12包括:
S121,模型訓練;
S122,模型有效性驗證,包括:
基于所述S121中訓練好的所述深度學習模型對平均皮爾森相關系數小于第一閾值的差異轉錄表達譜的實驗數據進行預測,如果預測的差異轉錄表達譜與實驗結果的相關系數大于第三閾值,則將該實驗數據重新加入之前保留下來的所述樣本數據后重新進行步驟S121;如果預測的差異轉錄表達譜與實驗結果的相關系數小于第三閾值,則繼續步驟S123;
S123,基于所述模型訓練和模型有效性驗證,從而獲得深度學習模型。
2.根據權利要求1所述的一種藥物作用后差異轉錄表達譜及藥物適應癥的預測方法,其特征在于,所述藥物作用后差異轉錄表達譜適用于小分子藥物擾動細胞系實驗。
3.根據權利要求1所述的一種藥物作用后差異轉錄表達譜及藥物適應癥的預測方法,其特征在于,所述模型訓練包括一輪或者多輪,其中每一輪所述模型訓練包括:
(1)從所述樣本數據中隨機選取80%的樣本數據作為訓練集,20%的樣本數據作為測試集,所述訓練集與所述測試集用于進行所述深度學習模型的訓練與評估;
(2)基于語法變異自動編碼器中的簡化分子輸入線輸入系統以及權重文件對所述初始藥物數據中藥物化學分子式進行編碼,獲得56維特征向量以表示所述藥物的分子信息;
(3)基于初始細胞系數據以及癌癥細胞系百科全書中的轉錄表達數據,使用主成分分析算法對所述初始細胞系數據中的每個細胞系的基因表達譜進行降維處理,選取前11個主成分以表示對應細胞系的成分,從而保留超過90%的細胞系信息量;
(4)建立所述深度學習模型的基礎模型,其中所述56維特征向量、所述11個主成分、藥物劑量和藥物的不同擾動時長作為所述基礎模型的輸入,多個基因的差異轉錄表達值作為所述基礎模型的輸出,所述基礎模型使用5層全連接神經網絡;
(5)以余弦相似性作為目標優化函數,使用Adam優化器作為下降方法,利用所述訓練集中的數據訓練所述深度學習模型。
4.根據權利要求1所述的一種藥物作用后差異轉錄表達譜及藥物適應癥的預測方法,其特征在于,所述S2,基于所述深度學習模型進行藥物作用后差異轉錄表達譜的預測,所述預測包括在不同細胞系、不同擾動時長與不同藥物劑量條件下的差異轉錄表達譜包括:
將通過語法編譯自動編碼器對藥物化學分子式編碼獲得的特征向量、不同細胞系表達數據的主成分、藥物的不同擾動時長和/或藥物的不同劑量作為所述深度學習模型的輸入,獲得所述藥物的差異轉錄表達譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于普瑞基準生物醫藥(蘇州)有限公司;普瑞基準科技(北京)有限公司;北京普康瑞仁醫學檢驗所有限公司,未經普瑞基準生物醫藥(蘇州)有限公司;普瑞基準科技(北京)有限公司;北京普康瑞仁醫學檢驗所有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210257005.7/1.html,轉載請聲明來源鉆瓜專利網。





