[發(fā)明專利]一種藥物靶標(biāo)毒性預(yù)測模型的構(gòu)建方法及其應(yīng)用在審
| 申請?zhí)枺?/td> | 202110648660.0 | 申請日: | 2021-06-10 |
| 公開(公告)號: | CN113380341A | 公開(公告)日: | 2021-09-10 |
| 發(fā)明(設(shè)計)人: | 吳瓊;施璐 | 申請(專利權(quán))人: | 北京百奧智匯科技有限公司 |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/30;G16B25/10;G16B30/10;G16B5/00 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 鞏克棟 |
| 地址: | 100089 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 藥物 靶標(biāo) 毒性 預(yù)測 模型 構(gòu)建 方法 及其 應(yīng)用 | ||
1.一種藥物靶標(biāo)毒性預(yù)測模型的構(gòu)建方法,其特征在于,所述構(gòu)建方法包括如下步驟:
收集整理細(xì)胞系的CRISPR/Cas9敲除實驗數(shù)據(jù),根據(jù)所述CRISPR/Cas9敲除實驗數(shù)據(jù)確定細(xì)胞和基因之間為依賴關(guān)系或非依賴關(guān)系,并添加標(biāo)簽,獲得基因依賴性數(shù)據(jù);
收集整理細(xì)胞系基因表達(dá)譜數(shù)據(jù),模擬靶基因抑制后其下游基因的改變情況,并結(jié)合攜帶標(biāo)簽的基因依賴性數(shù)據(jù)得到任意基因擾動后改變的基因表達(dá)譜數(shù)據(jù);
將所述任意基因擾動后改變的基因表達(dá)譜數(shù)據(jù)隨機(jī)分為訓(xùn)練集和測試集,所述訓(xùn)練集輸入分類器模型進(jìn)行訓(xùn)練,所述測試集用于測試所得模型,交叉驗證后得到所述藥物靶標(biāo)毒性預(yù)測模型。
2.根據(jù)權(quán)利要求1所述的構(gòu)建方法,其特征在于,所述構(gòu)建方法中根據(jù)CRISPR/Cas9敲除實驗數(shù)據(jù)的截斷值確定細(xì)胞和基因之間的依賴關(guān)系;
所述細(xì)胞和基因之間為依賴關(guān)系,則添加標(biāo)簽1;
所述細(xì)胞和基因之間為非依賴關(guān)系,則添加標(biāo)簽0。
3.根據(jù)權(quán)利要求1所述的構(gòu)建方法,其特征在于,所述基因表達(dá)譜數(shù)據(jù)涉及的基因和所述基因依賴性數(shù)據(jù)涉及的基因一致;
所述構(gòu)建方法中利用ARACNe算法和TCGA數(shù)據(jù)生成的R軟件包獲得ARACNe基因調(diào)控網(wǎng)絡(luò)數(shù)據(jù),所述ARACNe基因調(diào)控網(wǎng)絡(luò)數(shù)據(jù)用于模擬靶基因抑制后其下游基因的改變情況,獲取任意基因擾動后改變的基因表達(dá)譜數(shù)據(jù)。
4.根據(jù)權(quán)利要求2所述的構(gòu)建方法,其特征在于,所述構(gòu)建方法中細(xì)胞對基因的依賴關(guān)系根據(jù)實驗數(shù)據(jù)的至少兩個截斷值確定,模型建立后,根據(jù)ROC曲線確定最優(yōu)模型。
5.如權(quán)利要求1~4任一項所述的構(gòu)建方法構(gòu)建的藥物靶標(biāo)毒性預(yù)測模型。
6.一種單細(xì)胞水平的藥物靶標(biāo)毒性的預(yù)測方法,其特征在于,所述預(yù)測方法包括:
利用如權(quán)利要求1~4任一項所述的構(gòu)建方法構(gòu)建藥物靶標(biāo)毒性預(yù)測模型;
收集整理人體器官的癌癥和正常組織樣品的單細(xì)胞基因表達(dá)譜數(shù)據(jù),利用ARACNe基因調(diào)控網(wǎng)絡(luò)構(gòu)建所述人體器官的不同細(xì)胞類型的干擾基因表達(dá)譜數(shù)據(jù);
所述藥物靶標(biāo)毒性預(yù)測模型根據(jù)所述干擾基因表達(dá)譜數(shù)據(jù)對待測的藥物靶標(biāo)進(jìn)行毒性預(yù)測。
7.根據(jù)權(quán)利要求6所述的預(yù)測方法,其特征在于,所述預(yù)測方法還包括去除單細(xì)胞基因表達(dá)譜數(shù)據(jù)與細(xì)胞系基因表達(dá)譜數(shù)據(jù)的批次效應(yīng)的步驟;
所述批次效應(yīng)的去除方法包括:
收集所述細(xì)胞系基因表達(dá)譜數(shù)據(jù)和單細(xì)胞基因表達(dá)譜數(shù)據(jù)的原始測序數(shù)據(jù),收集所述單細(xì)胞基因表達(dá)譜數(shù)據(jù)的基于唯一分子標(biāo)識的原始讀段數(shù)目;
使用方差穩(wěn)定變換的方法對數(shù)據(jù)進(jìn)行歸一化處理,再使用combat方法去除所有數(shù)據(jù)間的批次效應(yīng)。
8.一種用于預(yù)測藥物靶標(biāo)毒性的裝置,其特征在于,所述裝置包括:
數(shù)據(jù)收集整理模塊,用于獲取數(shù)據(jù)庫中CRISPR/Cas9敲除實驗數(shù)據(jù)、細(xì)胞系基因表達(dá)譜數(shù)據(jù)和人體器官的癌癥和正常組織樣品的單細(xì)胞基因表達(dá)譜數(shù)據(jù);
依賴關(guān)系確定模塊,用于根據(jù)所述CRISPR/Cas9敲除實驗數(shù)據(jù)確定細(xì)胞和基因之間為依賴關(guān)系或非依賴關(guān)系;
數(shù)據(jù)分析模塊,用于分析基因調(diào)控網(wǎng)絡(luò)和攜帶標(biāo)簽的基因依賴性數(shù)據(jù),獲取任意基因擾動后改變的基因表達(dá)譜數(shù)據(jù);
模型訓(xùn)練和優(yōu)化模塊,用于利用所得任意基因擾動后改變的基因表達(dá)譜數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型,測試所得機(jī)器學(xué)習(xí)模型的預(yù)測精度并進(jìn)行優(yōu)化。
9.一種計算機(jī)設(shè)備,其特征在于,所述計算機(jī)設(shè)備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如權(quán)利要求6或7中任一項所述的單細(xì)胞水平的藥物靶標(biāo)毒性的預(yù)測方法。
10.一種計算機(jī)存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求6或7中任一項所述的單細(xì)胞水平的藥物靶標(biāo)毒性的預(yù)測方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百奧智匯科技有限公司,未經(jīng)北京百奧智匯科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110648660.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





