[發(fā)明專利]抗乳腺癌候選藥物分子描述符的篩選方法、系統(tǒng)及終端在審
| 申請(qǐng)?zhí)枺?/td> | 202111663622.9 | 申請(qǐng)日: | 2021-12-31 |
| 公開(公告)號(hào): | CN114334033A | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設(shè)計(jì))人: | 陳家銳;楊培浩;李升;林慧賢 | 申請(qǐng)(專利權(quán))人: | 廣東海洋大學(xué) |
| 主分類號(hào): | G16C20/30 | 分類號(hào): | G16C20/30;G16C20/70 |
| 代理公司: | 深圳市廣諾專利代理事務(wù)所(普通合伙) 44611 | 代理人: | 祝晶 |
| 地址: | 524088 *** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 乳腺癌 候選 藥物 分子 描述 篩選 方法 系統(tǒng) 終端 | ||
1.抗乳腺癌候選藥物分子描述符的篩選方法,其特征是,包括以下步驟:
獲取多個(gè)化合物對(duì)ERα的生物活性數(shù)據(jù),每個(gè)化合物配置有多個(gè)分子描述符,得到由分子描述符組成的自變量集;
基于LASSO回歸方法建立初步篩選模型,以初步篩選模型對(duì)自變量集進(jìn)行降維處理,得到變量系數(shù)不為零的初篩變量集;
基于隨機(jī)森林遞歸特征消除法建立變量篩選模型,以變量篩選模型對(duì)初篩變量集對(duì)初篩變量集進(jìn)行迭代特征選擇,得到分類精度最高的最優(yōu)特征變量組合。
2.根據(jù)權(quán)利要求1所述的抗乳腺癌候選藥物分子描述符的篩選方法,其特征是,所述分子描述符為用于描述化合物的結(jié)構(gòu)和性質(zhì)特征的參數(shù)。
3.根據(jù)權(quán)利要求1所述的抗乳腺癌候選藥物分子描述符的篩選方法,其特征是,所述初步篩選模型對(duì)自變量集進(jìn)行降維處理時(shí),綜合考慮訓(xùn)練精度和正則化參數(shù)變化情況來確定實(shí)際降維處理的正則化參數(shù)取值。
4.根據(jù)權(quán)利要求3所述的抗乳腺癌候選藥物分子描述符的篩選方法,其特征是,所述正則化參數(shù)取值的確定過程具體為:
獲取不同懲罰項(xiàng)所對(duì)應(yīng)的精度結(jié)果;
以懲罰項(xiàng)為橫軸、精度結(jié)果為縱軸建立平滑擬合曲線;
分析得到平滑擬合曲線中不同懲罰項(xiàng)對(duì)應(yīng)的曲線斜率絕對(duì)值;
將曲線斜率絕對(duì)值和懲罰項(xiàng)相乘計(jì)算得優(yōu)先值;
以優(yōu)先值最大的懲罰項(xiàng)所對(duì)應(yīng)的正則化參數(shù)作為最終確定的正則化參數(shù)取值。
5.根據(jù)權(quán)利要求1所述的抗乳腺癌候選藥物分子描述符的篩選方法,其特征是,所述初步篩選模型的計(jì)算公式具體為:
其中,J(θ)表示真實(shí)值與預(yù)測(cè)值的變量;θ表示回歸系數(shù);hθ(x)(i)表示預(yù)測(cè)第i個(gè)樣本的值;y(i)表示真實(shí)第i個(gè)樣本的值,i∈[1,m];m表示樣本個(gè)數(shù);n表示參數(shù)個(gè)數(shù);α表示正則化參數(shù),隨著α的增大,各變量的系數(shù)會(huì)逐漸趨于零;x為自變量,表示分子描述符;y為因變量,表示生物活性;θj表示第j個(gè)變量的回歸系數(shù)。
6.根據(jù)權(quán)利要求1所述的抗乳腺癌候選藥物分子描述符的篩選方法,其特征是,所述最優(yōu)特征變量組合的獲得過程具體為:
將初篩變量集中的k個(gè)特征作為初始特征子集輸入到隨機(jī)森林分類器中,計(jì)算得到每個(gè)特征的重要性,并利用交叉驗(yàn)證方法得到初始特征子集的分類精度;
從當(dāng)前特征子集中移除特征重要性最低的一個(gè)特征,得到一個(gè)新的特征子集,再次輸入到隨機(jī)森林分類器中,計(jì)算新的特征子集中每個(gè)特征的重要性,并利用交叉驗(yàn)證方法得到新的特征子集的分類精度;
遞歸的重復(fù)上述步驟,直至特征子集為空,最后得到k個(gè)不同特征數(shù)量的特征子集,選擇分類精度最高的特征子集作為最優(yōu)特征組合。
7.根據(jù)權(quán)利要求1所述的抗乳腺癌候選藥物分子描述符的篩選方法,其特征是,該篩選方法還包括:
通過Pearson相關(guān)系數(shù)來度量最優(yōu)特征變量組合中兩個(gè)變量之間的相關(guān)程度,并建立相關(guān)系數(shù)熱力分析圖;
識(shí)別出相關(guān)系數(shù)熱力分析圖中相關(guān)系數(shù)的正負(fù)分布情況,依據(jù)正負(fù)分布情況將最優(yōu)特征變量組合的變量分為正相關(guān)變量集和負(fù)相關(guān)變量集。
8.抗乳腺癌候選藥物分子描述符的篩選系統(tǒng),其特征是,包括:
數(shù)據(jù)采集模塊,用于獲取多個(gè)化合物對(duì)ERα的生物活性數(shù)據(jù),每個(gè)化合物配置有多個(gè)分子描述符,得到由分子描述符組成的自變量集;
初篩模塊,用于基于LASSO回歸方法建立初步篩選模型,以初步篩選模型對(duì)自變量集進(jìn)行降維處理,得到變量系數(shù)不為零的初篩變量集;
終篩模塊,用于基于隨機(jī)森林遞歸特征消除法建立變量篩選模型,以變量篩選模型對(duì)初篩變量集對(duì)初篩變量集進(jìn)行迭代特征選擇,得到分類精度最高的最優(yōu)特征變量組合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東海洋大學(xué),未經(jīng)廣東海洋大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111663622.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 乳腺癌細(xì)胞MDA-MB-231的核酸適體LXL-2及其應(yīng)用
- 乳腺癌細(xì)胞MDA-MB-231的核酸適體LXL-3及其應(yīng)用
- 乳腺癌細(xì)胞MDA-MB-231的核酸適體LXL-1及其應(yīng)用
- 試劑在制備藥物中的用途以及篩選藥物的方法
- 一種乳腺癌干細(xì)胞特異性結(jié)合多肽及其在制備治療乳腺癌藥物中的應(yīng)用
- 乳腺癌分型基因群及其應(yīng)用
- 羥基紅花黃色素B在制備治療乳腺癌藥物中的應(yīng)用
- IL1R2在乳腺癌預(yù)后評(píng)估與靶向治療中的應(yīng)用
- 乳腺腫瘤組織中CICs在制備預(yù)測(cè)乳腺癌預(yù)后生存產(chǎn)品中的應(yīng)用
- 多模態(tài)多參數(shù)乳腺癌篩查系統(tǒng)、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)





