[發(fā)明專利]一種生物醫(yī)學(xué)關(guān)鍵屬性選擇方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710332543.7 | 申請(qǐng)日: | 2017-05-12 |
| 公開(公告)號(hào): | CN107169284A | 公開(公告)日: | 2017-09-15 |
| 發(fā)明(設(shè)計(jì))人: | 羅森林;潘麗敏;張?jiān)婪?/a>;胡雅嫻 | 申請(qǐng)(專利權(quán))人: | 北京理工大學(xué) |
| 主分類號(hào): | G06F19/00 | 分類號(hào): | G06F19/00 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100081 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 生物醫(yī)學(xué) 關(guān)鍵 屬性 選擇 方法 | ||
1.一種生物醫(yī)學(xué)關(guān)鍵屬性選擇方法,其特征在于,所述方法包括以下步驟:
步驟1,數(shù)據(jù)集S包含N個(gè)樣本,M維影響2型糖尿病干預(yù)效果的待選屬性,使用boruta算法對(duì)人群的干預(yù)效果進(jìn)行擬合,得到影響干預(yù)效果的關(guān)鍵屬性,以及待選屬性的重要性排序;
步驟2,基于原始數(shù)據(jù)集S,根據(jù)人群的干預(yù)效果構(gòu)建邏輯回歸判別模型,使用邏輯回歸算法對(duì)人群的干預(yù)效果進(jìn)行擬合,得到對(duì)干預(yù)效果具有顯著影響的屬性;
步驟3,基于步驟1中boruta算法得到對(duì)干預(yù)效果具有重要影響的屬性,步驟2中邏輯回歸算法得到對(duì)干預(yù)效果具有顯著影響的屬性,結(jié)合專家意見,采用交集歸類的方法,得到影響干預(yù)效果的關(guān)鍵屬性。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述使用boruta算法選擇重要屬性的步驟具體包括:
步驟2.1,創(chuàng)建數(shù)據(jù)集S的副本屬性,并進(jìn)行重排得到重組數(shù)據(jù)集S,增加給定數(shù)據(jù)集的隨機(jī)性;
步驟2.2,構(gòu)建樹的個(gè)數(shù)為n(0<n N)在數(shù)據(jù)集S中,采用bootstrap方式有放回地隨機(jī)抽取N個(gè)新的樣本集,每個(gè)樣本集的數(shù)據(jù)量大約為2N/3,每個(gè)樣本集被記錄為Di(0<i n),沒(méi)有被抽取的數(shù)據(jù)記錄為袋外數(shù)據(jù)Oi(0<in),構(gòu)建包含n棵樹的隨機(jī)森林模型;
步驟2.3,構(gòu)建分類回歸樹,計(jì)算每個(gè)樹對(duì)應(yīng)的袋外數(shù)據(jù)均方誤差,記為MSEi,則n棵樹的原始袋外數(shù)據(jù)均方誤差向量為[MSE1,MSE2,…,MSEn];
步驟2.4,基于步驟2.2得到的均方誤差向量[MSE1,MSE2,…,MSEn],與對(duì)應(yīng)屬性計(jì)算得到的Z值,確定Z值最大的副本屬性,同時(shí)篩選出比其值更大的屬性作為重要屬性,而對(duì)應(yīng)其Z值小的屬性標(biāo)記為非重要屬性,并從數(shù)據(jù)集中刪除;
步驟2.5,重復(fù)以上步驟1.1至1.4,直到達(dá)到預(yù)設(shè)的終止條件;
步驟2.6,屬性的均方誤差代表屬性的重要性,屬性重要性排序靠前的屬性,為對(duì)2型糖尿病干預(yù)效果具有重要影響的屬性。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,使用邏輯回歸算法選擇顯著屬性的步驟具體包括:
步驟3.1,對(duì)M維待選屬性進(jìn)行歸一化處理,計(jì)算方法為:
其中,是第i個(gè)樣本第l維屬性原始值,是第i個(gè)樣本第l維屬性的歸一化值,和則分別是樣本第l維屬性的最大值和最小值;
步驟3.2,構(gòu)建邏輯回歸模型,采用最大似然估計(jì)方法計(jì)算各屬性系數(shù),回歸方程如下:
f(x)=b0+b1x1+b2x2+...+bMxM
其中,xl(0<l≤M)表示第l維屬性,M為屬性的維度,bl(0<l≤M)表示邏輯回歸模型中各屬性的權(quán)重;
步驟3.3,采用AIC準(zhǔn)則進(jìn)行逐步回歸,得到AIC最小時(shí)的屬性組合,構(gòu)建邏輯回歸模型;
步驟3.4,對(duì)邏輯回歸模型中M維屬性權(quán)重進(jìn)行顯著性檢驗(yàn),以顯著性水平為0.05,篩選對(duì)干預(yù)效果具有顯著影響的屬性。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,屬性融合得到關(guān)鍵屬性的步驟具體包括:
步驟4.1,結(jié)合專家經(jīng)驗(yàn)意見,考慮屬性的采集難度,對(duì)步驟1和步驟2中選擇得到的屬性進(jìn)一步篩選;
步驟4.2,基于boruta算法得到對(duì)干預(yù)效果具有重要影響的屬性,和邏輯回歸算法得到對(duì)干預(yù)效果具有顯著影響的屬性,選擇同時(shí)出現(xiàn)的屬性,作為影響干預(yù)效果的關(guān)鍵屬性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京理工大學(xué),未經(jīng)北京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710332543.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建?;蚍抡妫纾焊怕誓P突騽?dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)?,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 從聚合生物醫(yī)學(xué)裝置中萃取可萃取材料的裝置、組合件和方法
- 基于生物可吸收基質(zhì)的可植入生物醫(yī)學(xué)裝置
- 基于生物可吸收基質(zhì)的可植入生物醫(yī)學(xué)裝置
- 基于生物可吸收基質(zhì)的可植入生物醫(yī)學(xué)裝置
- 用于生物醫(yī)學(xué)模擬的系統(tǒng)和方法
- 一種生物醫(yī)學(xué)知識(shí)庫(kù)的信息更新方法及系統(tǒng)
- 基于上下文向量圖核的生物醫(yī)學(xué)實(shí)體關(guān)系分類方法
- 生物醫(yī)學(xué)實(shí)體展示平臺(tái)的構(gòu)建方法、裝置和計(jì)算機(jī)設(shè)備
- 基于預(yù)訓(xùn)練模型和自注意力機(jī)制的生物醫(yī)學(xué)關(guān)系抽取方法
- 基于文獻(xiàn)的癌癥相關(guān)生物醫(yī)學(xué)事件數(shù)據(jù)庫(kù)構(gòu)建方法
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 標(biāo)有關(guān)鍵點(diǎn)和關(guān)鍵線的人臺(tái)
- 關(guān)鍵詞質(zhì)量度的檢測(cè)方法和裝置
- 關(guān)鍵詞排名的檢測(cè)方法和裝置
- 關(guān)鍵點(diǎn)識(shí)別
- 磁性開關(guān)鍵
- 面板開關(guān)鍵
- 關(guān)鍵短語(yǔ)提取方法以及關(guān)鍵短語(yǔ)提取系統(tǒng)
- 通信行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種長(zhǎng)尾關(guān)鍵詞識(shí)別方法、關(guān)鍵詞搜索方法及計(jì)算機(jī)設(shè)備





