[發(fā)明專利]基于多標記學習和貝葉斯網(wǎng)絡的中醫(yī)癥型分類預測方法有效
| 申請?zhí)枺?/td> | 201710027490.8 | 申請日: | 2017-01-16 |
| 公開(公告)號: | CN106874655B | 公開(公告)日: | 2018-12-14 |
| 發(fā)明(設計)人: | 夏勇;馬夢羽;沈璐;張艷寧 | 申請(專利權(quán))人: | 西北工業(yè)大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 西北工業(yè)大學專利中心 61204 | 代理人: | 劉新瓊 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 標記 學習 貝葉斯 網(wǎng)絡 中醫(yī) 分類 預測 方法 | ||
1.一種基于多標記學習和貝葉斯網(wǎng)絡的中醫(yī)癥型分類預測方法,其特征在于步驟如下:
步驟1:根據(jù)收集到的t個中醫(yī)病例,整理了s種四診癥狀,選擇以二值方式為特征賦值,如果病人出現(xiàn)某一癥狀,則該癥狀賦值為1,反之為0,由此得到每個樣本的特征集xi=(xi1,xi2,…,xis),其中i=1,…,t;同時,根據(jù)中醫(yī)病例整理出k種常見的糖尿病癥型,針對每個樣本,如果該樣本對應標記集中有某一癥型,則為該癥型賦值1,反之為0,由此得到每個樣本的標記集Yi=(yi1,yi2,…,yik),其中i=1,…,t,將每個樣本的特征集和標記集一一對應對應得到一個數(shù)據(jù)集S={(x1,Y1),(x2,Y2),…,(xt,Yt)},將數(shù)據(jù)集S分為訓練數(shù)據(jù)集D={(x1,Y1),(x2,Y2),…,(xm,Ym)}和測試數(shù)據(jù)集K={(x1,Y1),(x2,Y2),…,(xn,Yn)};
步驟2:將樣本的標記集Yi=(yi1,yi2,…,yik)輸入到Bayesian DAG learning工具包中,使用Bayesian DAG learning工具包中所提供動態(tài)規(guī)劃算法DP來計算得到最優(yōu)貝葉斯網(wǎng)絡模型;
步驟3:根據(jù)貝葉斯網(wǎng)絡模型讀取訓練數(shù)據(jù)集D中每個樣本標記的父節(jié)點信息pa=(p1,p2,…,pk),將已有s維的四診信息與k維的父節(jié)點信息融合,得到了一個s+k維的訓練數(shù)據(jù)的增廣特征集:xi′=xi∪pai=(xi1,xi2,…,xis,pi1,pi2,…,pik);
步驟4:使用訓練數(shù)據(jù)集 D 的特征集x1,x2,…,xm和它們的父節(jié)點信息pa1,pa2,…,pam分別作為訓練數(shù)據(jù)和訓練數(shù)據(jù)的標記集,訓練得到一個多標記神經(jīng)網(wǎng)絡,使用這個多標記神經(jīng)網(wǎng)絡來預測測試數(shù)據(jù)集K中每個樣本標記的父節(jié)點信息;然后將父節(jié)點信息與測試數(shù)據(jù)四診信息融合,形成測試數(shù)據(jù)的增廣特征集;
步驟5:將增廣訓練數(shù)據(jù)集D’={(x1′,Y1),(x2′,Y2),…,(xn′,Yn)}平均分成兩份D1’,D2’用來訓練出最優(yōu)特征子集;使用訓練數(shù)據(jù)D1’來隨機生成新的特征子集共100組,將100組特征子集作為最初解空間,使用模擬退火算法SA進行迭代,每輪迭代中,將經(jīng)過每組特征子集簡化后的訓練數(shù)據(jù)D1’輸入多標記分類器,由多標記分類器輸出一個指標Averageprecision作為描述特征子集的適應度,在設定時間Tk搜索解空間里適應度最高的解,即100組的特征子集:BF1’,BF2’,…,BF100’;
步驟6:將BF1’,BF2’,…,BF100’作為遺傳算法GA的100個初始種群,經(jīng)過選擇、交叉和變異算子,不斷迭代產(chǎn)生新的解,每輪迭代中,將經(jīng)過每組特征子集簡化后的訓練數(shù)據(jù)D1’輸入多標記分類器,由多標記分類器輸出一個指標Average precision作為描述特征子集的適應度,在設定時間Tg內(nèi)得到適應度最高的100組的特征子集:BF1”,BF2”,…,BF100”;
步驟7:將適應度最高的100組解:BF1”,BF2”,…,BF100”作為爬山算法HC的輸入,每輪迭代時改變每組特征子集中的任意一個特征值,將經(jīng)過這組特征子集簡化后的訓練數(shù)據(jù)D1’輸入多標記分類器,由多標記分類器輸出一個指標Average precision作為描述特征子集的適應度,在設定時間Th內(nèi)計算選出適應度最優(yōu)的一組,將其作為最優(yōu)特征子集BF;
步驟8:使用步驟5-7對D2’依次進行隨機生成新的特征子集共100組、模擬退火算法SA、遺傳算法GA、爬山算法HC迭代,得到最優(yōu)特征子集BF’,比較BF和BF’的適應度,選取適應度高的那組作為最終的最優(yōu)特征子集;
步驟9:將增廣測試數(shù)據(jù)集中的增廣特征集按照步驟8得到的最終最優(yōu)特征子集的特征序號進行特征選擇,將訓練數(shù)據(jù)集和測試數(shù)據(jù)集中的增廣特征集替換為最優(yōu)特征子集,分別得到了最優(yōu)訓練數(shù)據(jù)集DBF和最優(yōu)測試數(shù)據(jù)集KBF;最后使用DBF訓練多標記分類器,并在KBF上完成測試。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學,未經(jīng)西北工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710027490.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種自主融合先驗知識的貝葉斯網(wǎng)絡方法
- 構(gòu)建解決組合爆炸問題的級聯(lián)貝葉斯網(wǎng)絡的方法
- 一種可重構(gòu)系統(tǒng)貝葉斯網(wǎng)構(gòu)建方法
- 一種基于貝葉斯網(wǎng)絡的網(wǎng)站缺陷預測方法及其實現(xiàn)系統(tǒng)
- 應用處理方法、裝置、存儲介質(zhì)及電子設備
- 一種遮擋目標檢測方法、電子設備、存儲介質(zhì)及系統(tǒng)
- 基于貝葉斯網(wǎng)絡推理模型的犯罪重建方法及裝置
- 利用憶阻器本征噪聲實現(xiàn)貝葉斯神經(jīng)網(wǎng)絡的方法及裝置
- 基于面向?qū)ο筘惾~斯網(wǎng)絡的中央空調(diào)系統(tǒng)故障診斷方法
- 一種基于貝葉斯神經(jīng)網(wǎng)絡權(quán)重約束的圖像分類方法





