[發明專利]基于多標記學習和貝葉斯網絡的中醫癥型分類預測方法有效
| 申請號: | 201710027490.8 | 申請日: | 2017-01-16 |
| 公開(公告)號: | CN106874655B | 公開(公告)日: | 2018-12-14 |
| 發明(設計)人: | 夏勇;馬夢羽;沈璐;張艷寧 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 劉新瓊 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 標記 學習 貝葉斯 網絡 中醫 分類 預測 方法 | ||
本發明涉及一種基于多標記學習和貝葉斯網絡的中醫癥型分類預測方法,通過尋找到中醫糖尿病6種癥型之間的關系,發掘每個癥型存在的隱形“成因”,并將這些“成因”與傳統四診信息結合起來,構造增廣特征集來描述樣本。最后通過特征選擇算法和多標記分類算法來構造分類器,實現對中醫臨床糖尿病6種常見癥型的分類預測。
技術領域
本發明涉及一種信息分類預測方法,特別是涉及一種使用標記相關性作為描述樣本的補充特征,并且將多標記學習算法和貝葉斯網絡進行結合的基于多標記學習的中醫臨床癥型分類方法。
背景技術
中醫臨床癥型分類主要是通過中醫望聞問切的手法得到患者的癥狀信息(如:頭疼、四肢冰冷、脈細等),并運用分類模型得到該患者對應癥型(如:氣虛、肝胃郁熱等)。中醫臨床癥型分類問題最大特點在于:每個患者對應癥型常有多個,例如:氣陰兩虛兼血瘀,其中包含了氣虛、陰虛和血瘀三種癥型,因此使用多標記學習模型構建分類器成為解決該問題的常用方法。基于考察標記之間相關性的不同方式,已有的多標記學習問題求解策略大致可以分為三種:一階、二階和高階;其中一階方法將多標記問題轉化成多個獨立的二分類問題,忽略標記之間的關系,所以模型泛化能力最低,正確率不高;二階方法將多標記問題拆分成兩兩標記比較,在一定程度上提高分類器泛化能力和正確率,但當現實問題具有超越二階的相關性時,該類方法的性能將會受到很大影響;高階方法策略通過考察高階的標記相關性來構造分類器,如處理任一標記對其它所有標記的影響,這類方法往往泛化能力最高,但其復雜度也可能隨之變大,不利于處理大規模數據。使用標記相關性來設計分類器,是多標記學習領域的特點也是難點。現在常用的多標記分類方法有大部分是將已有的二分類器進行改編,以適應多標記學習問題。
發明內容
要解決的技術問題
為了避免現有技術的不足之處,本發明提出一種基于多標記學習和貝葉斯網絡的中醫癥型分類預測方法。
技術方案
一種基于多標記學習和貝葉斯網絡的中醫癥型分類預測方法,其特征在于步驟如下:
步驟1:根據收集到的t個中醫病例,整理了s種四診癥狀,選擇以二值方式為特征賦值,如果病人出現某一癥狀,則該癥狀賦值為1,反之為0,由此得到每個樣本的特征集xi=(xi1,xi2,…,xis),其中i=1,…,t;同時,根據中醫病例整理出k種常見的糖尿病癥型,針對每個樣本,如果該樣本對應標記集中有某一癥型,則為該癥型賦值1,反之為0,由此得到每個樣本的標記集Yi=(yi1,yi2,…,yik),其中i=1,…,t,將每個樣本的特征集和標記集一一對應對應得到一個數據集S={(x1,Y1),(x2,Y2),…,(xt,Yt)},將數據集S分為訓練數據集D={(x1,Y1),(x2,Y2),…,(xm,Ym)}和測試數據集K={(x1,Y1),(x2,Y2),…,(xn,Yn)};
步驟2:將樣本的標記集Yi=(yi1,yi2,…,yik)輸入到Bayesian DAG learning工具包中,使用Bayesian DAG learning工具包中所提供動態規劃算法DP來計算得到最優貝葉斯網絡模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710027490.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種輸血管理系統
- 下一篇:一種基于實驗室自動化系統的樣本重測方法及系統





