[發(fā)明專利]一種基于貝葉斯網絡過濾的心電圖病癥確定方法有效
| 申請?zhí)枺?/td> | 202010678145.2 | 申請日: | 2020-07-15 |
| 公開(公告)號: | CN112201340B | 公開(公告)日: | 2022-08-26 |
| 發(fā)明(設計)人: | 韓京宇;孫廣鵬 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G06V10/764;G06V10/84 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 曹坤 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 貝葉斯 網絡 過濾 心電圖 病癥 確定 方法 | ||
本發(fā)明公開了一種基于貝葉斯網絡過濾的心電圖病癥確定方法,屬于心電圖病癥診斷領域。該發(fā)明在已訓練好的基分類器的基礎上,采用兩層結構確定最終病癥標簽:第一層構建投票器對基分類器的結果進行篩選,產生錨點病癥集和候選病癥集;第二層采用基于BDe評分的爬山法構建貝葉斯網絡,貝葉斯網絡對錨點病癥集和候選病癥集進行過濾,確定最終預測病癥集。該方法特點:(1)充分利用了病癥標簽間的依賴關系,提高了模型的泛化能力;(2)通過兩層過濾處理能夠糾正基分類器的預測結果,提高模型預測的準確度;(3)由于構建貝葉斯網絡使用的因果關系是一種強關聯(lián)性,因此模型具有穩(wěn)定性的特點,不會因為數(shù)據(jù)分布不同而表現(xiàn)出太大差異。
技術領域
本發(fā)明屬于基于機器學習的心電圖病癥智能診斷技術領域,涉及心電圖病癥確定,尤其涉及基于機器學習的多標簽病癥確定方法。
背景技術
多標簽分類是指對于給定的樣本進行多個標簽的分類,該樣本可能對應標簽集中的一個或者多個標簽。定義特征空間X=Rd,其中d表示特征的維數(shù),L={L1,L2,…,Ln}表示帶有n個標簽的標簽空間,構建訓練集D=(xi,Lj),1≤i≤q,1≤j≤n,q表示訓練集的大小,i表示樣本的序號,xi∈X表示一個d維的特征向量,Lj∈L表示一個L中的一個標簽元素。多標簽學習的任務就是根據(jù)訓練集D學習一個多標簽分類器h(·),使用分類器h(·)對新的樣本x進行預測,其預測結果就是樣本x的類別標簽集。
多標簽分類的解決方法目前主要分為兩種:一種是基于問題轉換的策略,一種是基于算法適應的策略。問題轉換的策略是將多標簽問題轉換為多個單標簽二分類的子模型,再將子模型的結果合并得到最終結果。而基于算法適應的策略是調整流行的學習算法以適應多標簽學習。
問題轉換的策略可以分為二元關聯(lián)(Binary Relevance)、分類器鏈(ClassifierChains)、標簽冪集法(Label Powerset)等方式。二元關聯(lián)法是最簡單的方法,核心思想是將多標簽分類問題進行分解,轉換為多個二元分類問題。這種方法的優(yōu)點是實現(xiàn)方法簡單、容易理解,當標簽之間不存在依賴關系時訓練得到模型效果很好,但如果標簽之間存在直接的依賴關系,那么最后構建的模型泛化能力較弱,不能達到預期的效果。分類器鏈核心思想是將多標簽分類問題轉換成為一個二元分類器鏈的形式,其中鏈后的二元分類器的構建是在前面分類器預測結果的基礎上進行的,模型構建過程中,需要將標簽順序進行打亂排序,然后按照從頭到尾的順序分別構建每個標簽對應的模型。分類器鏈方法的優(yōu)點在于實現(xiàn)方法相對簡單,同時考慮了標簽的聯(lián)系,一定程度上增強了模型的泛化能力,但該方法的效果受到排序的影響,很難找到合適的標簽依賴關系。而標簽冪集法是將多標簽分類轉換為多分類問題,每個樣本實例的標簽集都作為一個單獨的類構建多分類器。該方法考慮到了標簽之間的組合關系,但沒有考慮標簽間的依賴性,同時隨著標簽數(shù)的增加類的數(shù)目也可能會隨之增大,使得模型變得更加復雜一定程度上降低了模型的泛化能力。
采用算法適應策略的方法主要有ML-kNN、ML-DT。ML-kNN是kNN算法的一種改進算法,它的思想是對于每一個樣本實例,獲取距離它最近的k個實例,利用這些實例的特征信息來判斷該實例的預測標簽集。ML-kNN能夠識別出每個樣本不同的鄰域,利用領域間信息來預測,因此準確率較高,但對異常點不敏感。ML-DT基本思想是采用決策樹技術處理多標簽數(shù)據(jù),利用基于多標簽熵的信息增益準則遞歸構建決策樹,它可以從多標簽數(shù)據(jù)中高效地導出決策樹模型,但在計算信息熵時假設標簽之間相互獨立。
算法適應策略和問題轉換策略很大程度上都忽略了標簽之間的依賴性,沒有利用標簽間的關系構建模型,而心電圖病癥之間恰恰存在著這種聯(lián)系,因此這些方法不能很好的利用心電圖確定病癥,預測的準確度較差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010678145.2/2.html,轉載請聲明來源鉆瓜專利網。





