[發(fā)明專利]基于實例和特征共享級聯(lián)的疾病預(yù)測系統(tǒng)、設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202010070744.6 | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111312403A | 公開(公告)日: | 2020-06-19 |
| 發(fā)明(設(shè)計)人: | 王紅;趙麗麗;虞鳳萍;王倩;王彩雨;韓書;李威;莊魯賀;張慧 | 申請(專利權(quán))人: | 山東師范大學(xué) |
| 主分類號: | G16H50/80 | 分類號: | G16H50/80;G16H50/20;G06F17/18 |
| 代理公司: | 濟南圣達(dá)知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250358 山東省*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 實例 特征 共享 級聯(lián) 疾病 預(yù)測 系統(tǒng) 設(shè)備 介質(zhì) | ||
1.基于實例和特征共享級聯(lián)的疾病預(yù)測系統(tǒng),其特征是,包括:
待預(yù)測數(shù)據(jù)集獲取模塊,其被配置為:獲取待預(yù)測患者的所有疾病特征;
待預(yù)測數(shù)據(jù)集預(yù)測模塊,其被配置為:將待預(yù)測患者的所有疾病特征,輸入到已經(jīng)訓(xùn)練好的基于特征和實例遷移的平衡概率分布模型中,輸出待預(yù)測患者所患疾病是否為慢性阻塞性肺疾病。
2.如權(quán)利要求1所述的系統(tǒng),其特征是,已經(jīng)訓(xùn)練好的基于特征和實例遷移的平衡概率分布模型的訓(xùn)練模塊,包括:
訓(xùn)練集獲取單元,其被配置為:獲取第一數(shù)據(jù)集和第二數(shù)據(jù)集;所述第一數(shù)據(jù)集為慢性阻塞性肺疾病的前期疾病數(shù)據(jù)集;所述第二數(shù)據(jù)集為已患和未患慢性阻塞性肺疾病的疾病數(shù)據(jù)集;所述第二數(shù)據(jù)集為小樣本數(shù)據(jù)集;
基于特征和實例遷移的平衡概率分布模型構(gòu)建單元,用于構(gòu)建基于特征和實例遷移的平衡概率分布模型,所構(gòu)建的基于特征和實例遷移的平衡概率分布模型,包括:依次串聯(lián)的實例共享級聯(lián)單元、特征共享級聯(lián)單元和特征共享級聯(lián)優(yōu)化單元;
實例共享級聯(lián)單元,其被配置為:從第一數(shù)據(jù)集中篩選出統(tǒng)計次數(shù)最多的N種疾病名稱;
特征共享級聯(lián)單元,其被配置為:篩選出第一數(shù)據(jù)集與第二數(shù)據(jù)集疾病特征距離最近的M種疾病特征;
特征共享級聯(lián)優(yōu)化單元,其被配置為:根據(jù)N種疾病名稱和M種疾病特征,計算第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的平衡概率分布值;
預(yù)測單元,其被配置為:根據(jù)平衡概率分布值與設(shè)定閾值的比較,輸出第二數(shù)據(jù)集中待預(yù)測疾病是否為慢性阻塞性肺疾病;
驗證單元,其被配置為:將預(yù)測單元的預(yù)測結(jié)果和預(yù)測單元的當(dāng)前待預(yù)測疾病對應(yīng)的特征均輸入到彈性網(wǎng)絡(luò)中,彈性網(wǎng)絡(luò)輸出損失函數(shù)值,如果損失函數(shù)值達(dá)到最小值,則表示基于特征和實例遷移的平衡概率分布模型訓(xùn)練結(jié)束;否則,繼續(xù)對基于特征和實例遷移的平衡概率分布模型進(jìn)行訓(xùn)練。
3.如權(quán)利要求2所述的系統(tǒng),其特征是,所述訓(xùn)練集獲取單元之后,所述基于特征和實例遷移的平衡概率分布模型構(gòu)建單元之前,還包括:預(yù)處理單元,所述預(yù)處理單元,用于對第一數(shù)據(jù)集和第二數(shù)據(jù)集均進(jìn)行預(yù)處理。
4.如權(quán)利要求3所述的系統(tǒng),其特征是,所述預(yù)處理單元包括:
數(shù)據(jù)轉(zhuǎn)換子單元,用于將文字?jǐn)?shù)據(jù)轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù);
數(shù)據(jù)篩選子單元,用于將噪聲數(shù)據(jù)剔除,噪聲數(shù)據(jù)是指與待預(yù)測疾病數(shù)據(jù)不相關(guān)的數(shù)據(jù);
數(shù)據(jù)填充子單元,用于對缺失數(shù)據(jù)進(jìn)行填充;對篩選出的重要生理指標(biāo)的缺失值進(jìn)行填充。
5.如權(quán)利要求2所述的系統(tǒng),其特征是,實例共享級聯(lián)單元,其被配置為:將的第一數(shù)據(jù)集中疾病名稱相同的患者記錄進(jìn)行統(tǒng)計,按照統(tǒng)計結(jié)果從多到少進(jìn)行排序,排序靠前的N種疾病被賦予高權(quán)重;最后得到高權(quán)重對應(yīng)的N種疾病名稱。
6.如權(quán)利要求2所述的系統(tǒng),其特征是,所述特征共享級聯(lián)單元,其被配置為:
對第一數(shù)據(jù)集和第二數(shù)據(jù)集的疾病特征均映射到同一個特征空間中,計算特征之間的距離,如果第一數(shù)據(jù)集的疾病特征a與第二數(shù)據(jù)集的疾病特征b距離小于設(shè)定閾值,則表示兩個特征相似,對第一數(shù)據(jù)集的疾病特征a賦予設(shè)定的高權(quán)重;否則,對第一數(shù)據(jù)集的疾病特征a賦予設(shè)定的低權(quán)重;最后得到賦予權(quán)重后的若干個疾病特征;
利用近似馬爾科夫毯算法對賦予權(quán)重后的所有疾病特征進(jìn)行過濾,剔除不相關(guān)特征和冗余特征,得到過濾后的M種特征。
7.如權(quán)利要求2所述的系統(tǒng),其特征是,特征共享級聯(lián)優(yōu)化單元,其被配置為:
計算第一數(shù)據(jù)集中N種疾病名稱的每種疾病名稱c的M種特征,與第二數(shù)據(jù)集中的M種特征的邊緣概率分布和條件概率分布;對邊緣概率分布和條件概率分布進(jìn)行加權(quán)求和,得到平衡概率分布值。
8.如權(quán)利要求2所述的系統(tǒng),其特征是,所述預(yù)測單元,其被配置為:
如果平衡概率分布值大于設(shè)定閾值,則表示疾病名稱c對應(yīng)的疾病,是慢性阻塞性肺疾病;如果平衡概率分布值小于等于設(shè)定閾值,則表示疾病名稱c對應(yīng)的疾病,不是慢性阻塞性肺疾病;
所述對第一數(shù)據(jù)集和第二數(shù)據(jù)集的疾病特征均映射到同一個特征空間中,是利用多維標(biāo)度法將特征映射到同一個特征空間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東師范大學(xué),未經(jīng)山東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010070744.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





