[發(fā)明專利]一種基于核主成分分析和多項式特征的腦血管病神經(jīng)功能損傷程度預(yù)測模型在審
| 申請?zhí)枺?/td> | 201911291182.1 | 申請日: | 2019-12-16 |
| 公開(公告)號: | CN111028944A | 公開(公告)日: | 2020-04-17 |
| 發(fā)明(設(shè)計)人: | 易應(yīng)萍;羅顥文 | 申請(專利權(quán))人: | 南昌大學(xué)第二附屬醫(yī)院 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H50/50;G16H50/70;G06K9/62;G06N20/00 |
| 代理公司: | 江西省專利事務(wù)所 36100 | 代理人: | 胡里程 |
| 地址: | 330006 *** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 成分 分析 多項式 特征 腦血管病 神經(jīng)功能 損傷 程度 預(yù)測 模型 | ||
本發(fā)明公開一種基于核主成分分析和多項式特征的腦血管病神經(jīng)功能損傷程度預(yù)測模型,先從大數(shù)據(jù)平臺中獲取已經(jīng)處理好的醫(yī)療結(jié)構(gòu)化數(shù)據(jù),對所有數(shù)據(jù)進(jìn)行預(yù)處理后,采用如下特征提取方法:先構(gòu)建特征,然后針對所有特征數(shù)據(jù),提取有顯著性差異的特征數(shù)據(jù),接著采用核主成分分析將數(shù)據(jù)映射到高維度后再降維。最后構(gòu)建基于邏輯回歸、支持向量機(jī)、隨機(jī)森林的腦卒中病情嚴(yán)重程度的機(jī)器學(xué)習(xí)模型。實(shí)驗(yàn)分別設(shè)置4個對照組,實(shí)踐證明,該方法相比于對照組能夠有效的提高各分類器對于腦血管病神經(jīng)功能損傷程度的預(yù)測性能,相比于對照組,大大縮短了特征提取的時間。
技術(shù)領(lǐng)域
本發(fā)明涉及醫(yī)療大數(shù)據(jù)挖掘及疾病智能評估領(lǐng)域,尤其是一種基于核主成分分析和多項式特征的腦血管病神經(jīng)功能損傷程度預(yù)測模型。
背景技術(shù)
腦血管病(cerebrovascular disease,CVD)是指由于各種腦血管病變所引起的腦部病變,包括出血性腦血管病和缺血性腦血管病,狹義的腦血管病即腦卒中。我國腦血管病負(fù)擔(dān)居于世界前列,具有高發(fā)病率、高致殘率、高死亡率、高復(fù)發(fā)率等特點(diǎn),嚴(yán)重威脅人口健康,已經(jīng)成為我國重大的公共衛(wèi)生問題。
腦血管病神經(jīng)功能損害的臨床表現(xiàn)復(fù)雜,對患者神經(jīng)功能缺損程度的準(zhǔn)確評估有助于判斷病情嚴(yán)重程度、預(yù)測短期及長期預(yù)后,為醫(yī)務(wù)人員治療決策及選擇適合的康復(fù)方案提供指導(dǎo),特異性神經(jīng)功能缺損程度評估量表是必不可少的工具。腦血管病神經(jīng)功能損傷程度評估主要基于量表評分,美國國立衛(wèi)生研究院卒中量表(National Institutes ofHealth Stroke Scale,NIHSS)是全世界范圍內(nèi)應(yīng)用最廣泛的腦血管病神經(jīng)功能損傷程度評估量表,其包括11項內(nèi)容:1a.意識水平,1b.意識水平提問,1c.意識水平指令,2.凝視,3.視野,4.面癱,5.上下肢運(yùn)動,6.下肢運(yùn)動,7.肢體共濟(jì)失調(diào),8.感覺,9.語言,10.構(gòu)音障礙,11.忽視,總分0~42分,平均評估用時6min,各項目評分相加的和即為患者的NIHSS評分,根據(jù)分值的不同將病情分為2級,NIHSS評分1~5分為輕度腦卒中,預(yù)后良好;NIHSS評分≥6分為中重度腦卒中,提示預(yù)后不良。
近年來,隨著醫(yī)療大數(shù)據(jù)的興起,大部分醫(yī)療單位構(gòu)建的傳統(tǒng)疾病預(yù)測模型一般步驟即獲取樣本→數(shù)據(jù)預(yù)處理→集成學(xué)習(xí)器→輸出結(jié)果,而這些模型過分依賴于集成學(xué)習(xí)器的性能,沒有從特征的角度取挖掘數(shù)據(jù)的潛在信息。因此本發(fā)明從特征工程角度出發(fā),先基于原始特征構(gòu)建交互特征和多項式特征,結(jié)合單因素分析方法,提取差異有統(tǒng)計學(xué)意義的的特征。方法以及核主成分分析(kernel principal component analysis,KPCA)算法對數(shù)據(jù)特征進(jìn)行處理,最后構(gòu)建腦血管病神經(jīng)功能損傷程度預(yù)測模型,實(shí)現(xiàn)腦卒中患者入院病情嚴(yán)重程度的智能評估,提高評定準(zhǔn)確性,并能夠?yàn)閷?shí)施腦卒中的早期干預(yù)提供科學(xué)參考,提高腦卒中臨床決策的準(zhǔn)確率,降低腦卒中患者的死亡率以及患腦卒中并發(fā)癥的風(fēng)險。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于核主成分分析和多項式特征的腦血管病神經(jīng)功能損傷程度預(yù)測模型,從特征的角度取挖掘數(shù)據(jù)的潛在信息,構(gòu)建腦血管病神經(jīng)功能損傷程度預(yù)測模型,為實(shí)施腦卒中的早期干預(yù)提供科學(xué)參考。
本發(fā)明的技術(shù)方案為:一種基于核主成分分析和多項式特征的腦血管病神經(jīng)功能損傷程度預(yù)測模型,主要包括以下步驟:
1.數(shù)據(jù)獲取:獲取腦血管病患者的醫(yī)療結(jié)構(gòu)化數(shù)據(jù),其中包括連續(xù)型數(shù)據(jù)和字符串類型數(shù)據(jù)。
2.數(shù)據(jù)預(yù)處理:
2.1.字符串轉(zhuǎn)換:針對所有字符串類型數(shù)據(jù),二分類變量轉(zhuǎn)化成0,1數(shù)據(jù),多分類變量先轉(zhuǎn)化成連續(xù)性變量后再轉(zhuǎn)換成離散型變量;
2.2對數(shù)據(jù)缺失值和異常值的處理:對于異常和偏離正常值的數(shù)據(jù),默認(rèn)刪除或者作為缺失值進(jìn)行處理。對于缺失數(shù)據(jù),連續(xù)型變量特征采用隨機(jī)森林回歸進(jìn)行填補(bǔ),離散型變量特征采用眾數(shù)進(jìn)行填補(bǔ)。
2.3.數(shù)據(jù)集的劃分:將數(shù)據(jù)劃分成訓(xùn)練集和測試集以及驗(yàn)證集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南昌大學(xué)第二附屬醫(yī)院,未經(jīng)南昌大學(xué)第二附屬醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911291182.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于查詢受保護(hù)的結(jié)構(gòu)化數(shù)據(jù)的方法和設(shè)備
- 編解碼方法以及編碼器、解碼器、乘積項裝置
- 生物體認(rèn)證方法及計算機(jī)系統(tǒng)
- 信息認(rèn)證方法和信息認(rèn)證系統(tǒng)
- 浮式生產(chǎn)和儲存單元的工藝和公用工程管道的疲勞分析
- 用于共享密碼密鑰的系統(tǒng)
- 用于執(zhí)行基于格的密碼操作的方法和處理設(shè)備
- 用于3級自動駕駛車輛的無地圖且基于攝像機(jī)的車道標(biāo)識取樣方法
- 用于生成循環(huán)冗余校驗(yàn)碼的網(wǎng)絡(luò)交換機(jī)和方法
- 里德-所羅門編碼裝置





