[發明專利]一種癲癇患者腦電信號的計算機模式識別方法有效
| 申請號: | 201811569002.7 | 申請日: | 2018-12-21 |
| 公開(公告)號: | CN109645990B | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 龔光紅;王夏爽;李妮 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | A61B5/0476 | 分類號: | A61B5/0476 |
| 代理公司: | 北京永創新實專利事務所 11121 | 代理人: | 姜榮麗 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 癲癇 患者 電信號 計算機 模式識別 方法 | ||
1.一種癲癇患者腦電信號的識別模型的構建方法,包括如下步驟,
步驟一:采集癲癇患者的腦電信號,并對所述的腦電信號進行預處理及腦電特征提取;
對于ICU病房中采集的癲癇患者的腦電信號,通過計算機進行腦電信號的預處理,其中預處理是指對所采集的腦電信號進行濾波、剔除壞道、基線校正和重參考操作;同時,對所述的腦電信號采用獨立成分分析法去除多種類型的偽跡;
步驟二、構建隨機森林識別模型,利用步驟一提取出來的腦電特征對隨機森林識別模型進行訓練,生成最優的隨機森林識別模型;
步驟三、根據多種測試指標來評判隨機森林這個計算機自動識別方法的性能;評估隨機森林識別模型的泛化能力;
首先,確定隨機森林識別模型的所有參數及取值;
然后,通過網格搜索優化算法對隨機森林識別模型生成的所有參數進行粗搜索,限定參數的局部范圍;在此局部范圍的基礎上進行小步長的二次尋優,得到隨機森林識別模型的最優參數;
最后,將最優參數輸入到隨機森林識別模型中,生成最優的識別模型,用于對癲癇患者的腦電信號進行計算機識別,從而為醫生進行癲癇病況診斷提供技術支持和輔助;
其特征在于:對于步驟二的生成最優的隨機森林識別模型的具體步驟如下:
步驟201、對步驟一中提取的腦電特征進行歸一化處理;
步驟202、將歸一化處理后的腦電特征分成三部分,分別為訓練集、測試集以及用于防止隨機森林識別模型過擬合的驗證集;
步驟203、對不同程度病況的癲癇腦電信號進行時間同步的分幀,得到多級導聯的腦電信號;
步驟204、對癲癇患者的發作期、間歇期和健康期這三類腦電信號的進行打標簽處理:發作期“1”、間歇期“0”、健康期“-1”;
步驟205、采用重采樣方法,從訓練集的數據M中隨機抽取bootstrap訓練樣本Mi,并且是有放回地進行k次抽取,從而得到一個隨機生成的訓練集M*={M1,M2,…,Mk},i=1,2,…,k;一共選取k個樣本數據,作為新的訓練集數據;
步驟206、以上述步驟205中隨機生成的訓練集M*為訓練數據,建立k個決策樹Tj,j=1,2,…,k,從決策樹的每一個節點的特征集合中隨機選擇一個包含k個特征的子集;從所述子集中隨機選取m個最優特征的分化作為識別特征,這里面的k控制了隨機程度的大小;進入步驟207;
步驟207、通過對決策樹的每個終端節點遞歸地重復執行步驟206,將隨機森林決策樹生長為增強綁定數據,直到這決策樹能夠準確地對訓練集M*進行識別,同時達到最小節點大小;
在模型訓練的過程中,采用識別回歸樹CART方法分裂節點,基尼指數GINI值作為分裂節點的依據;訓練集M*含有k個不同的特征,則此訓練集M*的基尼指數為:
其中pi為第i個特征的出現概率;{M1,M2,…,Mk}對應的特征數分別為{n1,n2,…,nk},則分裂的基尼指數為:
其中,n表示n1+n2+…+nk,i=1,2,…,k;GINI(Mi)表示樣本Mi的GINI指數;
步驟208、集合所有決策樹,對于一個輸入樣本Mi,k個決策樹有k個識別結果,隨機森林繼承了所有的識別投票結果;
步驟209、在新的節點上進行預測,投票數目最多的識別是輸出;進入步驟210的隨機森林方法處理;
步驟210、采用網格搜索的優化方法對隨機森林識別模型進行優化;
網格搜索優化方法是指將變量區域進行網格化,遍歷所有的網格點,求解滿足約束條件的目標函數值,選出最優數值;遍歷網格上所有參數需要大量訓練時間,為了提高訓練速度,使用改進的網格搜索的隨機森林參數優化方法;
步驟211、首先粗搜索超參數:決策樹數量k、分裂特征數m、葉子節點最少樣本數以及懲罰參數;進入步驟212;
用大步長劃分網格,設置搜索步長為10,進行粗搜索選擇出一次最優參數;
步驟212、然后在一次最優參數附近利用小步長劃分網格,使網格劃分更加密集,再次進行搜索選擇出二次最優參數;所述小步長是相對于大步長而言的相對量,選取步長為5;改變節點數,再隨機打亂數據,選擇驗證集進行模型識別;
步驟213、重復步驟212,在二次最優參數附近利用小步長劃分網格和搜索參數,直至網格間距或目標函數變化量小于給定值;
步驟214、如果有多組參數使得隨機森林的方法達到最優,則從這些組參數中選出使得懲罰函數最小的那組參數為最優參數;
步驟215、對隨機森林方法得到的參數進行精確搜索,減小搜索范圍,即減小網格搜索優化方法的搜索步長,此時步長設置為0.1;
根據隨機森林識別模型的實際情況,調整步長大小,使得懲罰參數最小化是最佳參數組;具體步驟如下:
確定決策樹數量k和分裂特征數m的范圍,設定步長,在決策樹數量k和分裂特征數m坐標系上建立二維網格,網格節點就是相應的決策樹數量k和分裂特征數m的參數對;
對網格節點上的每一組參數構建隨機森林識別模型,并利用袋外數據評估識別的準確性;
選擇識別準確性最高的參數k和m,若識別準確性或者步長滿足要求,則輸出最優參數和識別準確率;否則,縮小步長,繼續精確搜索;
步驟216、得出對隨機森林進行網格搜索優化后的參數,同時計算機采用10重交叉驗證去識別該隨機森林識別模型的準確性;對于給定的訓練集進行樣本采樣,產生出10個不同的子集,再從每個子集中訓練出來一個屬于該子集的隨機森林識別子模型,這樣通過不同子集訓練出來的隨機森林識別子模型具有比較大的差異,從而有效地避免隨機森林識別模型的過擬合問題;同時為獲得更優的隨機森林識別模型,還希望每個隨機森林識別子模型不能太差,如果分化出的子集過于多,只能通過小部分數據進行訓練,這樣的模型不足以成為好的隨機森林識別子模型,為此使用以一種相互交疊的方式對訓練集進行采樣;
步驟217、改變節點數,再隨機打亂數據,選擇一個全新的驗證集進行隨機森林識別模型計算機識別;
步驟218、重復步驟217,直至交叉驗證準確性最高;
步驟219、此時的節點數認為是最優節點數;訓練出的參數為隨機森林識別模型的最優參數,模型確定;
步驟220、將優化后的隨機森林識別模型在測試集上進行不同程度病況的癲癇患者腦電信號的模式識別測試。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811569002.7/1.html,轉載請聲明來源鉆瓜專利網。





