[發明專利]一種基于決策樹的腦電信號特征選擇方法有效
| 申請號: | 201410112806.X | 申請日: | 2014-03-24 |
| 公開(公告)號: | CN103876734A | 公開(公告)日: | 2014-06-25 |
| 發明(設計)人: | 段立娟;葛卉;周海燕;喬元華;馬偉;苗軍 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | A61B5/0476 | 分類號: | A61B5/0476 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 決策樹 電信號 特征 選擇 方法 | ||
1.一種基于決策樹的腦電信號特征選擇方法,其特征在于,包括以下步驟:
步驟1,采集數據;
受試者佩戴電極帽,想象上下移動屏幕上的光標;采集受試者腦電信號,得到訓練樣本集和測試樣本集;
步驟2,進行數據預處理;
步驟2.1,數據重組;
將采集到的一個電極的訓練樣本集表示為一個m*p的矩陣,其中m表示訓練樣本集的樣本量,p=r*t為樣本集的維度,其中r表示采樣率,t表示采樣時間;將采集到的所有電極的訓練樣本集,按樣本量不變、維度增加的方法重組成一個訓練數據集,即重組成一個m*k的矩陣,k=a*p,其中a為記錄電極的個數;
將采集到的一個電極的測試樣本集表示為一個n*p的矩陣,其中n表示測試樣本集的樣本量;按照與訓練樣本集相同的處理方式,將所有電極的測試樣本集重組成一個n*k的矩陣;
步驟2.2,數據分組;
將步驟2.1得到的測試數據集和訓練數據集按照維度不變、增加樣本量的方法組合成一個數據集,即一個h*k的矩陣,h=m+n;然后再將此數據集按樣本量平均地分成10份,其中訓練數據是一個w*k的矩陣,w=0.9h,測試數據是一個g*k的矩陣,g=0.1h;
步驟3,特征提取;
利用主成分分析法分別對訓練數據和測試數據進行特征提取,得到特征向量,即將兩個數據集均從k維數據降為d維數據,也就是將每個電極的數據從p維降到q維,其中d=a*q;
步驟4,特征選擇;
將特征提取后的特征向量輸入到決策樹中,進行優勢特征選擇;
步驟5,進行腦電信號分類;
取出訓練數據中c個特征對應的數據,形成新的訓練樣本,即一個w*c的矩陣;對測試樣本做同樣的工作,形成新的測試樣本,即一個g*c的矩陣;將重組后的優勢特征向量,包括訓練樣本、訓練樣本標簽、測試樣本、測試樣本標簽,輸入到支持向量機分類器中,進行腦電信號分類,得到分類正確率;
步驟6,求分類正確率;
輪流選擇步驟2.2所述的10份數據中的1份作為測試數據,其它9份作為訓練數據,重復步驟3~5,共進行10次實驗,求10次實驗所得到分類正確率的平均值,得到最終的分類正確率。
2.根據權利要求1所述的一種基于決策樹的腦電信號特征選擇方法,其特征在于,步驟4所述優勢特征選擇的方法包括以下步驟:
(1)構造決策樹;
以代表訓練樣本的單個結點開始建樹;結點存放的是一個屬性;如果樣本都在同一個類,則該結點成為樹葉,并用該類標記;否則,使用成為信息增益的基于熵的度量為啟發信息,選擇能夠最好地將樣本分類的屬性,即具有最高信息增益的屬性;該屬性成為該結點的“測試”或“判定”屬性;對測試屬性的每個已知的值,創建一個分支,并據此劃分樣本;重復上述過程,遞歸地形成每個劃分上的樣本決策樹,當下列條件之一成立時停止:
條件一:給定結點的所有樣本屬于同一類;
條件二:沒有剩余屬性可以用來進一步劃分樣本;在此情況下,采用多數表決,即將給定的結點轉換成樹葉,用樣本中多數所在的類別標記它;
條件三:對于根據測試屬性的其中一個已知的值創建的分支中沒有樣本;在這種情況下,以樣本中多數類創建一個樹葉;
按照上述方法構造一棵具有非葉結點、分支和樹葉的完全決策樹;對于d維的訓練數據來說,對應有d個屬性;樹的結點存放著屬性Ai,其中i=1,2,…,d;根據分支Ai=aj劃分樣本,其中aj是屬性Ai的一個已知的值,j=1,2,…,w,;樹葉存放著結點樣本的類別標簽;
(2)修剪決策樹;
對于完全決策樹中的每一個非葉結點的子樹,嘗試將其替換成一個葉結點,該葉結點的類別用子樹所覆蓋訓練樣本中存在最多的那個類來代替,這樣就產生了一個簡化決策樹;然后,比較完全決策樹和簡化決策樹在測試數據集中的表現,如果簡化決策樹在測試數據集中的錯誤比較少,并且該子樹里面沒有包含另外一個具有類似特性的子樹,那么該子樹就可以替換成葉結點;所述類似特性是指把子樹替換成葉結點后其測試數據集誤判率降低的特性;以這種自下而上的方式遍歷所有的子樹,直至沒有任何子樹可以替換使得測試數據集的表現得以改進時,修剪便終止,得到最終的簡化樹;
此時簡化樹有c個非葉結點,對應數據集中的c個屬性,即c個特征,稱這c個特征為優勢特征,而數據集中剩余的特征為非優勢特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410112806.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:家用電器的測試電路、裝置和系統
- 下一篇:一種小型干式精選機





