[發(fā)明專利]基于腦電信號進行情感分析的層級Bagging方法在審
| 申請?zhí)枺?/td> | 201910492885.4 | 申請日: | 2019-06-06 |
| 公開(公告)號: | CN110414548A | 公開(公告)日: | 2019-11-05 |
| 發(fā)明(設(shè)計)人: | 楊利英;張清楊;袁細(xì)國;習(xí)佳寧 | 申請(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 西安長和專利代理有限公司 61227 | 代理人: | 黃偉洪 |
| 地址: | 710071 陜西省*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類算法 腦電信號 層級 情感分析 訓(xùn)練子集 預(yù)處理 腦電信號處理 多分類器 分類結(jié)果 風(fēng)險預(yù)測 數(shù)據(jù)處理 數(shù)據(jù)子集 特征提取 特征選擇 樣本數(shù)據(jù) 重要意義 訓(xùn)練集 分類 準(zhǔn)確率 減小 腦電 算法 抽樣 監(jiān)測 投票 情緒 監(jiān)督 學(xué)習(xí) | ||
本發(fā)明屬于腦電信號處理技術(shù)領(lǐng)域,公開了一種基于腦電信號進行情感分析的層級Bagging方法,腦電樣本數(shù)據(jù)預(yù)處理、特征提取和特征選擇、訓(xùn)練集有放回抽樣、不同基分類算法用于多個數(shù)據(jù)子集的訓(xùn)練、多分類器投票獲得分類結(jié)果。與傳統(tǒng)Bagging算法中單個訓(xùn)練子集對應(yīng)單個分類算法不同的是,層級Bagging將多個訓(xùn)練子集對應(yīng)單個分類算法,減小了單個性能良好的分類算法由于不適應(yīng)個別數(shù)據(jù)導(dǎo)致被刪去的風(fēng)險。本發(fā)明可以有效提高腦電信號分類的準(zhǔn)確率,解決單個分類算法穩(wěn)定性不強的問題,也可推廣至其他相似類型的數(shù)據(jù)處理。本發(fā)明對情緒監(jiān)測、風(fēng)險預(yù)測、有監(jiān)督學(xué)習(xí)的分類都有重要意義。
技術(shù)領(lǐng)域
本發(fā)明屬于腦電信號處理技術(shù)領(lǐng)域,尤其涉及一種基于腦電信號進行情感分析的層級Bagging方法。
背景技術(shù)
在當(dāng)今數(shù)字化、計算化的時代,腦電信號的分析研究在處理人類的高級思維活動領(lǐng)域具有重要作用。情緒分類在之前的研究中,主要通過被試者表情,聲音,肢體動作等指標(biāo)來衡量,但由于這些指標(biāo)受個人習(xí)慣及表現(xiàn)方式的影響較大,且具有可偽裝和可掩飾性,相較之下,利用腦電波這種生理信號進行情緒分類的方法獲得了得天獨厚的真實性和準(zhǔn)確性的優(yōu)勢。
目前,利用腦電信號進行情感分析最常用的現(xiàn)有技術(shù)是將進行過格式處理后的腦電數(shù)據(jù)應(yīng)用于現(xiàn)有的有監(jiān)督學(xué)習(xí)的分類器,如支持向量機,神經(jīng)網(wǎng)絡(luò)算法等。通過部分?jǐn)?shù)據(jù)體系的訓(xùn)練,預(yù)測出整體數(shù)據(jù)表現(xiàn)出的結(jié)果。有監(jiān)督學(xué)習(xí)的分類問題主要是通過學(xué)習(xí)已被標(biāo)注標(biāo)簽的數(shù)據(jù)集樣本,產(chǎn)生特征到標(biāo)簽的映射,依此確定未標(biāo)簽化數(shù)據(jù)集的標(biāo)簽。
而在實際問題中,由于腦電數(shù)據(jù)緯度高、表現(xiàn)角度多樣和其高度復(fù)雜的數(shù)據(jù)結(jié)構(gòu),使它不像傳統(tǒng)簡單數(shù)據(jù)類型那樣容易分類,傳統(tǒng)單個的分類算法由于學(xué)習(xí)角度單一,若直接應(yīng)用單個算法處理腦電數(shù)據(jù),容易造成學(xué)習(xí)不充分導(dǎo)致的準(zhǔn)確率低下問題。鑒于此,如果利用集成學(xué)習(xí)思想進行腦電信號分類,勢必會提升性能。
集成學(xué)習(xí)則是通過一定整合方式組合單獨的分量分類器的多學(xué)習(xí)器系統(tǒng),利用集成學(xué)習(xí)器,可以有效減小有監(jiān)督學(xué)習(xí)中單個分類器造成的泛化誤差,達到減小整體方差、提高準(zhǔn)確率和實驗穩(wěn)定性的作用,其理論源自于PAC基礎(chǔ),思想可以由以下公式體現(xiàn):
其中Pwrong是集成之后分類器的錯誤率,P是單個學(xué)習(xí)器的分類錯誤率,n是集成分類器的數(shù)目,組合方式采用投票法,當(dāng)n足夠大時,集成學(xué)習(xí)器的錯誤率極低。每個集成分類器中,分類器種屬數(shù)目越多,分類準(zhǔn)確度越高。
集成學(xué)習(xí)還依靠分類器之間的多樣性,只有在不同角度有不同表現(xiàn)優(yōu)異的地方才能讓集成分類器做到精準(zhǔn)的“面面俱到”。總的來說,集成學(xué)習(xí)成功的要點在于“優(yōu)而異”。
當(dāng)前的集成學(xué)習(xí)大致可以分為Bagging,Boosting和Stacking三類,其中,Bagging針對復(fù)雜模型求解和強基分類器有更良好的表現(xiàn)效果。Bagging算法可以減少數(shù)據(jù)之間的方差導(dǎo)致的泛化誤差(一般由于過擬合導(dǎo)致)。在訓(xùn)練數(shù)據(jù)的過程中,由于每個分類器不同,各自有其關(guān)注的重點,隨機抽取訓(xùn)練集和集成多分類器的方法是Bagging算法的特點。步驟如下:
1.從原始數(shù)據(jù)集中抽出部分樣本,將其作為一個子集,有放回的多次抽取形成多個子集。每個子集中的樣本存在重疊現(xiàn)象,如果抽取的次數(shù)少,原始數(shù)據(jù)集中也許也有沒有被抽取到的數(shù)據(jù)。
2.用抽取出的不同子集作為數(shù)據(jù)集應(yīng)用不同分類算法訓(xùn)練不同的學(xué)習(xí)器,這里綜合算法的方式根據(jù)具體問題決定回歸還是分類選擇平均還是投票。
3.將每個訓(xùn)練出來的學(xué)習(xí)器進行投票,票選出最終的結(jié)果。將Bagging算法的原理繪制成圖。
在傳統(tǒng)Bagging算法中,通過有放回抽樣取原始數(shù)據(jù)集的部分?jǐn)?shù)據(jù)組成數(shù)據(jù)子集,不同數(shù)據(jù)子集應(yīng)用于不同分類算法,最后用原始測試集在訓(xùn)練出的多個模型上做測試,最終分類結(jié)果為多個模型測試出的投票結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910492885.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





