[發(fā)明專利]一種基于皮膚電信號識別中文情感詞的方法在審
| 申請?zhí)枺?/td> | 201710998545.X | 申請日: | 2017-10-20 |
| 公開(公告)號: | CN107918487A | 公開(公告)日: | 2018-04-17 |
| 發(fā)明(設(shè)計)人: | 葉寧;張力行;王娟;黃海平;王汝傳;汪瑩;程康;徐葉強;趙佳文 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | G06F3/01 | 分類號: | G06F3/01;G06K9/00;G06N3/02;G06F17/30 |
| 代理公司: | 南京知識律師事務(wù)所32207 | 代理人: | 李吉寬 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 皮膚 電信號 識別 中文 情感 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于電數(shù)字數(shù)據(jù)處理技術(shù)的處理自然語言數(shù)據(jù)領(lǐng)域,具體涉及基于皮膚電信號情感識別技術(shù)用于識別中文情感詞的方法。
背景技術(shù)
利用皮膚電信號識別情感有其獨特的優(yōu)勢,比如它是生理參數(shù)所以更加客觀,比如它相比于其他生理參數(shù)更易于采集、對于神經(jīng)情緒變化最有效最敏感。對于利用皮膚電信號研究情感,目前技術(shù)相對成熟,所以適時的想利用該技術(shù)引入文本的分析。目前文本的分析因為其主觀性強,語法語義拆分困難,情感詞庫的不完善等缺陷阻礙了文本情感分析的步伐。
但是隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,文字信息更是煙波浩渺,其中包含著大量的有用實用信息讓人們又不愿意放棄文字信息的提取。客觀上需要用更加客觀的生理參數(shù)來識別中文情感詞,這必將為單純文本分析提供一個嶄新的思路。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出利用皮膚電信號識別出中文情感詞,為單純的文本情感分析提供嶄新的思路,使文本情感分析更加準確。
為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為一種基于皮膚電信號識別中文情感詞的方法,具體包含以下步驟:
S1:皮膚電采集;
S2:對采集之后的數(shù)據(jù)進行預(yù)處理;
S3:特征提取;
S4:歸一化處理;
S5:特征選擇;
S6:利用改進的模擬退火人工神經(jīng)網(wǎng)絡(luò)算法得到分類結(jié)果;
S7:在分類結(jié)果中加入情感詞比對,進行識別。
作為優(yōu)選,上述步驟2中的預(yù)處理采用小波變換進行去噪處理。
進一步,步驟3中的特征提取是提取了信號的時域和頻域中能代表皮膚電信號變化的統(tǒng)計值作為情感識別研究的原始特征。
進一步,上述時域原始特征包括皮膚電信號的均值、中值、最大值、最小值、標準差、最小值比率、最大值比率、最大最小差值,以及將上述信號特征分別進行一階差分、二階差分計算后再提取以上統(tǒng)計特征后生成的24個時域特征。
進一步,在提取所述頻域特征前先對皮膚電信號進行離散傅里葉變換,然后計算頻率均值、中值、標準差、最大值、最小值、最大最小差值,得到6個頻域特征。
進一步,上述步驟4中的所述歸一化處理使得各特征值的取值范圍限定在0到1之間,去除個體差異性的方法如下式:
其中XG為原始信號,為每個被試者平靜下的均值,歸一化之后得到:
X=(XG-Xmean)/(Xmax-Xmin) (2)。
進一步,為了以最少的特征個數(shù)和最高的識別率來識別情感,步驟5所述特征選擇時在標準化后的數(shù)據(jù)中隨機選取若干組,并將其分成三份:第一部分為分類器訓(xùn)練集,第二部分測試集測試分類效果,最后部分數(shù)據(jù)用來驗證特征集在情感識別中的有效性。
進一步,上述改進的模擬退火人工神經(jīng)網(wǎng)絡(luò)算法包含如下步驟:
步驟一:根據(jù)樣本的輸入和輸出確定神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);
步驟二:運用有記憶的模擬退火算法,具體如下:
1)初始化參數(shù),這樣就產(chǎn)生了初始的權(quán)值S0,此時設(shè)置初始溫度T0>0,迭代次數(shù)i=0,檢驗精度ε,令fout=f(S0),f*=f(S0),Sp=S0;
2)將網(wǎng)絡(luò)權(quán)值Sp作為初始出發(fā)點S0,按Powell算法進行優(yōu)化,快速搜索到某一個局部極小值點;
3)設(shè)置記憶變量x′和f(x′),分別用于記憶當(dāng)前遇到的最優(yōu)解和最優(yōu)目標函數(shù)值,算法剛開始時令x′和f(x′)分別初始化等于初始解x0和其目標函數(shù)值f(x0),迭代開始后,每當(dāng)接受一個新的搜索解時,將其目標函數(shù)值f(xk)與f(x′)進行比較,如果f(xk)優(yōu)于f(x′),則分別用xk和f(xk)代替原來的x′和f(x′),最后算法結(jié)束時得到的就是全局最優(yōu)解;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710998545.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種落地紅棗渣葉分離裝置
- 下一篇:小型托盤稱重分選機
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





