[發(fā)明專利]一種基于情感衰變因子的抑郁情緒分析方法有效
| 申請?zhí)枺?/td> | 201910285499.8 | 申請日: | 2019-04-10 |
| 公開(公告)號: | CN109977231B | 公開(公告)日: | 2021-04-02 |
| 發(fā)明(設(shè)計)人: | 王澤慶;高俊波;孫偉;李巖鋒;高楚瑤 | 申請(專利權(quán))人: | 上海海事大學(xué) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/242;G16H50/30 |
| 代理公司: | 上海元好知識產(chǎn)權(quán)代理有限公司 31323 | 代理人: | 徐雯瓊;張妍 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 情感 衰變 因子 抑郁 情緒 分析 方法 | ||
1.一種基于情感衰變因子的抑郁情緒分析方法,其特征在于,包含以下步驟:
S1、發(fā)動人群在線填寫抑郁自評量表,獲得個體的抑郁量表得分以及微博昵稱,并采集其微博文本,并通過專家系統(tǒng)對微博內(nèi)容進行標(biāo)注;
S2、微博文本預(yù)處理,包含文本分詞、去停用詞和抑郁情感詞典構(gòu)建;
S3、經(jīng)過特征選擇、特征加權(quán),根據(jù)所述特征選擇的結(jié)果與所述特征加權(quán)的結(jié)果構(gòu)建詞向量空間,構(gòu)造文本分類器將待分類的微博文本進行分類,得到每條微博文本的抑郁情感狀態(tài);
S4、計算抑郁指數(shù),對所述抑郁指數(shù)和所述個體的抑郁量表得分之間的相關(guān)性進行皮爾遜檢測,并根據(jù)檢測結(jié)果建立抑郁程度與所述抑郁指數(shù)之間的關(guān)系,以抑郁指數(shù)表征個體抑郁程度;
S5、引入情感衰變因子得到每條微博對應(yīng)的抑郁情緒值,并判斷個體抑郁情況,刻畫個體抑郁情緒的波動情況;
所述步驟S5中進一步包含:
情感衰變因子的引入,構(gòu)造情感衰變公式,得到每條微博對應(yīng)的抑郁情緒值,公式為f(s)=f(s-1)+(-1)ke-λs,其中,時間s定義為相鄰兩條微博的時間間隔,則s的取值范圍為:s=0,1,2,…,n,且任意個體的初始狀態(tài)f(s=0)=0;f(s)表示s時刻這條微博所對應(yīng)的抑郁情緒值;f(s-1)表示上一時刻的微博文本所對應(yīng)的抑郁情緒值;λ是情感衰變因子,表示情感的衰變速度,假設(shè)抑郁情感符合半衰期規(guī)律,取λ=0.5,k的取值與相鄰兩時間點的微博狀態(tài)有關(guān);
所述步驟S5中,計算k的取值的方法為:
其中,c表示微博狀態(tài);當(dāng)出現(xiàn)連續(xù)兩個或以上的0狀態(tài)時,若下一時刻的狀態(tài)c=1,則s=1;當(dāng)出現(xiàn)連續(xù)兩個或以上的1狀態(tài)時,若下一時刻的狀態(tài)c=0,則s的值并不置1,而是接著上一時刻依次遞增,以上兩種狀態(tài)交替變化過程中,f(s-1)的值保持不變,仍為上一時刻的抑郁情緒值;
所述步驟S5中,所述判斷個體抑郁情況中進一步包含以下步驟:
計算每條微博的抑郁情緒值后,再計算抑郁情緒均值,如下:
其中,s=i表示從第i條微博開始考察,f(s=i)表示第i條微博的抑郁情緒值,Avg表示從第i條微博到第n條微博的抑郁情緒均值;
基于所述抑郁情緒均值,判斷個體抑郁情況:
如果個體的抑郁情緒均值在[-1.6,0.2)區(qū)間時,則個體抑郁情況為情緒正常;若抑郁情緒均值在[0.2,2]區(qū)間時,則個體抑郁情況為有抑郁傾向。
2.如權(quán)利要求1所述的基于情感衰變因子的抑郁情緒分析方法,其特征在于,
所述抑郁情感詞典構(gòu)建進一步包括以下步驟:
步驟S231、采集抑郁情感網(wǎng)絡(luò)流行詞語;
步驟S232、從微博抽取常用抑郁情感符號;
步驟S233、在已有情感詞典基礎(chǔ)上,將采集到的網(wǎng)絡(luò)用語和抑郁情感符號加入進去,構(gòu)建抑郁情感詞典,還原在所述文本分詞過程中被切分的抑郁詞。
3.如權(quán)利要求1所述的基于情感衰變因子的抑郁情緒分析方法,其特征在于,
所述特征選擇進一步包括以下步驟:
采用CHI方法對文本進行特征選擇,計算公式為:
其中,t為特征,ci為類別,N為文檔數(shù),A表示文檔屬于所述類別ci包含特征t,B表示所述文檔不屬于類別ci包含特征t,C表示所述文檔屬于所述類別ci不包含所述特征t,D表示所述文檔不屬于所述類別ci不包含所述特征t;
最后,選擇特征t的最大值作為全局CHI統(tǒng)計量,公式如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海海事大學(xué),未經(jīng)上海海事大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910285499.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- Ⅶ因子多肽和Ⅷ因子多肽的聯(lián)合應(yīng)用
- VII因子多肽和IX因子多肽的聯(lián)合應(yīng)用
- 一種城鄉(xiāng)生態(tài)規(guī)劃的生態(tài)等級空間分區(qū)規(guī)劃控制方法
- 一種基于阿爾法散度的動態(tài)PET圖像因子處理方法
- 一種設(shè)備綜合風(fēng)險評估方法、裝置和電力系統(tǒng)
- 一種集群資源容量預(yù)測方法和裝置
- 一種計算因子植入方法、介質(zhì)及設(shè)備
- 一種規(guī)模組網(wǎng)環(huán)境TI-LFA可靠性評估測試方法
- 近地表品質(zhì)因子確定方法及系統(tǒng)
- 一種模擬凝血過程的教學(xué)模型





