[發(fā)明專利]一種網絡個體或群體情緒認知能力預測與可視化方法在審
| 申請?zhí)枺?/td> | 201410795679.8 | 申請日: | 2014-12-18 |
| 公開(公告)號: | CN104636425A | 公開(公告)日: | 2015-05-20 |
| 發(fā)明(設計)人: | 周建棟;趙燕平;張華平;李想 | 申請(專利權)人: | 北京理工大學;北京化工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 無 | 代理人: | 無 |
| 地址: | 100081 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 個體 群體 情緒 認知 能力 預測 可視化 方法 | ||
1.一種網絡個體或群體情緒認知能力預測與可視化方法,其特征在于:包括以下步驟:
步驟1)構建可整合多來源情感詞的本體庫;
步驟2)確定網絡個體情緒分叉點位置,根據(jù)按時間序列采集的網絡個體發(fā)表的文本信息集計算其情緒認知能力指數(shù)序列;
步驟3)對步驟2)得到的情緒認知能力指數(shù)序列進行可視化;
步驟4)對多個網絡個體的情緒認知能力指數(shù)水平進行對比分析。
2.根據(jù)權利要求1所述的一種網絡個體或群體情緒認知能力預測與可視化方法,其特征在于:所述步驟1)構建情感詞本體庫,進一步包括以下步驟:
步驟1-1)將現(xiàn)有中文情感詞典中的常用情感詞以及從語料集中篩選出的網絡情感新詞和表情符號合并得到情感元素集;
步驟1-2)對所述情感元素集中的每個詞Wi確定情感強度Ii并進行情感極性標注Pi;
步驟1-3)篩選出情感強度Ii超過閾值的詞Wi,將詞Wi與其情感極性Pi和情感強度Ii作為三元組加入情感詞本體庫E,得到E為:
E=<(W1,P1,I1),(W2,P2,I2),...,(Wi,Pi,Ii),...,(Wn,Pn,In)>。
3.根據(jù)權利要求2所述的一種網絡個體或群體情緒認知能力預測與可視化方法,其特征在于:所述步驟1-2)進一步包括以下步驟:
步驟1-2-1)情感極性標注:常用情感詞的極性Pi與情感詞典中的極性一致,如發(fā)生同一情感詞在不同情感詞典中的標注不一致的情形,使用多人投票方式修正;網絡情感新詞與表情符號由于數(shù)量有限,其極性均采用多人投票方式確定;
步驟1-2-2)情感強度確定:
(1)常用情感詞的情感強度確定:首先獲取大規(guī)模社交網絡文本集U,然后根據(jù)下式計算常用情感詞w*的情感強度:
I(w*)=r(w*|S負)-r(w*|S正)
其中S正和S負分別表示在社交網絡文本集U中的正情感詞和負情感詞集合,r(w*|S正)表示w*的正向情感權重,r(w*|S負)表示w*的負向情感權重,情感權重通過下式計算;
其中S*表示S正或者S負,α、β∈[0,1]是組合調整參數(shù),Ci是w*的第i個字,w*中共有k個字,P(Ci|S*)及P(w*)則可通過下式計算:
其中Freq(S*,Ci)表示屬于S*的詞的組成字Ci在U中出現(xiàn)的頻率,F(xiàn)req(S*)表示屬于S*的所有組成字在U中出現(xiàn)的頻率之和;δ為一個較小的數(shù)值;
其中Freq(w*)表示w*在U中出現(xiàn)的頻率,|U|表示U中詞的個數(shù),表示U中所有的詞wi在U中出現(xiàn)的頻率之和;
(2)常用情感詞的情感極性修正:
當情感強度I大于0,表示正情感,情感極性P=+1;
當情感強度I小于0,表示負情感,情感極性P=-1;
(3)網絡情感新詞與表情符號由于數(shù)量有限,其情感強度均在參考常用情感詞強度基礎上采用多人投票方式確定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學;北京化工大學;,未經北京理工大學;北京化工大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410795679.8/1.html,轉載請聲明來源鉆瓜專利網。





