[發(fā)明專利]一種微博情感可視化方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410254028.8 | 申請(qǐng)日: | 2014-06-09 |
| 公開(公告)號(hào): | CN104239383A | 公開(公告)日: | 2014-12-24 |
| 發(fā)明(設(shè)計(jì))人: | 任福繼;劉寧;康鑫 | 申請(qǐng)(專利權(quán))人: | 合肥工業(yè)大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 安徽合肥華信知識(shí)產(chǎn)權(quán)代理有限公司 34112 | 代理人: | 余成俊 |
| 地址: | 230009 *** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 情感 可視化 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及微博情感分析方法領(lǐng)域,具體是一種微博情感可視化方法。
背景技術(shù)
情感計(jì)算成為當(dāng)前熱門研究領(lǐng)域之一,文本情感計(jì)算尤為火熱。隨著微博這種短文本消息模式的興起,大量的富含情感特征的文本可以輕松的獲得,為文本情感研究提供了便利。由于文本情感度量上的難點(diǎn),使得文本情感可視化面臨諸多難題,微博情感可視化同樣如此。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種微博情感可視化方法,以實(shí)現(xiàn)直觀形象的展示微博文本情感。
為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案為:
一種微博情感可視化方法,其特征在于:包括以下步驟:
(1)、擴(kuò)充指定話題關(guān)鍵詞集合:
由于微博內(nèi)容上的口語(yǔ)化,獲取到的指定話題微博數(shù)據(jù)中,指定話題原有的種子關(guān)鍵詞并不是規(guī)范化表述,此時(shí)需要將指定話題原有的的種子關(guān)鍵詞口語(yǔ)話、俚語(yǔ)化,擴(kuò)充步驟如下:
(1.1)、將指定話題微博文本分詞,統(tǒng)計(jì)詞頻,并確定指定話題原有的種子關(guān)鍵詞;
(1.2)、按詞頻排序,取前20個(gè)詞作為候選指定話題種子關(guān)鍵詞;
(1.3)、根據(jù)公式(1)計(jì)算20個(gè)候選指定話題種子關(guān)鍵詞與指定話題原有的種子關(guān)鍵詞的相似度:
其中,word_seedj表示指定話題原有的種子關(guān)鍵詞,wordi表示候選指定話題種子關(guān)鍵詞,p(word_seedj,wordi)表示指定話題原有的種子關(guān)鍵詞與候選指定話題種子關(guān)鍵詞在微博文本中同時(shí)出現(xiàn)的概率,p(word_seedj)表示指定話題原有的種子關(guān)鍵詞在微博文本中出現(xiàn)的概率,p(wordi)表示候選指定話題種子關(guān)鍵詞在微博文本中出現(xiàn)的概率,d表示候選指定話題種子關(guān)鍵詞與指定話題原有的種子關(guān)鍵詞的相似性;
(1.4)、根據(jù)步驟(1.3)的計(jì)算結(jié)果,取相似度排名前10個(gè)的候選指定話題種子關(guān)鍵詞作為擴(kuò)充的種子關(guān)鍵詞,擴(kuò)充的種子關(guān)鍵詞與指定話題原有的種子關(guān)鍵詞一起作為話題關(guān)鍵詞集合,記為K;
(2)、分離指定話題微博數(shù)據(jù):將指定話題微博數(shù)據(jù)按照微博所屬城市拆分為地區(qū)微博數(shù)據(jù),記為Dcity;根據(jù)微博發(fā)布時(shí)間,以天為單位,將指定話題微博數(shù)據(jù)拆分為時(shí)間微博數(shù)據(jù),記為Dtime;
(3)、將步驟(2)獲取的地區(qū)微博數(shù)據(jù)按照時(shí)間以天為單位拆分為地區(qū)時(shí)分微博數(shù)據(jù),記為Dcitytime;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410254028.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 數(shù)據(jù)可視化模型的處理方法及裝置
- 一種可視化內(nèi)容分發(fā)方法及系統(tǒng)
- 數(shù)據(jù)可視化圖形快速應(yīng)用方法及系統(tǒng)
- 基于有效信息的流場(chǎng)可視化視圖量化方法
- 可視化報(bào)表的制作方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種可視化圖形快速應(yīng)用與傳輸?shù)姆椒跋到y(tǒng)
- 一種可視化數(shù)據(jù)模型編排系統(tǒng)和編排方法
- 一種供水行業(yè)機(jī)房3D可視化運(yùn)維管理系統(tǒng)
- 一種電網(wǎng)數(shù)據(jù)可視化方法、裝置、設(shè)備及介質(zhì)
- 一種大場(chǎng)景城市建筑實(shí)時(shí)三維可視化的方法
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





