[發(fā)明專利]基于上下文語(yǔ)義的微博短文本的情感分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110411497.6 | 申請(qǐng)日: | 2021-04-16 |
| 公開(公告)號(hào): | CN113190648B | 公開(公告)日: | 2022-09-20 |
| 發(fā)明(設(shè)計(jì))人: | 史偉;付月;史麥可 | 申請(qǐng)(專利權(quán))人: | 湖州師范學(xué)院 |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/31;G06F40/242;G06F40/279;G06F40/30 |
| 代理公司: | 西安研創(chuàng)天下知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 61239 | 代理人: | 梁寶龍 |
| 地址: | 313000 浙江省湖州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 上下文 語(yǔ)義 微博短 文本 情感 分析 方法 | ||
1.基于上下文語(yǔ)義的微博短文本的情感分析方法,其特征在于,包括以下步驟:
步驟1:獲取微博短文本數(shù)據(jù),基于該文本數(shù)據(jù),獲取上下文語(yǔ)境信息,并根據(jù)所述上下文語(yǔ)境信息構(gòu)建一組微博文本集T;
步驟2:采用分詞方法對(duì)每組微博文本集T中的文本進(jìn)行分詞處理,根據(jù)分詞結(jié)果為每個(gè)詞語(yǔ)創(chuàng)建詞語(yǔ)索引,并通過(guò)多種文本處理方法對(duì)詞語(yǔ)進(jìn)行預(yù)處理操作;
步驟3:針對(duì)所述的一組微博文本集T,生成詞語(yǔ)m的上下文語(yǔ)境向量;
步驟4:通過(guò)為每個(gè)詞語(yǔ)m計(jì)算其與語(yǔ)境中其它詞語(yǔ)的相關(guān)度來(lái)得到上下文語(yǔ)境特征,同時(shí)使用現(xiàn)有的外部情感本體為所述語(yǔ)境中的語(yǔ)境詞Ci分配初始情感值,即Ci的先驗(yàn)情感值;
步驟5:將詞語(yǔ)m的詞語(yǔ)語(yǔ)境向量轉(zhuǎn)換為2D幾何圓,以此表示情感極性和情感強(qiáng)度值,該幾何圓即為構(gòu)建的情感圈;
步驟5的具體操作步驟包括:
步驟51:以詞語(yǔ)m為圓心,詞語(yǔ)m的上下文語(yǔ)境特征為半徑,得到一個(gè)幾何圓,圓上的每個(gè)點(diǎn)為語(yǔ)境詞Ci,該幾何圓即為得到的情感圈,則情感圈在極坐標(biāo)系中可表示為:
其中,a是圓的半徑,(r0,φ)是圓中心的極坐標(biāo),(r,θ)是一個(gè)語(yǔ)境詞語(yǔ)在圓上的極坐標(biāo);
且語(yǔ)境詞語(yǔ)Ci的半徑ri以及語(yǔ)境詞語(yǔ)Ci的角度θi的計(jì)算公式分別為:
步驟52:在情感圈中將所有詞語(yǔ)的半徑都標(biāo)準(zhǔn)化為0-1之間,故任何一個(gè)情感圈的半徑a都為1,所有的角度值為弧度;
步驟53:使用三角函數(shù)正弦和余弦定理將極坐標(biāo)系轉(zhuǎn)換為笛卡爾坐標(biāo)系,轉(zhuǎn)換公式為:
xi=ricosθi yi=risinθi (4);
步驟54:利用圓的三角形屬性對(duì)詞語(yǔ)的上下文語(yǔ)義進(jìn)行編碼,并以此作為情感極性和情感強(qiáng)度值,在笛卡爾坐標(biāo)系中用Y軸表示詞語(yǔ)的情感極性,y為正值則表示正面情感,反之則表示負(fù)面情感;X軸表示詞語(yǔ)的強(qiáng)度,x值越小則情感越強(qiáng);
步驟6:基于情感圈進(jìn)行實(shí)體級(jí)和微博級(jí)的情感識(shí)別,得到識(shí)別結(jié)果;
步驟6的具體操作步驟包括:
步驟61:對(duì)于實(shí)體級(jí)情感識(shí)別:對(duì)于實(shí)體ei∈ε和它相應(yīng)的情感圈,該實(shí)體的情感由其情感圈的情感中值g表示,根據(jù)情感中值g所處的位置來(lái)判斷該實(shí)體的情感類型,即該情感實(shí)體的情感函數(shù)γ為:
其中,σ是定義″中性域″Y軸邊界的閥值;
步驟62:對(duì)于單條微博級(jí)情感識(shí)別:對(duì)于每條微博ti∈T采用中值法或關(guān)鍵詞法或混合法進(jìn)行處理,最終得到微博ti的整體情感值。
2.根據(jù)權(quán)利要求1所述的基于上下文語(yǔ)義的微博短文本的情感分析方法,其特征在于,步驟2中所述的預(yù)處理操作包括:
S21:對(duì)在空白邊界上的個(gè)別詞進(jìn)行分離;
S22:從詞語(yǔ)中去除所有非文字的數(shù)字字符;
S23:去除1208個(gè)標(biāo)準(zhǔn)停用詞;
S24:從微博中過(guò)濾掉連接符號(hào)和用戶名字;
S25:移除″回復(fù)″、″轉(zhuǎn)發(fā)微博″詞和轉(zhuǎn)發(fā)的內(nèi)容;
S26:基本詞性標(biāo)注;
S27:對(duì)出現(xiàn)的否定詞和程度詞分別進(jìn)行處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖州師范學(xué)院,未經(jīng)湖州師范學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110411497.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 自動(dòng)創(chuàng)建上下文信息提供配置的系統(tǒng)
- 用于管理上下文的方法、系統(tǒng)和裝置
- 一種基于本體的上下文感知應(yīng)用平臺(tái)框架模型
- 一種基于上下文感知的智能家居系統(tǒng)
- 實(shí)現(xiàn)上下文感知業(yè)務(wù)應(yīng)用的方法和相關(guān)裝置
- 一種多推理引擎融合上下文感知系統(tǒng)及其工作方法
- 多個(gè)并發(fā)上下文虛擬演進(jìn)型會(huì)話管理(虛擬ESM)
- 一種基于異質(zhì)上下文感知的推薦方法
- 一種可提高上下文質(zhì)量的本體建模方法及裝置
- 微服務(wù)全局上下文控制方法及系統(tǒng)
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 微博排序、搜索、展示方法和系統(tǒng)
- 一種收藏微博的方法和微博收藏服務(wù)系統(tǒng)
- 利用微博短鏈的網(wǎng)頁(yè)搜索系統(tǒng)及網(wǎng)頁(yè)搜索方法
- 微博應(yīng)用服務(wù)器及其微博平臺(tái)中鏈接地址的分享方法
- 基于事件的微博采集系統(tǒng)及方法
- 微博用戶影響力的評(píng)估方法
- 一種面向微博檢索的基于時(shí)間的微博文檔擴(kuò)展方法
- 基于微博主題標(biāo)簽進(jìn)行微博轉(zhuǎn)發(fā)預(yù)測(cè)的方法和系統(tǒng)
- 基于詞匯鏈特征擴(kuò)展和LDA模型的微博短文本分類方法
- 基于人工免疫危險(xiǎn)理論的微博水軍檢測(cè)方法及檢測(cè)系統(tǒng)





