[發(fā)明專利]一種基于情感分析的UGC模糊綜合評價方法在審
| 申請?zhí)枺?/td> | 201610131279.6 | 申請日: | 2016-03-08 |
| 公開(公告)號: | CN105718446A | 公開(公告)日: | 2016-06-29 |
| 發(fā)明(設(shè)計)人: | 徐勇;張慧;李東勤;陳亮;梁后軍;魏蘇林 | 申請(專利權(quán))人: | 徐勇 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06N7/02;G06Q30/06;G06Q30/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 233000 安徽省蚌埠*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 情感 分析 ugc 模糊 綜合 評價 方法 | ||
1.一種基于情感分析的UGC模糊綜合評價方法,其特征在于,包括以下步驟:
(1)建立電子商務(wù)商品評價指標(biāo)結(jié)構(gòu)模型
經(jīng)過收集、分析消費(fèi)者在淘寶購買商品時的評價信息,歸納得出消費(fèi)者在進(jìn)行淘寶購 物時關(guān)心的因素,建立電子商務(wù)商品評價指標(biāo)結(jié)構(gòu)模型;
(2)文本情感分析
(2.1)信息抽取
利用語句情感標(biāo)簽抽取方法分析商品評價信息,挖掘消費(fèi)者對商品的評價意見,并且 累計關(guān)于商品的“好的評價信息”和“壞的評價信息”的數(shù)量;語句情感標(biāo)簽抽取方法是指將 一小段文字的評論信息,利用分詞器將一段話分割成一系列短語,然后再進(jìn)行情感標(biāo)簽的 抽取與統(tǒng)計;
(2.2)情感極性判斷
(2.2.1)初步判斷
信息抽取完畢后,對結(jié)果進(jìn)行情感極性的判定;對于極性明顯的詞語,直接利用hownet 情感詞語集和同義詞詞林建立情感詞典來直接確定其極性,“好”、“漂亮”相關(guān)褒義詞語記 為”1”;如果在褒義詞之前加有否定詞,如“不好”、“不喜歡”記為”-1”;如果一般或者其它中 性的描述,就記為”0”;如果無法直接查找到情感詞語的極性,則利用上下文關(guān)系進(jìn)行判斷, 如果消費(fèi)者評論語句中出現(xiàn)轉(zhuǎn)折詞語,比如“盡管…還是…”,“可”,“但是”的詞語出現(xiàn)時, 則在基本情感提取結(jié)果上減1;如果出現(xiàn)遞進(jìn)關(guān)系的詞語,“不但、不僅、而且”的詞語出現(xiàn) 時,在評論語句的基本情感基礎(chǔ)上加1;
(2.2.2)進(jìn)一步判斷
情感描述性詞語被副詞修飾的情況下,情感極性強(qiáng)度會被加強(qiáng),好的情感傾向在程度 副詞的修飾下會更好,壞的情感傾向則會更壞,比如“很好、超符合、極其差”,當(dāng)一個評論中 的情感描述詞被程度副詞修飾時,如果情感極性通過步驟(2.2.1)中的方法被判斷為”1”, 則將其更改為”2”;如果情感極性通過步驟(2.2.1)中的方法被判斷為”-1”,則將其更改 為”-2”;
評論信息的情感極性判斷完成之后,會得到一個相對應(yīng)的數(shù)值,有五種可能:2、1、0、- 1、-2,分別將這五種可能與五個等級相對應(yīng),如{2,1,0,-1,-2}={較好,好,一般,差,極 差};
(3)模糊綜合評價
(3.1)模糊統(tǒng)計
①在每一次試驗(yàn)中都要確定指標(biāo)集U中的固定元素Bi中的一個u0是否屬于可變動的等 級集合;每一次試驗(yàn)中,指標(biāo)集都必須屬于一個確定清晰的集合,而每一個消費(fèi)者對商品的 評價都可以看做一個試驗(yàn),如:針對一條消費(fèi)者評價,商品的質(zhì)量情況屬于五個等級中的哪 一個,必須清晰、明確;
②在每一條消費(fèi)者評論中,u0是固定的,而評價等級A在隨機(jī)變動;如果在所分析的n條 評論中,元素u0屬于A的次數(shù)為m,則元素u0對A的隸屬頻率定義為:
當(dāng)商品評論條數(shù)n足夠大時,根據(jù)大數(shù)定律,元素u0的隸屬頻率總是穩(wěn)定于某一數(shù),這 個穩(wěn)定的數(shù)即為元素u0對A的隸屬度,模糊統(tǒng)計用來確定模糊評價方法的隸屬度;
(3.2)模糊評價
(3.2.1)構(gòu)建模糊評價指標(biāo)
根據(jù)商品評價指標(biāo)確定指標(biāo)集,一級指標(biāo)集記為U={U1U2…Um},其中i=1,2,..., m,表示有m個一級指標(biāo);二級指標(biāo)記為Ui={ui1,ui2,…,uin},表示第i個一級指標(biāo)有n個二級 指標(biāo);一級指標(biāo)集為U={B1B2B3},二級指標(biāo)集為B1={C1C2C3};
(3.2.2)確定評價集V={V1,V2,…,Vn}
每一個評價指標(biāo)Ui有n個評價等級,淘寶評分系統(tǒng)用五顆星的評價方法,在這里用常見 的方法確定五個等級:{較好,好,一般,差,極差},評價等級與分?jǐn)?shù)的對應(yīng)關(guān)系為:{較好, 好,一般,差,極差}={5,4,3,2,1};
(3.2.3)確定評價指標(biāo)權(quán)重
首先,統(tǒng)計商品的評論信息條數(shù)(n);然后,利用步驟(2)實(shí)現(xiàn)信息抽取;然后統(tǒng)計評論 中提及的商品情況(m)、物流情況(f)、服務(wù)情況(x);接著,分別計算這三個指標(biāo)的評論條數(shù) 占總評論條數(shù)的百分比作為權(quán)重,具體權(quán)重計算方法為:商品自身情況的權(quán)重為m/(m+f+ x),物流情況權(quán)重為f/(m+f+x),服務(wù)情況權(quán)重為x/(m+f+x),同一條評論中同時提及多個商 品的指標(biāo),即(m+f+x)≠n;并且對商品評價信息提到的要素進(jìn)行歸類,在統(tǒng)計數(shù)量時,商品 情況+1;統(tǒng)計結(jié)束得到的權(quán)重要進(jìn)行歸一化處理,最后的結(jié)果作為模糊綜合評價的各個指 標(biāo)的權(quán)重,記為A={a1,a2,…,am},m表示指標(biāo)的個數(shù);
(3.2.4)確定模糊評價矩陣
在商品情況、物流情況,服務(wù)情況的指標(biāo)下,計算每個評價等級所占的比例,得到以下m 個指標(biāo)構(gòu)成的模糊評價矩陣R
(3.2.5)計算綜合評價值
模糊綜合評價模型為:
其中bj表示被評級對象從整體上看對評價等級模糊子集隸屬程度,A表示評價指標(biāo)的 相關(guān)權(quán)重,R是模糊評價矩陣;
然后對B進(jìn)行歸一化處理,得到模糊綜合評價集最后用的值確 定該商品的綜合得分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于徐勇,未經(jīng)徐勇許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610131279.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種社交網(wǎng)站內(nèi)容的備份方法及系統(tǒng)
- 對優(yōu)質(zhì)用戶生成內(nèi)容的數(shù)據(jù)挖掘方法和系統(tǒng)
- 用戶生成內(nèi)容訪問次數(shù)的發(fā)布方法、客戶端及系統(tǒng)
- 用戶生成內(nèi)容的發(fā)布方法、系統(tǒng)和前端裝置
- 一種UGC內(nèi)容庫擴(kuò)充方法及裝置
- 一種UGC視頻分類方法及裝置
- 一種信息處理方法、裝置、終端和計算機(jī)可讀存儲介質(zhì)
- 一種信息推薦方法及裝置
- 一種用戶生成內(nèi)容UGC重復(fù)次數(shù)確定方法及裝置
- UGC處理方法、裝置、電子設(shè)備和存儲介質(zhì)





