[發(fā)明專利]一種面向中文評論的情感多傾向分類方法有效
| 申請?zhí)枺?/td> | 202011547122.4 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112883145B | 公開(公告)日: | 2022-10-11 |
| 發(fā)明(設計)人: | 張少中 | 申請(專利權)人: | 浙江萬里學院 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/284 |
| 代理公司: | 寧波甬致專利代理有限公司 33228 | 代理人: | 李迎春 |
| 地址: | 315100 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 中文 評論 情感 傾向 分類 方法 | ||
本發(fā)明提供一種面向中文評論的情感多傾向分類方法,包括如下步驟:首先,提取語素詞和情感詞;其次,構建語素情感變量之間的相似性關系;最后,計算語素情感緊密路徑;將語素情感變量看成是有向加權無環(huán)圖中的節(jié)點,在語素情感節(jié)點之間構建有向加權關系連接,作為有向加權鏈接邊,在這些有向加權鏈接邊基礎上,搜索滿足一定權值條件的有效路徑。本發(fā)明將有向加權無環(huán)圖模型與情感傾向性分析相結合,通過提取評論的各種語素情感、分析語素情感之間的相似性關系、計算語素情感緊密路徑三個步驟實現(xiàn)評論的情感多傾向分類,更準確區(qū)分用戶對事物所表達出來的多種態(tài)度,反映出用戶對事物屬性和特征看法。
技術領域
本發(fā)明涉及情感傾向性分類,具體講的是一種面向中文評論的情感多傾向分類方法。
背景技術
隨著博客、微博、點評等應用的快速推廣和發(fā)展,網絡中各種評論已成為用戶表達意見和在線交流的重要途徑。網絡中評論信息通常以短文本的形式表達用戶對事物的看法,例如對新聞事件的評價、對商品性能的評論等等。所有這些評論信息是由大量用戶發(fā)布,從不同的側面和不同的角度對事物提出了自己的看法和主張。這些評價信息隨著日積月累,形成了一種結構復雜、內容多樣、多種情感交合的數(shù)據集合。
用戶對感興趣的事物所發(fā)表的相關評論是反映用戶對事物屬性和特征看法的重要方式。用戶通過評論表達他們對事件的態(tài)度、商品的性能、服務的質量等多方面的態(tài)度。現(xiàn)有的評論情感傾向性分類研究中主要將情感傾向性劃分為正面情感、負面情感和中性情感,有些研究將情感傾向性劃分成了幾個等級,如:非常贊成、贊成、中性、不贊成、非常不贊成等,這些分類都是將情感傾向性劃分成幾個固定的類型,難以處理更為復雜的情感分類情況。
由于用戶對事件的了解、事物的理解、服務的體驗等都可能存在較大差異,不同的用戶對事件、事物和服務等會有不同的感受。這種不同的感受體現(xiàn)在他們的評論中就可能表達出各種各樣的情感和態(tài)度。同時,用戶在對某個對象(事件、事物、服務等)的單個評論中,有時候表達的是單一的態(tài)度,例如贊成或反對,這種態(tài)度是關于對象的整體評價,表達了情感的某種傾向性。但是,由于人類情感的豐富性和復雜性,用戶通常會對目標的不同方面進行分別評論和評價,例如,評價商品的時候會涉及價格、性能、外觀等不同的細節(jié)和方面,并表達對這些細節(jié)和方面的不同態(tài)度。這就導致了在同一評論中用戶所表達的情感傾向性并不總是單一的情感類型。在許多情況下,用戶可能會同意或者否定同一事物的某些部分,而不是肯定或否定整個事物。因此,這些不同的態(tài)度是用戶對某個對象的更全面的描述,表達了多方面的情感傾向性。為了更準確區(qū)分用戶對事物所表達出來的多種態(tài)度,有必要對用戶的評論進行更細致的情感多傾向分類。
發(fā)明內容
本發(fā)明要解決的技術問題是,克服以上現(xiàn)有技術的缺陷,提供一種更準確區(qū)分用戶對事物所表達出來的多種態(tài)度的面向中文評論的情感多傾向分類方法。
本發(fā)明公開了一種面向中文評論的情感多傾向分類方法,包括如下步驟:
S1,提取語素情感變量;根據中文語素詞庫和情感語料詞庫對評論文本中關于被評論對象的各種語素詞和情感詞進行提取,采用皮爾遜相關系數(shù)方法計算語素詞與情感詞之間的關聯(lián)系數(shù),通過關聯(lián)系數(shù)組成語素情感變量;
S2,構建語素情感變量之間的相似性關系;采用條件互信息計算公式計算兩個語素情感變量的近似關系,對語素情感變量之間的關系進行描述;
S3,計算語素情感緊密路徑;將語素情感變量看成是有向加權無環(huán)圖中的節(jié)點,稱為語素情感節(jié)點或語素情感節(jié)點變量,在語素情感節(jié)點之間構建有向加權關系連接,作為有向加權鏈接邊,在這些有向加權鏈接邊基礎上,基于有向加權無環(huán)圖模型設計改進的最短路徑搜索算法,搜索滿足一定權值條件的有效路徑,每個路徑都是一種情感傾向性分類。
作為優(yōu)選,步驟S1中,將中文語素劃分為名詞類語素和情感類語素兩種類型,兩類語素按照聯(lián)合、偏正、支配、陳述、補充中的一種或多種復合方式進行組合,通過有監(jiān)督的機器學習方法提取評論文本中的語素,采用語素與情感之間的皮爾遜相關系數(shù)作為關聯(lián)系數(shù)將語素和情感對應起來,構建語素情感變量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江萬里學院,未經浙江萬里學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011547122.4/2.html,轉載請聲明來源鉆瓜專利網。





