[發明專利]一種基于擴散傳播模型的關聯實體情感判斷方法有效
| 申請號: | 201811283258.1 | 申請日: | 2018-10-31 |
| 公開(公告)號: | CN109471928B | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 吳振豪;陳鐘;李青山;楊可靜;蘭云飛;高健博;王曉青 | 申請(專利權)人: | 北京國信云服科技有限公司;北京大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/36 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 劉曉嵐 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 擴散 傳播 模型 關聯 實體 情感 判斷 方法 | ||
本發明提供一種基于擴散傳播模型的關聯實體情感判斷方法,涉及信息技術領域。該方法首先根據現有的語料信息,判斷文本中實體之間的聯系,建立實體之間的關系圖,并構建情感分析模塊,判斷文本中所有實體的實際情感;然后采用擴散傳播算法,針對不同情感確定不同的情感擴散模式;根據關聯實體之間的關系,結合情感擴散模式,計算出其他實體的情感分值;然后根據預設的閾值,來確定其他實體的情感;最后結合關聯實體的關系網絡和情感擴散模型,得出文本對整個行業的情感影響;本發明提供的基于擴散傳播模型的關聯實體情感判斷方法,能夠對文本中的實體進行分析,然后推廣至其他的有關聯關系的實體,以提高文本的利用率,增加數據挖掘深度。
技術領域
本發明涉及信息技術領域,尤其涉及一種基于擴散傳播模型的關聯實體情感判斷方法。
背景技術
隨著互聯網技術的快速發展,網絡上信息呈現爆炸式增長,但是相較于生活中能夠涉及到的方方面面,網絡仍舊有許多難以覆蓋或覆蓋不足的方面。尤其是信息覆蓋不均、信息數量不同的問題,導致有些實體的信息在網上呈現出多數,而有些實體的信息確是極少,很可能導致對差不多的實體有完全不一樣的評價標準。
現今,根據互聯網信息來對一個實體進行整體判斷是常用手段,無論是查詢這個實體的基本信息,還是了解這個實體的一些實際情況,在互聯網上進行查詢是大家通常都會采用的方案。但是互聯網上信息覆蓋程度不一,且具有明顯的偏向性,越大、越出名的實體會有越多的輿論覆蓋,大家對于他的認識在一定程度上也更為詳細;而光芒不顯的實體卻越容易不被重視。就算兩個實體有相似的技術實力,在后續的發展也會有極大的差距。
另外,目前的媒體新聞在報道的時候,往往只針對提及的幾家實體,但是有許多現象是行業現象。而行業現象的評估非常困難,因為某一行業覆蓋范圍廣,且行業內情況復雜,同時,實體本身在具有較高復雜性的同時也朝多元化發展,往往在多個行業內立足,這也給行業評估增加了難度。
目前對于一條普通新聞的情感分析,通常只針對在新聞中出現的實體本身;而對于一條比較重要的新聞進行情感分析,往往會關聯開來,使得這條新聞的影響力常常超出新聞本身打算的覆蓋范圍,而對其他實體、其他行業和產業都產生影響,這樣的深度分析常常需要耗費大量的人力物力才能夠有這樣的效果。但是每一條內容充實的新聞中反映出來的信息都是值得深挖的。如果能夠對每一條這樣的新聞進行深挖,就能夠很好地挖掘出新聞中的有效信息,并且做到以少見多,管中窺豹。這樣的內容挖掘同時也可以把某篇文章中對某個實體的情感評價推廣到其他的相關實體,擴大了推廣范圍,也可以對行業進行一個大致的評估。
發明內容
本發明要解決的技術問題是針對上述現有技術的不足,提供一種基于擴散傳播模型的關聯實體情感判斷的方法,能夠對文本中的實體進行分析,然后推廣至其他的有關聯關系的實體,以提高文本的利用率,增加數據挖掘深度。
為解決上述技術問題,本發明所采取的技術方案是:一種基于擴散傳播模型的關聯實體情感判斷方法,包括以下步驟:
步驟1、根據現有的語料信息,判斷文本中實體之間的聯系,建立實體之間的關系圖網絡;
步驟2、構建情感分析模塊,并使用情感分析模塊判斷文本中所有實體的實際情感,得到文本中出現的實體的情感;所述情感分析模塊采用訓練好的SVM模型,用于分析情感極性;
步驟3、采用擴散傳播算法,確定文本中實體的情感擴散模式;
所述情感擴散模式包括兩種,分別基于兩個關系模型;第一種情感擴散模式用于負面情感的傳播,如下公式所示:
其中,f(x)為文本中待評測實體的情感影響力結果,S為影響力常數,x表示被傳播實體與文本中的實體的距離;所述文本中實體的情感影響力結果f(x)不能是文本中的實體,文本中實體的情感影響力結果為S;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國信云服科技有限公司;北京大學,未經北京國信云服科技有限公司;北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811283258.1/2.html,轉載請聲明來源鉆瓜專利網。





