[發(fā)明專利]實體情感分析方法、系統(tǒng)、存儲介質(zhì)及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202111283577.4 | 申請日: | 2021-11-01 |
| 公開(公告)號: | CN114003694A | 公開(公告)日: | 2022-02-01 |
| 發(fā)明(設(shè)計)人: | 趙子恒;沈劍峰;徐菊婷;王曉旭;鐘浩 | 申請(專利權(quán))人: | 北京明略軟件系統(tǒng)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F16/951 |
| 代理公司: | 青島清泰聯(lián)信知識產(chǎn)權(quán)代理有限公司 37256 | 代理人: | 梁春艷 |
| 地址: | 100089 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 實體 情感 分析 方法 系統(tǒng) 存儲 介質(zhì) 電子設(shè)備 | ||
本申請公開了一種實體情感分析方法、系統(tǒng)、存儲介質(zhì)及電子設(shè)備,實體情感分析方法包括:獲取步驟:通過爬蟲腳本從網(wǎng)站中獲取輿情信息,并將所述輿情信息存儲到數(shù)據(jù)庫中;識別步驟:從所述數(shù)據(jù)庫中獲取待預(yù)測輿情文本信息,使用實體識別模型對所述待預(yù)測輿情文本信息進行識別,得到至少一待預(yù)測輿情實體名稱;情感極性獲取步驟:構(gòu)建并使用實體情感分析模型對所述待預(yù)測輿情實體名稱及所述待預(yù)測輿情文本信息進行處理,獲得對應(yīng)每一所述待預(yù)測輿情實體名稱的實體情感極性并保存到數(shù)據(jù)表中。本發(fā)明通過將用戶行為+微信生態(tài)開放數(shù)據(jù)+業(yè)務(wù)數(shù)據(jù)+會話數(shù)據(jù)做用戶數(shù)據(jù)打通,提供用戶在多觸點以及在企微觸點會話中的關(guān)鍵節(jié)點。
技術(shù)領(lǐng)域
本發(fā)明屬于實體情感分析領(lǐng)域,具體涉及一種實體情感分析方法、系統(tǒng)、存儲介質(zhì)及電子設(shè)備。
背景技術(shù)
現(xiàn)代產(chǎn)業(yè)園區(qū)隨著經(jīng)濟環(huán)境的發(fā)展逐步發(fā)展起來,但隨著經(jīng)濟的不斷變化,主要依托于投資環(huán)境評估報告、招商手冊、招商宣傳片等線下的面對面交流與傳播的傳統(tǒng)招商模式,時間限制大、覆蓋面小、成本高等諸多缺點限制已經(jīng)不能滿足產(chǎn)業(yè)園招商需求,招商模式急需轉(zhuǎn)型。智慧招商是當(dāng)下各地政府、園區(qū)積極探索的招商引資新模式。智慧招商是將大數(shù)據(jù)與互聯(lián)網(wǎng)技術(shù)運用到園區(qū)招商的實踐經(jīng)驗中,利用大數(shù)據(jù)和云計算等現(xiàn)代高新技術(shù)手段為園區(qū)解決招商運營難、為企業(yè)解決投資入園難的問題,突破了時間與地域的限制,提高了招商效率,節(jié)省了大量人力物力成本。
在智慧招商的過程中,主要是關(guān)注企業(yè)的相關(guān)動態(tài)。在新聞輿情中,能夠獲取到大量企業(yè)相關(guān)動態(tài),因此它也成為業(yè)務(wù)人員尋找決策參考信息的重要來源。然而,信息爆炸式增長使得從中獲取有用信息的難度顯著加大。例如在同一篇新聞文本中,針對不同的公司可能會存在不同的情感極性。然而如何判斷同一篇新聞輿情中的不同企業(yè)的情感極性是一個急需解決的技術(shù)問題。然而在目前的智慧招商項目中,還缺少針對新聞輿情中的企業(yè)實體的情感分析的相關(guān)方案。
目前的智慧招商任務(wù)中,關(guān)于新聞輿情的情感分析僅僅是停留在篇章級別和句子級別。篇章級和句子級情感分析的方法僅僅是處理對象文本的長度的差異。它們假設(shè)一段文本只有一種情感,并對給定文本進行分析并判斷其整體的情感極性是正面、負面或者中性等。根據(jù)整篇新聞輿情的情感極性和當(dāng)前文本中存在得公司實體,進一步推斷出輿情新聞中得公司的情感極性。目前,針對文本整體進行情感分析的研究技術(shù)已經(jīng)相對成熟,達到了較好的性能。
然而,針對智慧招商中,對文本進行整體情感分析的方法,會掩蓋輿情新聞中的具體細節(jié)。且整體的輿情新聞的情感并不能反映出在文本中的企業(yè)的情感極性,目前的推斷方法會導(dǎo)致企業(yè)的情感極性出現(xiàn)較大的誤差。如果只關(guān)注輿情整體的情感極性,而忽略了出現(xiàn)在輿情中公司實體的情感極性,可能會使業(yè)務(wù)人員的決策出現(xiàn)較大的錯誤。因此,為了獲得更加準(zhǔn)確的公司情感極性,找到每一篇新聞輿情中的每一個公司實體,并確定該公司在當(dāng)前輿情中情感極性是一個更加可靠的方法。
發(fā)明內(nèi)容
本申請實施例提供了一種實體情感分析方法、系統(tǒng)、存儲介質(zhì)及電子設(shè)備,以至少解決現(xiàn)有的實體情感分析方法在智慧招商項目中的新聞輿情情感分析的粒度較大的問題。
本發(fā)明提供了一種實體情感分析方法,其中,包括:
獲取步驟:通過爬蟲腳本從網(wǎng)站中獲取輿情信息,并將所述輿情信息存儲到數(shù)據(jù)庫中;
識別步驟:從所述數(shù)據(jù)庫中獲取待預(yù)測輿情文本信息,使用實體識別模型對所述待預(yù)測輿情文本信息進行識別,得到至少一待預(yù)測輿情實體名稱;
情感極性獲取步驟:構(gòu)建并使用實體情感分析模型對所述待預(yù)測輿情實體名稱及所述待預(yù)測輿情文本信息進行處理,獲得對應(yīng)每一所述待預(yù)測輿情實體名稱的實體情感極性并保存到數(shù)據(jù)表中。
上述實體情感分析方法,其中,所述識別步驟包括:讀取所述數(shù)據(jù)庫中的數(shù)據(jù)獲取所述待預(yù)測輿情文本信息,通過所述實體識別模型識別出所述待預(yù)測輿情實體名稱,通過企業(yè)工商庫中的實體名稱對所述待預(yù)測輿情實體名稱進行過濾獲得最終的所述待預(yù)測輿情實體名稱。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明略軟件系統(tǒng)有限公司,未經(jīng)北京明略軟件系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111283577.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





