[發明專利]一種基于深度學習算法的金融同業輿情分析方法及系統在審
| 申請號: | 202010424186.9 | 申請日: | 2020-05-19 |
| 公開(公告)號: | CN111639183A | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 李振;鮑東岳;張剛;尹正;劉昊霖;張雨楓;徐超;陳厚霖;馬圣楠;傅佳美 | 申請(專利權)人: | 民生科技有限責任公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 巴曉艷 |
| 地址: | 101300 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 算法 金融 同業 輿情 分析 方法 系統 | ||
本發明涉及輿情分析技術領域,提供了一種基于深度學習算法的金融同業輿情分析方法及系統,所述方法對經過預處理的同業新聞文本數據依次進行性質分析、事件分類及事件主體發現,得到特定事件及特定領域范圍內的輿情狀況;其中,性質分析的結果包括三個類別:正向、中性、負向;事件分類用以得到新聞類型判斷結果;事件主體發現用以發現同業新聞文本的主體,并將主體與事件進行對應。所述系統包括同業新聞文本數據預處理模塊、性質分析模塊、事件分類模塊及事件主體發現模塊。本發明在三個模型的基礎上結合中文以及新聞文本的特殊性做了模型的訓練及改進,能最大限度優化模型判斷結果提升計算效率,實現定時處理輿情判斷。
技術領域
本發明涉及輿情分析技術領域,特別涉及一種基于深度學習算法的金融同業輿情分析方法及系統。
背景技術
隨著我國互聯網的迅速發展,網民數量及互聯網信息呈現爆發性增長,在如此大量的信息中,如何進行甄別,挑選出實際性的信息以及關聯人,是非常重要的。從輿情監控的角度來說,我們每天的信息中,涵蓋著各類輿情信息,而各種輿情信息匯總后,如何在更短的事件、更有效的進行識別、更好的得出所需的結果,是輿情分析的關鍵。
從傳統的輿情監控系統來看,主要以關鍵詞為主,可根據地域、來源、分類等篩選,按期提供輿情監測報告。但無法對大量新聞內各主體及對應關系進行自動識別,仍然需要人工進行判斷。
現有的輿情系統大多是建立在微博、論壇、博客等評論文本基礎上,通過熱詞抽取和文本聚類抓取當前的輿情熱點,但是現有的文章來源與處理方法應用到金融行業存在著較大弊端。首先,評論文本存在著大量注水數據以及不真實評論,相對于正式的同業新聞文本而言評論文本的影響力以及可信度都較小,參考度較低;其次進行熱詞抽取以及文章聚類會導致文章類型以及描述主題的確認偏差或者無法明確真實的描述主體事件,導致輿情的判斷出現錯誤。
發明內容
本發明的目的是克服現有技術的不足,提供了一種基于深度學習算法的金融同業輿情分析方法及系統,相較于傳統方法做了較大的改變,本發明旨在對同業新聞語料進行輿情分析,對于近期熱點事件以及相應的企業、個人以及其它組織,結合網絡上群眾的價值取向以及社會態度進行科學直觀的歸納總結;通過對每篇文章的情感取向和事件種類的判定,結合描述主體的輸出,給出對應時間段內的金融相關輿情總結,使得相關人員在不需要閱讀海量文本的前提下,快速了解大量信息,并通過對新聞中出現的事件類別以及特定主體的情感傾向性總結對熱點事件有一個直觀的認識。
本發明采用如下技術方案:
一種基于深度學習算法的金融同業輿情分析方法,所述方法對經過預處理的同業新聞文本數據依次進行性質分析(情感分析)、事件分類及事件主體發現,得到特定事件及特定領域范圍內的輿情狀況;其中,所述性質分析的結果包括三個類別:正向、中性、負向;所述事件分類用以得到新聞類型判斷結果;所述事件主體發現用以發現同業新聞文本的主體,并將主體與事件進行對應。
進一步的,所述方法具體包括:
S1、對同業新聞文本數據進行預處理;
S2、經過步驟S1預處理的同業新聞文本數據輸入XLNET性質分析模型,得到性質分析的判斷結果;
S3、經過步驟S1預處理的同業新聞文本數據輸入BERT分類模型,得到新聞類型判斷結果;
S4、將經過步驟S1預處理的同業新聞文本數據及經過步驟S3處理得到的新聞類型判斷結果輸入注意力機制的事件主體發現模型,得到“主體-事件”的對應表示;
S5、將步驟S4得到的“主體-事件”的對應表示按照情感方向進行歸納,根據出現頻率以及相似度計算,羅列出近期的熱點主體、熱點事件以及相互對應關系,得到特定事件以及領域范圍內的輿情狀況。
進一步的,步驟S1中,對同業新聞文本數據進行預處理具體方法為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于民生科技有限責任公司,未經民生科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010424186.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種服務器狀態獨立監控系統及方法
- 下一篇:一種面向申威平臺的容器熱遷移方法





