[發明專利]一種互聯網金融平臺用戶評論主題分析系統及方法有效
| 申請號: | 201910256768.8 | 申請日: | 2019-04-01 |
| 公開(公告)號: | CN109977414B | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 孫慶;賀敏;杜慧;王秀文;徐小磊;岳宇飛;杜漫;馬秀娟 | 申請(專利權)人: | 中科天璣數據科技股份有限公司;國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/35 |
| 代理公司: | 北京市盛峰律師事務所 11337 | 代理人: | 于國富 |
| 地址: | 100190 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 互聯網 金融 平臺 用戶 評論 主題 分析 系統 方法 | ||
本發明公開了一種互聯網金融平臺用戶評論主題分析系統及方法,涉及自然語言處理領域;分析系統包括數據采集模塊、金融詞向量學習模塊、評論主題生成模塊、用戶評論分類模塊和評論主題更新模塊;分析方法所述方法利用金融論壇中平臺用戶印象聚類生成用戶評論主題,基于用戶評論主題對互聯網金融平臺相關用戶評論進行分析,并定期對評論主題進行更新。本發明不需要進行長期人工干預,借助互聯網中易于獲取的用戶知識實現穩定的互聯網金融平臺評論分析及主題提取,分析獲得的評論主題較有代表性,從而可以通過分析結果幫助用戶更直觀了解該互聯網金融平臺。
技術領域
本發明涉及自然語言處理領域,尤其涉及一種基于用戶印象的互聯網金融平臺用戶評論主題分析系統及方法。
背景技術
近年來隨著互聯網技術的發展和普及,傳統金融機構與互聯網企業結合,利用互聯網技術提供金融相關服務,以互聯網為平臺開展各類金融活動,各類p2p,眾籌,第三方支付,網貸,理財等金融平臺相繼涌現。“門檻低、收益高、投資周期短、風險小等”鋪天蓋地的營銷文案吸引普通投資者紛紛投入到互聯網金融的浪潮中。這些金融平臺豐富了大眾投資渠道的同時,也相應的帶來了極大的風險。許多問題平臺注銷、跑路,致使普通投資者血本無歸,給社會造成巨大不良影響。
通過對互聯網金融平臺的用戶評論分析,可以幫助投資者對平臺情況有更加全面公正的了解,輔助投資者進行決策,降低投資風險。
目前常見的評論分析技術有情感分析、評論觀點提取分析等。情感分析通過情感詞典或機器學習等算法分析用戶評論內容的情感極性,通常分為正面、負面、中立三類情感極性,無法給出對平臺情況的描述。評論觀點提取分析方法主要有基于規則的提取、基于LDA模型的主題分析、基于聚類的算法等。在基于規則的觀點提取方法中,歸納觀點陳述句的固定的句式結構規則,通過句法分析工具以及規則可以簡單有效地抽取到評論觀點。但人工總結規則的方式,無法涵蓋所有的觀點表述方式。并且,這種方法僅對陳述句有效,而中文中有多種句式表達方式。對于以LDA為代表的主題模型和以K-means為代表的傳統聚類方法,方法比較成熟,效果也得到了很多場景的驗證。但是這類方法直接從用戶評論中挖掘主題,主題受評論數據的影響較大,得到的主題沒有直觀的主題含義,且不能涵蓋有助于全面有效了解金融平臺整體情況的主題視角。
因此如何高效地對金融平臺用戶評論進行分析,提取有代表性的用戶評論主題是目前需要解決的問題。
發明內容
本發明的目的在于提供一種互聯網金融平臺用戶評論主題分析系統和方法,從而解決現有技術中存在的前述問題。
為了實現上述目的,本發明采用的技術方案如下:
一種互聯網金融平臺用戶評論主題分析系統,包括數據采集模塊、金融詞向量學習模塊、評論主題生成模塊、用戶評論分類模塊和評論主題更新模塊,所述數據采集模塊采集金融類新聞報道、用戶評論和用戶印象,并將其匯總后入庫;
所述金融詞向量學習模塊是基于金融平臺評論和金融新聞等數據學習金融領域詞向量,并定期更新,為金融平臺用戶評論分析提供基礎支撐;
所述評論主題生成模塊主要基于用戶印象采集模塊采集到的用戶印象進行相似聚類后得到一系列類簇,作為評論主題t,主題下的用戶印象集合記為M;
所述用戶評論分類模塊主要負責對用戶評論進行依存句法分析,對每條評論提取評論的代表短語集合,利用集合中的短語計算評論與每個主題的相似度,發現評論內容所屬主題;
所述評論主題更新模塊主要負責定期采集金融論壇上新增用戶印象,與已有主題去重后,聚類生成新的評論主題,并將其添加到評論主題生成模塊中得到的主題集合中。
本發明的另一個目的是提供一種互聯網金融平臺用戶評論主題分析方法,包括以下步驟:
S1,使用金融平臺評論和金融新聞等數據學習金融領域詞向量,并定期更新,為金融平臺用戶評論分析提供基礎支撐;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科天璣數據科技股份有限公司;國家計算機網絡與信息安全管理中心,未經中科天璣數據科技股份有限公司;國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910256768.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于改進CNN-LDA的情感分析方法
- 下一篇:一種文本糾錯方法及裝置





