[發明專利]一種商品期貨新聞輿情分析方法及系統在審
| 申請號: | 201910532065.3 | 申請日: | 2019-06-19 |
| 公開(公告)號: | CN110377696A | 公開(公告)日: | 2019-10-25 |
| 發明(設計)人: | 花京華;唐志偉;劉可薇;易顯天 | 申請(專利權)人: | 新華智云科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F17/27;G06K9/62 |
| 代理公司: | 杭州裕陽聯合專利代理有限公司 33289 | 代理人: | 姚宇吉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 期貨 輿情分析 結構化 標簽 圖譜 期貨行業 分析請求 商品期貨 實體庫 標簽結構 關聯分析 期貨市場 數據建立 輿情信息 粗粒度 關系庫 體系化 系統化 映射 維度 關聯 輸出 分析 | ||
1.一種商品期貨新聞輿情分析方法,其特征在于,包括以下步驟:
獲取期貨行業數據,基于所述期貨行業數據建立期貨知識圖譜,所述期貨知識圖譜包括實體庫和關系庫;
獲取期貨相關輿情新聞,對所述相關輿情新聞按照輿情分析維度進行標簽結構化處理,輸出各期貨相關輿情新聞的結構化標簽;所述結構化標簽包括主題標簽、情感標簽、粗粒度標簽和細粒度標簽,所述粗粒度標簽與所述實體庫中的實體相映射;
獲取分析請求,根據分析請求對期貨知識圖譜和具有結構化標簽的期貨相關輿情新聞進行關聯分析,獲得相應的分析結果。
2.根據權利要求1所述的一種商品期貨新聞輿情分析方法,其特征在于,獲取期貨相關輿情新聞,對所述期貨相關輿情新聞按照輿情分析維度進行標簽結構化處理的方法包括以下步驟:
獲取輿情新聞,對所述輿情新聞進行分詞處理,獲得分詞結果;
將所述分詞結果輸入預設的分類模型,當分類模型輸出結果為其屬于期貨相關輿情新聞時,對分詞結果進行以下處理:
將所述分詞結果輸入預設的主題模型,由主題模型輸出相應的主題標簽,并將所述分詞結果輸入預設的情感分析模型,由情感分析模型輸出相應的情感標簽;
將所述分詞結果進行實體鏈接,輸出所述期貨相關輿情新聞與期貨知識圖譜實體庫相關的實體作為粗粒度標簽;
將所述分詞結果輸入預設的多標簽分類模型,由多標簽分類模型輸出所述期貨相關輿情新聞在實體屬性/方面級別的細粒度標簽。
3.根據權利要求2所述的一種商品期貨新聞輿情分析方法,其特征在于,分類模型、主題模型、情感分析模型、多標簽分類模型的構建方法包括以下步驟:
獲取期貨新聞數據、非期貨新聞數據、商品關聯新聞數據、宏觀主題新聞數據和看盤新聞數據;
將期貨新聞數據和商品關聯新聞數據標注為正樣本,非期貨新聞數據標注為負樣本,對期貨新聞數據、新聞數據和商品關聯新聞數據進行分詞處理,利用所得分詞結果訓練獲得分類模型;
主題標簽包括宏觀主題標簽和商品主題標簽,將宏觀主題新聞數據按照宏觀主題標簽進行劃分,利用劃分后的宏觀主題新聞數據訓練獲得宏觀主題模型,同時,將商品關聯新聞數據按照商品宏觀主題標簽進行劃分,利用劃分后的宏觀主題新聞數據訓練獲得商品主題模型,商品主題模型和宏觀主題模型構成主題模型;或,對劃分后的商品關聯新聞數據和宏觀主題新聞數據進行分詞處理,利用所得分詞結果訓練獲得主題模型;
分別設計商品關聯新聞數據、宏觀主題新聞數據和看盤新聞數據的情感分,將設計情感分后的商品關聯新聞數據、宏觀主題新聞數據和看盤新聞數據進行分詞處理,利用所得分詞結果訓練獲得情感分析模型;
將商品關聯新聞數據按照細粒度標簽進行劃分后進行分詞,利用所得分詞結果訓練獲得多標簽分類模型。
4.根據權利要求1~3任一所述的一種商品期貨新聞輿情分析方法,其特征在于,根據分析請求對期貨知識圖譜和具有結構化標簽的期貨相關輿情新聞進行關聯分析,獲得相應的分析結果的具體方法為:
根據分析請求從期貨知識圖譜的實體庫提取相關實體,相關實體包括與分析請求相對應的實體,以及根據所述實體從關系庫提取與其相關聯的實體;
根據實體與粗粒度標簽的映射關系獲取與預設時間段內與相關實體相對應的期貨相關輿情新聞,對所得期貨相關輿情新聞的主題標簽、情感標簽、粗粒度標簽和細粒度標簽進行統計分析,獲得相應的分析結果。
5.根據權利要求4所述的一種商品期貨新聞輿情分析方法,其特征在于,所述分析請求包括商品價格異常分析請求、商品預警請求、黑嘴監管請求、輿情熱點分析請求和輿情趨勢分析請求。
6.根據權利要求1~3任一所述的一種商品期貨新聞輿情分析方法,其特征在于,獲取期貨行業數據,基于所述期貨行業數據建立期貨知識圖譜的方法為:
從期貨相關垂直網站抓取期貨行業數據;
將所抓取的期貨行業數據依次進行實體名稱對齊、實體屬性對齊、實體融合和關系抽取處理,獲得預處理后的該期貨行業數據;
利用預處理后的期貨行業數據建立包含實體庫和關系庫的期貨知識圖譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新華智云科技有限公司,未經新華智云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910532065.3/1.html,轉載請聲明來源鉆瓜專利網。





