[發明專利]基于新聞語料的金融概念對應股票關聯方法及其裝置在審
| 申請號: | 201610051993.4 | 申請日: | 2016-01-26 |
| 公開(公告)號: | CN105718444A | 公開(公告)日: | 2016-06-29 |
| 發明(設計)人: | 陳發君;黃金才;劉忠;程光權;朱承;修保新;陳超;馮旸赫 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京中濟緯天專利代理有限公司 11429 | 代理人: | 陳立新 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 新聞 語料 金融 概念 對應 股票 關聯 方法 及其 裝置 | ||
本發明提供一種基于新聞語料的金融概念對應股票關聯方法,該方法以爬取的互聯網上財經新聞或社交論壇獲的文章為語料,通過統計語料中關鍵詞的出現頻次,動態建立金融概念與個股之間的關聯關系,作為決策資訊提供給投資者。
技術領域
本發明涉及基于海量文本的實體關聯分析方法,尤其涉及一種基于新聞語料的金融概念對應股票關聯方法及其裝置。
背景技術
目前,社會上出現熱點事件時,人們通常會形成一套對熱點事件的固定用詞,比如,柴靜拍攝的紀錄片《穹頂之下》在網絡上播出后,“柴靜”、“穹頂之下”就成為該事件的相關熱點詞。通常股票容易受到社會突發事件的影響,使其股價發生波動,此類與熱點事件相關的個股常稱為概念成分股。
現有主要通過行業分析師撰寫相關領域股票的分析文章,以獲得熱點詞與概念成分股之間的關聯。但人工分析存在以下問題,一是存在主觀因素,不同分析師針對同一熱點事件,給出的概念成分股難以完全一致;二是金融概念涉及社會生產的方方面面,熱點事件對應的概念不斷涌現,人工分析要想實現全面掌握,工作量巨大。
發明內容
本發明的目的在于提供一種基于新聞語料的金融概念對應股票關聯方法及其裝置,該發明解決了現有技術中依靠人工獲取與某一金融概念相關的股票時,工作量巨大,準確性一致性較差的技術問題。
本發明提供一種基于新聞語料的金融概念對應股票關聯方法,包括:步驟S100:對經過清洗的新聞語料進行分詞,得到分詞文檔;步驟S200:獲取分詞文檔的子句中金融概念C
進一步地,新聞語料為從新聞網站財經頻道獲取的最近一個月內的財經新聞語料。
進一步地,子句通過以下步驟獲得:步驟S210:依據句尾終結符對文檔進行分句,得到分句文檔;步驟S220:依據句中分隔符將分句文檔的句子分為多個子句。
進一步地,S300還包括以下步驟:步驟S310:按式二計算對金融概念C
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610051993.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于輸送系統的上壓輪
- 下一篇:貨架連接接頭





