[發(fā)明專利]一種期貨領(lǐng)域的投研報告處理方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 202210927239.8 | 申請日: | 2022-08-03 |
| 公開(公告)號: | CN115358201B | 公開(公告)日: | 2023-06-20 |
| 發(fā)明(設(shè)計)人: | 楊勝利;吳福文;康維鵬;唐逐時 | 申請(專利權(quán))人: | 浙商期貨有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/289;G06F40/295;G06F40/30;G06F16/215;G06F16/35;G06F16/36;G06F16/84;G06Q40/06 |
| 代理公司: | 杭州創(chuàng)智卓英知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33324 | 代理人: | 唐超文 |
| 地址: | 310000 浙江省杭州市西湖*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 期貨 領(lǐng)域 報告 處理 方法 系統(tǒng) | ||
本申請涉及一種期貨領(lǐng)域的投研報告處理方法,其中,該方法包括:采集期貨行業(yè)的原始數(shù)據(jù),包括:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),其中,結(jié)構(gòu)化數(shù)據(jù)可以通過關(guān)系型數(shù)據(jù)庫進行管理;對結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),進行預(yù)處理得到第一語義數(shù)據(jù),對非結(jié)構(gòu)化數(shù)據(jù)進行預(yù)處理及語義結(jié)構(gòu)化處理,得到第二語義知識數(shù)據(jù);基于第一語義知識數(shù)據(jù)和第二語義知識數(shù)據(jù),構(gòu)建期貨結(jié)構(gòu)化基礎(chǔ)數(shù)據(jù)和產(chǎn)業(yè)鏈關(guān)聯(lián)圖譜;根據(jù)期貨結(jié)構(gòu)化基礎(chǔ)數(shù)據(jù)和產(chǎn)業(yè)鏈關(guān)聯(lián)圖譜,自動化進行進行投投研報告告選題以及自動化生成投投研報告。通過本申請,解決了期貨領(lǐng)域傳統(tǒng)投研方式可靠性較差的問題,實現(xiàn)了效率和可靠性。
技術(shù)領(lǐng)域
本申請涉及大數(shù)據(jù)領(lǐng)域,特別是涉及一種期貨領(lǐng)域的投研報告處理方法、系統(tǒng)、計算機設(shè)備和計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展,金融行業(yè)加快了謀求數(shù)字化轉(zhuǎn)型的進程,期貨行業(yè)也在技術(shù)的推動下逐漸探索應(yīng)用場景的新方向,隨之智能投資研究應(yīng)運而生。
傳統(tǒng)投研方式普遍存在前期信息采集耗時、內(nèi)容不完全、數(shù)據(jù)質(zhì)量低的缺陷,同時,研究員受自身知識體系和個體工作情緒影響,導(dǎo)致研究報告穩(wěn)定性差、信息版權(quán)混亂等問題。
目前針對期貨領(lǐng)域傳統(tǒng)投研報告處理方法穩(wěn)定性較差的問題,尚未提出有效的解決方案。
發(fā)明內(nèi)容
本申請實施例提供了一種期貨領(lǐng)域的投研報告處理方法和系統(tǒng),以至少解決相關(guān)技術(shù)中期貨領(lǐng)域傳統(tǒng)投研方式可靠性較差的問題。
第一方面,本申請實施例提供了一種期貨領(lǐng)域的投研報告處理方法,所述方法包括:
采集期貨行業(yè)的原始數(shù)據(jù),包括:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),其中,所述結(jié)構(gòu)化數(shù)據(jù)可以通過關(guān)系型數(shù)據(jù)庫進行管理;
對所述結(jié)構(gòu)化數(shù)據(jù)和所述半結(jié)構(gòu)化數(shù)據(jù),進行預(yù)處理得到第一語義數(shù)據(jù),對所述非結(jié)構(gòu)化數(shù)據(jù)進行預(yù)處理及語義結(jié)構(gòu)化處理,得到第二語義知識數(shù)據(jù);
基于所述第一語義知識數(shù)據(jù)和第二語義知識數(shù)據(jù),構(gòu)建期貨結(jié)構(gòu)化基礎(chǔ)數(shù)據(jù)與產(chǎn)業(yè)鏈關(guān)聯(lián)圖譜;
根據(jù)所述期貨結(jié)構(gòu)化基礎(chǔ)數(shù)據(jù)與產(chǎn)業(yè)鏈關(guān)聯(lián)圖譜,進行投研報告選題以及及自動化生成投研報告。
在其中一些實施例中,所述結(jié)構(gòu)化數(shù)據(jù)為關(guān)系型數(shù)據(jù),可通過關(guān)系型數(shù)據(jù)庫進存儲和管理;
所述半結(jié)構(gòu)化數(shù)據(jù)為報表數(shù)據(jù),其非關(guān)系型數(shù)據(jù)但具備固定的數(shù)據(jù)格式;
所述非結(jié)構(gòu)化數(shù)據(jù)為不具備固定格式的文檔數(shù)據(jù)。
在其中一些實施例中,對所述結(jié)構(gòu)化數(shù)據(jù)和所述半結(jié)構(gòu)化數(shù)據(jù),進行預(yù)處理得到第一語義數(shù)據(jù)包括:
對于所述結(jié)構(gòu)化數(shù)據(jù):對其中的缺失數(shù)據(jù)進行忽略和/或補漏,對其中的重復(fù)數(shù)據(jù)進行合并和/或冗余剔除,以及對其中的噪聲數(shù)據(jù)進行平滑處理;
對于所述半結(jié)構(gòu)化數(shù)據(jù),通過Xpath定向抽取模板對所述非結(jié)構(gòu)化數(shù)據(jù)進行抽取,將數(shù)據(jù)表格轉(zhuǎn)換為可存儲的結(jié)構(gòu)化庫表數(shù)據(jù);
集合所述預(yù)處理之后的結(jié)構(gòu)化數(shù)據(jù)和所述結(jié)構(gòu)化庫表數(shù)據(jù),得到所述第一語義知識數(shù)據(jù)。
在其中一些實施例中,所述對所述非結(jié)構(gòu)化數(shù)據(jù)進行預(yù)處理包括:
提取所述非結(jié)構(gòu)化數(shù)據(jù)中的文檔對應(yīng)的內(nèi)容對象流,對所述內(nèi)容對象流進行解碼得到標(biāo)準(zhǔn)字符流;
對所述標(biāo)準(zhǔn)字符流進行信息提取得到目標(biāo)信息,其中,所述目標(biāo)信息包括:標(biāo)題信息、事件信息、來源信息、正文文本信息、發(fā)布者信息。
在其中一些實施例中,對所述非結(jié)構(gòu)化數(shù)據(jù)進行語義結(jié)構(gòu)化處理,包括:
對非結(jié)構(gòu)化數(shù)據(jù)中的文本進行分詞,并通過預(yù)訓(xùn)練模型獲取所述文本中各個分詞的實體識別結(jié)果;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙商期貨有限公司,未經(jīng)浙商期貨有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210927239.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于移動終端的期貨交易數(shù)據(jù)傳輸?shù)姆椒ê拖到y(tǒng)
- 一種甲醇期貨價格預(yù)測方法
- 一種結(jié)構(gòu)和參數(shù)聯(lián)合學(xué)習(xí)的TSK型模糊系統(tǒng)的銅期貨價格預(yù)測的方法
- 一種通過構(gòu)建反布林模型的期貨投資策略分析方法
- 一種期貨信息處理方法及系統(tǒng)
- 一種期貨數(shù)據(jù)人工智能分析方法及系統(tǒng)
- 一種基于數(shù)據(jù)分析的期貨推薦方法及系統(tǒng)
- 一種基于電力期貨合約的結(jié)算方法、裝置及存儲介質(zhì)
- 一種期貨大數(shù)據(jù)可視分析系統(tǒng)
- 期貨標(biāo)簽抽取方法及裝置





