[發(fā)明專利]一種基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011641247.3 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112734569A | 公開(公告)日: | 2021-04-30 |
| 發(fā)明(設(shè)計)人: | 徐嬌;馮煜博;王廣普 | 申請(專利權(quán))人: | 沈陽麟龍科技股份有限公司 |
| 主分類號: | G06Q40/04 | 分類號: | G06Q40/04;G06Q40/08;G06F16/36;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 南霆 |
| 地址: | 110117 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 畫像 知識 圖譜 股票 風(fēng)險 預(yù)測 方法 系統(tǒng) | ||
1.一種基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測方法,其特征在于,包括以下步驟:
利用股票領(lǐng)域相關(guān)文本數(shù)據(jù)和金融知識圖譜,構(gòu)建金融事件特征;
利用用戶畫像和受影響的股票代碼,構(gòu)建用戶投資特征;
利用金融事件、金融知識圖譜和股票數(shù)據(jù)的漲跌情況,標(biāo)定股票風(fēng)險值;
將獲得的所述金融事件特征和所述用戶投資特征,根據(jù)股票代碼進(jìn)行關(guān)聯(lián),形成訓(xùn)練集的特征部分;再將訓(xùn)練集的特征部分與所述股票風(fēng)險值,根據(jù)股票代碼進(jìn)行關(guān)聯(lián),最終形成訓(xùn)練集;
將所述訓(xùn)練集,利用LSTM算法進(jìn)行訓(xùn)練,形成基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測模型;
將某個待預(yù)測投資用戶的投資特征和下一時刻的金融事件特征,輸入到基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測模型,為該投資用戶投資的股票進(jìn)行下一時刻的風(fēng)險值預(yù)測,輸出該投資用戶投資的股票風(fēng)險值;
利用用戶投資特征和預(yù)測的所述股票風(fēng)險值,構(gòu)建股票風(fēng)險提示信息規(guī)則,通過所述股票風(fēng)險提示信息規(guī)則為用戶提示股票風(fēng)險信息。
2.根據(jù)權(quán)利要求1所述的一種基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測方法,其特征在于,所述用戶畫像的構(gòu)建方法為:
獲取理財軟件中的用戶行為數(shù)據(jù)和用戶調(diào)查數(shù)據(jù);
對所述用戶行為數(shù)據(jù)和用戶調(diào)查數(shù)據(jù)通過數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)融合進(jìn)行數(shù)據(jù)處理;
將數(shù)據(jù)處理后的用戶行為數(shù)據(jù)和用戶調(diào)查數(shù)據(jù),經(jīng)模型層的k-means和GMM算法,對每個標(biāo)簽維度進(jìn)行聚類;
最終形成用戶畫像,即用戶的標(biāo)簽化展示以及標(biāo)簽對應(yīng)的等級信息。
3.根據(jù)權(quán)利要求1所述的一種基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測方法,其特征在于,所述金融知識圖譜的構(gòu)建方法為:
對非結(jié)構(gòu)化數(shù)據(jù),進(jìn)行正文抽取;并利用自然語言處理技術(shù),進(jìn)行至少中文分詞、關(guān)鍵詞提取、特征提取的操作;
通過包裝器學(xué)習(xí)半結(jié)構(gòu)化數(shù)據(jù)的抽取規(guī)則,對半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行內(nèi)容提取;
通過ETL技術(shù)獲取結(jié)構(gòu)化數(shù)據(jù),直接獲取實體、實體和實體之間的關(guān)系;
知識庫構(gòu)建及管理,通過數(shù)據(jù)映射技術(shù)建立知識庫中術(shù)語和不同數(shù)據(jù)源抽取知識中詞匯的映射關(guān)系;使用實體匹配將不同數(shù)據(jù)源相同客體的數(shù)據(jù)進(jìn)行融合;最后對融合而成的知識庫進(jìn)行存儲、管理;
所述知識庫根據(jù)用戶查詢場景的不同采用不同的存儲架構(gòu),最終形成金融知識圖譜。
4.根據(jù)權(quán)利要求1所述的一種基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測方法,其特征在于,所述利用股票領(lǐng)域相關(guān)文本數(shù)據(jù)和金融知識圖譜,構(gòu)建金融事件特征,具體為:
通過內(nèi)容文本庫獲取股票領(lǐng)域相關(guān)文本數(shù)據(jù),利用自然語言處理技術(shù)對所述文本數(shù)據(jù)進(jìn)行分析,首先對文本數(shù)據(jù)中的內(nèi)容抽取事件實體,然后抽取影響所述事件實體的事件,利用專家標(biāo)注法構(gòu)建事件庫;
通過抽取的事件實體與金融知識圖譜中的實體進(jìn)行關(guān)聯(lián),獲取受所述事件影響的股票代碼,并結(jié)合金融知識圖譜,從金融知識圖譜中挖掘出相關(guān)要素;再結(jié)合所述事件和該事件發(fā)生的時間,共同構(gòu)成金融事件特征。
5.根據(jù)權(quán)利要求1所述的一種基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測方法,其特征在于,所述利用用戶畫像和受影響的股票代碼,構(gòu)建用戶投資特征,所述用戶投資特征具體表示為:
E(u)=[user_id,stock_id,x5,x6],其中user_id表示用戶id,stock_id表示股票代碼,X5表示風(fēng)險偏好,X6表示風(fēng)險承受能力,通過one-hot方法將原本類別型的風(fēng)險偏好X5和風(fēng)險承受能力X6數(shù)據(jù)轉(zhuǎn)換成數(shù)值形式。
6.根據(jù)權(quán)利要求1所述的一種基于用戶畫像和知識圖譜的股票風(fēng)險預(yù)測方法,其特征在于,所述利用金融事件、金融知識圖譜和股票數(shù)據(jù)的漲跌情況,標(biāo)定股票風(fēng)險值,具體為:
其中,xa為金融事件影響的股票風(fēng)險值,ω1為金融事件影響的股票風(fēng)險值的權(quán)重,xb為股票數(shù)據(jù)的漲跌情況影響的股票風(fēng)險值,ω2為股票數(shù)據(jù)的漲跌情況影響的股票風(fēng)險值的權(quán)重;選取n個時刻的該支股票的數(shù)據(jù)進(jìn)行累加,然后取平均值做為該支股票的股票風(fēng)險值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于沈陽麟龍科技股份有限公司,未經(jīng)沈陽麟龍科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011641247.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金





