[發明專利]基于事件抽取的金融數據分析方法及裝置在審
| 申請號: | 202110095467.9 | 申請日: | 2021-01-25 |
| 公開(公告)號: | CN112784580A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 王立林;楊丹;施生燊;徐克寶 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F16/35;G06Q40/00 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 任默聞;孫乳筍 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 事件 抽取 金融 數據 分析 方法 裝置 | ||
1.一種基于事件抽取的金融數據分析方法,其特征在于,包括:
獲取資訊數據,所述資訊數據包含:多條資訊的資訊標題和對應的日期信息;
從每條資訊的資訊標題中,抽取結構化的金融事件數據;
將抽取的金融事件數據輸入到預先訓練好的金融主體情感分析模型中,輸出每個金融事件的情感分類;
統計各個情感分類對應的金融事件量,生成一個偏差向量,與待分析金融數據的特征向量進行融合,得到融合后的特征向量;
將融合后的特征向量,輸入到預先訓練好的金融時間序列分析網絡模型中,輸出所述待分析金融數據的金融時間序列,其中,所述金融時間序列用于反映所述待分析金融數據的數據變化趨勢。
2.如權利要求1所述的方法,其特征在于,獲取資訊數據,包括:
獲取目標網站的網址信息;
根據目標網站的網址信息,向所述目標網站發送HTTP請求,獲取所述目標網站的頁面內容;
根據預先設定的關鍵字,使用正則表達式,從所述目標網站的頁面內容中,匹配出相應的資訊標題。
3.如權利要求2所述的方法,其特征在于,根據預先設定的關鍵字,使用正則表達式匹配所述頁面內容中相應的資訊標題,包括:
從所述目標網站的頁面內容中解析出一個或多個子頁面的網址信息;
根據各個子頁面的網址信息,向各個子頁面發送HTTP請求,獲取各個子頁面的頁面內容;
根據預先設定的關鍵字,使用正則表達式,從所述目標網站和各個子頁面的頁面內容中,匹配出相應的資訊標題。
4.如權利要求1所述的方法,其特征在于,從每條資訊的資訊標題中,抽取結構化的金融事件數據,包括:
獲取預先設定的事件觸發詞;
根據預先設定的事件觸發詞,利用SimHash算法,對獲取的資訊標題進行去重處理;
從去重處理后的資訊標題中,抽取結構化的金融事件數據。
5.如權利要求4所述的方法,其特征在于,根據預先配置的事件觸發詞,利用SimHash算法,對獲取的資訊數據進行去重處理,包括:
根據預先配置的事件觸發詞,對每個資訊標題進行分詞,得到多個特征向量;
利用Hash函數,計算各個特征向量的Hash值;
根據每個資訊標題各個特征向量的Hash值和對應的權重值,計算每個資訊標題的SimHash值;
根據兩個資訊標題的SimHash值,計算兩個資訊標題的海明距離,作為兩個資訊標題的相似度;
如果兩個資訊標題的相似度小于預設閾值,則刪除其中一個資訊標題。
6.如權利要求4所述的方法,其特征在于,從去重處理后的資訊標題中,抽取結構化的金融事件數據,包括:
使用BERT模型,對每個資訊標題的句子進行編碼,得到每個資訊標題對應的句子向量以及句子中各個事件觸發詞的向量;
根據每個資訊標題對應的句子向量,識別出金融事件的事件類型;
根據事件類型對應的句子向量以及句子中各個事件觸發詞的向量,識別出每個資訊標題中包含的事件元素實體;
對每個資訊標題中包含的各個事件元素實體進行角色識別,得到結構化的金融事件數據。
7.如權利要求1所述的方法,其特征在于,在將抽取的金融事件數據輸入到預先訓練好的金融主體情感分析模型中,輸出所述金融事件數據的情感分類結果之前,所述方法還包括:
對結構化的金融事件數據進行情感分類標注;
根據標注后的金融事件數據,生成第一訓練樣本數據;
根據第一訓練樣本數據,訓練一個基于注意力機制的金融主體情感分析模型,其中,所述金融主體情感分析模型包含:詞嵌入層、網絡層、注意力機制層和全連接層,所述詞嵌入層用于將結構化的金融數據轉換為一個固定長度的矩陣向量;所述網絡層用于將詞嵌入層輸出的矩陣向量輸入到雙向長短期記憶網絡模型進行特征提取,得到特征向量;所述注意力機制層用于將所述網絡層輸出的特征向量進行聚合和加權處理;所述全連接層用于對所述注意力機制層輸出的特征向量進行融合,使用softmax函數得到金融事件數據的情感分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110095467.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:交易處理方法及裝置
- 下一篇:一種新型自動搬運機器人





