[發明專利]交易對象預測方法和裝置在審
| 申請號: | 201810338035.4 | 申請日: | 2018-04-16 |
| 公開(公告)號: | CN110390408A | 公開(公告)日: | 2019-10-29 |
| 發明(設計)人: | 王穎帥;李曉霞;苗詩雨 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/04 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 張一軍;張效榮 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 交易對象 預測 文本 方法和裝置 歷史交易 傾向因子 參考 計算機技術領域 變化趨勢 獲取目標 價格數據 交易周期 歷史數據 模型訓練 預測模型 準確率 維度 預設 引入 分析 | ||
本發明公開了一種交易對象預測方法和裝置,涉及計算機技術領域。該方法的一具體實施方式包括:獲取目標交易對象在多個歷史交易周期中每一周期的多個預測參考文本,并確定每一預測參考文本的漲跌傾向因子;利用所述漲跌傾向因子確定目標交易對象在該周期的文本傾向指數;將目標交易對象在所述多個歷史交易周期中每一周期的價格數據和文本傾向指數輸入預先訓練完成的預測模型,得到目標交易對象在未來交易周期至少一個預設維度的信息。該實施方式能夠通過將預測參考文本中影響交易對象變化趨勢的特征引入模型訓練和預測并對含有該特征的大量歷史數據進行分析,提升交易對象預測的準確率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種交易對象預測方法和裝置。
背景技術
隨著大數據和人工智能的發展,有必要將機器學習等技術應用在瞬息萬變的金融市場(例如股票市場)進行信息預測,以克服現有預測方法準確率低、無法指導實踐的缺陷。
現有技術中,一般采用一次指數平滑法處理交易對象的歷史信息時間序列實現預測,由于該方法的局限性以及股票信息極易受到內外多種因素影響的特點,當時間序列出現直線趨勢時,預測結果存在較大滯后,嚴重影響其預測準確率。
發明內容
有鑒于此,本發明實施例提供一種交易對象預測方法和裝置,能夠通過將預測參考文本中影響交易對象變化趨勢的特征引入模型訓練和預測并對含有該特征的大量歷史數據進行分析,提升交易對象預測的準確率。
為實現上述目的,根據本發明的一個方面,提供了一種交易對象預測方法。
本發明實施例的交易對象預測方法包括:獲取目標交易對象在多個歷史交易周期中每一周期的多個預測參考文本,并確定每一預測參考文本的漲跌傾向因子;利用所述漲跌傾向因子確定目標交易對象在該周期的文本傾向指數;將目標交易對象在所述多個歷史交易周期中每一周期的價格數據和文本傾向指數輸入預先訓練完成的預測模型,得到目標交易對象在未來交易周期至少一個預設維度的信息。
可選地,所述交易對象包括股票,所述交易周期包括交易日。
可選地,多個歷史交易日是連續的,未來交易日為所述多個歷史交易日中最近一日的下一交易日。
可選地,所述文本傾向指數為所述多個歷史交易日的漲跌傾向因子的平均值;任一預測參考文本的漲跌傾向因子為該預測參考文本的關注系數和其作者權重系數之和與其類別系數的乘積;所述類別系數是將該預測參考文本的特征向量輸入預先訓練完成的文本分類模型中得到的。
可選地,所述方法進一步包括:對每一預測參考文本進行分詞;在分詞結果中去除停用詞,并將詞語按照詞頻-逆向文件頻率數值降序排列;選取在前的預設數量的詞語進行向量轉換,得到該預測參考文本的特征向量。
可選地,所述多個預測參考文本可根據類別系數分為看漲文本與看跌文本;所述方法進一步包括:獲取看漲文本漲跌傾向因子的平均值以及看跌文本漲跌傾向因子的平均值,將二者差值與和的比值的絕對值確定為目標股票在該日的文本極化指數,并將目標股票在所述多個歷史交易日中每一日的文本極化指數輸入所述預測模型。
可選地,所述預測模型是由多個批次的訓練數據訓練而成;其中,每一批次的訓練數據包括:目標股票在連續的多個歷史交易日中每一日的價格數據、文本傾向指數以及文本極化指數,還包括具有所述至少一個預設維度的目標信息,所述至少一個預設維度不同于價格數據的任一維度。
可選地,所述預測模型為長短期記憶網絡LSTM,其由輸入層、隱藏層、輸出層、損失層以及目標層構成,其損失函數為預測信息與目標信息的均方誤差函數。
可選地,所述文本分類模型為卷積神經網絡CNN;所述價格數據包括以下至少一種維度的數據:最低價、最高價、開盤價、收盤價、交易量、交易額以及漲跌幅;所述預測參考文本為股票相關新聞文本、和/或股評文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810338035.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





