[發明專利]一種基于社會網絡聚類的股票指數跟蹤預測方法及系統在審
| 申請號: | 201710100466.2 | 申請日: | 2017-02-23 |
| 公開(公告)號: | CN106897797A | 公開(公告)日: | 2017-06-27 |
| 發明(設計)人: | 劉海飛;許金濤 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/04;G06K9/62 |
| 代理公司: | 南京經緯專利商標代理有限公司32200 | 代理人: | 朱小兵 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社會 網絡 股票 指數 跟蹤 預測 方法 系統 | ||
1.一種基于社會網絡聚類的股票指數跟蹤預測方法,其特征在于,包括以下步驟:
(1)、從第三方數據庫中采集上月和當月的指數以及成份股數據,并對數據進行清洗,得到能用于研究的樣本內數據和樣本外數據;所述樣本內數據為指數及其成份股上月的前復權1分鐘收盤價數據,所述樣本外數據為指數及其成份股當月的前復權1分鐘收盤價數據;
(2)、根據樣本內數據構建訓練模型,對成份股采用社會網絡聚類模型構建股票池,并用指數跟蹤優化模型確定最優權重;
(3)、將樣本內訓練得到的股票池和最優權重運用于樣本外數據的指數跟蹤,得到預測的指數。
2.根據權利要求1所述的基于社會網絡聚類的股票指數跟蹤預測方法,其特征在于,在步驟(1)中,對所有收盤價數據進行數據清洗,包括:剔除缺失嚴重的股票、刪除第一天和最后一天停市或數據缺失的股票、刪除所有股票和指數及期貨缺失超過一半的時刻、對缺失數據進行線性插值補全、再次對首末存在缺失的時刻進行刪除,最終得到研究的樣本內、樣本外數據。
3.根據權利要求1所述的基于社會網絡聚類的股票指數跟蹤預測方法,其特征在于,在步驟(2)中,是從成份股中提取相關性低且具有代表性的股票構建股票池,具體流程包括:用成份股間的相關系數計算度量距離,構建成份股間的社會網絡,用自適應仿射傳播聚類算法對網絡進行聚類,提取每簇的聚類中心形成股票池。
4.根據權利要求1所述的基于社會網絡聚類的股票指數跟蹤預測方法,其特征在于,在步驟(2)中,所述指數跟蹤優化模型是通過最優化模型實現股票池股票對標的指數的最優跟蹤,具體為:用股票池股票的線性組合得到跟蹤指數,以跟蹤指數與標的指數的跟蹤誤差最小為目標,進行二次優化模型求解股票的最優線性組合,確定最優權重。
5.根據權利要求3所述的基于社會網絡聚類的股票指數跟蹤預測方法,其特征在于,在步驟(2)中,用成份股間的相關系數計算度量距離,構建成份股間的社會網絡,用自適應仿射傳播聚類算法對網絡進行聚類,提取每簇的聚類中心形成股票池,具體如下:
A、計算研究樣本的對數收益率ri(t),ri(t)=lnpi(t)-lnpi(t-1),得到指數以及成份股的對數收益率序列;其中,pi(t)表示第i只成分股在第t時間的前復權收盤價;
B、基于對數收益率序列,計算任意兩只股票i和j在觀測時間內股價波動的線性相關系數ρij,其中E(ri)表示第i只股票在樣本內的平均對數收益率,t1表示樣本內總交易天數;
C、根據任意兩只股票間的相關系數構建相應的相關系數矩陣C,其中C為對角線為1的對稱矩陣;
D、將相關系數ρij轉化為對應的度量距離dij,將相關系數矩陣C轉化為距離矩陣D,以距離矩陣D表示任意兩只股票間的度量距離,得到成份股間的社會網絡,其中D為對角線為0的對稱矩陣;
E、對成份股間的社會網絡進行自適應仿射傳播AAP聚類,通過不斷調整偏向參數值確定一系列包含不同簇的聚類結果,并提取每一組聚類結果的每簇的聚類中心分別構建股票池。
6.根據權利要求5所述的基于社會網絡聚類的股票指數跟蹤預測方法,其特征在于,在步驟(2)中,針對每組聚類結果,通過二次指數跟蹤優化模型確定最優權重,并引入跟蹤誤差TE度量指數跟蹤效果的好壞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710100466.2/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





