[發明專利]基于標準量化參數動態篩選海量數據的方法及其在金融證券領域的應用在審
| 申請號: | 201410122235.8 | 申請日: | 2014-03-30 |
| 公開(公告)號: | CN104123668A | 公開(公告)日: | 2014-10-29 |
| 發明(設計)人: | 曾盛敏 | 申請(專利權)人: | 廣州天策軟件科技有限公司 |
| 主分類號: | G06Q40/04 | 分類號: | G06Q40/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 標準 量化 參數 動態 篩選 海量 數據 方法 及其 金融證券 領域 應用 | ||
技術領域
本發明涉及篩選數據的方法,尤其是一種基于標準量化參數動態篩選數據的方法,這種方法在金融證券領域能夠被廣泛的應用。?
??
背景技術
人類進入“大數據”時代,隨之而來的數據倉庫、數據安全、數據分析、數據挖掘等等圍繞大數據的商業價值的利用逐漸成為行業人士爭相追捧的利潤焦點。數據分析和數據挖掘被深入的研究并取得廣泛應用的領域。所謂數據分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料進行分析,以求最大化地開發數據資料的功能,發揮數據的作用;數據挖掘是指從數據庫的大量數據中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。基于長期對大數據的應用,尤其是對金融證券領域數據的研究和應用發現,金融數據尤其是股票、期貨等證券數據其具有三個顯著的共性:一是數量化;二是數量化數據動態化;二是數量化數據符合統計學的概率分布。盡管對金融數據三個共性并不陌生,但是直接應用上述數據共性,系統化成為海量數據篩選方法指導并提供決策,這是個空白。以最為常見利用數量化數據選擇股票為例,現有系統的操作是通過外部設置參數或閥值,直接從海量的數據中篩選標的股票,這種方法僅僅關注和應用了數據數量化的特點,而忽視了數據動態性以及符合統計學概率分布的特點,實際效果并不理想。?
??
發明內容
本發明提供一種基于標準量化參數動態篩選數據的方法,這種方法充分考慮和應用了數據數量化、動態化以及符合統計學概率分布的特點,能夠將從海量量化數據中篩選出符合標準量化參數篩選條件的數據。這種方法最為直接的應用就是金融證券領域,本發明還公開了應用基于標準量化參數動態選擇股票組合的方法以及選擇期貨品種的方法。?
????為達到上述目的,本發明應用于在海量數據中量化分析篩選符合決策條件數據集合用于決策,其步驟包括:?
?????(1)通過數據接收端接收數據源提供的海量數據;
?????(2)預處理海量數據,提取海量數據中的量化數據,編制整理形成量化數據倉庫;
?????(3)形成標準量化參數作為篩選數據的篩選條件:選取量化數據中的一類數據,作為一個樣本空間,根據概率分布計算樣本空間中這類數據的標準差,然后計算樣本空間標準差的倍數,以此數值與平均值之間形成的偏離數量關系作為篩選條件;
?????(4)利用步驟(3)形成的篩選條件,在樣本空間中篩選出符合條件的數據集合并保存;
?????(5)循環步驟(3),選擇量化數據中與上一次相異的另一類數據,計算形成另一標準量化參數,進而循環步驟(4)形成另一組數據集合;
?????(6)當根據步驟(3)至(5)形成至少一組數據集合后,將各組集合做交/并集合運算形成符合最終篩選條件的決策集合;
?????(7)輸出決策集合,提供最后決策根據。
????步驟(2)和步驟(3)之間可以通過外部設置參數對量化數據倉庫的數據進行預篩選。?
步驟(3)形成的標準量化參數表述三種形式:<1>大于平均值偏離標準差N倍;<2>小于平均值偏離標準差N倍;<3>介于平均值偏離標準差-N倍至-M倍之間或介于平均值偏離標準差+N倍至-M倍之間或介于平均值偏離標準差+N倍至+M倍之間。?
倍數N和M在步驟(3)和步驟(4)之間通過外部預設賦值,倍數N和M為絕對值,正負號在于定義偏離是位于平均值的左側或是右側。通常的定義是正號表示偏離在平均值的右側,負號表示偏離在平均值得左側。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州天策軟件科技有限公司,未經廣州天策軟件科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410122235.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車裝鉆機轉盤動力輸入裝置
- 下一篇:中藥提取自動投料機構





