[發明專利]一種金融大數據優化存儲方法在審
| 申請號: | 202211532808.5 | 申請日: | 2022-12-02 |
| 公開(公告)號: | CN115543946A | 公開(公告)日: | 2022-12-30 |
| 發明(設計)人: | 岳發宇 | 申請(專利權)人: | 陜西湘秦衡興科技集團股份有限公司 |
| 主分類號: | G06F16/174 | 分類號: | G06F16/174;H03M7/30;G06Q40/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 710082 陜西省西安*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 金融 數據 優化 存儲 方法 | ||
本發明涉及數據處理技術領域,具體涉及一種金融大數據優化存儲方法,該方法包括:獲取股價數據,對股價數據進行二進制編碼得到二進制編碼數據,得到多段目標二進制數據,獲取每段目標二進制數據的最優字典滑窗長度,對目標二進制數據進行壓縮并存儲,本發明通過自適應獲取的最優字典滑窗長度,從而在利用LZ77編碼算法編碼時,實現對數據的高效壓縮,進而減少壓縮后的數據占用的存儲空間。
技術領域
本發明涉及數據處理技術領域,具體涉及一種金融大數據優化存儲方法。
背景技術
隨著社會的不斷發展,人們投資意識的不斷提高,越來越多的人加入了股票投資市場的行列,使得股票市場不斷的壯大起來。而股票市場的快速發展,不僅可以為就業問題做出良好的改善,還可以為經濟的增長做出突出貢獻,因此,提高股票的收益率,不斷壯大股票市場,就變得尤為重要。
目前最能有效預測股價的方法為大數據分析,通過股票價格的浮動去預測未來的走勢,但是這需要海量的股票價格數據做支撐,而股票市場從成立到現在,已經儲蓄了大量的數據,在進行大數據分析時,預處理數據的難度極大,且儲存所占空間較大,增添了不必要的成本與精力,因此如何將該數據在不丟失原始信息的同時降低儲存空間是急需要解決的問題。
目前的壓縮算法有LZ77編碼算法,LZ77編碼算法可以對數據進行壓縮,然后對壓縮后的數據進行儲存,但是在壓縮過程中,由于股票價格的波動數據變化較小且具有一定的規律,傳統的LZ77編碼算法對該數據進行壓縮時,字典滑窗長度始終唯一,對于整體數據來說,長度唯一的字典滑窗在某一段數據內適應度較高,壓縮速率相對應較高,但長度唯一的字典滑窗對于不適應的數據段來說,壓縮效率便較低,故使得整體數據的壓縮效率低,進而導致存儲占用空間大。
發明內容
本發明提供一種金融大數據優化存儲方法,以解決現有的壓縮效率低,導致存儲占用空間大的問題。
本發明的一種金融大數據優化存儲方法采用如下技術方案:
獲取每天的股價數據;
對每天的股價數據進行二進制編碼得到二進制編碼數據;
獲取每相鄰兩天的股價數據對應的波動圖,根據波動圖中的股價數據獲取相鄰兩天的股價數據的平穩程度;
獲取相鄰兩天的股價數據的差異性值,根據差異性值和平穩程度獲取相鄰兩天的股價數據的關聯程度,根據相鄰兩天的股價數據的關聯程度判斷是否對連續相鄰天的股價數據所對應的二進制編碼數據進行合并,并得到多段目標二進制數據;
獲取每段目標二進制數據中每類相同的數據串出現的頻率及對應類的數據串長度,根據每類相同的數據串出現的頻率及數據串長度獲取每類相同的數據串對應的匹配率,根據匹配率、最高頻率數據串的長度和各數據串的長度大小確定目標二進制數據的最優字典滑窗長度;
利用最優字典滑窗長度將對應的目標二進制數據進行壓縮并存儲。
優選的,得到多段目標二進制數據包括:
其中,每段目標二進制數據包括第一目標二進制數據或者第二目標二進制數據;
第一目標二進制數據由連續相鄰天的股價數據對應的二進制編碼數據構成,且連續相鄰天的股價數據中的每相鄰兩天的股價數據的關聯程度均大于關聯程度閾值;
第二目標二進制數據由單天的股價數據對應的二進制編碼數據構成,該單天對應的所有相鄰兩天的股價數據的關聯程度均小于或者等于關聯程度閾值。
優選的,獲取每類相同的數據串對應的匹配率包括:
獲取每類相同的數據串出現的頻率與對應類的數據串長度的目標比值;
以自然常數為底,以目標比值的負值為冪得到指數函數值;
將1減去指數函數值得到每類相同的數據串對應的匹配率。
優選的,獲取相鄰兩天的股價數據的平穩程度包括:
設定第一權重系數和第二權重系數,且第一權重系數小于第二權重系數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西湘秦衡興科技集團股份有限公司,未經陜西湘秦衡興科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211532808.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





