[發明專利]數據特征提取的方法、裝置、計算機設備和存儲介質在審
申請號: | 201810362785.5 | 申請日: | 2018-04-20 |
公開(公告)號: | CN108763305A | 公開(公告)日: | 2018-11-06 |
發明(設計)人: | 王義文;王健宗;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q20/38 |
代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 數據特征提取 原始數據 區塊 計算機設備 存儲介質 算法 申請 特征數據 離散點 篡改 | ||
本申請揭示了本申請的數據特征提取的方法、裝置、計算機設備和存儲介質,用于對區塊鏈上的數據進行數據特征提取,其中方法包括:獲取區塊鏈上的原始數據;將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據。本申請利用數據是區塊鏈上下載的,其無法篡改的特性,所以在數據特征提取的過程中并沒有進行離散點處理的過程,而使用CCIPCA算法直接進行數據特征提取,數據特征提取更快。
技術領域
本申請涉及到計算機技術領域,特別是涉及到一種數據特征提取的方法、裝置、計算機設備和存儲介質。
背景技術
區塊鏈是一種去中心化、無需信任的新型數據架構,它由網絡中所有的節點共同擁有、管理和監督,不接受單一方面的控制。
區塊鏈是一個剛剛興起的技術,各企業正在做前期的技術研發和發展布局,所以對區塊鏈上的數據進行分析是一個必要的過程,但是隨著區塊鏈上的數據日益增多,如何快速地提取區塊鏈上的原始數據的特征數據,是亟需解決的問題。
發明內容
本申請的主要目的為提供一種數據特征提取的方法、裝置、計算機設備和存儲介質,旨在可以快速提取區塊鏈上的原始數據的特征數據。
本申請提出一種數據特征提取的方法,用于對區塊鏈上的數據進行數據特征提取,所述方法包括:
獲取區塊鏈上的原始數據;
將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據。
進一步地,所述將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據的步驟,包括:
對所述原始數據進行加窗處理;
將窗口內的原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據。
進一步地,所述將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據的步驟,包括:
將獲取的所述原始數據存入到緩存區;
將緩存區內的原始數據分批次地輸入所述CCIPCA算法中,當一個批次的原始數據輸入完畢后,開始進行迭代計算,得到所述原始數據的特征數據。
進一步地,所述將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據的步驟,包括:
在CCIPCA算法計算時,對于第一個待求的特征數據,先輸入第一個樣本進行計算直到其收斂,對后面的輸入樣本計算殘差以計算后一個特征數據,并以此類推,逐個計算特征數據。
進一步地,所述將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據的步驟之后,包括:
將獲取到的特征數據分批次地進行相關矩陣分析;
將同一批次中與該批次內的其它特征數據不相關的不相關特征數據,按照預設規則進行處理。
進一步地,所述將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據的步驟之后,包括:
將輸出的特征數據實時地添加到可視化的散點圖中。
進一步地,所述將所述原始數據輸入到CCIPCA算法中計算所述原始數據的特征數據的步驟之后,包括:
對輸出的特征數據進行分類;
將分類后的特征數據輸入到對應的運算模型進行計算。
本申請還提供一種數據特征提取的裝置,用于對區塊鏈上的數據進行數據特征提取,所述裝置包括:
獲取單元,用于獲取區塊鏈上的原始數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810362785.5/2.html,轉載請聲明來源鉆瓜專利網。