[發明專利]一種高維數據協同變化幅度識別方法及裝置有效
| 申請號: | 202011592277.X | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112685509B | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 通聯數據股份公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/26;G06F16/2458 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 許曼;賈磊 |
| 地址: | 200085 上海市虹*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 協同 變化 幅度 識別 方法 裝置 | ||
本文提供了一種高維數據協同變化幅度識別方法及裝置,其中,方法包括:對高維數據樣本進行預處理,得到數據矩陣X,其中,預處理包括:對齊高維數據的頻率及填補高維數據的缺失值;利用抽樣周期T0對數據矩陣X進行抽樣處理,得到多個子數據矩陣Xi;根據所有子數據矩陣Xi,計算所述數據矩陣X的協方差矩陣估計V;對所述協方差矩陣估計V進行特征分解,得到特征向量Vx;將數據矩陣X在特征向量Vx方向進行投影,得到高維數據協同變化幅度。本實施例能夠解決高維數據頻率不一、發布時間不對齊的問題,使得計算出的高維數據協同變化幅度與實際情況相符,提高高維數據協同變化幅度的精確度。
技術領域
本文涉及數據分析領域,尤其涉及一種高維數據協同變化幅度識別方法及裝置。
背景技術
現有技術中存在較多的高維數據,例如聲波陣列信號、強噪環境信號、金融數據及經濟數據等,這些高維數據包含多個變量(也可稱之為指標),這些變量之間存在協同性變化,以經濟數據(包含多個經濟變量)為例,現有對經濟數據協同性變化分析的主要實現方式為:利用Geweke、Sargent和Sims(1977)提出的動態因子模型(Dynamic Factor Model,DFM)從一系列宏觀經濟變量中提取出單一因子,以描述變量間的協同運動,從而解決了采用單一經濟變量表示數據變化存在的局限性。但是,該方法僅能僅能處理頻率相同的經濟數據,且當分析數據的維度增加時,DFM模型將變得不穩定。伴隨社會分工細化和經濟活動多樣化,經濟數據的維度呈現出暴發增長,該分析方法難以精確的確定經濟數據的協同變化幅度,進而使得利用經濟數據協同變化幅度分析得到的經濟周期、經濟周期拐點判斷不準確。
發明內容
本文用于解決現有技術中,對于高維數據的分析僅從中提取單一變量因子,用于表示高維數據中所有變量的協同變化,該種方法并不能精確地表示高維數據協同變化幅度的問題。
為了解決上述問題,本文的第一方面提供一種高維數據協同變化幅度識別方法,包括:
對高維數據樣本進行預處理,得到數據矩陣X,其中,預處理包括:對齊高維數據的頻率及填補金融數據的缺失值;
利用抽樣周期T0對數據矩陣X進行抽樣處理,得到多個子數據矩陣Xi;
根據所有子數據矩陣Xi,計算所述數據矩陣X的協方差矩陣估計V;
對所述協方差矩陣估計V進行特征分解,得到特征向量Vx;
將數據矩陣X在特征向量Vx方向進行投影,得到高維數據協同變化幅度。
本文進一步實施例中,填補所述高維數據的缺失值包括:利用如下公式所示的前向插值法填補所述高維數據的缺失值:
E[Dt,j]=Dt-k,j,
其中,Dt-k,j為高維數據中的j變量在采樣時間t之前最近可得的數據記錄,E[Dt,j]為高維數據中的j變量在采樣時間t的填充值,t-k為最近的數據記錄的采樣時間。
本文進一步實施例中,根據所有子數據矩陣Xi,計算所述數據矩陣X的協方差矩陣估計V,包括:
利用Newey-West協方差矩陣調整方法,估計各子數據矩陣Xi的協方差矩陣Vi;
對各子數據矩陣Xi的協方差矩陣Vi進行加權平均處理,將計算得到的平均值作為所述數據矩陣X的協方差矩陣估計V。
本文進一步實施例中,對所述協方差矩陣估計V進行特征分解,得到特征向量Vx,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于通聯數據股份公司,未經通聯數據股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011592277.X/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





