[發明專利]一種基于斜率關聯度的顯著變量選擇方法在審
| 申請號: | 201711032726.3 | 申請日: | 2017-10-30 |
| 公開(公告)號: | CN107704723A | 公開(公告)日: | 2018-02-16 |
| 發明(設計)人: | 鄒見效;向偉;凡時財;徐紅兵 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 成都行之專利代理事務所(普通合伙)51220 | 代理人: | 溫利平 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 斜率 關聯 顯著 變量 選擇 方法 | ||
技術領域
本發明屬于時間序列分析技術領域,更為具體地講,涉及一種基于斜率關聯度的顯著變量選擇方法。
背景技術
隨著計算機軟件和硬件的快速發展,人們對日常生活中積累的數據信息的關注和分析也日趨增加,這些數據中大多都是與時間相關的,可以簡要說是與時間序列相關的。例如,氣象預報中降雨量數據序列、股票價格波動數據序列、某產品的交易或銷售數據序列等等,這些數據按照時間先后組成時間序列數據。從統計意義上講,所謂時間序列就是將某一個指標在不同時間上的不同數值,按照時間的先后順序排列而成的數列。這種數列由于受到各種偶然因素的影響,往往表現出某種隨機性,彼此之間存在著統計上的依賴關系。
而從這些時間序列數據中挖掘出隱含的有價值的數據信息,有利于揭示或預測時間序列事件變化規律,從而發現歷史序列數據和現今及未來數據之間的聯系及相互關系,即以某種標準來度量時間序列之間的相似性,并以此為基礎來分析時間序列數據之間的相似性問題
目前,灰色關聯分析被廣泛采用,其中,鄧氏關聯度是最早最為經典的關聯度模型。按照鄧氏關聯度的定義和基本思想,關聯度體現的實際上是兩序列曲線之間的幾何相似程度,如果相似程度大,則關聯度高,反之亦然。但是通常會出現以下問題:兩序列在無量綱處理(如初值化、均值化等)前可能非常相似,即關聯度很大,但經處理后并不相似,此時關聯度就小,前后結果并不一致。
發明內容
本發明的目的在于克服現有技術的不足,提供一種基于斜率關聯度的顯著變量選擇方法,通過計算斜率關聯度來分析時間序列相似性,克服傳統鄧氏關聯度模型存在的無量綱化后不能保序等問題。
為實現上述發明目的,本發明一種基于斜率關聯度的顯著變量選擇方法,其特征在于,包括以下步驟:
(1)、分析歷史數據,確定以特征序列作為目標變量的歷史數據而構成的時間序列,以及以影響因素序列作為各影響因素的歷史數據而構成的時間序列;
(2)、對特征序列和影響因素序列進行異常值和缺失值處理,得到完整歷史時間序列;
(3)、對完整歷史時間序列進行定量分析,并運用斜率關聯模型計算出每個影響因素和目標變量之間的關聯度;
(3.1)、計算變量的斜率:
其中,k=0表示目標變量,k=1,2,3,…,n,表示影響因素,n為影響因素總個數,xk(t)表示第k個變量對應的完整時間序列的第t個樣本數據,Δxk(t)表示第k個變量對應的完整時間序列的第t+1個樣本數據和第t個樣本數據的差值,σk表示第k個變量的標準差;
(3.2)、計算第j個影響因素與目標變量的關聯系數δij(t):
其中,i=0表示目標變量,j=1,2,3,…,n,表示影響因素;
(3.3)、計算第j個影響因素與目標變量的關聯度γij:
其中,m表示完整歷史時間序列中樣本數據總量;
(3.4)、重復步驟(3.1)~(3.3),計算出所有影響因素與目標變量的關聯度;
(4)、對得到的所有關聯度從大到小排序,再根據預設閾值ε,選出關聯度較大的前n+ε個關聯度,組成關聯度序列;
(5)、將關聯度序列中對應的n+ε個影響因素進行專家經驗論證、定性分析,最終確定n個影響因素作為選擇的顯著變量。
本發明的發明目的是這樣實現的:
本發明一種基于斜率關聯度的顯著變量選擇方法,利用斜率關聯度模型,通過先計算各變量時間序列的斜率,再計算出關聯度系數,得到關聯度,并組成關聯序,反映了關聯度從大到小的排列,它的幾何意義在于,曲線同一時刻變化的斜率越接近,則關聯度越大,最后我們對關聯度較大的影響因素作為選擇的顯著變量,而顯著變量越大表示時間序列的相似度越高。
同時,本發明基于斜率關聯度的顯著變量選擇方法還具有以下有益效果:
(1)、通過計算斜率關聯度來分析時間序列相似性,克服傳統鄧氏關聯度模型存在的無量綱化后不能保序等問題。
(2)、同時通過實驗結果可以發現,斜率關聯度模型的準確度要比傳統的鄧氏關聯度模型的準確度高;
附圖說明
圖1是本發明基于斜率關聯度的顯著變量選擇方法流程圖;
圖2是各影響因素和目標變量之間的時間序列走勢圖;
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711032726.3/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





