[發明專利]一種時間序列中的異常數據校正方法、裝置及處理設備在審
| 申請號: | 201810556799.0 | 申請日: | 2018-06-01 |
| 公開(公告)號: | CN108846058A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 李瑩潔 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 李輝 |
| 地址: | 英屬開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 時間序列 校正 異常數據 處理設備 變化趨勢 自動識別 自動校正 準確度 分解 不規則 | ||
本說明書的一個實施例提供一種對時間序列中的異常數據進行校正的方法、裝置及處理設備,該方法包括:對時間序列進行分解,至少分解出第一時間序列和第二時間序列,所述第一時間序列反映所述時間序列的變化趨勢,所述第二時間序列反映所述時間序列的不規則變動;分別校正所述第一時間序列和/或所述第二時間序列;根據校正后的所述第一時間序列和/或校正后的所述第二時間序列生成校正后的所述時間序列。利用本發明技術方案,可以自動識別時間序列中的異常數據并進行自動校正,提高了異常數據校正的效率和準確度。
技術領域
本說明書實施例涉及數據處理技術領域,特別涉及一種時間序列中的異常數據校正方法、裝置及處理設備。
背景技術
時間序列分析是一種應用廣泛的分析方法,其主要目的是根據已有的歷史數據對未來進行預測,通常應用在國民經濟宏觀控制、區域綜合發展規劃、企業經營管理、市場潛量預測、風險業務控制、氣象預報、水文預報、地震前兆預報、農作物病蟲災害預報、環境污染控制等方面。
在時間序列分析中,時間序列中的異常數據的檢測與校正是該領域的一個基礎且重要的問題。異常數據會影響整個時間序列分析模型預測的準確率,例如,如果一個時間序列當中存在多個有影響的異常數據,會大大降低時間序列分析模型預測的準確率。
應該注意,上面對技術背景的介紹只是為了方便對本說明書實施例的技術方案進行清楚、完整的說明,并方便本領域技術人員的理解而闡述的。不能僅僅因為這些方案在本說明書實施例的背景技術部分進行了闡述而認為上述技術方案為本領域技術人員所公知。
發明內容
本說明書的一個實施例提供一種對時間序列中的異常數據進行校正的方法,能夠提高異常數據校正的效率和準確度。
根據本說明書實施例的一個方面,提供一種對時間序列中的異常數據進行校正的方法,所述方法包括:
對時間序列進行分解,至少分解出第一時間序列和第二時間序列,所述第一時間序列反映所述時間序列的變化趨勢,所述第二時間序列反映所述時間序列的不規則變動;
分別校正所述第一時間序列和/或所述第二時間序列;
根據校正后的所述第一時間序列和/或校正后的所述第二時間序列生成校正后的所述時間序列。
根據本說明書實施例的第二方面,提供一種如第一方面所述的方法,其中,所述校正所述第一時間序列包括:
對所述第一時間序列進行線性擬合或者非線性擬合,生成校正后的第一時間序列。
根據本說明書實施例的第三方面,提供一種如第一方面所述的方法,其中,所述校正所述第二時間序列包括:
對所述第二時間序列中超過規定的置信區間的異常數據進行校正。
根據本說明書實施例的第四方面,提供一種如第三方面所述的方法,其中,對所述異常數據進行校正包括:
利用所述第二時間序列的部分或全部數據校正所述異常數據。
根據本說明書實施例的第五方面,提供一種如第四方面所述的方法,其中,在所述異常數據處于所述第二時間序列的第一個時間單位內的情況下,用所述第二時間序列的平均值替換所述異常數據;
在所述異常數據處于所述第二時間序列的最后一個時間單位內的情況下,用所述第二時間序列的平均值替換所述異常數據;
在所述異常數據不處于所述第一個時間單位內并且也不處于所述最后一個時間單位內、并且所述異常數據是其所處的時間單位中的第m個數據的情況下,用所述異常數據所處的該時間單位的前一個時間單位的第m個數據和后一個時間單位內的第m個數據的平均值替換所述異常數據,其中m為自然數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810556799.0/2.html,轉載請聲明來源鉆瓜專利網。





