[發明專利]一種基于稀疏時間序列數據的事件發生時間預測方法在審
| 申請號: | 202111576670.4 | 申請日: | 2021-12-22 |
| 公開(公告)號: | CN114239743A | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 付波;劉術輝 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/764;G06N20/00 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 鄒裕蓉 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稀疏 時間 序列 數據 事件 發生 預測 方法 | ||
本發明公開了一種基于稀疏時間序列數據的事件發生時間預測方法,分為統計特征選擇和模型訓練測試兩個步驟依次實施,統計特征選擇是采用單因素分析的方法,通過統計檢驗初步選擇出有顯著差異的特征;模型訓練測試是使用篩選完成的特征構造新的時間序列特征并使用梯度提升樹進行訓練。本發明簡化了特征構造方式,有效解決了時序數據的特征構造在不同的數據系統中存在較大差異無法通用的問題,同時預測精度相比于其他的方法提升明顯。
技術領域
本發明涉及機器學習技術,特別涉及基于時間序列數據的事件預測技術。
背景技術
時間序列數據是一串按時間維度索引的數據,這類數據描述了某個被測量的主體在一個時間范圍內的每個時間點上的測量值。對時序數據通常會包含三個部分,分別是:主體,時間點和測量值。稀疏表示的目的就是在給定的超完備字典中用盡可能少的原子來表示信息,可以獲得信息更為簡潔的表示方式,從而使我們更容易地獲取信號中所蘊含的信息,更方便進一步對信號進行加工處理。基于稀疏時間序列數據的事件發生時間預測,用于根據稀疏表示的時間序列數據來預測某個時間在指定時間是否發生,該應用在生活中無處不在,從對自然環境、人體行為或者身體機能各方面的事件的判斷上,比如天氣預報與各種預警系統。
機器學習在時序數據預測上有很多的成果,在這方面應用最廣泛的是循環神經網絡。但是循環神經網絡對數據的要求較高,需要數據是連續且不能存在空值,而且現有的循環神經網絡模型都存在特異度較高而靈敏度較低的問題。其他還有隨機森林和梯度提升樹等模型,雖然模型的精度較高,但是無法處理時間序列數據,或者需要根據數據本身的特點手動構造,在不同的時間序列數據中無法通用,處理過程非常繁瑣。
發明內容
本發明所要解決的技術問題是,提供一種自動構造基于時間序列數據的特征來進行事件是否發生的預測方法。
本發明為解決上述技術問題所采用的技術方案是,一種基于稀疏時間序列數據的事件預測方法,包括:
S1.對稀疏時間序列數據進行數據分類,將在觀測時間長度內未發生變換的作為靜態數據,持續隨時間變化的作為動態數據,間斷出現且只有0與1兩種狀態的作為離散數據;
S2.按數據類別進行特征提取:
對于靜態數據,選取與事件相關的特征作為靜態數據特征;
對于動態數據,先按事件是否發生進行分組,再對各動態數據提取數據特征,再計算數據特征的置信度,再按保留置信度小于0.1的數據特征的方式進行篩選;篩選后的數據特征作為原始動態特征,再將原始動態特征對應時間點之前的一段時間的數據特征作時序特征,原始動態特征和其對應的時序特征合并為最終的動態數據特征;
對于離散數據,先對離散數據進行獨熱編碼作為離散數據的原始離散特征,再對每個原始特征統計在對應時間點之前的原始特征出現次數作為計數特征,原始離散特征和其對應的計數特征合并為最終的離散數據特征;
S3.將同一時間點的靜態數據特征、時間特征序列和離散數據特征進行拼接形成模型的輸入特征,再按照事件是否發生進行貼標后形成訓練數據;將觀測時間內的訓練數據形成訓練集輸入至事件發生預測模型中進行訓練;
S4.將待預測的稀疏時間序列數據通過S1-S2步驟,將同一時間點的靜態數據特征、時間特征序列和離散數據特征進行拼接形成模型的輸入特征輸入至訓練完成的事件發生預測模型中,事件發生預測模型輸出對應時間點是否發生事件的預測結果。
進一步的,事件發生預測模型由多個子模型組成,在事件發生預測模型訓練過程中,使用多折交叉驗證方法將訓練集輸入多個子模型訓練,采用自定義評價函數和貝葉斯超參數優化訓練子模型,并使用多個子模型輸出的均值作為最后的預測值;
本發明方法運用統計特征篩選,以簡單時間相關來構造特征。本發明的有益效果是:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111576670.4/2.html,轉載請聲明來源鉆瓜專利網。





