[發明專利]一種基于稀疏時間序列數據的事件發生時間預測方法在審
| 申請號: | 202111576670.4 | 申請日: | 2021-12-22 |
| 公開(公告)號: | CN114239743A | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 付波;劉術輝 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/764;G06N20/00 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 鄒裕蓉 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稀疏 時間 序列 數據 事件 發生 預測 方法 | ||
1.一種基于稀疏時間序列數據的事件發生時間預測方法,其特征在于:
S1.對稀疏時間序列數據進行數據分類,將在觀測時間長度內未發生變換的作為靜態數據,持續隨時間變化的作為動態數據,間斷出現且只有0與1兩種狀態的作為離散數據;
S2.按數據類別進行特征提取:
對于靜態數據,選取與事件相關的特征作為靜態數據特征;
對于動態數據,先按事件是否發生進行分組,再對各動態數據提取數據特征,再計算數據特征的置信度,再按保留置信度小于0.1的數據特征的方式進行篩選;篩選后的數據特征作為原始動態特征,再將原始動態特征對應時間點之前的一段時間的數據特征作時序特征,原始動態特征和其對應的時序特征合并為最終的動態數據特征;
對于離散數據,先對離散數據進行獨熱編碼作為離散數據的原始離散特征,再對每個原始特征統計在對應時間點之前的原始特征出現次數作為計數特征,原始離散特征和其對應的計數特征合并為最終的離散數據特征;
S3.將同一時間點的靜態數據特征、時間特征序列和離散數據特征進行拼接形成模型的輸入特征,再按照事件是否發生進行貼標后形成訓練數據;將觀測時間內的訓練數據形成訓練集輸入至事件發生預測模型中進行訓練;
S4.將待預測的稀疏時間序列數據通過S1-S2步驟,將同一時間點的靜態數據特征、時間特征序列和離散數據特征進行拼接形成模型的輸入特征輸入至訓練完成的事件發生預測模型中,事件發生預測模型輸出對應時間點是否發生事件的預測結果。
2.如權利要求1方法,其特征在于,計算數據特征的置信度之前,先判斷特征是否屬于無法使用數字進行量化或者觀測次數少于總事件發生次數的情況,如是,則丟棄該數據特征,否則再計算該算數據特征的置信度。
3.如權利要求1方法,其特征在于,計算數據特征的置信度的具體方式為:對于每一個數據特征使用KS檢驗該數據特征的分布是否服從正態分布,如是則使用獨立樣本的T檢驗計算置信度,否則使用Mann-Whitney U檢驗計算置信度。
4.如權利要求1方法,其特征在于,原始動態特征Fi(t)對應的時序特征為:Fi(t-2),Fi(t-4),Fi(t)-Fi(t-1),Fi(t-1)-Fi(t-3),t為當前時間點。
5.如權利要求1方法,其特征在于,事件發生預測模型由多個子模型組成,在事件發生預測模型訓練過程中,使用多折交叉驗證方法將訓練集輸入多個子模型訓練,并使用多個子模型輸出的均值作為最后的預測值。
6.如權利要求5方法,其特征在于,在事件發生預測模型訓練過程中,采用自定義評價函數和貝葉斯超參數優化訓練子模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111576670.4/1.html,轉載請聲明來源鉆瓜專利網。





