[發明專利]一種行為數據的可預測性評估方法、系統及介質在審
| 申請號: | 202010135440.3 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111444176A | 公開(公告)日: | 2020-07-24 |
| 發明(設計)人: | 曹健 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2455;G06F16/2458 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 行為 數據 預測 評估 方法 系統 介質 | ||
本發明提供了一種行為數據的可預測性評估方法、系統及介質,包括:步驟M1:通過探針采集行為數據;步驟M2:根據不同的時間間隔單元將行為數據轉換為各個時間點上的行為次數時間序列;步驟M3:從各個時間點上的行為次數時間序列中提取出活躍片段;步驟M4:計算所有活躍片段的相鄰值,比較排列熵;步驟M5:比較在不同時間間隔單元設置下獲得的活躍片段的相鄰值比較排列熵高低,根據排列熵的高低,確定行為序列數據的可預測性高低。本發明能夠支持從多種時間間隔單元對序列數據進行可預測性分析,得出的結論能夠全面的揭示其可預測性。
技術領域
本發明涉及行為數據分析、行為序列數據預測領域,具體地,涉及一種行為數據的可預測性評估方法、系統及介質。
背景技術
隨著互聯網技術的發展,人們的行為越來越多元化,相應的,也通過各種渠道留下了海量的行為數據。這些行為數據涉及到了眾多的領域,具有多種類型,增長速度非常迅速,這些數據中蘊含了越來越多的可挖掘價值。
將發生在特定時間的行為次數按照一定的時間單位進行累計后,形成行為時間序列數據。為了確定未來的行為規律,需要對行為時間序列進行預測。但是每一個人的行為(具體而言是未來各個單位時間內的行為次數)是否可以(是否值得)預測需要評估。本發明中提出了評估行為序列數據可預測性的方法。
發明內容
針對現有技術中的缺陷,本發明的目的是提供一種行為數據的可預測性評估方法、系統及介質。
根據本發明提供的一種行為數據的可預測性評估方法,包括:
步驟M1:通過探針采集行為數據;
步驟M2:根據不同的時間間隔單元將行為數據轉換為各個時間點上的行為次數時間序列;
步驟M3:從各個時間點上的行為次數時間序列中提取出活躍片段;
步驟M4:計算所有活躍片段的相鄰值,比較排列熵;
步驟M5:比較在不同時間間隔單元設置下獲得的活躍片段的相鄰值比較排列熵高低,根據排列熵的高低,確定行為序列數據的可預測性高低。
優選地,所述步驟M2中的時間間隔單元是能體現出行為規律的時間間隔單元,記錄每個時間間隔內的行為總次數從而形成行為次數時間序列。
優選地,所述步驟M3包括:
步驟M3.1:取出行為次數時間序列的最后一個非0值;
步驟M3.2:行為次數時間序列從最后一個非0值往前遍歷索引,直到行為次數時間序列當前值到最后一個非0值中的0值數量占當前索引行為次數時間序列段中所有值的數量占比高于預設值;
步驟M3.3:從行為次數時間序列中當前值往前遍歷索引,去除前置的連續0值,將當前次數時間序列保存入活躍片段集中;
步驟M3.4:重復執行步驟M3.1至步驟M3.3,直至得到各個時間點上的行為次數時間序列的所有活躍片段。
優選地,所述步驟M4包括:
步驟M4.1:預設相鄰值比較排列熵的嵌入維度m,表示計算相鄰值比較排列熵時取出的子序列的長度;預設相鄰值比較排列熵的時間延遲算子L,表示計算相鄰比較排列熵時,從序列中每隔預設值取出一個序列值;將活躍片段序列重構成若N-m+1干子序列X(1),X(2),…,X(N-m+1);其中,X(i)={u(i),u(i+L),u(i+2L),…,u(i+(m-1)L)}為重構后的行為次數子序列,u(i)表示第i個時間點的行為次數值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010135440.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





