[發明專利]一種基于數據挖掘技術的用戶行為分析系統及方法在審
| 申請號: | 202110260276.3 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112990291A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 胡旭光;李正;馬大中;胡旌偉;孫秋野;李希博;王鵬程;李程晨;王雷 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 李珉 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 挖掘 技術 用戶 行為 分析 系統 方法 | ||
1.一種基于數據挖掘技術的用戶行為分析系統,其特征在于,包括溫度數據采集單元、手機控制終端以及服務器端;
所述溫度數據采集單元由單片機、溫度傳感器、Wi-Fi通信模塊和電源模塊構成,單片機與溫度傳感器連接,接收到手機控制終端的喚醒命令后,通過I2C總線協議從溫度傳感器讀取溫度數據,通過Wi-Fi通信模塊發送給手機控制終端,電源模塊是單節鋰聚合物電池和穩壓芯片,分別與單片機、溫度傳感器、Wi-Fi通信模塊的電源接口連接;
所述手機控制終端為用戶行為特征提取單元,通過Wi-Fi通信模塊與溫度數據采集單元通信,獲取實時溫度數據,對溫度數據進行加工,添加對應的時間、GPS方位、當前天氣溫度數據等數據,并對溫度數據進行中位值平均濾波處理,通過分布式存儲技術分割存儲,并將數據經手機上傳至服務器端;
所述服務器端包括用戶群體分類單元、關聯因素辨識及綜合應用單元;所述用戶群體分類單元結合基于時間序列的數據挖掘技術,對上傳服務器端的不同時間、地點、天氣下溫度采集單元采集到的溫度信息進行分類,建立用戶分類模型;所述關聯因素辨識及綜合應用單元對經過整理和分類的溫度信息進行分析,找出用戶汽車內部溫度信息與時間、地點、天氣之間的潛在關聯因子,實現對用戶行為的分析、預測和對異常行為的檢測。
2.一種基于數據挖掘技術的用戶行為分析方法,通過權利要求1所述一種基于數據挖掘技術的用戶行為分析系統實現,其特征在于:包括以下步驟:
步驟1:手機控制終端通過測溫節點采集溫度信息,經過添加外部環境信息作為用戶行為信息,并上傳至服務器,完成基于互聯網的用戶行為信息數據;
步驟2:對用戶行為信息數據進行預處理,對上傳到服務器的基于時間序列的溫度信息進行預處理和等長處理,通過時間序列上升和下降點對時間序列數據進行近似處理,
步驟2.1:對時間序列進行預處理,將時間序列數據都映射到區間[0,1]內,消除時間序列數據中存在的噪聲,公式如下:
其中,x*代表的是進行轉換后得到的歸一化或標準化數據;max(x)代表的是時間序列中存在的最大值;min(x)代表的是時間序列中存在的最小值;
步驟2.2:提取以r為半徑、o(ti,xi)為中心區域的極值點;將o(ti,xi)作為中心,時間序列點(tp,xp)依次向后或向前采集第i個時間序列點,得到r為半徑、o(ti,xi)為中心的區域G(o),通過下式判斷區域中存在的極值點:
其中,f(xi,1)代表的是以r為半徑、o(ti,xi)為中心區域內存在的數值特征;-1、1分別代表的是區域內的極小值點和極大值點;當f(xi,1)的值為零時,表明該時間序列點不是極值點;ti代表時間序列中第i個點的對應的時間、GPS方位、天氣、車外溫度構成的數組,xi代表歸一化處理后第i個點對應的車內溫度,tp代表時間序列中第p個點的對應的時間、GPS方位、天氣、車外溫度構成的數組,xp代表第p個點對應的車內溫度;
步驟2.3:對提取的時間序列中的極值點進行等長處理;提取兩個時間序列中存在的極值點并集,重新劃分具有新極值點的時間序列,使時間序列的長度相等,時間序列等長處理的具體方法如下式所示:
其中,X、Y為等長時間序列,SX、SY為極值點對應的極值點序列,長度分別為m、n,SX′、SY′為經過等長處理后的時間序列;
步驟3:對用戶行為信息進行數據挖掘,將多目標決策理論應用到時間序列數據挖掘中;
步驟3.1:根據提取得到的區間極值點序列構建標準決策矩陣Z,決策矩陣Z中的行列均為時間序列中存在的極值點以及極值點對應的對象屬性;設向量A={a1,…,an}是由n個極值點構成的集合;向量C={c1,…,cm}是由m個極值點屬性構成的集合,即為評價指標,通過下式比較不同指標對應的決策對象:
dk(ai,aj)=ck(ai)-ck(aj)
其中,dk(ai,aj)代表的是在評價指標ck上極值點ai、aj存在的差值;
步驟3.2:通過偏好函數用標準化的偏好度πk(ai,aj)代替差值dk(ai,aj),方法為:
πk(ai,aj)=fk(dk(ai,aj))
其中,fk()代表的是偏好函數;
步驟3.3:基于多目標決策的時間序列數據挖掘算法在線性特征的基礎上對偏好函數進行選擇,如下式所示:
其中,pk代表的是偏好閾值;qk代表的是無差異閾值;上述兩個閾值可以對偏好度的分布態勢進行預測;dk(ai,aj)在評價指標ck上極值點ai、aj存在的差值;
步驟3.4:確定目標的正負偏好;決策對象a和決策對象b之間存在的多目標偏好度如下式所示:
正偏好流和負偏好流的計算公式分別如下:
其中,代表的是正偏好流,在全部決策目標上決策對象ai的正偏好流對應的偏好級別最高;代表的是負偏好流,在全部決策目標上決策對象ai的負偏好流對應的偏好級別最低;
步驟3.5:最優決策對象在極端情況下對應的負偏好流值和正偏好流的值分別為0和1;基于多目標決策的時間序列數據挖掘算法根據偏好流排序結果實現時間序列數據挖掘,凈偏好流的值越大表明極值點對應的偏好級別越高,根據級別對時間序列數據進行分類,實現時間序列的數據挖掘,凈偏好流計算如下式:
步驟4:利用云、邊協同計算方法,將邊緣端服務器和云端服務器進行協同作業;提高用戶行為分析的執行效率,從整體上提高任務處理的速度;
步驟4.1:通過云端服務器集群組成的云端部件和邊緣服務器集群組成的邊緣部件的任務是否有相互干擾和數據往來,將云邊協同模式分為三類任務:云邊相離類任務、云邊相交類任務以及云邊包含類任務;
其中云邊相離類任務為云端部件和邊緣端部件中的任務沒有數據往來,云邊相交類任務為云端部件與邊緣端部件中的任務有數據交換,云邊包含類任務為云端部件中的任務是邊緣端部件中任務的子任務;
步驟4.2:將云端服務器和邊緣端服務器上的DAG(Directed acyclic graph:DAG)進行合并,如下式所示:
其中,A、B為集合1、集合2,C為合并后的集合;式①表示對于云邊相離任務,合并的方法是增加一個虛擬的入口任務節點和出口任務節點,然后更新虛擬入口任務節點和出口任務節點;式②表示對于云邊相交任務,合并的方式是入口任務節點同時作為每個子DAG入口任務節點的父親節點,然后以替換的方法實現DGA合并;式③表示對于云邊包含任務,通過判斷較大任務節點來替代小任務節點實現合并;
步驟4.3:利用基于關鍵路徑的分割策略劃分任務,分割方法如下式所示:
其中,CTS(Critical tasks set)表示關鍵任務集,NCTS(Non-critical tasks set)非關鍵任務集,其中任務集類型分為邊緣端任務EST(Edge-side tasks)和云端任務CST(Cloud-side tasks);
步驟4.4:根據DAG合并圖關鍵路徑的邊的權值之和確定云邊協同計算架構下任務圖的優先級,云邊協同計算架構下DAG合并圖Dk的優先級rank(Dk)方法如下式所示:
其中n*表示任務個數;
步驟4.5:從任務圖列表中具有較高優先級的任務圖開始優先分配處理器資源,根據任務圖列表構成相應的路徑列表,路徑pk的優先級rank(pk)如下式所示:
ηi代表任務圖列表對應的路徑值,ei代表該路徑的權值;
步驟5:對用戶行為隱私保護,對對稱密鑰進行加密保護,消息訂閱者正確解密并得到正確的對稱密鑰,進而解密并恢復出元數據M,實現對用戶行為的分析、預測和對異常行為的檢測。
3.根據權利要求2所述的一種基于數據挖掘技術的用戶行為分析方法,其特征在于,步驟5具體包括:
步驟5.1:數據安全分享的初始化算法;首先選擇兩個雙線性群G0(階為p,生成元為g)和G1,并且定義一個雙線性映射e:G0×G0=G1;另外,選擇兩個安全哈希函數H1(·),H2(·)和訪問參數α,β1,β2∈Zp使得α≠0,β1≠0,,β2≠1且β2≠β1,公開密鑰為:
主密鑰MSK為:
MSK={β1,β2,gα}
步驟5.2:數據安全分享的密鑰生成算法;設S表示一個數據訂閱者的屬性集合,屬性授權端首先選擇然后為每個訂閱者產生私鑰SK,公式如下所示:
步驟5.3:發布者對終端進行加密;執行一個具有簽名策略的密鑰產生算法,并且獲得一個一次密鑰對(sk,vk),根據消息內容構建一個訪問樹Γ=ΓuANDtc作為該消息的訪問控制策略,然后計算K=e(g,g)αs,對稱密鑰ek=H2(K)和用對稱密鑰ek對明文M進行對稱加密得到C=Enc M,最后輸出密文Cu,Cu計算公式如下:
Cu={Γ,C,C1}
步驟5.4:訂閱者終端解密,當消息訂閱者從網絡中獲取了其感興趣的數據包之后,如果他的屬性集滿足該數據包的樹形訪問結構u,用驗證密鑰在密文上驗證簽名通過,并用對稱密鑰ek解密得到明文元數據M。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110260276.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種抗拉纖維錨桿桿體及錨桿
- 下一篇:一種用于攝像裝置的視頻編碼方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





