[發明專利]大數據挖掘處理方法、裝置及云平臺有效
| 申請號: | 202010593710.5 | 申請日: | 2020-06-27 |
| 公開(公告)號: | CN111708785B | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 莫怡極;莫敏婷 | 申請(專利權)人: | 深圳市創世易明科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2458 |
| 代理公司: | 杭州知管通專利代理事務所(普通合伙) 33288 | 代理人: | 黃華 |
| 地址: | 518110 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 挖掘 處理 方法 裝置 平臺 | ||
1.一種大數據挖掘處理方法,其特征在于,應用于與用戶終端通信的云平臺,所述方法包括:
在采集到所述用戶終端實時通過應用程序上傳的應用程序行為數據后,提取所述應用程序行為數據的行為特征向量,并基于所述行為特征向量對所述應用程序行為數據進行索引分析得到多個應用業務數據片段;其中,所述行為特征向量為所述應用程序行為數據中與待挖掘業務相關的設定行為標識所形成的特征向量;
將所述應用程序行為數據的每組應用業務數據片段與設定數據片段序列中各設定數據片段進行挖掘;其中,所述設定數據片段序列中保存有多個設定數據片段以及每組設定數據片段對應的業務分布信息,所述多個設定數據片段為所述待挖掘業務所在的用戶業務范圍的業務節點信息序列;其中,如果所提取出的應用程序行為數據的每組應用業務數據片段包括多個業務分布信息,則通過以下方式進行挖掘:按照預先為各個業務分布信息配置的挖掘策略,進行多級挖掘;其中,在每級挖掘中,僅基于每組應用業務數據片段中的其中一個業務分布信息進行挖掘,并將符合預設條件的應用業務數據片段輸入到下一級挖掘模型中,以便基于下一個業務分布信息進行挖掘應用業務數據片段輸入到下一級挖掘模型中,以便基于下一個業務分布信息進行挖掘;
根據與所述應用程序行為數據的挖掘結果符合預設條件的目標應用業務數據片段對應的數據片段分量,確定所述應用程序行為數據的數據挖掘分布圖;
基于所述應用程序行為數據以及確定出的應用程序行為數據的數據挖掘分布圖對所述用戶終端的用戶畫像數據進行生成得到生成結果;
提取所述應用程序行為數據的行為特征向量,并基于所述行為特征向量對所述應用程序行為數據進行索引分析得到多個應用業務數據片段,包括:
將所述應用程序行為數據中的行為對象列出,確定每個行為對象的操作頻率,按照所述操作頻率由大到小的順序將所述行為對象進行排序得到所述行為特征向量;
獲取所述行為特征向量的向量片段序列以及所述應用程序行為數據的多個應用程序業務對象序列;在根據所述向量片段序列確定出所述應用程序行為數據中包含有可挖掘數據對象的情況下,根據所述應用程序行為數據在所述可挖掘數據對象下的應用程序業務對象序列及其業務驗證信息確定所述應用程序行為數據在目標挖掘數據對象下的各應用程序業務對象序列與所述應用程序行為數據在所述可挖掘數據對象下的各應用程序業務對象序列之間的挖掘相關參數;將所述應用程序行為數據在所述目標挖掘數據對象下的與在所述可挖掘數據對象下的應用程序業務對象序列的挖掘相關參數最小的應用程序業務對象序列調整到所述可挖掘數據對象下;
在所述應用程序行為數據對應的所述目標挖掘數據對象下包含有多個應用程序業務對象序列的情況下,根據所述應用程序行為數據在所述可挖掘數據對象下的應用程序業務對象序列及其業務驗證信息確定所述應用程序行為數據在所述目標挖掘數據對象下的各應用程序業務對象序列之間的挖掘相關參數,并基于所述各應用程序業務對象序列之間的挖掘相關參數對所述目標挖掘數據對象下的各應用程序業務對象序列進行融合;根據所述應用程序行為數據在所述可挖掘數據對象下的應用程序業務對象序列及其業務驗證信息為上述融合獲得的目標應用程序業務對象序列設置調整挖掘策略,并將所述目標應用程序業務對象序列調整到所述調整挖掘策略所對應的所述可挖掘數據對象的設定節點處;
基于所述行為特征向量中的向量片段序列對應的存在分段標識的目標節點的節點屬性對所述目標挖掘數據對象下的應用程序業務對象序列進行分段處理得到多個應用業務數據片段;
根據與所述應用程序行為數據的挖掘結果符合預設條件的目標應用業務數據片段對應的數據片段分量,確定所述應用程序行為數據的數據挖掘分布圖,包括:
提取所述挖掘結果的挖掘特征向量參數,在所述挖掘特征向量參數滿足所述用戶終端的預設挖掘參數時,確定所述挖掘特征向量參數對應的目標應用業務數據片段;
按照設定片段長度提取所述目標應用業務數據片段的片段分區特征;
生成所述片段分區特征對應的分區位圖以及目標應用業務數據片段對應的片段業務狀態位圖,所述分區位圖和所述片段業務狀態位圖分別包括多個不同狀態值的位圖單位;
提取所述片段分區特征在所述分區位圖的其中一個位圖單位的位圖屬性表達結果并將所述片段業務狀態位圖中具有最小狀態值的位圖單位確定為基準位圖單位;
將所述位圖屬性表達結果模擬至所述基準位圖單位中以在所述基準位圖單位中得到模擬對象信息,然后基于所述位圖屬性表達結果以及所述模擬對象信息生成所述片段分區特征和所述目標應用業務數據片段之間的數據關聯信息;
以所述模擬對象信息為信息模板在所述基準位圖單位中獲取對象挖掘分布信息,根據所述數據關聯信息對應的關聯行為節點將所述對象挖掘分布信息模擬到所述位圖屬性表達結果所在位圖單位中并在所述位圖屬性表達結果所在的位圖單位中得到所述對象挖掘分布信息對應的模擬挖掘分布信息;
將所述模擬挖掘分布信息中的挖掘分布節點和分布關聯信息列出并根據所述挖掘分布節點和所述分布關聯信息生成所述應用程序行為數據的數據挖掘分布圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市創世易明科技有限公司,未經深圳市創世易明科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010593710.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種污水檢測及處理裝置
- 下一篇:一種用于虛擬現實設備的圖像處理方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





