[發明專利]用戶行為進行分類和預測的方法和系統有效
| 申請號: | 201711055158.9 | 申請日: | 2017-10-31 |
| 公開(公告)號: | CN107818344B | 公開(公告)日: | 2020-01-07 |
| 發明(設計)人: | 王盼;夏良超 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q10/04;G06Q30/02 |
| 代理公司: | 11015 北京英特普羅知識產權代理有限公司 | 代理人: | 林彥之 |
| 地址: | 518052 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 行為 進行 分類 預測 方法 系統 | ||
本發明涉及一種對用戶行為進行分類識別和預測的方法和系統,所述方法包括以下步驟:步驟1、從一個或多個來源獲取預設時段的用戶行為數據,并計算用戶行為數據在預設的各個維度上的屬性;步驟2、根據用戶行為數據的來源、以及與所述來源相對應的所述屬性,選擇相應的分類模型;步驟3、根據所選的分類模型,對用戶行為數據進行分類識別;步驟4、根據分類結果,調用信息知識庫,預測用戶行為的目的,其中,所述信息知識庫記錄了用戶行為的過程與行為目的之間的關系。
技術領域
本發明涉及互聯網服務技術領域,尤其涉及基于決策樹歸納對用戶行為進行預測的方法。
背景技術
隨著互聯網的發展,每天都有成千上萬的人在頁面上進行操作,如何通過方法有效的分析海量數據,并從其中找到有利的規格或資訊已經成為一種趨勢。機器學習(Machine Learning)目前看來是最有前途的一種技術。機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。其在各個領域都有廣泛的應用,特別在數據分析領域有著深遠的影響。而決策樹是機器學習中最基礎且應用最廣泛的算法模型。在做小微企業信貸時,風控是關鍵,也是比較難把握的一個環節。
在傳統的方法中,需要對用戶行為進行人工分類、判定,從而預測用戶訪問網站的意圖,并在后期提供有針對性的服務或其它處理應對。在海量數據的場景下,數據往往維度多、數據量大,人工很難將用戶行為相關的指標統計全面。此外,由于人會出現疲勞等情況,這種傳統的人工識別的方法準確率并不高。
然而,在現有技術中,對用戶行為進行分類和預測的方法較為單一,參考效果不理想。由于用戶行為包括線上和線下行為,數據來源復雜,存在這樣的需求:開發能夠針對不同的數據來源、結合多種分類預測技術而綜合判定和預測用戶屬性的方案。
發明內容
基于此,有必要針對上述技術問題,提供基于決策樹歸納對用戶行為進行預測的方法,其通過同步用戶網絡訪問行為和其它業務行為的次數以及操作時間,根據每個屬性的行為次數與時間等特征,建立分類模型(決策樹),從而對用戶的行為分類、并預測用戶的潛在行為(需求)。
根據本發明的實施例,提供了一種對用戶行為進行分類識別和預測的方法,包括以下步驟:
步驟1、從一個或多個來源獲取預設時段的用戶行為數據,并計算用戶行為數據在預設的各個維度上的屬性;
步驟2、根據用戶行為數據的來源、以及與所述來源相對應的所述屬性,選擇相應的分類模型;
步驟3、根據所選的分類模型,對用戶行為數據進行分類識別;
步驟4、根據分類結果,調用信息知識庫,預測用戶行為的目的,
其中,所述信息知識庫記錄了用戶行為的過程與行為目的之間的關系。
根據本發明的實施例,其中,所述步驟1包括:
步驟1-1、對用戶身份進行識別,獲取所述用戶行為數據在各個維度上的屬性,如果所述用戶行為數據在部分維度的屬性不完整,則調用該用戶的歷史行為數據,與所述預設時段的用戶行為數據合并,補充所述部分維度的屬性。
根據本發明的實施例,其中,在所述步驟1中,所述用戶行為數據的來源包括:用戶在業務服務端的網絡訪問行為數據、線下業務數據、和/或從第三方獲取的所述用戶行為數據。
根據本發明的實施例,在所述步驟2中,對于用戶在業務服務端的網絡訪問行為數據,選擇決策樹分類模型,對于線下業務數據、和/或從第三方獲取的所述用戶行為數據,選擇隨機森林分類模型。
根據本發明的實施例,其中,通過以下步驟,構建所述決策樹分類模型:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711055158.9/2.html,轉載請聲明來源鉆瓜專利網。





