[發明專利]數據處理方法、電子設備和介質有效
| 申請號: | 201910400639.1 | 申請日: | 2019-05-14 |
| 公開(公告)號: | CN110245684B | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 金榮明;王雪;李旭 | 申請(專利權)人: | 杭州米雅信息科技有限公司 |
| 主分類號: | G06F18/241 | 分類號: | G06F18/241;G06F18/23 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 楊靜 |
| 地址: | 310000 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 電子設備 介質 | ||
1.一種數據處理方法,應用于服務器端,所述方法包括:
響應于獲得來自客戶端的選擇指令,確定多個屬性以及所述多個屬性中的每個屬性的處理類型;
獲得多個用戶的多個第一特征值,其中,所述第一特征值表征用戶在所述屬性的維度上的特征;
基于所述處理類型,處理用戶在不同屬性的維度上的多個第一特征值得到第二特征值,其中包括:
將每個屬性的維度上的第一特征值的取值范圍劃分為多個區間;
確定所述第一特征值所處的區間,其中包括:基于時間處理所述第一特征值得到修正后的第一特征值;確定修正后的第一特征值所處的區間;
對于一個屬性,根據所述處理類型以及所述第一特征值所處的區間,確定用戶在該屬性的維度上的權重值,其中,包括以下至少一種:在所述處理類型為第一處理類型的情況下,不同區間上所確定的權重值呈指數變化;在所述處理類型為第二處理類型的情況下,不同區間上所確定的權重值呈線性變化;在所述處理類型為第三處理類型的情況下,不同區間上所確定的權重值呈對數變化;其中,對于重要的屬性,采用第一處理類型,使用指數級變化的規則來確定權重值,對于普通的屬性,采用第二處理類型,使用線性變化的規則來確定權重值,對于重要性較低的屬性,采用第三處理類型,使用對數變化的規則來確定權重值;
根據用戶在多個屬性的維度上的權重值,確定所述用戶的第二特征值,其中,所述第二特征值為用戶在多個屬性的維度上的權重值經過累加或累乘的方式處理之后的合并值;
基于所述第二特征值對所述多個用戶聚類,以便將所述多個用戶劃分為多個類別,得到分類結果,其中包括:在所述第二特征值的分布滿足預定分布條件的情況下,對所述第二特征值執行兩次聚類處理,以便將所述多個用戶劃分為P個類別,其中,第一次聚類的簇的數量M大于P,第二次聚類的簇的數量N小于P,M、N、P為正整數,其中,預定分布條件是用于判斷第二特征值是否滿足長尾分布的判斷條件;以及
向所述客戶端發送所述分類結果;
其中,所述對所述第二特征值執行兩次聚類處理包括:
對所述第二特征值進行第一次聚類,得到M個簇;
基于所述第二特征值,從所述M個簇中確定K個簇,其中,包括:從所述M個簇中確定第二特征值相對最低的一個簇,且K=N-P;
從所述多個用戶的第二特征值中剔除與所述K個簇對應的第二特征值,對剩余的第二特征值進行第二次聚類,得到N個簇;以及
基于第一次聚類得到的K個簇和第二次聚類得到的N個簇,生成將所述多個用戶分為P類的分類結果。
2.根據權利要求1所述的方法,還包括:
檢查所述多個屬性之間的相關性;
若存在兩個屬性之間的相關性大于閾值,則輸出提示信息。
3.一種電子設備,包括:
一個或多個處理器;
存儲器,用于存儲一個或多個計算機程序,
其中,當一個或多個計算機程序被一個或多個處理器執行時,使得一個或多個處理器實現權利要求1或2的方法。
4.一種計算機可讀存儲介質,其上存儲有可執行指令,該指令被處理器執行時使處理器實現權利要求1或2的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州米雅信息科技有限公司,未經杭州米雅信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910400639.1/1.html,轉載請聲明來源鉆瓜專利網。





