[發(fā)明專利]基于用戶行為特征的選擇聚類初始點(diǎn)的方法及相關(guān)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201910515534.0 | 申請(qǐng)日: | 2019-06-14 |
| 公開(公告)號(hào): | CN110413854A | 公開(公告)日: | 2019-11-05 |
| 發(fā)明(設(shè)計(jì))人: | 鄧悅;金戈;徐亮 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06F16/906 | 分類號(hào): | G06F16/906 |
| 代理公司: | 北京市京大律師事務(wù)所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518033 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 初始點(diǎn) 數(shù)據(jù)集中 用戶行為特征 最小距離 集合 數(shù)據(jù)集 聚類 群組 聚類模型 循環(huán)迭代 用戶分組 關(guān)聯(lián)性 分割 申請(qǐng) 保證 | ||
本申請(qǐng)涉及聚類模型領(lǐng)域,提供一種基于用戶行為特征的基于用戶行為特征的選擇聚類初始點(diǎn)的方法及相關(guān)設(shè)備,所述方法包括:獲取待發(fā)掘群組的數(shù)據(jù)集,從所述數(shù)據(jù)集中選擇第一初始點(diǎn);從所述數(shù)據(jù)集中選擇第二初始點(diǎn),所述第二初始點(diǎn)是指所述數(shù)據(jù)集中距離所述第一初始點(diǎn)最遠(yuǎn)的點(diǎn);計(jì)算所述數(shù)據(jù)集中每個(gè)點(diǎn)與所述第一初始點(diǎn)和所述第二初始點(diǎn)的距離最小的最小距離點(diǎn)集合;從所述最小距離點(diǎn)集合中選擇一個(gè)最大的最小距離點(diǎn)作為第三初始點(diǎn),循環(huán)迭代得到包括所有初始點(diǎn)的初始點(diǎn)集合;按照所述初始點(diǎn)集合將所述數(shù)據(jù)集分割為多個(gè)存在關(guān)聯(lián)性的群組。通過采用本方案,能夠保證用戶分組的準(zhǔn)確性和效率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及聚類模型領(lǐng)域,尤其涉及一種基于用戶行為特征的基于用戶行為特征的選擇聚類初始點(diǎn)的方法及相關(guān)設(shè)備。
背景技術(shù)
聚類是一種無監(jiān)督的學(xué)習(xí)方法,其通過一定規(guī)則將數(shù)據(jù)對(duì)象按照定義的相似性劃分為多個(gè)類或簇,在同一個(gè)簇中的對(duì)象之間具有較高的相似度,不同簇中的對(duì)象差別較大。聚類分析主要用于統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、圖像分割、數(shù)據(jù)挖掘和用戶分群等領(lǐng)域。
現(xiàn)有的聚類算法用于用戶分群時(shí),聚類的初始點(diǎn)為隨機(jī)選擇,而初始點(diǎn)選擇不當(dāng),則會(huì)導(dǎo)致最終的聚類結(jié)果陷入局部最優(yōu)的現(xiàn)象,導(dǎo)致最終的聚類結(jié)果較差。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┝艘环N基于用戶行為特征的基于用戶行為特征的選擇聚類初始點(diǎn)的方法及相關(guān)設(shè)備,能夠解決現(xiàn)有基于用戶行為特征的聚類算法中由于選擇初始點(diǎn)不當(dāng)導(dǎo)致用戶分群結(jié)果陷入局部最優(yōu)的現(xiàn)象的問題。
第一方面,本申請(qǐng)?zhí)峁┮环N基于用戶行為特征的選擇聚類初始點(diǎn)的方法,所述方法包括:
獲取待發(fā)掘群組的數(shù)據(jù)集,所述數(shù)據(jù)集包括多個(gè)用戶的行為特征,將一個(gè)用戶作為一個(gè)點(diǎn);
從所述數(shù)據(jù)集中選擇第一初始點(diǎn);
從所述數(shù)據(jù)集中選擇第二初始點(diǎn),所述第二初始點(diǎn)是指所述數(shù)據(jù)集中距離所述第一初始點(diǎn)最遠(yuǎn)的點(diǎn);
計(jì)算所述數(shù)據(jù)集中每個(gè)點(diǎn)與所述第一初始點(diǎn)和所述第二初始點(diǎn)的距離最小的最小距離點(diǎn)集合,所述最小距離點(diǎn)集合包括多個(gè)最小距離點(diǎn);
從所述最小距離點(diǎn)集合中選擇一個(gè)最大的最小距離點(diǎn)作為第三初始點(diǎn),循環(huán)迭代得到包括所有初始點(diǎn)的初始點(diǎn)集合;
按照所述初始點(diǎn)集合將所述數(shù)據(jù)集分割為多個(gè)存在關(guān)聯(lián)性的群組。
在一些可能的設(shè)計(jì)中,所述第一初始點(diǎn)和所述第二初始點(diǎn)均基于歐式距離的最大最小距離算法得到。
在一些可能的設(shè)計(jì)中,所述計(jì)算所述數(shù)據(jù)集中每個(gè)點(diǎn)與所述第一初始點(diǎn)和所述第二初始點(diǎn)的距離最小的最小距離點(diǎn)集合,包括:
從所述數(shù)據(jù)集中選取第一候選點(diǎn);
分別計(jì)算所述第一候選點(diǎn)與所述第一初始點(diǎn)的第一距離,以及計(jì)算所述第一候選點(diǎn)與所述第二初始點(diǎn)的第二距離;
記錄所述第一距離和所述第二距離中最小的距離,將所述第一候選點(diǎn)作為一個(gè)最小距離點(diǎn),分別得到所述數(shù)據(jù)集中每個(gè)候選點(diǎn)相對(duì)所述第一初始點(diǎn)和所述第二初始點(diǎn)的最小的距離;
將每個(gè)候選點(diǎn)作為一個(gè)最小距離點(diǎn),最終得到所述最小距離點(diǎn)集合。
在一些可能的設(shè)計(jì)中,所述從所述最小距離點(diǎn)集合中選擇一個(gè)最大的最小距離點(diǎn)作為第三初始點(diǎn),循環(huán)迭代得到包括所有初始點(diǎn)的初始點(diǎn)集合,包括:
若所述數(shù)據(jù)集中還剩余n個(gè)點(diǎn),則計(jì)算Pk與所述第一初始點(diǎn)的距離D1k,與所述第二初始點(diǎn)的距離D2k;其中,Pk是指n個(gè)點(diǎn)中的任意一個(gè)點(diǎn),k為大于1且小于n的正整數(shù);
將所述Pk與所述第一初始點(diǎn)距離最小且與所述第二初始點(diǎn)距離最小的點(diǎn)記為Dk_min=min(nk1,nk2);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910515534.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種在嵌入式系統(tǒng)中生成坐標(biāo)點(diǎn)的方法
- 發(fā)動(dòng)機(jī)噴油控制方法及發(fā)動(dòng)機(jī)電控單元
- 基于牛頓法極值搜索的多峰極值搜索方法
- 基于梯度法極值搜索的多峰極值搜索方法
- 基于激光結(jié)構(gòu)光焊縫初始點(diǎn)導(dǎo)引裝置及方法
- 裸眼3D液晶光柵和3D顯示屏模組
- 用于選擇用于工業(yè)機(jī)器人調(diào)試的初始點(diǎn)的方法和裝置
- 基于用戶行為特征的選擇聚類初始點(diǎn)的方法及相關(guān)設(shè)備
- 一種基于圖像處理的點(diǎn)云濾波方法、裝置和存儲(chǔ)介質(zhì)
- 用于重建戶型圖輪廓的方法、裝置及電子設(shè)備
- 一種分布式配置數(shù)據(jù)庫系統(tǒng)的備份方法
- 以集中抄錄方式收集計(jì)量數(shù)據(jù)的方法及系統(tǒng)
- 用于集中抄錄數(shù)據(jù)系統(tǒng)的三連接頭集中抄錄轉(zhuǎn)發(fā)數(shù)據(jù)組件
- 用于集中抄錄數(shù)據(jù)系統(tǒng)的雙連接頭集中抄錄轉(zhuǎn)發(fā)數(shù)據(jù)組件
- 用于集中抄錄數(shù)據(jù)系統(tǒng)的單連接頭集中抄錄轉(zhuǎn)發(fā)數(shù)據(jù)組件
- 用于集抄系統(tǒng)的隔離輸出電源的數(shù)據(jù)集中記錄轉(zhuǎn)發(fā)裝置
- 以集中抄錄方式收集計(jì)量數(shù)據(jù)的系統(tǒng)
- 基于分布式數(shù)據(jù)源的數(shù)據(jù)集中系統(tǒng)和方法
- 一種數(shù)據(jù)集中管理系統(tǒng)
- 一種AGV無線集中控制系統(tǒng)
- 用戶網(wǎng)絡(luò)行為的分類方法和裝置及對(duì)應(yīng)的搜索方法和裝置
- 基于用戶行為特征識(shí)別的主動(dòng)身份認(rèn)證系統(tǒng)
- 一種用戶異常行為檢測(cè)方法、裝置及系統(tǒng)
- 用戶識(shí)別方法及裝置
- 用戶特征分析方法及系統(tǒng)
- 一種確定用戶行為特征的方法及系統(tǒng)
- 一種行為檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 確定用戶偏好的方法、裝置、介質(zhì)和電子設(shè)備
- 用戶行為預(yù)測(cè)方法、用戶行為預(yù)測(cè)裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 特征構(gòu)建方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 確定天線最小測(cè)試距離的方法
- 確定天線最小測(cè)試距離的方法
- 一種基于DTW的平權(quán)1?范數(shù)多傳感器不等長(zhǎng)序列相似度度量方法
- 一種電子白板軌跡跟蹤方法和裝置
- 基于大數(shù)據(jù)的有向線的周邊點(diǎn)位的排序方法及裝置
- 一種匹配用戶問題的方法、裝置、非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種基于最小誤差傳播的錨節(jié)點(diǎn)優(yōu)化選擇的最小二乘定位方法
- 一種基于最小標(biāo)準(zhǔn)差的錨節(jié)點(diǎn)優(yōu)化選擇的最小二乘定位方法
- 基于最小誤差傳播和優(yōu)化選擇的最小二乘定位方法
- 距離監(jiān)測(cè)方法、裝置、血管機(jī)、電子設(shè)備及存儲(chǔ)介質(zhì)





