[發(fā)明專利]用于確定相似用戶的方法、裝置和服務(wù)器在審
| 申請(qǐng)?zhí)枺?/td> | 201710451969.4 | 申請(qǐng)日: | 2017-06-15 |
| 公開(公告)號(hào): | CN107247786A | 公開(公告)日: | 2017-10-13 |
| 發(fā)明(設(shè)計(jì))人: | 李澤中 | 申請(qǐng)(專利權(quán))人: | 北京小度信息科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京英賽嘉華知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司11204 | 代理人: | 王達(dá)佐,馬曉亞 |
| 地址: | 100085 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 確定 相似 用戶 方法 裝置 服務(wù)器 | ||
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其涉及用于確定相似用戶的方法、裝置和服務(wù)器。
背景技術(shù)
隨著電子商務(wù)技術(shù)的發(fā)展,越來越多的用戶選擇在線上購物平臺(tái)進(jìn)行采購。線上購物平臺(tái)可以獲取海量的用戶數(shù)據(jù),包括用戶的基本屬性信息、訂單數(shù)據(jù)、評(píng)價(jià)信息、物流信息等。基于這些用戶數(shù)據(jù),可以構(gòu)建出每個(gè)用戶的畫像,包括用戶的年齡、喜好、消費(fèi)能力、購物習(xí)慣等。線上購物平臺(tái)可以利用用戶畫像篩選出與每個(gè)商戶的忠實(shí)用戶相似的用戶作為商戶的潛在用戶進(jìn)行推薦。
在現(xiàn)有的相似用戶篩選方法中,用戶畫像構(gòu)建過程中未考慮用戶的各類別屬性對(duì)相似度計(jì)算的影響,然而在相似用戶篩選過程中,各類別屬性對(duì)用戶間相似度計(jì)算的影響力不同,例如用戶的性別比用戶的購物習(xí)慣對(duì)相似度計(jì)算的影響力小,因此現(xiàn)有的相似用戶定位結(jié)果的準(zhǔn)確性有待提升。
發(fā)明內(nèi)容
為了解決上述背景技術(shù)部分的一個(gè)或多個(gè)技術(shù)問題,本申請(qǐng)實(shí)施例提供了用于確定相似用戶的方法、裝置和服務(wù)器。
本申請(qǐng)實(shí)施例公開A1、一種用于確定相似用戶的方法,所述方法包括:獲取待處理用戶集中各用戶的用戶信息,所述用戶信息包括地理位置信息以及與至少一個(gè)預(yù)設(shè)標(biāo)簽關(guān)聯(lián)的歷史訂單信息;統(tǒng)計(jì)與各所述預(yù)設(shè)標(biāo)簽關(guān)聯(lián)的歷史訂單信息對(duì)應(yīng)的用戶數(shù)量,以確定各所述預(yù)設(shè)標(biāo)簽的權(quán)重;基于所述待處理用戶集中各用戶的歷史訂單信息以及各所述預(yù)設(shè)標(biāo)簽的權(quán)重,生成各所述用戶的標(biāo)簽屬性特征;根據(jù)所述標(biāo)簽屬性特征和地理位置信息將所述待處理用戶集中的用戶聚類為多個(gè)用戶簇;基于所述標(biāo)簽屬性特征計(jì)算目標(biāo)用戶與同一用戶簇中其他用戶的相似度并確定出所述目標(biāo)用戶的相似用戶。
A2、如A1所述的方法中,所述統(tǒng)計(jì)與各所述預(yù)設(shè)標(biāo)簽關(guān)聯(lián)的歷史訂單信息對(duì)應(yīng)的用戶數(shù)量,以確定各所述預(yù)設(shè)標(biāo)簽的權(quán)重,包括:對(duì)每個(gè)所述預(yù)設(shè)標(biāo)簽,篩選出與所述預(yù)設(shè)標(biāo)簽關(guān)聯(lián)的歷史訂單信息;
統(tǒng)計(jì)篩選出的歷史訂單信息對(duì)應(yīng)的用戶數(shù)量;對(duì)統(tǒng)計(jì)出的用戶數(shù)量求對(duì)數(shù)后取倒數(shù)作為所述預(yù)設(shè)標(biāo)簽的權(quán)重。
A3、如A1所述的方法中,所述基于所述待處理用戶集中各用戶的歷史訂單信息以及各所述預(yù)設(shè)標(biāo)簽的權(quán)重,生成各所述用戶的標(biāo)簽屬性特征,包括:根據(jù)所述歷史訂單信息,確定每個(gè)所述用戶對(duì)應(yīng)于各預(yù)設(shè)標(biāo)簽的下單頻次;基于每個(gè)用戶對(duì)應(yīng)于各預(yù)設(shè)標(biāo)簽的下單頻次和對(duì)應(yīng)預(yù)設(shè)標(biāo)簽的權(quán)重,計(jì)算得出每個(gè)用戶對(duì)應(yīng)的各所述預(yù)設(shè)標(biāo)簽的有效下單頻次;基于各所述預(yù)設(shè)標(biāo)簽的有效下單頻次生成各所述用戶的標(biāo)簽特征向量,作為各所述用戶的標(biāo)簽屬性特征。
A4、如A3所述的方法中,所述基于每個(gè)用戶對(duì)應(yīng)于各預(yù)設(shè)標(biāo)簽的下單頻次和對(duì)應(yīng)預(yù)設(shè)標(biāo)簽的權(quán)重,計(jì)算得出每個(gè)用戶對(duì)應(yīng)的各所述預(yù)設(shè)標(biāo)簽的有效下單頻次,包括:將每個(gè)用戶對(duì)應(yīng)于各預(yù)設(shè)標(biāo)簽的下單頻次與對(duì)應(yīng)各預(yù)設(shè)標(biāo)簽的權(quán)重相乘,作為每個(gè)用戶對(duì)應(yīng)的各預(yù)設(shè)標(biāo)簽的有效下單頻次;所述基于各所述預(yù)設(shè)標(biāo)簽的有效下單頻次生成各所述用戶的標(biāo)簽特征向量,包括:將各所述預(yù)設(shè)標(biāo)簽的有效下單頻次作為所述標(biāo)簽特征向量中對(duì)應(yīng)于各所述預(yù)設(shè)標(biāo)簽的特征值。
A5、如A3所述的方法中,所述根據(jù)標(biāo)簽屬性特征和地理位置信息將待處理用戶集中的用戶聚類為多個(gè)用戶簇,包括:對(duì)各用戶的標(biāo)簽特征向量中的元素按特征值進(jìn)行降序排序,選擇排序前預(yù)設(shè)位的元素對(duì)應(yīng)的預(yù)設(shè)標(biāo)簽為待匹配標(biāo)簽;以所述地理位置信息和所述待匹配標(biāo)簽為各所述用戶的特征信息,基于所述特征信息將所述待處理用戶集中的用戶聚類為多個(gè)用戶簇。
A6、如A5所述的方法中,所述以所述地理位置信息和所述待匹配標(biāo)簽為各所述用戶的特征信息,基于所述特征信息將所述待處理用戶集中的用戶聚類為多個(gè)用戶簇,包括:將所述地理位置信息相同且至少一個(gè)待匹配標(biāo)簽相同的用戶聚為同一用戶簇。
A7、如A3所述的方法中,所述基于所述標(biāo)簽屬性特征計(jì)算目標(biāo)用戶與同一用戶簇中其他用戶的相似度并確定出所述目標(biāo)用戶的相似用戶,包括:計(jì)算所述目標(biāo)用戶的標(biāo)簽特征向量與同一用戶簇中其他各用戶的標(biāo)簽特征向量的相似度;基于所述目標(biāo)用戶的標(biāo)簽特征向量與同一用戶簇中其他各用戶的標(biāo)簽特征向量的相似度篩選出所述目標(biāo)用戶的相似用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京小度信息科技有限公司,未經(jīng)北京小度信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710451969.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





