[發(fā)明專利]一種基于大數(shù)據(jù)的人群匹配方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202111277037.5 | 申請(qǐng)日: | 2021-10-29 |
| 公開(公告)號(hào): | CN113988193A | 公開(公告)日: | 2022-01-28 |
| 發(fā)明(設(shè)計(jì))人: | 吳鵬 | 申請(qǐng)(專利權(quán))人: | 深圳市環(huán)世創(chuàng)源科技有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06F16/9536;G06F16/9538;G06N20/00 |
| 代理公司: | 北京酷愛智慧知識(shí)產(chǎn)權(quán)代理有限公司 11514 | 代理人: | 阮建 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)南山*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 人群 匹配 方法 系統(tǒng) | ||
本發(fā)明提供了基于大數(shù)據(jù)的人群匹配方法及系統(tǒng),方法包括以下步驟:獲取各個(gè)用戶的歷史行為,構(gòu)建每個(gè)歷史行為對(duì)應(yīng)的歷史相關(guān)行為集;所述歷史相關(guān)行為集包括多種行為;分別計(jì)算所述歷史行為與對(duì)應(yīng)的歷史相關(guān)行為集中每個(gè)行為的相似度,獲得歷史相關(guān)行為集中與所述歷史行為相似度最大的N個(gè)行為;對(duì)所述歷史行為以及對(duì)應(yīng)的N個(gè)行為進(jìn)行訓(xùn)練,得到排序模型;獲取用戶的當(dāng)前行為,將所述當(dāng)前行為輸入至所述排序模型中,得到排序模型輸出的N個(gè)推薦行為,將所述N個(gè)推薦行為推送給所述用戶。該基于大數(shù)據(jù)的人群匹配方法,提高了用戶匹配的精準(zhǔn)度。
技術(shù)領(lǐng)域
本發(fā)明屬于大數(shù)據(jù)技術(shù)領(lǐng)域,具體涉及一種基于大數(shù)據(jù)的人群匹配方法及系統(tǒng)。
背景技術(shù)
大數(shù)據(jù)匹配是近年來(lái)計(jì)算機(jī)技術(shù)發(fā)展的熱點(diǎn)之一。通過(guò)對(duì)歷史積累的大量數(shù)據(jù)進(jìn)行有效分析,得到隱藏的規(guī)律和模式,為決策提供支持。而這些規(guī)律或模式是不能依靠簡(jiǎn)單的數(shù)據(jù)查詢得到,或者是不能在可接受的時(shí)間內(nèi)得到。這些規(guī)律或模式可以進(jìn)一步在專業(yè)人員的識(shí)別下成為知識(shí)。大數(shù)據(jù)匹配面對(duì)的任務(wù)是復(fù)雜的,通常包括數(shù)據(jù)分類、數(shù)據(jù)標(biāo)簽化、數(shù)據(jù)篩選、數(shù)據(jù)預(yù)測(cè)和數(shù)據(jù)關(guān)聯(lián)分析等。
大數(shù)據(jù)匹配建立在對(duì)大量的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,采用相應(yīng)的數(shù)據(jù)匹配算法,在具體的應(yīng)用模型上進(jìn)行數(shù)據(jù)的提取、數(shù)據(jù)篩選、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘和模式分析,最后做出歸納性的推理、預(yù)測(cè)用戶的個(gè)性化行為以及用戶習(xí)慣,從而精準(zhǔn)為用戶匹配到符合自己要求的用戶人群數(shù)據(jù)。
但是現(xiàn)有的人群匹配系統(tǒng),在進(jìn)行人群匹配時(shí)無(wú)法精準(zhǔn)地匹配人群,現(xiàn)有的人群匹配系統(tǒng)主要采用文本化標(biāo)簽化方式及線性模型進(jìn)行排序推薦人群,這種方法存在以下問(wèn)題:由于用戶的標(biāo)簽數(shù)量有限,標(biāo)簽化匹配效果不理想,且標(biāo)簽庫(kù)維護(hù)更新成本較高。線性模型無(wú)法挖掘特征間的非線性的關(guān)系,模型效果有限。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種基于大數(shù)據(jù)的人群匹配方法及系統(tǒng),提高了用戶匹配的精準(zhǔn)度。
第一方面,一種基于大數(shù)據(jù)的人群匹配方法,包括以下步驟:
獲取各個(gè)用戶的歷史行為,構(gòu)建每個(gè)歷史行為對(duì)應(yīng)的歷史相關(guān)行為集;所述歷史相關(guān)行為集包括多種行為;
分別計(jì)算所述歷史行為與對(duì)應(yīng)的歷史相關(guān)行為集中每個(gè)行為的相似度,獲得歷史相關(guān)行為集中與所述歷史行為相似度最大的N個(gè)行為;
對(duì)所述歷史行為以及對(duì)應(yīng)的N個(gè)行為進(jìn)行訓(xùn)練,得到排序模型;
獲取用戶的當(dāng)前行為,將所述當(dāng)前行為輸入至所述排序模型中,得到排序模型輸出的N個(gè)推薦行為,將所述N個(gè)推薦行為推送給所述用戶。
優(yōu)選地,所述歷史相關(guān)行為集中的行為滿足:至少與所述歷史行為的服務(wù)商、類目信息、地域信息、行為類型的一項(xiàng)相同,或者完成時(shí)間與所述歷史行為完成時(shí)間的時(shí)間差在預(yù)設(shè)的時(shí)間差范圍內(nèi)。
優(yōu)選地,所述構(gòu)建每個(gè)歷史行為對(duì)應(yīng)的歷史相關(guān)行為集具體包括:
對(duì)所述歷史行為進(jìn)行哈希編碼;
根據(jù)所述歷史行為以及對(duì)應(yīng)的哈希編碼構(gòu)建所述歷史相關(guān)行為集。
優(yōu)選地,所述分別計(jì)算所述歷史行為與對(duì)應(yīng)的歷史相關(guān)行為集中每個(gè)行為的相似度具體包括:
對(duì)所述行為進(jìn)行哈希編碼;
計(jì)算所述行為的哈希編碼與所述歷史行為的哈希編碼之間的距離,以得到所述相似度。
優(yōu)選地,所述對(duì)所述歷史行為以及對(duì)應(yīng)的N個(gè)行為進(jìn)行訓(xùn)練,得到排序模型具體包括:
根據(jù)所述歷史行為以及對(duì)應(yīng)的N個(gè)行為構(gòu)建相似性特征矩陣;
利用梯度提升樹GBDT算法對(duì)所述相似性特征矩陣進(jìn)行特征分類組合,以獲得訓(xùn)練集;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市環(huán)世創(chuàng)源科技有限公司,未經(jīng)深圳市環(huán)世創(chuàng)源科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111277037.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種機(jī)械加工用焊接裝置
- 下一篇:一種兒童康復(fù)用手臂鍛煉裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





