[發(fā)明專利]基于大數(shù)據(jù)的用戶畫(huà)像構(gòu)建方法、裝置及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110294601.8 | 申請(qǐng)日: | 2021-03-19 |
| 公開(kāi)(公告)號(hào): | CN113051324A | 公開(kāi)(公告)日: | 2021-06-29 |
| 發(fā)明(設(shè)計(jì))人: | 孫圣力;陳忠毅;李青山;司華友 | 申請(qǐng)(專利權(quán))人: | 南京博雅區(qū)塊鏈研究院有限公司 |
| 主分類號(hào): | G06F16/25 | 分類號(hào): | G06F16/25;G06F16/28;G06K9/62 |
| 代理公司: | 無(wú)錫永樂(lè)唯勤專利代理事務(wù)所(普通合伙) 32369 | 代理人: | 孫際德 |
| 地址: | 210000 江蘇省南京市*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 數(shù)據(jù) 用戶 畫(huà)像 構(gòu)建 方法 裝置 存儲(chǔ) 介質(zhì) | ||
1.一種基于大數(shù)據(jù)的用戶畫(huà)像構(gòu)建方法,其特征在于,其包括:
建立用戶畫(huà)像標(biāo)簽體系;
采集用戶數(shù)據(jù)并將采集到的用戶數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)倉(cāng)庫(kù)內(nèi)預(yù)先構(gòu)建好的實(shí)體表和事實(shí)表內(nèi),所述用戶數(shù)據(jù)包括結(jié)構(gòu)化用戶數(shù)據(jù)和非結(jié)構(gòu)化用戶數(shù)據(jù);
將實(shí)體表和事實(shí)表進(jìn)行ID-Mapping關(guān)聯(lián)以實(shí)現(xiàn)對(duì)用戶數(shù)據(jù)的聚合;
基于用戶畫(huà)像標(biāo)簽體系,對(duì)于每一個(gè)標(biāo)簽,從數(shù)據(jù)倉(cāng)庫(kù)中獲取與所述標(biāo)簽相關(guān)的用戶數(shù)據(jù)處理后保存至用戶畫(huà)像數(shù)據(jù)庫(kù)。
2.如權(quán)利要求1所述的用戶畫(huà)像構(gòu)建方法,其特征在于,在所述用戶畫(huà)像標(biāo)簽體系中,從用戶自然屬性、行為屬性、風(fēng)險(xiǎn)屬性三個(gè)方面構(gòu)建用戶全面的用戶畫(huà)像。
3.如權(quán)利要求1所述的用戶畫(huà)像構(gòu)建方法,其特征在于,所述采集用戶數(shù)據(jù)并將采集到的用戶數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)倉(cāng)庫(kù)內(nèi)包括:
在數(shù)據(jù)倉(cāng)庫(kù)內(nèi)預(yù)先創(chuàng)建實(shí)體表和事實(shí)表,所述實(shí)體表用于存儲(chǔ)用戶的自然屬性數(shù)據(jù),所述事實(shí)表用于存儲(chǔ)用戶行為數(shù)據(jù);
根據(jù)用戶畫(huà)像標(biāo)簽體系,梳理需要采集的用戶數(shù)據(jù)并形成數(shù)據(jù)埋點(diǎn)需求,數(shù)據(jù)埋點(diǎn)在客戶端和服務(wù)器端進(jìn)行數(shù)據(jù)采集;
將采集到的用戶數(shù)據(jù)分類存儲(chǔ)至數(shù)據(jù)倉(cāng)庫(kù)內(nèi)預(yù)先創(chuàng)建的實(shí)體表和事實(shí)表內(nèi)。
4.如權(quán)利要求3所述的用戶畫(huà)像構(gòu)建方法,其特征在于,所述事實(shí)表包括事務(wù)事實(shí)表、周期快照事實(shí)表及累計(jì)快照事實(shí)表。
5.如權(quán)利要求1所述的用戶畫(huà)像構(gòu)建方法,其特征在于,所述用戶畫(huà)像標(biāo)簽體系內(nèi)的標(biāo)簽類型包括統(tǒng)計(jì)類標(biāo)簽、規(guī)則類標(biāo)簽和挖掘類標(biāo)簽,所述從數(shù)據(jù)倉(cāng)庫(kù)中獲取與所述標(biāo)簽相關(guān)的用戶數(shù)據(jù)處理后保存至用戶畫(huà)像數(shù)據(jù)庫(kù)包括:
所述標(biāo)簽的類型為統(tǒng)計(jì)類標(biāo)簽時(shí),從數(shù)據(jù)倉(cāng)庫(kù)中抽取出與所述標(biāo)簽相關(guān)的結(jié)構(gòu)化用戶數(shù)據(jù)后直接作為標(biāo)簽數(shù)據(jù)保存至用戶畫(huà)像數(shù)據(jù)庫(kù)內(nèi),或?qū)?dǎo)出的結(jié)構(gòu)化用戶數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)算后作為標(biāo)簽數(shù)據(jù)保存至用戶畫(huà)像數(shù)據(jù)庫(kù)內(nèi);
所述標(biāo)簽的類型為規(guī)則標(biāo)簽時(shí),從數(shù)據(jù)倉(cāng)庫(kù)中抽取出與所述標(biāo)簽相關(guān)的結(jié)構(gòu)化用戶數(shù)據(jù),使用分類算法對(duì)所述結(jié)構(gòu)化用戶數(shù)據(jù)進(jìn)行處理以獲得與所述規(guī)則標(biāo)簽對(duì)應(yīng)的標(biāo)簽數(shù)據(jù),并標(biāo)簽數(shù)據(jù)保存至用戶畫(huà)像數(shù)據(jù)庫(kù)內(nèi);
所述標(biāo)簽的類型為挖掘類標(biāo)簽時(shí),從數(shù)據(jù)倉(cāng)庫(kù)中抽取出與所述標(biāo)簽相關(guān)的非結(jié)構(gòu)化用戶數(shù)據(jù),對(duì)所述非結(jié)構(gòu)化用戶數(shù)據(jù)進(jìn)行挖掘以獲得與所述挖掘類標(biāo)簽對(duì)應(yīng)的標(biāo)簽數(shù)據(jù),并將標(biāo)簽數(shù)據(jù)保存至用戶畫(huà)像數(shù)據(jù)庫(kù)內(nèi)。
6.如權(quán)利要求5所述的用戶畫(huà)像構(gòu)建方法,其特征在于,所述對(duì)導(dǎo)出的結(jié)構(gòu)化用戶數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)算包括:
將導(dǎo)出的結(jié)構(gòu)化用戶數(shù)據(jù)與構(gòu)建好的統(tǒng)計(jì)函數(shù)封裝成spark任務(wù),將spark任務(wù)提交至spark集群上以完成統(tǒng)計(jì)計(jì)算。
7.如權(quán)利要求5所述的用戶畫(huà)像構(gòu)建方法,其特征在于,所述用分類算法對(duì)所述用戶數(shù)據(jù)進(jìn)行處理以獲得與所述規(guī)則標(biāo)簽對(duì)應(yīng)的標(biāo)簽數(shù)據(jù)包括:
將導(dǎo)出的結(jié)構(gòu)化用戶數(shù)據(jù)與構(gòu)建好的分類函數(shù)封裝成spark任務(wù),將spark任務(wù)提交至spark集群上以完成分類。
8.如權(quán)利要求5所述的用戶畫(huà)像構(gòu)建方法,其特征在于,所述對(duì)所述非結(jié)構(gòu)化用戶數(shù)據(jù)進(jìn)行挖掘以獲得與所述挖掘類標(biāo)簽對(duì)應(yīng)的標(biāo)簽數(shù)據(jù)包括:
對(duì)所述非結(jié)構(gòu)化用戶數(shù)據(jù)進(jìn)行分詞向量化處理以獲得所述非結(jié)構(gòu)化用戶數(shù)據(jù)的特征詞向量;
采用貝葉斯分類模型或決策樹(shù)模型對(duì)所述特征詞向量進(jìn)行挖掘以獲得與所述挖掘類標(biāo)簽對(duì)應(yīng)的標(biāo)簽數(shù)據(jù)。
9.一種電子裝置,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器內(nèi)并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的用戶畫(huà)像構(gòu)建方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-8任一項(xiàng)所述的用戶畫(huà)像構(gòu)建方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京博雅區(qū)塊鏈研究院有限公司,未經(jīng)南京博雅區(qū)塊鏈研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110294601.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 用戶畫(huà)像標(biāo)簽查詢方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 廣告投放方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種主體畫(huà)像生成的方法、裝置和存儲(chǔ)介質(zhì)
- 基于流平臺(tái)的智能全景客戶畫(huà)像聯(lián)動(dòng)方法及系統(tǒng)
- 畫(huà)像構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 畫(huà)像構(gòu)建方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種適用于城市軌道交通的乘客畫(huà)像系統(tǒng)及其構(gòu)建方法
- 用戶畫(huà)像方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備
- 一種跨境場(chǎng)景畫(huà)像構(gòu)建方法和裝置
- 一種用戶畫(huà)像方法與裝置





