[發(fā)明專利]數(shù)據(jù)處理方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011251902.4 | 申請(qǐng)日: | 2020-11-11 |
| 公開(kāi)(公告)號(hào): | CN112347355A | 公開(kāi)(公告)日: | 2021-02-09 |
| 發(fā)明(設(shè)計(jì))人: | 饒慧林;黃志濠 | 申請(qǐng)(專利權(quán))人: | 廣州酷狗計(jì)算機(jī)科技有限公司 |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06F16/2455;G06F16/28 |
| 代理公司: | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 郭翱杰 |
| 地址: | 510660 廣東省廣州*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)處理 方法 裝置 服務(wù)器 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)?zhí)峁┝艘环N數(shù)據(jù)處理方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì),屬于大數(shù)據(jù)技術(shù)領(lǐng)域。該方法包括:基于數(shù)據(jù)倉(cāng)庫(kù)中的任一用戶標(biāo)識(shí)對(duì)應(yīng)的多個(gè)第一歷史行為數(shù)據(jù)中的多個(gè)第一內(nèi)容標(biāo)識(shí),生成第一位數(shù)組,每個(gè)第一內(nèi)容標(biāo)識(shí)分別對(duì)應(yīng)該第一位數(shù)組中的多個(gè)位;存儲(chǔ)該任一用戶標(biāo)識(shí)以及該第一位數(shù)組的對(duì)應(yīng)關(guān)系;響應(yīng)于過(guò)濾請(qǐng)求,基于所存儲(chǔ)的用戶標(biāo)識(shí)與位數(shù)組的對(duì)應(yīng)關(guān)系,確定該過(guò)濾請(qǐng)求攜帶的用戶標(biāo)識(shí)對(duì)應(yīng)的目標(biāo)位數(shù)組;基于該目標(biāo)位數(shù)組,確定對(duì)該過(guò)濾請(qǐng)求攜帶的內(nèi)容標(biāo)識(shí)的過(guò)濾結(jié)果。本申請(qǐng)由二進(jìn)制的位數(shù)組來(lái)對(duì)大量的內(nèi)容標(biāo)識(shí)進(jìn)行表示,通過(guò)存儲(chǔ)位數(shù)組來(lái)支持過(guò)濾服務(wù),能夠極大地減少為支持過(guò)濾服務(wù)而占用的存儲(chǔ)空間,提高存儲(chǔ)空間的利用率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及大數(shù)據(jù)技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)處理方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)。
背景技術(shù)
在一些場(chǎng)景中,為了向用戶提供更好的服務(wù),存在基于海量數(shù)據(jù)的過(guò)濾需求。例如,在向用戶進(jìn)行內(nèi)容推薦的場(chǎng)景中,需要從候選內(nèi)容中過(guò)濾掉已向該用戶推薦的內(nèi)容,再?gòu)氖S嗟暮蜻x內(nèi)容中確定出向該用戶推薦的內(nèi)容。
相關(guān)技術(shù)中,會(huì)預(yù)先對(duì)應(yīng)存儲(chǔ)用戶標(biāo)識(shí)和已推薦內(nèi)容的內(nèi)容標(biāo)識(shí),從而能夠根據(jù)已存儲(chǔ)的用戶標(biāo)識(shí)與已推薦內(nèi)容的內(nèi)容標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,確定出已推薦內(nèi)容,進(jìn)而對(duì)已推薦內(nèi)容進(jìn)行過(guò)濾。
由于內(nèi)容標(biāo)識(shí)通常為字符串的格式,在內(nèi)容標(biāo)識(shí)的存儲(chǔ)數(shù)量很多的情況下,直接存儲(chǔ)內(nèi)容標(biāo)識(shí)會(huì)占用巨大的存儲(chǔ)空間,導(dǎo)致存儲(chǔ)空間的利用率較低。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種數(shù)據(jù)處理方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì),能夠提高存儲(chǔ)空間的利用率。所述技術(shù)方案如下:
根據(jù)本申請(qǐng)實(shí)施例的一方面,提供了一種數(shù)據(jù)處理方法,所述方法包括:
基于數(shù)據(jù)倉(cāng)庫(kù)中的任一用戶標(biāo)識(shí)對(duì)應(yīng)的多個(gè)第一歷史行為數(shù)據(jù)中的多個(gè)第一內(nèi)容標(biāo)識(shí),生成第一位數(shù)組,其中,所述第一歷史行為數(shù)據(jù)用于記錄被執(zhí)行交互行為的內(nèi)容,每個(gè)所述第一內(nèi)容標(biāo)識(shí)分別對(duì)應(yīng)所述第一位數(shù)組中的多個(gè)位;
存儲(chǔ)所述任一用戶標(biāo)識(shí)以及所述第一位數(shù)組的對(duì)應(yīng)關(guān)系;
響應(yīng)于過(guò)濾請(qǐng)求,基于所存儲(chǔ)的用戶標(biāo)識(shí)與位數(shù)組的對(duì)應(yīng)關(guān)系,確定所述過(guò)濾請(qǐng)求攜帶的用戶標(biāo)識(shí)對(duì)應(yīng)的目標(biāo)位數(shù)組;
基于所述目標(biāo)位數(shù)組,確定對(duì)所述過(guò)濾請(qǐng)求攜帶的內(nèi)容標(biāo)識(shí)的過(guò)濾結(jié)果。
在一種可選的實(shí)現(xiàn)方式中,所述基于數(shù)據(jù)倉(cāng)庫(kù)中的任一用戶標(biāo)識(shí)對(duì)應(yīng)的多個(gè)第一歷史行為數(shù)據(jù)中的多個(gè)第一內(nèi)容標(biāo)識(shí),生成第一位數(shù)組,包括:
響應(yīng)于查詢壓縮語(yǔ)句,調(diào)用查詢壓縮模塊,在數(shù)據(jù)倉(cāng)庫(kù)工具h(yuǎn)ive對(duì)應(yīng)的內(nèi)存中,執(zhí)行所述基于數(shù)據(jù)倉(cāng)庫(kù)中的任一用戶標(biāo)識(shí)對(duì)應(yīng)的多個(gè)第一歷史行為數(shù)據(jù)中的多個(gè)第一內(nèi)容標(biāo)識(shí),生成第一位數(shù)組的步驟;
其中,所述查詢壓縮語(yǔ)句用于指示獲取用于表示所述任一用戶標(biāo)識(shí)對(duì)應(yīng)的多個(gè)第一內(nèi)容標(biāo)識(shí)的第一位數(shù)組,所述查詢壓縮模塊是以所述hive為基礎(chǔ)擴(kuò)展的功能模塊。
在另一種可選的實(shí)現(xiàn)方式中,所述第一歷史行為數(shù)據(jù)用于記錄在第一時(shí)間段內(nèi)被執(zhí)行交互行為的內(nèi)容;
所述存儲(chǔ)所述任一用戶標(biāo)識(shí)以及所述第一位數(shù)組的對(duì)應(yīng)關(guān)系,包括:
基于所述任一用戶標(biāo)識(shí)和所述第一時(shí)間段,生成第一關(guān)鍵字;
存儲(chǔ)所述第一關(guān)鍵字以及所述第一位數(shù)組的對(duì)應(yīng)關(guān)系。
在另一種可選的實(shí)現(xiàn)方式中,所述存儲(chǔ)所述任一用戶標(biāo)識(shí)以及所述第一位數(shù)組的對(duì)應(yīng)關(guān)系之后,所述方法還包括:
響應(yīng)于到達(dá)位數(shù)組更新時(shí)間,基于所述數(shù)據(jù)倉(cāng)庫(kù)中的所述任一用戶標(biāo)識(shí)對(duì)應(yīng)的多個(gè)第二歷史行為數(shù)據(jù)中的多個(gè)第二內(nèi)容標(biāo)識(shí),生成第二位數(shù)組,所述第二歷史行為數(shù)據(jù)用于記錄在所述位數(shù)組更新時(shí)間所屬的第二時(shí)間段內(nèi)被執(zhí)行交互行為的內(nèi)容;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州酷狗計(jì)算機(jī)科技有限公司,未經(jīng)廣州酷狗計(jì)算機(jī)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011251902.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于UDP分布式小文件存儲(chǔ)系統(tǒng)及其數(shù)據(jù)處理方法
- 一種新型云計(jì)算管理系統(tǒng)
- 一種云計(jì)算管理裝置
- 一種節(jié)能數(shù)據(jù)服務(wù)器架構(gòu)系統(tǒng)
- 一種基于云計(jì)算的客戶信息管理裝置
- 一種基于即時(shí)通訊技術(shù)的通訊系統(tǒng)
- 服務(wù)器系統(tǒng)及分配服務(wù)器的方法
- 一種MMORPG游戲服務(wù)器端
- 一種訪問(wèn)請(qǐng)求的處理方法、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于Spark技術(shù)的大數(shù)據(jù)脫敏管理系統(tǒng)





