[發(fā)明專利]特征聚合的方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201910618663.2 | 申請(qǐng)日: | 2019-07-09 |
| 公開(公告)號(hào): | CN110310161A | 公開(公告)日: | 2019-10-08 |
| 發(fā)明(設(shè)計(jì))人: | 張浩 | 申請(qǐng)(專利權(quán))人: | 西安點(diǎn)告網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | G06Q30/02 | 分類號(hào): | G06Q30/02;G06K9/62 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 徐麗 |
| 地址: | 710000 陜西省西安市高新區(qū)天谷八路1*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)格 廣告特征 特征組 聚合 二維坐標(biāo)系 特征信息 廣告 廣告技術(shù)領(lǐng)域 預(yù)估 特征樣本 點(diǎn)擊率 訪問量 同列 輸出 智能 同行 | ||
本發(fā)明實(shí)施例提供一種特征聚合的方法及裝置,涉及智能廣告技術(shù)領(lǐng)域,用以解決現(xiàn)有技術(shù)中存在的特征樣本過少,從而導(dǎo)致預(yù)估的準(zhǔn)確性較低的問題。本方案為:獲取廣告的特征信息,特征信息包括廣告的訪問量PV和點(diǎn)擊率CTR;在二維坐標(biāo)系中根據(jù)廣告的PV和CTR確定廣告特征點(diǎn);對(duì)二維坐標(biāo)系劃分形成M*N個(gè)網(wǎng)格,以使得落入每列的PV的總和相同且落入同列的每個(gè)網(wǎng)格的PV的總和相同,或者以使得落入每行的PV的總和相同且落入同行的每個(gè)網(wǎng)格的PV的總和相同;根據(jù)M*N個(gè)網(wǎng)格輸出聚合后的特征組,每個(gè)特征組的PV為落入每個(gè)網(wǎng)格的廣告特征點(diǎn)的PV之和,每個(gè)特征組的CTR為落入每個(gè)網(wǎng)格的廣告特征點(diǎn)的CTR之和;其中,M和N是大于或等于2的整數(shù)。
技術(shù)領(lǐng)域
本發(fā)明涉及智能廣告技術(shù)領(lǐng)域,具體涉及一種特征聚合的方法及裝置。
背景技術(shù)
需求方平臺(tái)(英文全稱:DemandSidePlatform,簡(jiǎn)稱:DSP)是一個(gè)系統(tǒng),也是一種在線廣告平臺(tái),匯集了各種廣告交易平臺(tái)(Advertisement Exchange)的庫(kù)存。
DSP服務(wù)于廣告主,對(duì)接ADX的流量,集合了眾多小媒體的流量,這樣使得廣告的點(diǎn)擊率很低,數(shù)據(jù)比較稀疏,直接采用這些點(diǎn)擊率進(jìn)行預(yù)估時(shí),會(huì)導(dǎo)致預(yù)估的準(zhǔn)確率較低。因此,需要先解決特征樣本過少的問題。
目前均是通過特征聚合的方式實(shí)現(xiàn)降維,從而增加樣本數(shù)量?,F(xiàn)有技術(shù)中采用的K-means算法進(jìn)行特征聚合,聚合的特征組的特征數(shù)量無法控制,使得聚合的特征組的特征數(shù)量可大可小,這樣有些特征組的特征數(shù)量仍然較少,從而導(dǎo)致預(yù)估的準(zhǔn)確性依然很低。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種特征聚合的方法及裝置,解決現(xiàn)有技術(shù)中存在的特征樣本過少,從而導(dǎo)致預(yù)估的準(zhǔn)確性較低的問題。
為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
本發(fā)明實(shí)施例的第一方面,提供一種特征聚合的方法,所述方法包括:獲取廣告的特征信息,所述特征信息包括廣告的訪問量PV和點(diǎn)擊率CTR;在二維坐標(biāo)系中根據(jù)所述廣告的PV和CTR確定廣告特征點(diǎn);對(duì)所述二維坐標(biāo)系劃分形成M*N個(gè)網(wǎng)格,以使得落入每列的PV的總和相同且落入同列的每個(gè)網(wǎng)格的PV的總和相同,或者以使得落入每行的PV的總和相同且落入同行的每個(gè)網(wǎng)格的PV的總和相同;根據(jù)所述M*N個(gè)網(wǎng)格輸出聚合后的特征組,每個(gè)特征組的PV為落入每個(gè)網(wǎng)格的所述廣告特征點(diǎn)的PV之和,每個(gè)特征組的CTR為落入每個(gè)網(wǎng)格的所述廣告特征點(diǎn)的CTR之和;其中,所述M和N是大于或等于2的整數(shù)。
在一個(gè)實(shí)施例中,所述對(duì)所述二維坐標(biāo)系劃分形成M*N個(gè)網(wǎng)格,包括:按照從小到大的順序?qū)V告特征點(diǎn)中的PV排序;按照PV將所述二維坐標(biāo)系中的X軸劃分N列,每列的PV的總和相同;按照CTR分別將所述N列中的每列劃分為M行,同列的每個(gè)格子的PV的總和相同。
在一個(gè)實(shí)施例中,所述對(duì)所述二維坐標(biāo)系劃分形成M*N個(gè)網(wǎng)格,包括:按照從小到大的順序?qū)V告特征點(diǎn)中的CTR排序,按照CTR值將所述二維坐標(biāo)系中的Y軸劃分為M行,每行的CTR的總和相同;按照PV分別將所述M行中的每行劃分為N列,同行的每個(gè)格子的PV的總和相同。
在一個(gè)實(shí)施例中,所述方法還包括:根據(jù)CTR預(yù)估模型的權(quán)重驗(yàn)證聚合結(jié)果。
在一個(gè)實(shí)施例中,所述根據(jù)CTR預(yù)估模型的權(quán)重驗(yàn)證聚合結(jié)果,包括:當(dāng)CTR預(yù)估模型的權(quán)重和所述聚合結(jié)果不一致時(shí),調(diào)整M和N的大小,直到所述CTR預(yù)估模型的權(quán)重和所述聚合結(jié)果保持一致。
在一個(gè)實(shí)施例中,所述M為20,所述N為5。
本發(fā)明實(shí)施例的第二方面,提供一種廣告點(diǎn)擊率預(yù)估的方法,所述方法包括:通過第一方面所述的方法生成聚合后的特征組;根據(jù)所述聚合后的特征組訓(xùn)練點(diǎn)擊率預(yù)估模型;根據(jù)訓(xùn)練后的點(diǎn)擊率預(yù)估模型預(yù)估待投放廣告的點(diǎn)擊率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安點(diǎn)告網(wǎng)絡(luò)科技有限公司,未經(jīng)西安點(diǎn)告網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910618663.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷,例如,市場(chǎng)研究與分析、調(diào)查、促銷、廣告、買方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開發(fā)票
G06Q30-06 .購(gòu)買、出售或租賃交易
G06Q30-08 ..拍賣
- 通過監(jiān)視和分發(fā)網(wǎng)格活動(dòng)促進(jìn)整個(gè)網(wǎng)格環(huán)境管理
- 網(wǎng)格
- 點(diǎn)云網(wǎng)格簡(jiǎn)化系統(tǒng)及方法
- 網(wǎng)格
- CT穿刺引導(dǎo)定位膜
- CT穿刺引導(dǎo)定位膜
- 虛擬現(xiàn)實(shí)三維水體渲染中水體網(wǎng)格的處理方法
- 一種環(huán)境監(jiān)管網(wǎng)格化系統(tǒng)、方法及電子設(shè)備
- 用于海洋結(jié)構(gòu)物與水面網(wǎng)格重疊部分的重建方法
- 一種道具吸附的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





