[發(fā)明專利]一種基于機器學習的在線廣告精準投放方法在審
| 申請?zhí)枺?/td> | 202011128887.4 | 申請日: | 2020-10-20 |
| 公開(公告)號: | CN112418905A | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計)人: | 任程威;胡冀 | 申請(專利權(quán))人: | 杭州電子科技大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/9535;G06K9/62;G06N20/00 |
| 代理公司: | 浙江永鼎律師事務(wù)所 33233 | 代理人: | 陸永強 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機器 學習 在線 廣告 精準 投放 方法 | ||
本發(fā)明公開了基于機器學習的在線廣告精準投放方法,包括以下步驟:S10,數(shù)據(jù)采集;S20,特征標簽提取;S30,TGCW在線分類學習;S40,類別生成;S50,廣告投放。本發(fā)明針對大數(shù)據(jù)精準營銷中用戶畫像的刻畫,對用戶的瀏覽行為生成的流數(shù)據(jù)進行分析從而對用戶進行分類,以此實現(xiàn)針對各類別用戶的精準廣告投放。
技術(shù)領(lǐng)域
本發(fā)明屬于機器學習領(lǐng)域,涉及一種基于機器學習的在線廣告精準投放方法。
背景技術(shù)
隨著信息技術(shù)的迅猛發(fā)展,尤其是互聯(lián)網(wǎng)行業(yè)的廣泛應(yīng)用,越來越多的領(lǐng)域出現(xiàn)了對海量高速到達的數(shù)據(jù)實時處理需求。在電商行業(yè)產(chǎn)生的業(yè)務(wù)數(shù)據(jù)大多數(shù)情況下可以看作動態(tài)到達的流式數(shù)據(jù),與傳統(tǒng)數(shù)據(jù)相比,這類數(shù)據(jù)具有動態(tài)性、無序性、無限性、不平衡和體積大等特點。而現(xiàn)代數(shù)字廣告投放系統(tǒng)中常常以物擬人、以物窺人,所以在大數(shù)據(jù)的精準營銷中刻畫用戶畫像則需要考慮如何從用戶的瀏覽行為生成的海量流數(shù)據(jù)中進行實時分析,對每一個樣本進行精準分類,從而實現(xiàn)對每位用戶進行精準的廣告投放。
但是如果使用傳統(tǒng)的批處理式的學習方法來對用戶的瀏覽行為分析,一方面不僅存在學習時間長、學習效率低的問題,而且未考慮到數(shù)據(jù)的不平衡性,一定程度上會影響學習分類精度;另一方面難以針對增量數(shù)據(jù)有效地更新模型,即無法記憶大部分以前學得的模型,導致難以有效地使模型適應(yīng)數(shù)據(jù)中發(fā)生的概念遷移和概念演化問題。傳統(tǒng)的批處理模式的機器學習算法在當前大數(shù)據(jù)環(huán)境下變得越來越力不從心,而使用TGCW在線學習方法通過流式計算框架,在內(nèi)存中直接對數(shù)據(jù)實時運算,有助于電商行業(yè)對用戶行為流數(shù)據(jù)的學習,為廣告的精準投放提供了有力的工具。
因此,鑒于以往的方法很難滿足目前對于不平衡流數(shù)據(jù)在線分類,并且分類投放的精度仍有提升空間。現(xiàn)有技術(shù)至少存在以下缺點或問題:
1.傳統(tǒng)的批處理學習方法難以記憶以前學得的模型,難以對增量數(shù)據(jù)進行高效快速的學習,這使得這些學習算法難以應(yīng)用于精準快速的廣告投放系統(tǒng)。
2.現(xiàn)有的在線學習算法在用于用戶廣告投放的在線分類學習時并未考慮數(shù)據(jù)的不平衡性。而現(xiàn)實中有很多類別存在不均衡問題,它是常見的,并且也是合理的,符合人們期望的,所以以往在線學習分類算法在廣告投放的實際應(yīng)用中未考慮數(shù)據(jù)不平衡性的問題亟待解決。
3.以往在線分類學習算法的分類精度仍有提高空間,所以廣告投放的精準度仍可提升。
發(fā)明內(nèi)容
本發(fā)明通過TGCW在線學習方法對在線用戶流數(shù)據(jù)進行在線特征的精確選擇,根據(jù)用戶行為的特征對其進行分類,最終能夠精準快速的將相應(yīng)的廣告投放至相應(yīng)用戶。本發(fā)明方法即解決了傳統(tǒng)在線分類方法無解解決的不平衡流數(shù)據(jù)分類問題,同時提高了分類性能以實現(xiàn)廣告投放精準度的提升。
本發(fā)明提出一種基于三維點云數(shù)據(jù)識別出變電站設(shè)備類型的分類方法,包括以下步驟:
S10,數(shù)據(jù)采集;
S20,特征標簽提取;
S30,TGCW在線分類學習;
S40,類別生成;
S50,廣告投放。
優(yōu)選地,所述數(shù)據(jù)采集,為將用戶數(shù)據(jù)通過云端收入到數(shù)據(jù)采集模塊中。
優(yōu)選地,所述用戶數(shù)據(jù)包括用戶的性別、年齡段、常駐地點、用戶的平臺行為特征、用戶對內(nèi)容的瀏覽時長和用戶標簽,其中,用戶的平臺行為特征包括用戶的瀏覽內(nèi)容、用戶的購買記錄、用戶對內(nèi)容的評分;用戶標簽包括用戶興趣、用戶需求、用戶偏好。
優(yōu)選地,所述特征標簽提取,為通過對數(shù)據(jù)采集模塊中的數(shù)據(jù)進行統(tǒng)計,提取出特征和標簽。
優(yōu)選地,所述TGCW在線分類學習,為將提取的特征和標簽輸入至TGCW在線學習算法,進行增量學習以生成動態(tài)的分類學習模型,包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學,未經(jīng)杭州電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011128887.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:多振鏡激光拼接校準的快速處理方法
- 下一篇:基于電流脈沖滲透的胰島素泵
- 同類專利
- 專利分類





