[發明專利]一種基于遷移學習的在線廣告受眾排序方法有效
| 申請號: | 201410616126.1 | 申請日: | 2014-11-05 |
| 公開(公告)號: | CN104391883A | 公開(公告)日: | 2015-03-04 |
| 發明(設計)人: | 張立鑫;陳真勇;陳朋杰;熊璋 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 楊學明;顧煒 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 遷移 學習 在線 廣告 受眾 排序 方法 | ||
技術領域
本發明涉及互聯網廣告數據預處理、特征抽取、模型訓練、效果評測方法,特別涉及一種基于遷移學習的在線廣告受眾排序方法。
背景技術
科技與互聯網在全球的快速發展,帶動了一個具有巨大經濟價值的新興產業——在線廣告產業。在線廣告區別于傳統的線下購買的廣告投放模式,具有可交互性、可定制、可跟蹤、可送達的特點。根據其特點,為優化在線廣告的投放效果,使廣告主、媒體、受眾的收益最大化,一個新興的學科“計算廣告學”誕生了。“計算廣告學”旨在根據給定的用戶和上下文內容,通過計算得到與之最匹配的廣告并進行精準定向投放。
行為定向是在線廣告中一種主流的受眾定向方式,其根據用戶的在線歷史行為如搜索和網頁瀏覽日志等,將廣告正確的投放給對其感興趣的用戶。傳統的行為定向方式通過對用戶行為進行建模,按照用戶對廣告的興趣偏好輸出成百上千的用戶分段,且每個用戶分段會被給予一個標簽,如“體育”、“旅行”等,廣告主會通過這些標簽來判斷是否夠購買這些用戶分段,以盡可能的將廣告投放給對其產品感興趣的受眾。然而,這樣的受眾選擇方法過于依賴人工經驗,且用戶分段中可能包含數百萬的用戶,一些長尾廣告主由于預算有限無法負擔起如此大量的用戶。為了有效利用有限的預算,廣告主希望選擇更小范圍的受眾。根據用戶對廣告的潛在興趣,并通過對廣告與用戶的相關性排序,廣告主選擇相關性排序靠前的固定數量的用戶進行廣告投放,從而獲得更好的廣告收益。該問題稱為受眾排序問題。受眾排序依賴于傳統的行為定向中用戶行為歷史與其對廣告的偏好具有潛在相似性的假設。盡管用戶的歷史行為與其對廣告的潛在興趣有很強的關聯性,但是同一用戶不同的歷史行為信息并不具有完全相同的潛在興趣意圖。例如,某用戶的歷史查詢中包含較多的“牛仔褲”及“遷移學習”,但這兩個查詢與其對廣告的興趣意圖具有不同層次的關聯性。“牛仔褲”更有可能是是對“牛仔褲”服飾感興趣,如果推薦給其“牛仔褲”的廣告,其點擊的概率較大;而對于查詢“遷移學習”,可能用戶只想獲得與“遷移學習”的相關概念,而并不能認為其對“遷移學習”的廣告感興趣,何況幾乎不存在關于“遷移學習”的廣告。
綜上,本方法提出一種基于遷移學習的在線廣告受眾排序方法,該方法基于排序學習模型并根據用戶對廣告的潛在相關性對廣告受眾進行排序。與傳統的行為定向假設不同,本方法假設用戶歷史行為與用戶對廣告的潛在興趣是兩個不同的域,存在于不同的特征空間內。通過定義一個轉換矩陣建立兩個域之間的關系,并提出一種改進的BM25相關性算法——TransferBM25用以減少非相關查詢的影響。通過實驗表明,本方法提出在線廣告受眾排序方法是有效的,并且在相同的學習排序模型下,引入遷移知識的TransferBM25在廣告點擊率提升方面優于傳統的BM25相關性算法。
發明內容
本發明要解決的技術問題是:克服現有技術的不足,提出一種基于遷移學習的在線廣告受眾排序方法。首先,該方法提出基于排序學習模型,并按用戶對廣告的潛在相關性對廣告受眾進行排序。其次,與傳統的行為定向假設不同,該方法假設用戶歷史行為與用戶對廣告的潛在偏好是兩個不同的域,存在于不同的特征空間內。通過定義一個轉換矩陣建立兩個域之間的關系,并提出一個改進BM25相關性計算算法——TransferBM25,在刻畫廣告與用戶之間的相關性的同時,減少非相關歷史行為的影響。最后,該方法提出評價受眾排序效果的指標,以驗證本方法的正確性與有效性。
本發明解決其技術問題所采用的技術方案:一種基于遷移學習的在線廣告受眾排序方法,包括數據預處理、特征抽取、模型訓練、效果評測四部分。
數據預處理過程如下:
1.抽取廣告標題及其描述信息;
2.從互聯網歷史日志中,抽取用戶長期的搜索引擎查詢信息,并將其聚合在一起;
特征抽取過程如下:
1.提出引入遷移知識的改進BM25算法——TransferBM25,用于計算廣告與用戶的相關性分數;
2.計算用于排序學習模型訓練的特征值;
模型訓練過程如下:
1.采用基于pairwise的SVM?Ranking排序學習模型進行訓練;
實驗評測過程如下:
1.提出用于受眾排序效果評價的指標;
2.基于訓練后的最優模型對測試數據集中的受眾進行排序并對其效果進行評測;
本發明與現有技術相比所具有的優點是:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410616126.1/2.html,轉載請聲明來源鉆瓜專利網。





