[發明專利]一種基于遷移學習的在線廣告受眾排序方法有效
| 申請號: | 201410616126.1 | 申請日: | 2014-11-05 |
| 公開(公告)號: | CN104391883A | 公開(公告)日: | 2015-03-04 |
| 發明(設計)人: | 張立鑫;陳真勇;陳朋杰;熊璋 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 楊學明;顧煒 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 遷移 學習 在線 廣告 受眾 排序 方法 | ||
1.一種基于遷移學習的在線廣告受眾排序方法,其特征在于,包括如下步驟:數據預處理、特征抽取、模型訓練和效果評測;
步驟一:數據預處理過程如下:
1)抽取廣告標題及其描述信息;
2)從互聯網歷史日志中,抽取用戶長期的搜索引擎查詢信息,并將其聚合在一起;
步驟二:特征抽取過程如下:
1)提出引入遷移知識的改進BM25算法——TransferBM25,用于計算廣告與用戶的相關性分數;
2)計算用于排序學習模型訓練的特征值;
步驟三:模型訓練過程如下:
1)采用基于Pairwise的SVM?Ranking排序學習模型進行訓練;
步驟四:實驗評測過程如下:
1)提出用于受眾排序效果評價的指標;
2)基于訓練后的最優模型對測試數據集中的受眾進行排序并對其效果進行評測。
2.根據權利要求1所述的基于遷移學習的在線廣告受眾排序方法,其特征在于步驟二:假設用戶歷史行為域與其對廣告的偏好域在不同特征空間里,并通過定義相關性轉換矩陣建立兩者的關系,以減少非相關用戶歷史行為信息對其廣告偏好的影響,定義R(a|q)來表示查詢q與廣告a的相關性,其表達式為:
對于與廣告相關性很差的查詢,使用次數多,而召回的廣告少,因此R(a|q)分值會很低;而對于與廣告相關性較強的查詢而言,R(a|q)則會得到較高的分值;定義轉換矩陣T[i,j]=R(aj|qi),則引入遷移知識的用戶查詢矩陣為Utransfer=Uquery*T,其中Uquery為原始用戶查詢矩陣。
3.根據權利要求2所述的基于遷移學習的在線廣告受眾排序方法,其特征在于:步驟二中所述的TransferBM25方法如下:
對于給定的廣告A,用戶U以及包含關鍵詞q1...qn的廣告查詢Q,TransferBM25定義為:
其中f(qi,U)為qi在用戶歷史查詢U中出現的詞頻,其計算方法為f(qi,U)=|qi|/|q∈U|,|U|為用戶歷史查詢中包含的關鍵詞個數,avgl為用戶集合中所有用戶歷史查詢中平均包含的關鍵詞個數,k與b為調節參數。R(A|qi)表示查詢qi對廣告A的相關度分值;IDF(qi)為對qi的反文檔頻率,其計算的方法如下:
其中N為用戶集合中包含的用戶個數,n(qi)為包含查詢詞qi的用戶個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410616126.1/1.html,轉載請聲明來源鉆瓜專利網。





