[發(fā)明專利]一種無位置偏見影響的廣告與頁面匹配的方法有效
| 申請?zhí)枺?/td> | 201310197731.5 | 申請日: | 2013-05-24 |
| 公開(公告)號: | CN103268344A | 公開(公告)日: | 2013-08-28 |
| 發(fā)明(設(shè)計)人: | 賀樑;霍曉駿;向平;倪敏杰;徐曉楓;羅念 | 申請(專利權(quán))人: | 華東師范大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海藍迪專利事務(wù)所 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 位置 偏見 影響 廣告 頁面 匹配 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及用于為搜索引擎頁面匹配廣告的領(lǐng)域,具體地說是一種基于協(xié)同過濾鄰域模型的廣告匹配選取方法。
背景技術(shù)
在用戶瀏覽網(wǎng)頁時,特別是搜索引擎的檢索頁面,頁面的側(cè)邊欄會從上到下展示若干條廣告,這些廣告就是通過廣告匹配系統(tǒng),計算與該頁面的匹配程度,將匹配程度高的廣告展示在頁面?zhèn)冗厵谥锌可系奈恢谩?/p>
在各種廣告匹配系統(tǒng)中,對特定頁面與特定廣告之間的相關(guān)程度是是否為該頁面匹配該廣告的一個重要指標(biāo)。該指標(biāo)可以借由特定頁面下特定廣告的點擊率加以表示。
傳統(tǒng)的點擊率計算方法,通過日志找到要計算的廣告在要計算的頁面下的展示次數(shù)、被點擊次數(shù),只是簡單地相除。忽視了廣告展示位置對廣告點擊次數(shù)的影響。在早期的廣告匹配系統(tǒng)中,根據(jù)廣告商的競價來決定展示的位置,出價高的廣告會被展示在靠上的廣告位置中,而不考慮這個廣告與頁面是否相關(guān)。根據(jù)研究顯示,展示在位置靠上的廣告更容易被點擊,盡管這個廣告和刊登它的頁面的相關(guān)程度沒有位置靠下的廣告和該頁面的相關(guān)程度高,這是用戶的瀏覽習(xí)慣所導(dǎo)致的。這樣一來,即使不相關(guān)的廣告也擁有大量的點擊率,即被視為和該頁面相關(guān),這是不合邏輯的。因此,簡單地使用傳統(tǒng)的點擊率計算方法,求得的點擊率是帶有位置偏見的,這樣的點擊率不能很好地表達特定廣告與特定頁面的相關(guān)程度。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)中忽略位置偏見的技術(shù)缺陷而提供的一種排除位置偏見的廣告匹配方法,該方法可根據(jù)特定位置下所有廣告的點擊情況,調(diào)整個別廣告的點擊率,并且根據(jù)相似頁面的廣告刊登情況,調(diào)整目標(biāo)頁面的廣告匹配。
實現(xiàn)本發(fā)明目的的具體技術(shù)方案是:
一種無位置偏見影響的廣告與頁面匹配的方法,該方法包括如下步驟:
a)確定每個搜索頁面中所有廣告的展示位置、展示次數(shù)和點擊次數(shù);具體包括:
Ⅰ)確定頁面總數(shù)M、廣告總數(shù)N、頁面能展示廣告的位置總數(shù)P;
Ⅱ)計算每個頁面下每個廣告在每個位置的展示次數(shù)、點擊次數(shù);計算每個頁面下每個位置的所有廣告的展示總數(shù)、點擊總數(shù);計算每個廣告在每個位置的展示總數(shù)、點擊總數(shù);計算每個位置下所有廣告的展示總數(shù)、點擊總數(shù)以及每個廣告的展示總數(shù)、點擊總數(shù);根據(jù)得到的數(shù)據(jù),將對應(yīng)的點擊次數(shù)除以展示次數(shù),得到每個頁面下每個廣告在每個位置的點擊率、每個頁面下每個位置的所有廣告的點擊率、每個廣告在每個位置的點擊率、每個位置下所有廣告的點擊率以及每個廣告的點擊率;
b)利用統(tǒng)計方法,排除廣告所在頁面位置對廣告點擊所造成的影響,計算每個頁面下刊登的每個廣告的固有點擊率;具體包括:
Ⅰ)根據(jù)全概率公式和貝葉斯公式,計算出在某個頁面下某個廣告被點擊的條件概率,即某個廣告在某個頁面下的無偏見點擊率,排除廣告位置對廣告點擊率的影響;
c)根據(jù)頁面與廣告的固有點擊率,計算頁面之間關(guān)于廣告的相似度關(guān)系;具體包括:
Ⅰ)將一個頁面表示成一個N維向量,每一個維度上的元素對應(yīng)這個頁面下相應(yīng)廣告的無偏見點擊率;總計有M個頁面向量;
Ⅱ)通過調(diào)整余弦相似度計算總計M個頁面向量兩兩之間的相似度;
d)對于一個待推薦的目標(biāo)頁面,根據(jù)相似的其他頁面,為其匹配合適的廣告;具體包括:
Ⅰ)對于一個待匹配P個廣告的目標(biāo)頁面q,根據(jù)步驟c)中的相似度,找到與頁面q最相似的K個頁面,稱為相似鄰居;
Ⅱ)從相似鄰居中,找到在相似鄰居中展示、但在目標(biāo)頁面q下沒有展示過的廣告集合A;
Ⅲ)對于屬于集合A中的每個廣告,根據(jù)相似鄰居中對應(yīng)廣告的無偏見點擊率以及相似鄰居與頁面q的相似度進行加權(quán)求和,計算得到這個廣告在目標(biāo)頁面q下預(yù)測的無偏見點擊率;
Ⅳ)將集合A中所有廣告按照預(yù)測的無偏見點擊率從大到小排序,選擇最大的P個廣告推薦給目標(biāo)頁面q用作廣告展示。?
與背景技術(shù)相比,本發(fā)明有以下優(yōu)點:?
本發(fā)明在計算頁面與廣告的相關(guān)程度時,考慮到基礎(chǔ)數(shù)據(jù)由于受到位置偏見的作用而影響了數(shù)據(jù)的真實性,通過概率統(tǒng)計與計算排除了位置偏見對數(shù)據(jù)的影響,使得廣告的點擊率能夠真實反映該廣告與頁面的相關(guān)程度,更加合理地還原了數(shù)據(jù)中所蘊含的信息。
本發(fā)明在為頁面匹配廣告時,參考了協(xié)同推薦的思想,利用相似頁面進行廣告的選擇和相關(guān)程度的預(yù)估計,更加準(zhǔn)確的為頁面匹配廣告。
本發(fā)明不需要額外的數(shù)據(jù)支持,不需要進行文本的分析,向量的計算簡化了整個計算流程,提高了系統(tǒng)的效率。
附圖說明
圖1為本發(fā)明流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東師范大學(xué),未經(jīng)華東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310197731.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





