[發明專利]一種互聯網廣告的流量匹配算法在審
| 申請號: | 201711109061.1 | 申請日: | 2017-11-11 |
| 公開(公告)號: | CN107895285A | 公開(公告)日: | 2018-04-10 |
| 發明(設計)人: | 彭蓉 | 申請(專利權)人: | 北京小子科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 102200 北京市昌平區回龍觀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 互聯網 廣告 流量 匹配 算法 | ||
1.一種互聯網廣告的流量匹配算法,其特征在于,所述流量匹配算法包括文本相似度計算和地理信息挖掘計算;將通過文本相似度計算得到的文本相似度和通過地理信息挖掘計算得到的地理相似度進行線性組合,計算得到廣告與文本的最終相似度;
所述文本相似度計算包括利用VSM計算網頁與廣告的文本相似度;
所述地理信息挖掘計算包括:通過TF*IDF加權選取特征,確定網頁文本和廣告文本中的關鍵詞,之后對關鍵詞做同義詞、近義詞上的語義擴展并估算特征權重;抽取地理特征,并分配地理范圍,根據網頁和廣告的地理范圍計算得到地理相似度。
2.根據權利要求1所述的流量匹配算法,其特征在于,所述抽取地理特征通過Yahoo的Place工具來獲取網頁中的地理位置;在分配地理范圍時,網頁中唯一地址為地理范圍,若網頁中出現多個地理位置,將多個地理位置按出現的頻度由高到低排序,取頻度最高的地理位置。
3.根據權利要求2所述的流量匹配算法,其特征在于,設地理位置和網頁的相似度為tgr,tgr為人工設定值,其范圍為0-1,當地理位置精確到市級以下時tgr為1,當地理位置精確到省級時tgr為0.5,當地理位置精確到國家級時tgr為0。
4.根據權利要求3所述的流量匹配算法,其特征在于,地理相似度的計算如下:其中,Sw為所屬地理范圍的面積,Sa為廣告地理范圍的面積,Dwa為兩個地理范圍的距離,為重疊面積的影響因子,β為表示距離的影響因子,Sw∩Sa表示網頁地理范圍和廣告地理范圍的重疊面積。
5.根據權利要求4所述的流量匹配算法,其特征在于,所述Place工具能夠獲得地理位置的中心緯度和經度,通過經緯度轉化,地理位置可以計算成平面地圖上的點坐標(x,y)值,地理位置的中心坐標表示為C(x,y),地理范圍表示成由西南角和東北角兩個點構成的坐標范圍(SW(x1,y1),NE(x2,y2)),通過地理范圍的坐標換算,得到Sw和Sa。
6.根據權利要求5所述的流量匹配算法,其特征在于,文本相似度的計算公式如下:其中,dj表示第j個網頁文檔,ak表示第k個廣告文檔,Wij表示網頁文檔dj中第i個關鍵詞的權重,Wik表示廣告文檔ak中第i個關鍵詞的權重。
7.根據權利要求6所述的流量匹配算法,其特征在于,最終相似度的計算公式如下:R=ts×(1-tgr)+gs×tgr,其中,ts為文本相似度,gs為地理相似度,tgr為地理位置和網頁的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小子科技有限公司,未經北京小子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711109061.1/1.html,轉載請聲明來源鉆瓜專利網。





