[發明專利]一種基于微博的廣告推薦方法及系統有效
| 申請號: | 201310608335.7 | 申請日: | 2013-11-26 |
| 公開(公告)號: | CN103617230B | 公開(公告)日: | 2017-02-15 |
| 發明(設計)人: | 章昉;劉明君;趙中英 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02 |
| 代理公司: | 深圳中一專利商標事務所44237 | 代理人: | 張全文 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 廣告 推薦 方法 系統 | ||
技術領域
本發明屬于數據挖掘領域,尤其涉及一種基于微博的廣告推薦方法及系統。
背景技術
隨著新浪微博、騰訊微博等社交網站在國內的流行,微博等社會化媒體不僅成為了網民發布、共享、傳播信息的平臺,而且積累了大規模網民的行為數據。2012年5月,新浪微博事業部副總經理蘆義指出,新浪微博注冊用戶已超過3億,用戶平均每天發布超過1億條微博內容。微博用戶的基數大,數據量大,若微博運營系統能夠分析和挖掘已有的海量數據,能夠根據分析結果對微博用戶的興趣進行較為精準的判斷,根據微博用戶的興趣對其進行廣告投放,則對微博用戶推送的廣告將使微博用戶、商家和微博運營商三方都受益。
現有的微博廣告推薦方法主要利用用戶個人資料里的標簽或者使用用戶的搜索記錄對微博用戶進行興趣判斷,進而對其推送用戶可能感興趣的廣告。由于很多用戶的個人資料里面并不含有標簽或者用戶在創建個人資料時填寫的標簽不準確,因此通過用戶標簽來對其進行廣告推薦不能達到很好的效果。而通過對微博用戶的搜索記錄來判斷用戶的興趣具有一定的局限性,僅僅能表示該用戶的當前需要而不能對其興趣進行較為準確的判斷。
發明內容
本發明實施例提供了一種基于微博的廣告推薦方法,旨在解決現有的方法在挖掘用戶信息時準確性低,從而導致廣告推薦效果不好的問題。
本發明實施例是這樣實現的,一種基于微博的廣告推薦方法,所述方法包括下述步驟:
讀取用戶的微博數據;
初始化讀取的微博數據,以獲得微博文本詞項集合,所述初始化讀取的微博數據包括去除讀取的微博數據中的特殊符號、非中文字符、分詞;
刪除所述微博文本詞項集合的停用詞,以獲得微博文本原始特征詞項集合;
將所述微博文本原始特征詞項集合與預先生成的特征詞項字典進行映射,判斷所述微博文本原始特征詞項集合中的詞項是否出現在所述預先生成的特征詞項字典中,并計算出現在所述預先生成的特征詞項字典中的所述微博文本原始特征詞項集合中的詞項的詞頻-逆向文件頻率tf-idf值,以作為所述出現在所述預先生成的特征詞項字典中的所述微博文本原始特征詞項集合中的詞項在微博的特征值;
判斷所述預先生成的特征詞項字典的詞項是否出現在所述微博文本原始特征詞項集合中,并將沒有出現在所述微博文本原始特征詞項集合中的所述預先生成的特征詞項字典的詞項的特征值標記為0;
使用預先得到的分類模型將用戶的微博數據自動分類到預先劃分的類別中;
以自動分類的結果為依據,向讀取微博數據的用戶推薦廣告。
本發明實施例的另一目的在于提供一種基于微博的廣告推薦系統,所述系統包括:
第一數據讀入模塊,用于讀取用戶的微博數據;
第一數據初始化模塊,用于初始化讀取的微博數據,以獲得微博文本詞項集合,所述初始化讀取的微博數據包括去除讀取的微博數據中的特殊符號、非中文字符、分詞;
第一特征提取模塊,用于刪除所述微博文本詞項集合的停用詞,以獲得微博文本原始特征詞項集合;
第一特征向量化模塊,用于將所述微博文本原始特征詞項集合與預先生成的特征詞項字典進行映射,判斷所述微博文本原始特征詞項集合中的詞項是否出現在所述預先生成的特征詞項字典中,并計算出現在所述預先生成的特征詞項字典中的所述微博文本原始特征詞項集合中的詞項的tf-idf值,以作為所述出現在所述預先生成的特征詞項字典中的所述微博文本原始特征詞項集合中的詞項在微博的特征值;以及用于判斷所述預先生成的特征詞項字典的詞項是否出現在所述微博文本原始特征詞項集合中,并將沒有出現在所述微博文本原始特征詞項集合中的所述預先生成的特征詞項字典的詞項的特征值標記為0;
分類模塊,用于使用預先得到的分類模型將用戶的微博數據自動分類到預先劃分的類別中;
推薦模塊,用于以自動分類的結果為依據,向讀取微博數據的用戶推薦廣告。
本發明實施例中,由于用戶發布的微博數據比用戶標簽包含的信息更具有實時性,更能代表用戶的興趣偏好,因此通過分析用戶的微博數據得到的判斷結果更準確,從而推薦的廣告也更準確,效果也更好。
附圖說明
圖1是本發明第一實施例提供的一種基于微博的廣告推薦方法的流程圖;
圖2是本發明第二實施例提供的一種基于微博的廣告推薦系統結構圖;
圖3是本發明第二實施例提供的另一種基于微博的廣告推薦系統結構圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310608335.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種橡膠配方
- 下一篇:一種新型電容器用橡膠密封圈及其制備方法





