[發明專利]一種基于微博的知識推薦方法與系統有效
| 申請號: | 201410216252.8 | 申請日: | 2014-05-21 |
| 公開(公告)號: | CN104035972B | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 陳清財;劉勝宇;王曉龍;湯斌 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L12/58 |
| 代理公司: | 深圳市科吉華烽知識產權事務所(普通合伙)44248 | 代理人: | 于標 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 推薦 方法 系統 | ||
1.一種基于微博的知識推薦方法,其特征在于,包括如下步驟:
用戶建模:分析用戶本人所發布的微博以及該用戶在微博平臺中的社會關系網絡,得到用戶的知識背景及用戶知識興趣點;
定時批量采集用戶關注好友發布的微博:使用微博爬蟲,針對每個用戶,定時批量采集用戶關注的所有好友在一個采集周期內發布的微博;
知識條目發現:從用戶關注好友發布的微博中識別出各類知識條目;
知識條目擴展:利用百科知識庫獲取與該知識條目對應的百科詞條,利用搜索引擎獲取與該知識條目相關的網頁,并抽取對該條目的擴展解釋;
知識推薦:根據用戶的知識背景及知識興趣點向用戶推薦其感興趣的知識條目及相關擴展解釋;
在所述用戶建模步驟中,包括如下步驟:
用戶知識背景建模:通過分析用戶本人所發布的歷史微博數據,及其好友所發布的歷史微博數據,對用戶的知識背景建模;
用戶知識興趣建模:通過分析用戶在微博平臺中的社會關系網絡,分析用戶的知識興趣點所在;
在所述知識條目發現步驟中,包括如下步驟:
微博數據預處理:去除當前采集周期內所采集到的微博內容數據中的噪聲;
獲取知識條目發現模型的訓練語料:根據預先確定的待發現知識條目類別人工標注訓練語料,或者根據特定類別的種子知識條目從海量微博數據中自動獲取訓練語料;
發現知識條目:將訓練得到的知識條目發現模型應用到當前采集周期所采集到的微博數據,發現知識條目。
2.根據權利要求1所述的知識推薦方法,其特征在于,在用戶知識背景建模步驟中,包括如下步驟:
獲取用戶本人發布的歷史微博數據:利用微博爬蟲爬取用戶歷史上所發布的微博;
獲取用戶關注好友所發布的歷史微博數據:利用微博爬蟲爬取用戶所關注的好友歷史上所發布的微博數據;
獲取用戶知識背景:分析用戶本人所發布的歷史微博數據及用戶關注好友發布的歷史微博數據,得到用戶對各類知識條目的了解程度;
在用戶知識興趣建模步驟中,包括如下步驟:
獲取微博平臺中用戶社會關系網絡:獲取用戶所關注的好友以及用戶好友間的關注關系;
獲取用戶知識興趣:分析用戶關注好友的知識背景,通過用戶關注好友的知識背景發現用戶的知識興趣點所在。
3.根據權利要求1所述的知識推薦方法,其特征在于,在所述知識條目擴展步驟中,包括如下步驟:
獲取知識條目相應的候選詞條:從百科知識庫中獲取可能與知識條目相對應的所有候選詞條;
知識條目消歧義:在所有可能與知識條目相對應的候選詞條中,找到真正與該知識條目相對應的詞條,或者判斷出候選詞條中沒有與其相對應的詞條;
搜索引擎擴展知識條目:將待擴展的知識條目作為查詢,自動獲取到搜索引擎的檢索結果;
檢索結果相關度計算:綜合搜索引擎的檢索結果,得到與該知識條目較相關的檢索結果;
擴展知識條目:將百科知識庫中與該知識條目對應的詞條,以及檢索結果中與該知識條目較相關的檢索結果匯總整合,作為該知識條目的擴展解釋;
更新知識庫:將知識條目及其相應擴展解釋添加所構建的知識庫中。
4.根據權利要求1所述的知識推薦方法,其特征在于,在所述知識推薦步驟中,包括如下步驟:
確定待推薦候選知識條目:記錄用戶上一次登錄微博系統和當前登錄微博系統的時間,在這一時間段內用戶所關注的好友發布的微博中包含的知識條目被視為待推薦候選知識條目;
確定待推薦知識條目:對所有待推薦的候選知識條目,根據用戶的知識背景以及用戶的知識興趣點計算該知識條目與用戶相關度,根據相關度確定在用戶當前登錄時應推薦的知識條目;
獲取知識條目相關微博:獲取用戶上一次登錄微博系統到當前登錄微博系統的這一時間段內,用戶所關注的好友發布的微博中與待推薦知識條目相關的微博;
推薦擴展知識:將待推薦的知識條目、相應擴展解釋及相關微博推薦給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410216252.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種面向結構化醫藥信息的檢索方法和系統
- 下一篇:社交網絡群體識別方法和系統





