[發(fā)明專利]基于社交平臺的數(shù)據(jù)挖掘方法及裝置有效
| 申請?zhí)枺?/td> | 201810147207.X | 申請日: | 2014-11-10 |
| 公開(公告)號: | CN108197330B | 公開(公告)日: | 2019-10-29 |
| 發(fā)明(設計)人: | 陳韜;曹歡歡;羅立新 | 申請(專利權)人: | 北京字節(jié)跳動網(wǎng)絡技術有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536 |
| 代理公司: | 北京康信知識產(chǎn)權代理有限責任公司 11240 | 代理人: | 趙囡囡 |
| 地址: | 100000 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 注冊用戶 新注冊 社交平臺 資訊 客戶端 集合 標簽字典 數(shù)據(jù)挖掘 興趣模型 讀取 關系信息 歷史瀏覽 構建 匹配 標簽 記錄 | ||
本發(fā)明公開了一種基于社交平臺的數(shù)據(jù)挖掘方法及裝置。其中,該方法包括:獲取資訊客戶端上已注冊用戶的興趣標簽字典和社交平臺中與資訊客戶端上已注冊用戶具有關注關系的第一對象;根據(jù)已注冊用戶具有關注關系的第一對象,確定與已注冊用戶對應的第一關注集合;根據(jù)已注冊用戶的興趣標簽字典和第一關注集合,構建興趣模型;獲取資訊客戶端上新注冊用戶在社交平臺中與其具有關注關系的第二對象,并讀取新注冊用戶與第二對象之間的關系信息;根據(jù)新注冊用戶具有關注關系的第二對象;將第二關注集合與興趣模型進行匹配,確定新注冊用戶的推薦興趣標簽。本發(fā)明解決了現(xiàn)有技術中因新注冊用戶沒有歷史瀏覽記錄,導致的無法提供有針對性的資訊的問題。
技術領域
本發(fā)明涉及計算機領域,具體而言,涉及一種基于社交平臺的數(shù)據(jù)挖掘方法及裝置。
背景技術
目前,在計算機技術的發(fā)展和互聯(lián)網(wǎng)的逐漸普及,越來越多的人通過互聯(lián)網(wǎng)來獲取各種各樣的資訊。而相應的,互聯(lián)網(wǎng)上的資訊數(shù)量也隨著計算機技術的發(fā)展和互聯(lián)網(wǎng)的普及變得更加豐富起來。
近些年來,移動互聯(lián)網(wǎng)的快速發(fā)展,人們逐漸習慣通過移動終端上的資訊客戶端來獲取資訊內容。這種方式使得用戶在通過網(wǎng)絡進行獲取資訊的時間變得更加碎片化。在這種背景下,如何精準的為用戶提供有價值,且用戶感興趣的資訊信息變得更加重要。尤其,在為新用戶提供有價值且感興趣的資訊,成為了亟待解決的問題。
在現(xiàn)有的技術當中,推薦系統(tǒng)的冷啟動問題是資訊客戶端這類產(chǎn)品應用中的一個主要挑戰(zhàn)。其中,推薦系統(tǒng)的冷啟動問題是指對于新用戶系統(tǒng)缺乏足夠的數(shù)據(jù)來捕獲用戶的興趣并有效的推薦內容。這個問題在眾多解決方案中,有一類被廣泛使用的方法,就是鼓勵用戶用社交網(wǎng)絡(Social Network Service:SNS)賬號登陸推薦系統(tǒng),例如:微博、騰訊QQ、人人網(wǎng)等社交賬號登陸。推薦系統(tǒng)可以利用用戶社交網(wǎng)絡平臺的信息(例如:關注關系,好友關系,興趣標簽,發(fā)布內容等)初始化用戶的興趣模型,從而進行有效推薦。
一方面,單純利用社交網(wǎng)絡平臺的公開數(shù)據(jù)用于內容推薦(公開數(shù)據(jù)例如:視頻,文章,圖片,音樂,游戲,軟件,好友等)在實際應用中還有不少困難。例如:在社交網(wǎng)絡平臺的發(fā)布內容往往篇幅較短,且內容雜亂,用戶的標簽內容往往標新立異(例如:不睡懶覺會死星人、密集恐懼癥晚期患者等),較難被機器學習算法理解,對改進推薦服務幫助有限。而對于在社交網(wǎng)絡上不活躍,社交關系薄弱的用戶來說,其社交網(wǎng)絡平臺上的公開數(shù)據(jù)在改進推薦效果上作用就更加有限。另一方面,對于比較成熟,用戶量較大的內容推薦服務商來說,在長期的運營過程中,往往已經(jīng)積累了大量的用戶行為信息,例如:用戶點播的視頻,看過或評論過的文章。這部分數(shù)據(jù)如果能夠有效的和社交網(wǎng)絡公開數(shù)據(jù)融合使用,有可能極大的改進用戶的推薦效果。然而,現(xiàn)有的技術,基本將關注點都聚焦在利用社交網(wǎng)絡平臺提供的公開數(shù)據(jù)挖掘用戶興趣模型并進行推薦,此種方法實現(xiàn)的難度較大,且準確率較低。
針對現(xiàn)有技術中因新注冊用戶沒有歷史瀏覽記錄,導致的無法提供有針對性的資訊的問題,目前尚未提出有效的解決方案。
發(fā)明內容
本發(fā)明的主要目的在于提供一種基于社交平臺的數(shù)據(jù)挖掘方法及裝置,以解決現(xiàn)有技術中因新注冊用戶沒有歷史瀏覽記錄,導致的無法提供有針對性的資訊的問題。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明實施例的一個方面,提供了一種基于社交平臺的數(shù)據(jù)挖掘方法。該方法包括:獲取資訊客戶端上已注冊用戶的興趣標簽字典;獲取社交平臺中與資訊客戶端上已注冊用戶具有關注關系的第一對象,并讀取已注冊用戶與第一對象之間的關系信息;根據(jù)已注冊用戶具有關注關系的第一對象,確定與已注冊用戶對應的第一關注集合;根據(jù)已注冊用戶的興趣標簽字典和第一關注集合,構建興趣模型,其中,興趣模型用于表征具有相同第一關注集合的已注冊用戶與興趣標簽的對應關系;獲取資訊客戶端上新注冊用戶在社交平臺中與其具有關注關系的第二對象,并讀取新注冊用戶與第二對象之間的關系信息;根據(jù)新注冊用戶具有關注關系的第二對象,確定與新注冊用戶的第二關注集合;將第二關注集合與興趣模型進行匹配,根據(jù)興趣模型確定新注冊用戶的推薦興趣標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節(jié)跳動網(wǎng)絡技術有限公司,未經(jīng)北京字節(jié)跳動網(wǎng)絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810147207.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





