[發明專利]基于CNN的社交小眾用戶標簽挖掘及相似用戶推薦方法有效
| 申請號: | 202010835019.3 | 申請日: | 2020-08-19 |
| 公開(公告)號: | CN112016003B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 陳賢;羅朗;王豪 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/33;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 重慶輝騰律師事務所 50215 | 代理人: | 王海軍 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cnn 社交 小眾 用戶 標簽 挖掘 相似 推薦 方法 | ||
本發明涉及社交網絡技術處理領域,具體涉及一種基于CNN的社交小眾用戶標簽挖掘及相似用戶推薦的方法,包括:獲取用戶在社交軟件上發布的原始內容數據,預處理;通過word2vec模型獲得詞向量特征;將預處理后的內容數據輸入到詞嵌入層,每個詞取其在word2vec中的位置,尋找對應每個詞的詞向量;獲取用戶的個人屬性特征向量info,并將詞向量特征與個人屬性特征向量info相結合構成輸入矩陣;將輸入矩陣輸入CNN模型,獲得用戶的話題標簽;通過聚類算法構建社交網絡圖,輸出與用戶相似的群組或用戶感興趣的群組;對用戶進行話題標簽推薦和群組推薦。本發明解決了社交網絡上信息較少的用戶的話題推薦和相關群組推薦問題。
技術領域
本發明涉及社交網絡技術處理領域,具體涉及一種基于CNN的社交小眾用戶標簽挖掘及相似用戶推薦方法。
背景技術
隨著社會的發展,社交軟件已經成為人們交流、拓展人際關系、分享生活的熱門平臺之一。一些會使用社交軟件的人知道如何向他人展示自己以及自己感興趣的話題,他人可以通過系統或平臺找到他們,系統也可以基于用戶的個人信息以及歷史數據推薦給用戶可能喜歡的內容以及與該用戶有相似興趣的其他用戶。但是大多數用戶并沒有在社交網絡上展現他們的興趣,這些用戶只有少量的關注和粉絲,他們不知道自己感興趣的話題是什么,也不經常在社交軟件上發布動態,本發明稱這些用戶為普通小眾用戶。這樣的用戶在社交網絡中占據了很大一部分,然而普通小眾用戶并沒有受到足夠的重視,而這些用戶對于社交網絡和推薦系統來說是非常重要的,為這些普通小眾用戶推薦他們感興趣的話題和群組是很有必要的。因此需要提取能夠代表這些普通小眾用戶的標簽,從而幫助系統為小眾用戶推薦話題及相似用戶。
標簽在社交軟件和網絡社區中應用的很多,因為標簽簡而易懂。在以往的研究中,Guy和Chen提到了標簽的重要性。Lee等人認為標簽是社交媒體中用戶與用戶之間溝通的橋梁。目前,標簽已經廣泛應用于信息檢索、推薦算法、社交網絡等多個研究領域。然而在海量用戶使用的標簽中,很多用戶自定義的標簽對于其他人或者社交系統來說意義并不大。因此對于系統有用的標簽占比很少,無用的標簽則產生大量的噪音數據。此外,個性化屬性即用戶的個人屬性對于用戶發布內容的標簽也具有一定的作用,例如:位于經濟發達的沿海地區的用戶發布金融方面的動態比內地用戶相對較多;年輕的用戶發布娛樂方面的動態比年紀大的用戶相對較多;教育程度高的用戶發布社會方面的動態比教育程度相對不足的用戶要多。因此在提取用戶代表性標簽的同時,也需考慮用戶的個性化屬性。然而,小眾用戶使用的標簽比活躍用戶使用的少,提供的個人信息也比較少,這對提取普通小眾用戶的代表性標簽帶來了很大的困難。由于普通小眾用戶提供的信息比較少,很難從中發現普通用戶感興趣的群組。
發明內容
為了解決上述問題,本發明提供一種基于CNN的社交小眾用戶標簽挖掘及相似用戶推薦的方法,該方法利用卷積神經網絡(CNN)自動提取高維向量特征,在CNN模型的基礎上增加用戶的個性化屬性,提出了一種基于個性化CNN 模型的社交網絡普通小眾用戶的標簽及相似群組的推薦方法,在普通小眾用戶在社交軟件上發布的內容中融入用戶的個性化元素,并從中提取推薦能夠代表用戶特征的代表性標簽(話題標簽),進而利用聚類算法為普通用戶構建社交網絡圖,再通過提取的代表性標簽發現普通小眾用戶感興趣的話題和群組推薦給用戶。
一種基于個性化CNN的社交網絡普通小眾用戶代表性標簽推薦方法,包括以下步驟:
獲取用戶在社交軟件上發布的原始內容數據,對原始內容數據進行預處理,得到預處理后的內容數據;
將上述預處理后的內容數據輸入到word2vec模型中,得到每一個句子中每個詞的詞向量表示,一個句子中每個詞的詞向量表示為:
其中,wordi表示第i個詞,表示第i個詞的向量表示,n表示一個句子共有n個詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010835019.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種軸承裝配設備上的保持架上料架
- 下一篇:金相切割機及方法





