[發明專利]基于跨平臺標簽融合的問答社區推薦方法在審
| 申請號: | 201710362466.X | 申請日: | 2017-05-22 |
| 公開(公告)號: | CN107291815A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 彭艦;馮勇領;黃飛虎 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610065 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 平臺 標簽 融合 問答 社區 推薦 方法 | ||
技術領域
本發明涉及到問答社區的專家推薦研究,是基于跨平臺標簽融合的專家推薦方法。
背景技術
伴隨互聯網及信息化的發展,社區問答系統成為用戶在網絡中獲取信息的重要平臺,用戶可以通過自然語言對自己想了解的內容進行提問,由社區中其他用戶進行解答。通過自然語言的交流,使得問答系統可以為用戶之間提供很好的知識信息分享,更加方便地滿足用戶的信息需求。而隨著社區問答系統中用戶數量的增加,提問的數量也隨之增多,社區中許多的問題長時間無法得到解答,或者得到的回答質量不高,根本無法滿足問題需求。因此為了提高問答社區的工作效率,我們需要設計合適的推薦系統向社區中的問題推薦合適的回答者,增強用戶的社區參與度,提高社區中的內容質量。
目前問答社區中的專家推薦算法一般都是利用單一社區的用戶文檔或網絡結構進行對用戶進行建模并推薦,但單一平臺的數據通常只包含用戶的部分特征,并不能全面地構建用戶模型。
發明內容
本發明針對現有推薦算法的不足,利用對跨平臺用戶數據進行研究,提出了一直基于標簽融合的用戶興趣建模方法,并基于此實現問答社區中的專家推薦算法。
首先通過對知乎和微博兩個平臺的數據進行分析,從微博的社交關系以及知乎社區的問答功能出發,結合LDA主題模型與word2vec對文本標簽的語義進行深入挖掘,利用標簽語義相似度矩陣設計跨平臺的標簽融合算法,構建融合的用戶興趣模型。相比單一網絡的用戶模型,跨平臺用戶模型能更全面覆蓋用戶不同特性,對用戶特征有更清晰的描述。
同時綜合考慮了社區用戶的興趣偏好、回答能力度及影響力實現專家推薦。算法利用用戶知乎和微博平臺的歷史數據,通過標簽融合建模方法對知乎專家用戶的興趣進行分析;對跨平臺的共同用戶構建融合關注關系網絡,結合PageRank算法對用戶的綜合影響力進行分析;同時通過知乎社區的問答反饋機制,分析用戶的回答能力度。通過實驗結果表明,本文提出的算法具有更好的推薦效果。
本發明的有益效果是:通過跨平臺的信息構建用戶興趣模型,能更全面獲取用戶的興趣偏好。進而考慮用戶在問答社區中的回答能力度及影響力,找出最適合對社區中待回答問題進行解答的用戶,進行推薦。降低問答社區中問題的等待回答時間,提高社區運行效率。
附圖說明
圖1為本發明的主題詞選取流程。
圖2為本發明的推薦算法流程圖。
圖3為本發明的帶權重關注網絡示意圖。
具體實施方式
本發明以知乎問答社區為例,研究知乎與微博平臺之間的用戶特征關系。
通過前兩節的分析及數據的處理,我們已經提取到共同用戶在兩個平臺中的興趣主題,為了得到一個綜合的用戶興趣模型,我們需要將兩個平臺的主題標簽進行融合。
在對每個用戶不同平臺的標簽向量進行分析時,由于主題提取算法是通過生成概率對主題進行建模,沒有考慮詞的語義特征,結果導致部分用戶的標簽中含有許多相似的詞。因此如果直接將兩個特征空間的詞進行合并,將會使得用戶的標簽空間過大,同時用戶在很多特征詞上的值為0,導致數據稀疏問題,對用戶的建模產生影響。
于是我們引入語義相似度分析,通過標簽映射的思想,對兩個主題空間內的主題標簽之間進行語義相似度計算,對于相似度高的兩個主題標簽,選擇其中對用戶興趣指代性強,區分度高的詞作為特征詞,最終構建融合主題空間。
對于每個用戶,其知乎標簽Rz與微博標簽Rw的主題標簽相似度矩陣TR定義如下:
其中dij來自兩個網絡的特征詞的相似度:
dij=Sim(wzi,wwj)
其中,wzi代表用戶知乎標簽中第i個詞的詞向量,wwj代表用戶微博標簽中第j個詞的詞向量,我們通過Word2vec模型進行計算。
本發明將用戶的歷史問答及微博分詞數據作為輸入變量進行訓練,設每個詞的向量維度為n,對于每一個用戶,通過訓練好的模型對Rz及Rw中的每個詞做詞向量轉化,得到每一個用戶的單一平臺主題矩陣:
M=[w(t)]
其中t屬于Rz或Rw,矩陣中每一行w(t)表示用戶的主題標簽t的n維詞向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710362466.X/2.html,轉載請聲明來源鉆瓜專利網。





