[發明專利]面向問答平臺的融合用戶隱連接關系的標簽推薦方法有效
| 申請號: | 201810614031.4 | 申請日: | 2018-06-14 |
| 公開(公告)號: | CN108804689B | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 劉業政;田志強;姜元春;孫見山;陶丹丹;孫春華;陳夏雨;劉春麗 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/332;G06N3/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;余罡 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 問答 平臺 融合 用戶 連接 關系 標簽 推薦 方法 | ||
本發明的面向問答平臺的融合用戶隱連接關系的標簽推薦方法,可解決傳統標簽推薦方法推薦結果有限不能滿足用戶需求的技術問題。包括構建問題集合、問題對應的標簽集合、用戶集合;構建用戶網絡;經處理得到用戶的特征向量;再得到問題的特征向量;將所述用戶的特征向量和所述問題的特征向量做拼接,經過一層全連接網絡,得到融合用戶隱性連接的多特征向量集;將所述多特征向量集使用邏輯回歸模型映射成概率,基于輸出的概率值對標簽進行降序排序,取前top個標簽;訓練初步模型,訓練終止后,得到最終的推薦模型;當用戶在向網站提交問題時,從所述推薦模型中把前top個標簽推薦給用戶。本發明能提高標簽系統的多樣性及準確性,能夠滿足用戶需求。
技術領域
本發明涉及信息檢索技術領域,具體涉及一種面向問答平臺的融合用戶隱連接關系的標簽推薦方法。
背景技術
在一些問答網站上,用戶可以提交問題,搜索問題、瀏覽問題,回答問題等,導致信息呈現爆炸性增長。而標簽有助于改善問題信息的雜亂無章,并有助于用戶瀏覽問題,根據標簽去索引可以幫助用戶在網頁大量的信息中更容易獲取到感興趣的問題。在問答網站上看到標簽是非常常見的,它允許用戶用自己的語言去標記各種問題,這種標簽既描述了他們發布的問題的重要特征屬性,又反映了用戶的興趣點。
但是用戶在打標簽時會按照自己的想法,自己的語言去給問題打上奇奇怪怪的標簽,不同用戶想表達的的意思可能相同或相近,但是用的詞匯不同,這就造成了標簽系統變得非常龐大而且繁亂無章,使得一些問題沒有很好的歸類;另外打標簽需要用戶從鍵盤上輸入,一些用戶避免麻煩不愿意去給問題打標簽。所以如何在用戶想給問題打標簽時為其推薦適合的標簽就變得非常重要,這樣不僅能提高打標簽的質量,還能提高用戶打標簽的參與度。
當前多數的問答網站進行標簽推薦時,一般推薦整個網站最熱門的標簽,或者從問題本身提取關鍵詞作為標簽,或者推薦類似問題最熱門的標簽,或者推薦用戶最常用的標簽,但是以上推薦方式對一些新用戶或者新問題推薦結果不佳,推薦的結果有限,缺乏多樣性,供用戶選擇的可能比較少,不能滿足用戶的需求。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種面向問答平臺的融合用戶隱連接關系的標簽推薦方法,解決了傳統標簽推薦方法沒有考慮到網站上用戶與用戶的共現關系,推薦結果缺乏多樣性,不能滿足用戶的需求的技術問題。
(二)技術方案
為實現以上目的,本發明通過以下技術方案予以實現:
一種面向問答平臺的融合用戶隱連接關系的標簽推薦方法,包括以下步驟:
從問答網站上獲取問題、問題對應的標簽、問題對應的用戶信息,并構建問題集合、問題對應的標簽集合、用戶集合;
根據問題與用戶信息的對應關系,構建用戶網絡;
將所述用戶網絡輸入到node2vec模型中,得到用戶的特征向量;
將所述問題集合輸入到卷積神經網絡中,得到問題的特征向量;
將所述用戶的特征向量和所述問題的特征向量做拼接,經過一層全連接網絡,得到融合用戶隱性連接的多特征向量集;
將所述多特征向量集使用邏輯回歸模型映射成概率,表示屬于每個標簽的概率,在[0,1]之間,基于輸出的概率值對標簽進行降序排序,取前top個標簽,至此初步模型即構建好;
將所述問題、問題對應的標簽、問題對應的用戶信息作為輸入,訓練初步模型,訓練終止后,得到最終的推薦模型;
當用戶在向網站提交問題時,從所述推薦模型中把前top個標簽推薦給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810614031.4/2.html,轉載請聲明來源鉆瓜專利網。





