[發明專利]鑒定網絡用戶的方法及系統、網絡信息的屏蔽方法及系統有效
| 申請號: | 201910141807.X | 申請日: | 2019-02-26 |
| 公開(公告)號: | CN109800289B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 余本功;曹雨蒙;楊穎;范招娣;張宏梅;朱夢迪;王胡燕;汲浩敏 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/958 |
| 代理公司: | 北京潤平知識產權代理有限公司 11283 | 代理人: | 肖冰濱;劉兵 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 鑒定 網絡 用戶 方法 系統 信息 屏蔽 | ||
本發明實施方式提供一種鑒定網絡用戶的方法及系統、網絡信息的屏蔽方法及系統,屬于網絡信息的識別技術領域。該方法包括:獲取目標用戶集合;獲取每個目標用戶發布的歷史文本信息;采用LDA主題模型對歷史文本信息進行分析,確定每個目標用戶的專長領域;根據專長領域確定目標用戶集合中每兩個目標用戶的相似度以構建相似度矩陣;獲取目標用戶的粉絲數量、回答數量和獲贊數量以計算目標用戶的節點屬性特征值;獲取目標用戶集合中每兩個目標用戶之間的關注關系以構建關注矩陣;根據專長領域、相似度矩陣、以及關注矩陣構建目標用戶的轉移概率矩陣,采用PageRank算法根據節點屬性特征值與轉移概率矩陣獲取每個目標用戶的評分。
技術領域
本發明涉及網絡信息的識別技術領域,具體地涉及一種鑒定網絡用戶的方法及系統、網絡信息的屏蔽方法及系統。
背景技術
隨著Quora、知乎等網絡問答社區逐漸滲入大眾的生活,社區用戶可以在社區中自由提問、評論、轉發、點贊,表達自己的觀點。與百度知道、Yahoo!Answers等傳統問答社區不同,社會化問答社區更注重進行多元信息交互。隨著大量用戶生成內容涌現,社區中問題與答案數量累積,社區中出現問答質量良莠不齊,問題無法得到專家即時解答等現象。如何識別社會化網絡問答社區中的專家特征,發現可以提供優質答案的專家,也逐漸成為學術界的研究熱點。
發明內容
本發明實施方式的目的是提供一種鑒定網絡用戶的方法及系統、網絡信息的屏蔽方法及系統,鑒定網絡用戶的方法及系統可以對每個網絡用戶進行評分,屏蔽方法和系統可以屏蔽評分較低的網絡用戶的信息,從而提高網絡問答的效率和準確度。
為了實現上述目的,本發明實施方式提供一種鑒定網絡用戶的方法,所述方法包括:
獲取目標用戶集合;
獲取所述目標用戶集合中每個所述目標用戶發布的歷史文本信息;
采用LDA主題模型對所述歷史文本信息進行分析,確定每個所述目標用戶的專長領域;
根據每個目標用戶的專長領域確定所述目標用戶集合中每兩個所述目標用戶的相似度以構建相似度矩陣;
獲取所述目標用戶的粉絲數量、回答數量和獲贊數量以計算所述目標用戶的節點屬性特征值;
獲取所述目標用戶集合中每兩個所述目標用戶之間的關注關系以構建關注矩陣;
根據所述專長領域、所述相似度矩陣、以及所述關注矩陣構建所述目標用戶的轉移概率矩陣,采用PageRank算法根據所述節點屬性特征值與所述轉移概率矩陣獲取每個所述目標用戶的評分。
可選地,所述采用LDA主題模型對所述歷史文本信息進行分析,確定每個所述目標用戶的專長領域包括:
將所述歷史文本信息轉化為目標用戶與主題以及主題與詞語的概率分布;
根據所述概率分布確定所述目標用戶的專長領域。
可選地,所述根據每個目標用戶的專長領域確定所述目標用戶集合中每兩個所述目標用戶的相似度以構建相似度矩陣包括:
根據公式(1)計算每兩個所述目標用戶的相似度,
其中,uit為所述目標用戶ui專長領域的分布的值,ujt為所述目標用戶uj專長領域的分布的值,Sij為所述相似度,k為目標用戶ui及目標用戶uj的專長領域的值的總數。
可選地,所述獲取所述目標用戶的粉絲數量、回答數量和獲贊數量以計算所述目標用戶的節點屬性特征值包括:
對所述粉絲數量、所述回答數量和所述獲贊數量進行歸一化處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910141807.X/2.html,轉載請聲明來源鉆瓜專利網。





