[發明專利]一種由不實信息驅動的社交網絡主題專家查找方法有效
| 申請號: | 201811105652.6 | 申請日: | 2018-09-20 |
| 公開(公告)號: | CN109271422B | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 李國徽;董明;周全;李劍軍 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06Q50/00 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智;曹葆青 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 不實 信息 驅動 社交 網絡 主題 專家 查找 方法 | ||
本發明公開了一種由不實信息驅動的社交網絡主題專家查找方法,包括:利用社交網絡數據集,構建候選用戶文檔,利用候選用戶文檔和待查詢不實信息,構建概率圖模型;利用候選用戶文檔和待查詢不實信息訓練概率圖模型,當概率圖模型的參數收斂后,得到維度相同的候選用戶向量和待查詢不實信息向量;通過計算候選用戶向量和待查詢不實信息向量的余弦距離,得到候選用戶和待查詢不實信息的相似度,利用相似度得到查詢結果。本發明很好的應對社交網絡情形,應對包含多個主題的不實信息,考慮了社交網絡中用戶之間存在的聯系。
技術領域
本發明屬于信息檢索領域,更具體地,涉及一種由不實信息驅動的社交網絡主題專家查找方法。
背景技術
隨著互聯網技術尤其是Web2.0技術以及無線通信技術的不斷發展,我國互聯網用戶人群急劇增長,根據中國互聯網絡信息中心(CNNIC)發布的第39次《中國互聯網絡發展狀況》統計報告顯示,截至2016年12月,中國互聯網普及率達到53.2%,網民規模達7.31億,相當于整個歐洲人口總量。海量互聯網用戶促進了各種社交應用的蓬勃發展,如微博社交網絡(Twitter、新浪微博等)。截至2016年8月,新浪微博月活躍用戶為2.82億,連續九個季度保持30%以上的增長,其中移動端月活用戶同比增長40%。新浪微博作為中國社交網絡最具代表性的應用之一,在移動互聯網蓬勃發展的背景下也迅速成長,截至2016年8月,新浪微博月活躍用戶為2.82億,連續九個季度保持30%以上的增長,其中移動端月活用戶同比增長40%。然而,高速發展的微博平臺同樣為謠言傳播提供了環境,針對微博中可疑信息甄別問題已在社會學范疇被廣泛研究,其能夠有效幫助微博管理者實時準確的甄別大規模的可疑信息,以減少謠言傳播過程所帶來的額外存儲開銷以及嚴重的社會危害性,因此該問題具有十分重要的研究意義及商業價值。
社交媒體較傳統的互聯網應用,其信息的傳播方式發生了前所未有的變化,個人用戶可以自由公開地在網絡上發布、傳播和獲取自己感興趣的信息,因此其具有傳播速度快,影響人群廣,用戶交互頻繁等特性,從而在短期內產生了海量的用戶數據,其內容涵蓋不同領域的各種專業知識,如航天航空、生物醫藥、電子科技、互聯網金融等。
微博用戶數據具有信息網絡化、內容碎片化、線上線下交融等新特點,同時也為數據挖掘與知識檢索提供了前所未有的機遇。然而,擁有龐大用戶群體的社交網絡也為謠言(謠言通常是指為達到某種目的而編造出來與事實不符的虛假信息,并通過某種方式快速傳播且造成一定社會危害的言論)的傳播和擴散提供了土壤和媒介。借助這種新的傳播媒介,謠言比以往傳播速度更快、影響范圍更廣、監測難度更大且危害程度更深。在此種背景下,謠言的產生和傳播不僅妨礙了社交媒體中知識的有效利用,而且容易造成嚴重的社會危害,甚至為互聯網犯罪提供方便,從而嚴重影響了現代社會的經濟發展和穩定。例如,2017年2月9日,社交網絡上傳播的“膠濟鐵路列車相撞事件”引起了社會的廣泛關注以及公眾對鐵路安全的質疑,但經過核實此消息為謠言。類似案例層出不窮,造成了嚴重的社會危害和無法估量的經濟損失。因此,如何在現代社交網絡中及時準確地監測和識別謠言具有重要的研究價值和社會意義,其能夠有效限制謠言傳播,從而最大化的減少其造成的社會危害和經濟損失。
傳統的專家查找技術通常應用于企業文檔集合,無法很好的應對社交網絡情形,更無法應對包含多個主題的不實信息。傳統的語言模型LDA模型通常認為文檔之間是相互獨立的,忽視了社交網絡中用戶之間存在的聯系。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種由不實信息驅動的社交網絡主題專家查找方法,由此解決現有技術無法很好的應對社交網絡情形,更無法應對包含多個主題的不實信息,忽視了社交網絡中用戶之間存在的聯系的技術問題。
為實現上述目的,本發明提供了一種由不實信息驅動的社交網絡主題專家查找方法,包括:
(1)利用社交網絡數據集,構建候選用戶文檔,利用候選用戶文檔和待查詢不實信息,構建概率圖模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811105652.6/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





