[發明專利]一種基于網絡的微博消息可信度判別模型的方法有效
| 申請號: | 201710609782.2 | 申請日: | 2017-07-25 |
| 公開(公告)號: | CN107403007B | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 段大高;蓋新新;韓忠明;莫倩 | 申請(專利權)人: | 北京工商大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/28;G06F16/958;G06F40/279 |
| 代理公司: | 北京慧泉知識產權代理有限公司 11232 | 代理人: | 李娜 |
| 地址: | 100048*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡 消息 可信度 判別 模型 方法 | ||
1.一種基于網絡的微博消息可信度判別模型的方法,其特征在于:該方法具體步驟如下:
步驟一:計算先驗知識
對于一條評論u,首先計算它在初始狀態時是一條虛假評論的可能性yu;在半監督模式中,如果評論u是一條虛假評論,其yu=1,否則yu=0;對于未標注的評論,認為其yu=0;在非監督模式中,評論u在初始狀態時是一條虛假評論的可能性yu通過等式(1)計算:
其中,f(xlu)表示評論u關于特征l是一條虛假評論的可能性,L表示總的特征數量;而f(xlu)是通過等式(2)計算:
Xl是特征l的隨機變量,其對應的概率分布為P;
步驟二:定義網絡模式
根據提取的特征可以定義網絡模式,網絡模式中描述了不同類型的網絡節點以及在網絡中各個節點是怎樣連接的;
步驟三:定義元路徑并生成網絡
對于一條評論u,其關于某個特征l的虛假評論確定性的等級由等式(3)計算:
其中,s是等級的個數,這里選擇s=10,也就是說,一共有10個等級,即
如果兩條評論u和v,它們關于某個特征l的虛假評論確定性的等級相等,即那么為評論u和評論v之間建立一條關于特征l的元路徑,它們之間的元路徑的值記為則如果兩條評論u和v的虛假評論確定性的等級和不相等,則它們之間就是沒有元路徑的,它們之間的元路徑的值記為
對所有評論關于每個特征計算虛假評論確定性的等級,為所有相等等級的兩條評論建立元路徑,直至生成整個評論網絡;
步驟四:在異構信息網絡上做分類
①計算特征權重,得到每個特征在判別模型中的重要性
在異構信息網絡中,如果兩個節點關于某個特征l存在元路徑,且已知其中一個節點關于特征l是虛假評論的可能性很高,則另一個節點關于特征l是虛假評論的可能性也很高;在計算特征權重時,只考慮已經被標注為虛假消息評論所作的貢獻;為了計算特征l的權重Wl,提出下面等式(4):
其中,n表示評論的數量,表示評論u和評論v通過特征l連接的元路徑的值,如果評論u和評論v關于特征l是沒有元路徑的,則yu和yv是評論u和評論v的先驗知識,即,在半監督模式中,初始狀態時如果評論u是一條虛假消息評論,其yu=1,否則yu=0;對于未標注的評論,認為其yu=0;在非監督模式中,初始狀態時評論u的先驗知識是通過等式(1)去計算的;
②計算評論是虛假評論的最終概率
對于一條未標注的評論u,需要計算其是虛假評論的最終概率,這里我們只考慮其和已經被標注為虛假評論v的關系;如果評論u與虛假評論v之間有元路徑,則評論u是虛假評論的可能性Pu,v用等式(5)計算:
則評論u是虛假評論的最終概率Pu通過等式(6)計算:
Pu=avg(Pu,1,Pu,2,...,Pu,r)(6)
其中r表示在異構信息網絡中與評論u有元路徑的已經被標注為虛假評論的數量;
步驟五:虛假消息識別
將微博消息的評論分類之后,通過統計各個消息中真假評論所占的比例可以得到一個閾值,它能夠將真假消息很好地區分開,如果一個消息中虛假評論數量超過這個閾值,那么這個微博消息就是一個虛假消息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工商大學,未經北京工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710609782.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數字化證據管理系統
- 下一篇:一種基于更新序列號眼科影像處理歸檔的方法





