[發明專利]一種鑒定網絡謠言的方法和裝置有效
| 申請號: | 201210586904.8 | 申請日: | 2012-12-28 |
| 公開(公告)號: | CN103902621A | 公開(公告)日: | 2014-07-02 |
| 發明(設計)人: | 魏彥杰;張帆;張慧玲;彭豐斌;孟金濤;魏丹 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市科進知識產權代理事務所(普通合伙) 44316 | 代理人: | 宋鷹武 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 鑒定 網絡 謠言 方法 裝置 | ||
1.一種鑒定網絡謠言的方法,其特征在于,包括以下步驟:
A:對數據庫中的網絡信息進行分析并提取特征;
B:用機器學習法建模,生成打分函數;
C:利用打分函數對網絡信息進行鑒定。
2.如權利要求1所述的鑒定網絡謠言的方法,其特征在于,所述步驟A包括以下步驟:
a:對數據庫中謠言的分類,將每個謠言歸為其中的一類;
b:分析數據庫中每一類謠言和每一個網絡用戶,提取與傳播環境有關的特征;
c:分析數據庫中的每一類謠言,提取與網絡信息本身相關的特征;
d:從數據庫中提取相同數量的非謠言網絡信息,重復執行所述步驟a至步驟c,對所述非謠言網絡信息進行分析并提取特征。
3.如權利要求2所述的鑒定網絡謠言的方法,其特征在于,所述步驟b包括以下步驟:
b1:根據用戶是否發布過謠言,將用戶標記為謠言發布者/非發布者,從而對網絡信息的發布者進行分析;
b2:根據用戶是否傳播過謠言,將用戶標記為謠言傳播者/非傳播者,從而對網絡信息的傳播者進行分析;
b3:根據用戶是否相信謠言,將用戶標記謠言受眾/非受眾,從而對網絡信息的受眾進行分析。
4.如權利要求2或3所述的鑒定網絡謠言的方法,其特征在于,所述步驟c包括以下步驟:
c1:依據重要程度不同將謠言分類,通過統計分析數據庫中謠言的傳播速度,確定單位時間傳播次數的上限閾值和下限閾值,并根據謠言在單位時間內的傳播次數是否超過或小于所述上限閾值或下限閾值,實現從傳播速度提取謠言的重要性分類特征和對謠言的重要性分析;
c2:依據從社交網絡數據庫中提取和分析得到的模糊詞列表,和謠言中模糊詞出現的頻率,對謠言的模糊性分類,實現對謠言的模糊性分析;
c3:將謠言自動隨機發送給網絡用戶,依據對反饋信息的分析,對謠言的的反常性分類,實現對謠言的反常度分析。
5.如權利要求1或4所述的鑒定網絡謠言的方法,其特征在于,所述步驟B包括以下步驟:
e:準備樣本特征,將獲得的謠言和非謠言樣本和樣本特征換成相應機器學習分類方法的格式;
f:用機器學習分類方法,對所述獲得的謠言和非謠言樣本進行多重驗證訓練建模,從而得到打分函數模型的參數。
6.如權利要求5所述的鑒定網絡謠言的方法,其特征在于,所述步驟f包括以下步驟:
f1:所述用機器學習分類方法,包括支持向量機,神經網絡中的一種或者多種。
7.如權利要求5所述的鑒定網絡謠言的方法,其特征在于,所述步驟C包括以下步驟:
g:對數據庫中任一個新的網絡信息,提取特征;
h:利用打分函數進行打分,根據分數鑒定所述網絡信息是否為謠言。
8.如權利要求7所述的鑒定網絡謠言的方法,其特征在于,所述步驟h包括以下步驟:
當所述分數高于一個高的預設值時,則鑒定此網絡信息為謠言,低于一個低的預設值時,則鑒定此網絡信息不是網絡謠言,當分數介于所述高的預設值和低的預設值之間時,則定義該網絡信息有很大可能是網絡謠言,需要更多信息進一步驗證。
9.一種鑒定網絡謠言的裝置,其特征在于,包括:
數據庫,用于存儲網絡信息;
特征提取模塊,用于對數據庫中的網絡信息進行分析并提取特征;
建模模塊,用于用機器學習法建模,生成打分函數;
鑒定模塊,用于利用打分函數對網絡信息進行預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210586904.8/1.html,轉載請聲明來源鉆瓜專利網。





