[發明專利]基于水軍檢測模型構建方法和系統及水軍檢測方法在審
| 申請號: | 201410146467.7 | 申請日: | 2014-04-09 |
| 公開(公告)號: | CN103955714A | 公開(公告)日: | 2014-07-30 |
| 發明(設計)人: | 李倩;牛溫佳;管洋洋;黃超;孫衛強;李丹;胡玥;郭莉 | 申請(專利權)人: | 中國科學院信息工程研究所 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66;G06F19/00 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 楊立 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 水軍 檢測 模型 構建 方法 系統 | ||
1.一種水軍檢測模型構建方法,其特征在于,包括如下步驟:
步驟1:對一組給定的向量化的樣本數據先進行任務分割,得到對應的多個任務,對多個任務進行平均特征抽取,得到多個任務的訓練樣本集;
步驟2:對多個任務的訓練樣本集進行多任務特征選擇,得到多個任務的特征權重矩陣;
步驟3:設定一個閾值δ,判斷所述特征權重矩陣中的一個列向量中的最大值是否大于閾值δ,如果是,執行步驟4;否則,放棄所述列向量,執行步驟5;
步驟4:將所述列向量添加到共享特征項集合中;
步驟5:判斷特征權重矩陣中是否存在未與閾值δ進行比較的列向量,如果是,執行步驟3;否則,執行步驟6;
步驟6:輸入新的已知水軍特性的向量化的訓練數據集,將訓練數據集與共享特征項集合進行匹配,將在集合中排列位置匹配的特征項集合在一起,得到新共享特征項集合;
步驟7:對新共享特征項集合通過感知器學習算法(Perceptron?Learning?Algorithm)計算得到特征系數,通過計算共享特征項集合與特征系數的乘積得到標準線性分類值;
步驟8:根據標準線性分類值的大小設置水軍閾值,使被測線性分類值大于水軍閾值時判定其數據來源于水軍,完成水軍判斷模型的構建,結束。
2.根據權利要求1所述的一種基于多任務學習的水軍檢測模型構建方法,其特征在于,還包括水軍檢測模型測試過程,所述水軍檢測模型測試過程包括以下步驟:
步驟9:給定一組已知是水軍的水軍用戶集合,采集水軍用戶集合中所有用戶的包括用戶行為特征和內容特征的原始數據,并對每個維度的原始數據進行量化表示得到特征向量;
步驟10:將特征向量與步驟4中得到的共享特征項集合進行匹配,將位置匹配的特征項集合在一起,構成水軍用戶低維的特征向量;
步驟11:結合水軍用戶低維的特征向量與步驟7中的特征系數計算得到水軍用戶的線性分類值;
步驟12:判斷線性分類值是否大于水軍閾值,如果是,執行下一步,否則,將水軍閾值適當減小并重新設置,返回執行步驟9;
步驟13:給定一組已知不是水軍的正常用戶集合,采集正常用戶集合中所有用戶的包括用戶行為特征和內容特征的原始數據,并對每個維度的原始數據進行量化表示得到特征向量;
步驟14:將特征向量與步驟4中得到的共享特征項集合進行匹配,將位置匹配的特征項集合在一起,構成用戶低維的特征向量;
步驟15:結合正常用戶低維的特征向量與步驟7中的特征系數計算得到正常用戶的線性分類值;
步驟16:判斷線性分類值是否小于水軍閾值,如果是,執行下一步,否則,將水軍閾值適當增大并重新設置,返回執行步驟9;
步驟17:完成對水軍檢測模型的測試,結束。
3.根據權利要求1或2所述的一種基于多任務學習的水軍檢測模型構建方法,其特征在于,所述步驟2中采用求解正則化最小二乘法回歸實現多任務特征選擇。
4.根據權利要求3所述的一種基于多任務學習的水軍檢測模型構建方法,其特征在于,所述步驟1中的多個任務大小相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所,未經中國科學院信息工程研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410146467.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于燈檢機的瓶體檢測裝置
- 下一篇:全息底紋鐳射包裝材料印刷品質量檢測系統





