[發明專利]一種異常團體識別方法、裝置和智能芯片有效
| 申請號: | 202110542808.2 | 申請日: | 2021-05-19 |
| 公開(公告)號: | CN112990446B | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 王嘉誠;張少仲 | 申請(專利權)人: | 神威超算(北京)科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06K9/62;G06F16/335 |
| 代理公司: | 北京格允知識產權代理有限公司 11609 | 代理人: | 張沫 |
| 地址: | 100082 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 異常 團體 識別 方法 裝置 智能 芯片 | ||
1.一種異常團體識別方法,其特征在于,包括:
從監控的數據情報中抽取待識別的特征信息;其中,所述數據情報包括多個異常團體成員的真實身份信息;
將待識別的特征信息輸入到預先構建好的目標網絡模型中,得到至少一個異常團體;其中,每一個異常團體均包括至少兩個異常團體成員;所述目標網絡模型使用的訓練數據為從已知的數據情報中抽取到的特征信息及其標注;
從不同網絡平臺的網絡身份數據中提取多個虛擬身份用戶的虛擬身份信息;
基于提取得到的虛擬身份信息和監控的數據情報包括的真實身份信息,建立識別出的異常團體中每一個異常團體成員和目標虛擬身份用戶的關聯關系;其中,所述目標虛擬身份用戶是從多個虛擬身份用戶中確定出的;
其中,所述目標網絡模型是通過如下方式訓練后得到的:
獲取初始網絡模型;其中,所述初始網絡模型為神經網絡模型;
將所述初始網絡模型中的至少一個卷積層進行精簡,獲得精簡網絡模型;
采用預設的訓練算法,將訓練數據輸入所述精簡網絡模型進行訓練,得到目標網絡模型;
其中,所述預設的訓練算法為將運算數據中的部分數據設置為零,得到新的運算數據,并采用新的運算數據進行運算的操作;
所述基于提取得到的虛擬身份信息和監控的數據情報包括的真實身份信息,建立識別出的異常團體中每一個異常團體成員和目標虛擬身份用戶的關聯關系,包括:
按照預設的第一屬性類別對提取得到的虛擬身份信息和監控的數據情報包括的真實身份信息進行信息提取,并生成各虛擬身份用戶和各異常團體成員分別對應的第一分類向量集;
針對每一個異常團體成員,均執行如下操作:
對生成的各虛擬身份用戶和該異常團體成員分別對應的第一分類向量集進行相似度計算,得到各虛擬身份用戶和該異常團體成員針對每一個第一屬性類別的相似度值;
對得到的各虛擬身份用戶和該異常團體成員針對每一個第一屬性類別的相似度值進行加權計算;
判斷加權計算得到的相似度值是否大于預設的第一相似度閾值,如果是,則將該虛擬身份用戶作為目標虛擬身份用戶,并建立該異常團體成員和所述目標虛擬身份用戶的關聯關系;
其中,所述第一屬性類別包括“節點信息-背景信息”、“文本信息-興趣信息”和“社交信息-關系信息”,所述虛擬身份信息包括節點信息、文本信息和社交信息,所述真實身份信息包括背景信息、興趣信息和關系信息;所述節點信息包括用戶名、性別、職業、地址、生日、郵箱和學歷,所述文本信息包括用戶的興趣喜好、情緒狀態和@的對象,所述社交信息包括用戶的關注和粉絲的好友信息、以及用戶的評論、@和轉發的互動信息,所述背景信息包括姓名、性別、出生日期、身份證號、家庭地址、電話號、教育和工作經歷,所述興趣信息包括音樂、體育、電影、軍事、動漫、明星、美食和寵物,所述關系信息包括情侶、配偶、父母、子女、兄弟、同學、老師、室友和同事;
在所述建立識別出的異常團體中每一個異常團體成員和目標虛擬身份用戶的關聯關系之后,進一步包括:
基于提取得到的虛擬身份信息,建立識別出的異常團體中各虛擬身份用戶的關聯關系;
所述基于提取得到的虛擬身份信息,建立識別出的異常團體中各虛擬身份用戶的關聯關系,包括:
按照預設的第二屬性類別對提取得到的虛擬身份信息進行信息提取,并生成各虛擬身份用戶對應的第二分類向量集;
針對任意兩個虛擬身份用戶,對該兩個虛擬身份用戶對應的第二分類向量集進行相似度計算,得到該兩個虛擬身份用戶針對每一個第二屬性類別的相似度值;
對得到的該兩個虛擬身份用戶針對每一個第二屬性類別的相似度值進行加權計算;
判斷加權計算得到的相似度值是否大于預設的第二相似度閾值,如果是,則建立該兩個虛擬身份用戶的關聯關系。
2.根據權利要求1所述的方法,其特征在于,所述將所述初始網絡模型中的至少一個卷積層進行精簡,獲得精簡網絡模型,包括如下方式的至少一種:
減少至少一個卷積層中神經元的數量,并增加卷積層的數量;
將所述卷積層中的大尺寸的卷積核替換為級聯的小尺寸卷積核。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于神威超算(北京)科技有限公司,未經神威超算(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110542808.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:建筑板材快速噴涂設備
- 下一篇:一種基于語義分析的檔案自動開放鑒定方法及系統





