[發(fā)明專利]異常社交賬號識別方法、裝置、計算機設備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010828851.0 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN111708823B | 公開(公告)日: | 2021-05-18 |
| 發(fā)明(設計)人: | 王韻陶;陳炳文 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責任公司 11138 | 代理人: | 鄭曉玉 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 異常 社交 賬號 識別 方法 裝置 計算機 設備 存儲 介質(zhì) | ||
1.一種異常社交賬號識別方法,其特征在于,包括:
基于社交賬號集合的賬號標識之間的關(guān)聯(lián)關(guān)系,生成所述社交賬號集合之間的社交關(guān)系網(wǎng)絡,調(diào)用預設關(guān)系挖掘模型,提取所述社交關(guān)系網(wǎng)絡中社交賬號的行為特征信息;所述行為特征信息是用于表示社交賬號特征的數(shù)據(jù)含義上低維稠密的信息,包含社交賬號與其他社交賬號之間的局部關(guān)聯(lián)特征,以及社交賬號自身的特征,所述行為特征信息包括用戶行為特征和團伙行為特征,所述預設關(guān)系挖掘模型包括用于獲取賬號標識序列的序列提取子模型和用于基于隱層權(quán)重信息提取所述社交賬號的行為特征信息的映射子模型;所述序列提取子模型通過隨機游走算法生成所述賬號標識序列,所述賬號標識序列是構(gòu)成社交關(guān)系網(wǎng)絡中一條路徑的賬號標識組成的序列,包括多個按照路徑中相鄰關(guān)系排列的賬號標識;所述映射子模型包括skip-gram模型,所述skip-gram模型是一群用來產(chǎn)生賬號標識特征向量的相關(guān)模型,所述相關(guān)模型為淺而雙層的神經(jīng)網(wǎng)絡的模型,所述映射子模型用于對所述賬號標識序列進行分析;
采集多個標注有真實圖像類型的圖像標識樣本;
通過預設圖像分類模型預測所述圖像標識樣本的預測圖像類型;
獲取所述預測圖像類型對應的預測值;
基于所述預測圖像類型的預測值、所述真實圖像類型和權(quán)重參數(shù)構(gòu)建損失函數(shù);
根據(jù)所述預測圖像類型的預測值與所述損失函數(shù)獲取交叉熵損失;
根據(jù)所述交叉熵損失,對所述圖像分類模型中的參數(shù)進行更新;
根據(jù)所述預測圖像類型和所述真實圖像類型,確定當前圖像分類模型為訓練后的圖像分類模型;
基于所述訓練后的圖像分類模型中的至少一個卷積層,對所述圖像標識進行特征提取,得到初始圖像特征,基于所述訓練后的圖像分類模型中的第一全連接層,對所述初始圖像特征信息進行全連接運算,得到所述圖像標識的圖像特征信息;圖像分類模型包括5個卷積層的網(wǎng)絡結(jié)構(gòu)以及連接3層全連接神經(jīng)網(wǎng)絡,所述圖像標識的圖像特征信息為所述社交賬號的頭像圖像的特征信息,所述訓練后的圖像分類模型為通過多個標注有真實圖像類型的圖像標識樣本進行訓練得到;
將所述行為特征信息與所述圖像特征信息融合,得到所述社交賬號的賬號特征信息;
調(diào)用訓練后的分類模型,對所述賬號特征信息進行分類計算,確定所述社交賬號的類型,所述訓練后的分類模型為通過多個標注有真實賬號類型的賬號特征信息樣本進行訓練得到,所述訓練后的分類模型包括SVM、XGBoost和Logistic Regression三種分類模型,以根據(jù)所述三種分類模型的分類結(jié)果進行投票,被判為最多的類型作為所述社交賬號的賬號類型。
2.如權(quán)利要求1所述的異常社交賬號識別方法,其特征在于,所述調(diào)用訓練后的分類模型,對所述賬號特征信息進行分類計算,確定所述社交賬號的類型,包括:
采用多個訓練后的分類模型,分別對所述賬號特征信息進行全連接計算,得到所述社交賬號的多個候選類型;
根據(jù)所述多個候選類型確定所述社交賬號的類型。
3.如權(quán)利要求2所述的異常社交賬號識別方法,其特征在于,所述根據(jù)所述多個候選類型確定所述社交賬號的類型,包括:
從所述多個候選類型中確定重復最多的候選類型,作為所述社交賬號的類型。
4.如權(quán)利要求2所述的異常社交賬號識別方法,其特征在于,在所述調(diào)用訓練后的分類模型,對所述賬號特征信息進行分類計算,確定所述社交賬號的類型之前,包括:
采集多個標注有真實賬號類型的賬號特征信息樣本;
通過預設分類模型預測所述賬號特征信息樣本的預測賬號類型;
獲取所述預測賬號類型對應的預測值;
基于所述預測賬號類型的預測值、所述真實賬號類型和權(quán)重參數(shù)構(gòu)建損失函數(shù);
采用所述損失函數(shù)對所述分類模型進行收斂,得到訓練后的分類模型。
5.如權(quán)利要求4所述的異常社交賬號識別方法,其特征在于,所述采用所述損失函數(shù)對所述分類模型進行收斂,得到訓練后的分類模型,包括:
根據(jù)所述預測賬號類型的預測值與所述損失函數(shù)獲取當前損失;
根據(jù)所述當前損失,對所述分類模型中的參數(shù)進行更新;
根據(jù)所述預測賬號類型和所述真實賬號類型,確定當前分類模型為訓練后的分類模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010828851.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





