[發明專利]一種基于時空圖的詐騙號碼識別方法有效
| 申請號: | 202010542365.2 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN111726460B | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 李鵬;孫旭東;戚夢苑;初國俊;侯煒;劉瑤;計哲;肖紅;寧珊;張震 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心;杭州東信北郵信息技術有限公司 |
| 主分類號: | H04M3/22 | 分類號: | H04M3/22;H04W12/12;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時空 詐騙 號碼 識別 方法 | ||
1.一種基于時空圖的詐騙號碼識別方法,其特征在于,包括有:
步驟一、由全量通話記錄生成電信通聯網絡:G={V,E,Y},并據此構建識別詐騙號碼的時空圖,所構建的時空圖是由連續多張時空子圖組成的集合,其中,V表示所有通信用戶的節點集合,vi∈V,vi表示用戶i的節點,E表示所有用戶節點之間通話關系的集合,eijt=(vi,vj,t)∈E,eijt表示用戶i在t時刻給用戶j的通話,Y表示人工標注的用戶身份集合,yi∈Y,yi是人工標注的用戶i的身份,然后使用Snapshot方法按一定的時間間隔T、從構建的時空圖中連續截取出多張時空子圖:Gk={Vk,Ek,Xk,Y},其中,Gk表示截取出的第k張時空子圖,Vk表示時空子圖Gk中所有通信用戶的節點集合,Ek表示時空子圖Gk中所有用戶節點之間通話關系的集合,Xk表示時空子圖Gk中所有用戶的通話特征指標向量集合,dik∈Xk,dik表示時空子圖Gk中用戶i的通話特征指標向量;
步驟二、基于用戶在每張時空子圖對應時間周期下的通話記錄,計算每個用戶在每張時空子圖對應時間周期下的通話特征指標向量,同時,為每個用戶從所有時空子圖中提取和其擁有相同被叫的鄰居用戶,并由所有鄰居用戶構成每個用戶的鄰居組;
步驟三、構建、并訓練識別詐騙號碼的時空圖神經網絡,所述時空圖神經網絡的輸入是目標用戶和其鄰居組中的所有鄰居用戶在所有時空子圖中的通話特征指標向量,輸出是標識目標用戶號碼是否是疑似詐騙號碼的標簽信息;
步驟四、將待識別的目標用戶和其鄰居組中的所有鄰居用戶在所有時空子圖中的通話特征指標向量輸入訓練后的時空圖神經網絡,并根據時空圖神經網絡的輸出判斷待識別的目標用戶號碼是否是疑似詐騙號碼,
所述時空圖神經網絡包含有圖卷積網絡和遞歸神經網絡,當輸入目標用戶和其鄰居組中的所有鄰居用戶在所有時空子圖中的通話特征指標向量時,時空圖神經網絡的具體計算過程如下:
步驟1、依次將目標用戶和其鄰居組中的所有鄰居用戶在每張時空子圖對應時間周期下的通話特征指標向量輸入圖卷積神經網絡,從而輸出目標用戶在每張時空子圖對應時間周期下的空間融合特征向量,并將目標用戶在所有時空子圖對應時間周期下的空間融合特征向量構成目標用戶的空間融合特征向量組;
步驟2、將目標用戶的空間融合特征向量組輸入遞歸神經網絡,以通過遞歸神經網絡的隱狀態實現目標用戶及其鄰居用戶在不同時空子圖對應時間周期下的特征信息的整合,并根據最后一張時空子圖對應時間周期下的隱狀態獲得遞歸神經網絡的輸出,即標識用戶號碼是否是疑似詐騙號碼的標簽信息。
2.根據權利要求1所述的方法,其特征在于,步驟二中,構成通話特征指標向量的通話特征指標包括但不限于:呼叫頻次、被叫號碼數、離散度、忙時率、通話間隔平均值、呼叫間隔平均值、通話時長平均值、振鈴時長平均值、未接通振鈴時長平均值、接通率、被叫釋放率、主叫類型、被叫類型、主叫地區、被叫地區。
3.根據權利要求1所述的方法,其特征在于,當目標用戶或鄰居用戶在其中一張時空子圖中不存在有對應的通信用戶的節點時,以第z張時空子圖為例,步驟1還包括有:
將目標用戶或鄰居用戶在第z張時空子圖對應時間周期下的通話特征指標向量設置為全0向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心;杭州東信北郵信息技術有限公司,未經國家計算機網絡與信息安全管理中心;杭州東信北郵信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010542365.2/1.html,轉載請聲明來源鉆瓜專利網。





