[發明專利]一種涉法人員群體畫像分析系統及方法有效
| 申請號: | 201911366166.4 | 申請日: | 2019-12-26 |
| 公開(公告)號: | CN111159763B | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 王開紅;陳濤;金佳佳;丁鍇;李建元 | 申請(專利權)人: | 銀江技術股份有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06K9/62;G06Q50/18 |
| 代理公司: | 杭州之江專利事務所(普通合伙) 33216 | 代理人: | 張慧英 |
| 地址: | 310012 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 法人 群體 畫像 分析 系統 方法 | ||
1.一種涉法人員群體畫像分析方法,其特征在于,包括如下步驟:
(1)采集涉法數據,并對涉法數據進行融合及預處理;
(2)對融合及預處理后的涉法數據進行深度脫敏;其中,深度脫敏方法步驟如下:
(2.1)統計涉法人員姓名信息,按照姓名中姓和名字的分布情況,重新生成涉法人員姓名;
(2.2)對涉法數據中涉及到的組織機構信息進行編碼處理;
(2.3)將身份證件和聯系方式轉化為唯一標識代碼形式;
(2.4)結合外部地圖數據,對采集到的地址信息進行規范化處理,規范化為省市縣的形式,不涉及更加詳細信息;
(2.5)識別所述融合及預處理后的涉法數據中的實體數據,對所述實體數據執行步驟(2.1)-(2.4),完成數據脫敏;
(3)基于涉法數據分別進行文本特征處理與數值特征處理,并進行特征融合,得到涉法人員的特征;
(4)對涉法人員的特征作升維處理,將其轉化為固定長度向量后作降維處理,并采用聚類算法進行涉法人員群體挖掘;
(5)基于聚類結果,結合涉法人員的特征進行群體畫像構建;
(6)對構建得到的人物畫像進行可視化處理,并支持根據界面展示對特征進行二次篩選。
2.根據權利要求1所述的一種涉法人員群體畫像分析方法,其特征在于:所述步驟(1)具體為:通過多個業務系統收集涉法數據,將涉法人員基本信息賦予不同的權重,計算涉法人員相似程度,通過設置相似程度閾值、冗余信息處理、沖突信息處理來進行跨系統數據融合,并將單個業務系統中完全相同的記錄去除,將空值率大于預設閾值的字段去除。
3.根據權利要求1所述的一種涉法人員群體畫像分析方法,其特征在于:所述步驟(3)具體為:將涉法數據歸類為文本特征數據與數值特征數據,具體劃分為人員固定屬性、人員動態屬性、文本描述、地址、組織以及涉法案件特征六種特征類別數據,對這六種特征類別分別進行數據處理,并進行特征融合得到涉法人員的特征;其中,六種特征類別數據及處理具體如下:
1)人員固定屬性數據反映涉法人員的基本信息,對數據進行預處理;
2)人員動態屬性數據是指隨著時間變化而不斷改變的特征,反映涉法人員思想、行為變化狀態,計算各動態屬性數據的均值、方差、以及變化趨勢,其中類別類數據需轉化為數值型數據;
3)文本描述數據反應涉法案件文本描述信息,先進行分詞,并采用word2vec模型生成X維向量;
4)地址數據反映涉法案件的地址相關性,采用步驟(2.4)所述方法處理;
5)組織數據反映涉法案件的組織相關性,采用步驟(2.2)所述方法處理;
6)涉法案件特征是指司法機關對涉法人員涉法事件的相關裁定信息,并對此類信息進行預處理。
4.根據權利要求3所述的一種涉法人員群體畫像分析方法,其特征在于:所述變化趨勢通過如下公式計算:
x=[x1,x2,…,xm]
其中,m表示某個涉法人員動態數據記錄條數;j是下標,無實際意義;x表示動態記錄;1{}表示括號中記錄為真則值為1,否則值為0;td(x)是特征x的變化趨勢值,代表動態數據變好或者維持現狀的趨勢,在0-1之間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于銀江技術股份有限公司,未經銀江技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911366166.4/1.html,轉載請聲明來源鉆瓜專利網。





