[發明專利]一種分析計算人員親密度的方法及系統在審
| 申請號: | 201810574663.2 | 申請日: | 2018-06-06 |
| 公開(公告)號: | CN108897780A | 公開(公告)日: | 2018-11-27 |
| 發明(設計)人: | 田立娜;高軍;王可鑫;段文良 | 申請(專利權)人: | 山東合天智匯信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00;G06Q50/26 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 李琳 |
| 地址: | 250000 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分析計算 人員關系 屬性數據 行為數據 公安 篩選 挖掘 預測 分析 | ||
1.一種分析計算人員親密度的方法,其特征是:包括以下步驟:
(1)獲取公安數據,利用關系人的自身屬性直接計算單一關系親密度,通過單一關系表示人員關系的親疏度;
(2)獲取關系人的行為數據,對數據的質量進行統計及數據的時效性進行分析;
(3)對同住宿、同房間、同上網、同飛機、同火車、同交通違法、同車事故、同租房和同事關系的行為特征選定進行統計;
(4)對人員關系、行為數據和行為特征進行樣本的統計,利用邏輯回歸算法創建線性預測模型;
(5)利用Logistic Regression算法將線性預測模型的結果映射到sigmoid函數中,得到樣本數據的概率密度函數;
(6)通過大數據挖掘人與之間的屬性特征及出行行為特征進行數據的分析并將分析結果存儲,獲取預測數據,并將預測數據作為線性預測模型的輸入,計算得出人員親密度值。
2.如權利要求1所述的一種分析計算人員親密度的方法,其特征是:所述步驟(1)中,獲取公安數據,主要涉及人員的常住人口、民政廳數據、流口數據,使用關系人的自身屬性直接計算單一關系親密度,通過單一關系表示人員關系的親疏度,單一關系包括但不限于,同戶、夫妻、父女、母女或兄弟姐妹直接表示關系人關系。
3.如權利要求1所述的一種分析計算人員親密度的方法,其特征是:所述步驟(2)中,關系人行為數據,包括但不限于鐵路、民航、住宿、網吧、交通違法、交通事故、租房或/和同事關系數據。
4.如權利要求1所述的一種分析計算人員親密度的方法,其特征是:所述步驟(2)中,如果一段時間內沒有發生行為關系,則親密度會根據時間的推移消失。
5.如權利要求1所述的一種分析計算人員親密度的方法,其特征是:所述步驟(3)中,關系行為特征具體為:
同?。宏P系人同時在住同一賓館并開N個房間(N>1);或,同時開房、同時退房,時間差在T時間段;
同房間:關系人在同時入住同一個賓館的同一個房間;
同上網:關系人在在同一個網吧T時間上機、同上網鄰座;并在同T時間下機;
同飛機:關系人在同一個機場T時間同時登機、同下機;
同飛機訂票:關系人T時間同訂共同一個航班機票;
同飛機鄰座:關系人T時間在同航班并且為鄰座關系;
同火車:關系人在T時間同坐同一趟火車,并且起始地點相同;
同火車訂票:關系人在T時間同訂票,并且是同一趟火車相同起始地;
同火車鄰座:關系人在T時間乘坐同一趟火車,且為鄰座;
同交通違法:關系人在T時間使用同一輛車發生交通違法;
同車事故:關系人在T時間使用同一輛車發生交通事故;
同租房:關系人在T時間同租一套房;
同事:關系人在T時間為同事關系。
6.如權利要求1所述的一種分析計算人員親密度的方法,其特征是:所述步驟(4)中,對步驟(1)-步驟(3)中的所有關系特征值進行數據校驗,凡是涉及同戶、夫妻特征的樣本數據的值大于0分為a類;針對所有特征值進行數據校驗,涉及到同戶、夫妻特征的樣本數據值為0,而其他行為數據存在有效數據的分為b類。
7.如權利要求1所述的一種分析計算人員親密度的方法,其特征是:所述步驟(5)中,sigmoid的函數輸出介于(0,1)之間,若模型的輸出值小于設定值,則說明當前數據屬于a類;否則說明當前數據屬于b類。
8.如權利要求1所述的一種分析計算人員親密度的方法,其特征是:所述步驟(5)中,將有監督樣本數據作為模型訓練的數據源,通過設置模型參數,其中包括最大的迭代次數n,n>0,正則化系數r,r大于等于0,二分類預測的閾值t,迭代算法的收斂性l,進而創建親密度預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東合天智匯信息技術有限公司,未經山東合天智匯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810574663.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于多源大數據分析的圖像標注方法
- 下一篇:論文圖形查重系統





