[發(fā)明專利]基于關(guān)聯(lián)分析FP-Tree算法的企業(yè)風(fēng)險(xiǎn)預(yù)警方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011461438.1 | 申請(qǐng)日: | 2020-12-09 |
| 公開(kāi)(公告)號(hào): | CN112465393B | 公開(kāi)(公告)日: | 2022-07-08 |
| 發(fā)明(設(shè)計(jì))人: | 吳志雄;甘建武;李曉瓊;黃鼎 | 申請(qǐng)(專利權(quán))人: | 南威軟件股份有限公司;福建南威軟件有限公司 |
| 主分類號(hào): | G06Q10/06 | 分類號(hào): | G06Q10/06 |
| 代理公司: | 福州元?jiǎng)?chuàng)專利商標(biāo)代理有限公司 35100 | 代理人: | 陳明鑫;蔡學(xué)俊 |
| 地址: | 362000 福建省*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 關(guān)聯(lián) 分析 fp tree 算法 企業(yè) 風(fēng)險(xiǎn) 預(yù)警 方法 | ||
1.一種基于關(guān)聯(lián)分析FP-Tree算法的企業(yè)風(fēng)險(xiǎn)預(yù)警方法,其特征在于,包括如下步驟:
步驟S1、根據(jù)企業(yè)歷史相關(guān)行為數(shù)據(jù),分析衡量企業(yè)風(fēng)險(xiǎn)狀況的標(biāo)尺和重要依據(jù),設(shè)計(jì)風(fēng)險(xiǎn)指標(biāo)體系X={X1,X2,…,Xi},Xi表示風(fēng)險(xiǎn)指標(biāo)體系的第i個(gè)指標(biāo)的名稱;
步驟S2、根據(jù)風(fēng)險(xiǎn)指標(biāo)體系,運(yùn)用大數(shù)據(jù)分析形成風(fēng)險(xiǎn)規(guī)則,即由一個(gè)或多個(gè)指標(biāo)的值等于一預(yù)定值或預(yù)定區(qū)間值,認(rèn)為企業(yè)可能存在相應(yīng)風(fēng)險(xiǎn),得到風(fēng)險(xiǎn)規(guī)則集B:
B={X1:risk1,X2:risk2,…,Xb:riskb,},
其中,Xk為指標(biāo)體系X的子集;riskk為由Xk分析推理得到的相對(duì)應(yīng)的風(fēng)險(xiǎn)文字描述;
步驟S3、采集企業(yè)相關(guān)行為數(shù)據(jù),并構(gòu)建企業(yè)風(fēng)險(xiǎn)預(yù)警模型的訓(xùn)練指標(biāo)數(shù)據(jù)集及待預(yù)警企業(yè)指標(biāo)數(shù)據(jù)集,訓(xùn)練指標(biāo)數(shù)據(jù)集中訓(xùn)練集:測(cè)試集=4:1;
步驟S4、基于訓(xùn)練指標(biāo)數(shù)據(jù)集,通過(guò)企業(yè)信用維度數(shù)據(jù)計(jì)算獲得企業(yè)對(duì)應(yīng)的風(fēng)險(xiǎn)等級(jí),計(jì)算公式如下:
其中,creditScorenew表示最新信用風(fēng)險(xiǎn)分值歸一化后數(shù)值,100·creditScorenew作為風(fēng)險(xiǎn)得分的基礎(chǔ)分值;creditScorei表示前i年信用風(fēng)險(xiǎn)分值,代表信用分?jǐn)?shù)的穩(wěn)定性情況;riskListCount表示近5年來(lái)列入黑名單或失信名單次數(shù),4·riskListCount代表被列入黑名單或失信名單風(fēng)險(xiǎn);
步驟S5、運(yùn)用互熵-區(qū)間套法進(jìn)行分箱、卡方檢驗(yàn)相關(guān)性篩選指標(biāo),根據(jù)分箱結(jié)果進(jìn)行指標(biāo)的字符化,并保存分箱規(guī)則以及篩選后剩余的指標(biāo)列表;
步驟S6、獲取關(guān)聯(lián)規(guī)則集:運(yùn)用關(guān)聯(lián)分析FP-Tree算法挖掘企業(yè)各風(fēng)險(xiǎn)等級(jí)的企業(yè)行為的關(guān)聯(lián)規(guī)則,遍歷關(guān)聯(lián)規(guī)則并將其整合為由指標(biāo)集、風(fēng)險(xiǎn)等級(jí)及置信度組成的關(guān)聯(lián)規(guī)則集,關(guān)聯(lián)規(guī)則集由以“指標(biāo)集:風(fēng)險(xiǎn)等級(jí),置信度”形式且置信度大于0.5的元素構(gòu)成;
其中,A表示其中一指標(biāo)集;B表示其中一風(fēng)險(xiǎn)等級(jí);表示由指標(biāo)集A推理出風(fēng)險(xiǎn)等級(jí)B的置信度;count(A∩B)、count(A)分別表示指標(biāo)集A中的元素和風(fēng)險(xiǎn)等級(jí)B同時(shí)存在同一樣本的樣本數(shù)量、指標(biāo)集A中的元素同時(shí)存在同一樣本的樣本數(shù)量;
步驟S7、根據(jù)步驟S6得到的關(guān)聯(lián)規(guī)則集以及步驟S2得到的風(fēng)險(xiǎn)規(guī)則集,基于待預(yù)警企業(yè)指標(biāo)數(shù)據(jù)集對(duì)待預(yù)警企業(yè)進(jìn)行預(yù)警,預(yù)警企業(yè)命中的關(guān)聯(lián)規(guī)則,預(yù)測(cè)企業(yè)風(fēng)險(xiǎn)等級(jí)及可能存在的風(fēng)險(xiǎn)點(diǎn),輸出預(yù)警結(jié)果;
步驟S5中,運(yùn)用互熵-區(qū)間套法進(jìn)行分箱、卡方檢驗(yàn)相關(guān)性篩選指標(biāo)的具體實(shí)現(xiàn)方式如下:
對(duì)于值種類超過(guò)5個(gè)的離散變量屬性的指標(biāo)及連續(xù)變量的指標(biāo),運(yùn)用有監(jiān)督的互熵-區(qū)間套法對(duì)指標(biāo)變量進(jìn)行分箱并根據(jù)分箱結(jié)果字符化連續(xù)變量,降低模型過(guò)擬合的風(fēng)險(xiǎn);
互熵-區(qū)間套法進(jìn)行分箱步驟如下:
第0步,預(yù)先設(shè)定一個(gè)閾值threshold以及最大分箱數(shù)n;
對(duì)待分箱指標(biāo)I,有初始分箱邊界值集為Boundary={a,b},對(duì)指標(biāo)I進(jìn)行分箱:
第1步,取將[a,b]劃分為兩個(gè)區(qū)間[a,a0]、(a0,b],結(jié)合互信息和信息熵,提出一種新的類別不確定評(píng)價(jià)函數(shù)MiEntropy:
其中,t為區(qū)間;C為類別集合,C={c1,c2,…,cm},m為類別個(gè)數(shù);p(ci)、p(t)、p(t,ci)分別是訓(xùn)練集中ci類的樣本數(shù)、指標(biāo)值在區(qū)間t的樣本數(shù)、指標(biāo)值在區(qū)間t且屬于ci類的樣本數(shù)與訓(xùn)練集樣本總數(shù)的比例,p(ci|t)指標(biāo)值在區(qū)間t且屬于ci的樣本數(shù)與指標(biāo)值在區(qū)間t的樣本數(shù)的比例,η為超參數(shù),且滿足η∈[0,1];
應(yīng)用MiEntropy對(duì)[a,a0]、(a0,b]進(jìn)行評(píng)價(jià),轉(zhuǎn)第2步;
第2步,若MiEntropy([a,a0])≥threshold或MiEntropy((a0,b])≥threshold,則將a0添加至Boundary中,轉(zhuǎn)第3步;否則直接轉(zhuǎn)第3步;
第3步,根據(jù)Boundary獲得指標(biāo)I的分箱數(shù)numb(I):
若numb(I)≥n,則停止分箱
若MiEntropy([a,a0])≥threshold,取a=a,b=a0并跳至第1步;
若MiEntropy((a0,b])≥threshold,取a=a0,b=b并跳至第1步;
若MiEntropy([a,a0])≤MiEntropy((a0,b])<threshold,取a=a0,b=b并跳至第1步;
若MiEntropy((a0,b])≤MiEntropy([a,a0])<threshold,取a=a,b=a0并跳至第1步;
第4步,分箱結(jié)束后,得到一個(gè)分箱邊界集,將其按照從小到大的順序排序得到Boundary={a,a1,a2,…,ak,b},根據(jù)Boundary將指標(biāo)I分為k+1箱:{[a,a1],(a1,a2],…,(ak,b]};
卡方檢驗(yàn)相關(guān)性篩選指標(biāo)具體為:通過(guò)卡方檢驗(yàn)檢驗(yàn)指標(biāo)變量與企業(yè)風(fēng)險(xiǎn)的相關(guān)性,過(guò)濾對(duì)預(yù)警助益不大的指標(biāo),卡方檢驗(yàn)進(jìn)行相關(guān)分析的結(jié)果基于有監(jiān)督的分箱進(jìn)行劃分樣本空間。
2.根據(jù)權(quán)利要求1所述的基于關(guān)聯(lián)分析FP-Tree算法的企業(yè)風(fēng)險(xiǎn)預(yù)警方法,其特征在于,步驟S7的具體實(shí)現(xiàn)方式如下:
首先,對(duì)待預(yù)警企業(yè)指標(biāo)數(shù)據(jù)集中待預(yù)警企業(yè)指標(biāo)數(shù)據(jù)字符化:指標(biāo)數(shù)據(jù)的轉(zhuǎn)化,由步驟S5的分箱規(guī)則決定,將原始指標(biāo)數(shù)據(jù)轉(zhuǎn)換為相對(duì)應(yīng)的字符標(biāo)識(shí),得到該企業(yè)的轉(zhuǎn)化后的指標(biāo)集
其中,Ci為第i個(gè)樣本企業(yè)各指標(biāo)值字符化后的結(jié)果集合;表示第i個(gè)樣本企業(yè)第ci個(gè)指標(biāo)字符化結(jié)果值;
其次,獲取命中關(guān)聯(lián)規(guī)則:遍歷關(guān)聯(lián)規(guī)則,若關(guān)聯(lián)規(guī)則的指標(biāo)集滿足Ci∩Rj=Rj,則表示該企業(yè)命中Rj對(duì)應(yīng)的關(guān)聯(lián)規(guī)則,因此,得到企業(yè)命中風(fēng)險(xiǎn)規(guī)則指標(biāo)集Qi:
其中,表示第i個(gè)預(yù)警企業(yè)第qi個(gè)命中的風(fēng)險(xiǎn)規(guī)則的指標(biāo)集;表示第i個(gè)預(yù)警企業(yè)第qi個(gè)命中的風(fēng)險(xiǎn)規(guī)則的風(fēng)險(xiǎn)等級(jí);表示第i個(gè)預(yù)警企業(yè)第qi個(gè)命中的風(fēng)險(xiǎn)規(guī)則的置信度;
然后,獲取風(fēng)險(xiǎn)等級(jí):風(fēng)險(xiǎn)等級(jí)由命中關(guān)聯(lián)規(guī)則的風(fēng)險(xiǎn)等級(jí)和置信度所決定的,將關(guān)聯(lián)規(guī)則的風(fēng)險(xiǎn)等級(jí)轉(zhuǎn)換為對(duì)應(yīng)分值,置信度作為權(quán)值進(jìn)行加權(quán)平均,計(jì)算得到最終的風(fēng)險(xiǎn)分?jǐn)?shù),并根據(jù)各風(fēng)險(xiǎn)等級(jí)的分值區(qū)間獲得風(fēng)險(xiǎn)等級(jí);
其中,高風(fēng)險(xiǎn)用P0表示,中高風(fēng)險(xiǎn)有兩個(gè)等級(jí),即P1、P2,且P1的風(fēng)險(xiǎn)大于P2,低風(fēng)險(xiǎn)用P3表示,無(wú)風(fēng)險(xiǎn)用P4表示;riskScorei表示第i個(gè)預(yù)警企業(yè)的風(fēng)險(xiǎn)得分;SPij表示第i個(gè)預(yù)警企業(yè)第j個(gè)命中的風(fēng)險(xiǎn)規(guī)則的風(fēng)險(xiǎn)等級(jí)得分;Pij表示第i個(gè)預(yù)警企業(yè)第j個(gè)命中的風(fēng)險(xiǎn)規(guī)則的風(fēng)險(xiǎn)等級(jí);Confij表示第i個(gè)預(yù)警企業(yè)第j個(gè)命中的風(fēng)險(xiǎn)規(guī)則的置信度;ri表示第i個(gè)預(yù)警企業(yè)命中的風(fēng)險(xiǎn)規(guī)則的置信度之和;riskLevel為風(fēng)險(xiǎn)得分映射為風(fēng)險(xiǎn)等級(jí)的函數(shù);
最后,獲取風(fēng)險(xiǎn)描述:遍歷步驟S2所得的風(fēng)險(xiǎn)規(guī)則集B={X1:risk1,X2:risk2,…,Xb:riskb,},以及企業(yè)命中風(fēng)險(xiǎn)規(guī)則指標(biāo)集Qi={Rij:(Pij,Confij)},j=i,…,qi,若Xk∩Rij=Xk,則該企業(yè)大概率存在Xk所對(duì)應(yīng)的風(fēng)險(xiǎn)點(diǎn)riskk;遍歷完成后,得到該企業(yè)風(fēng)險(xiǎn)點(diǎn)集RISKi={riskj},j=1,…,ki,對(duì)風(fēng)險(xiǎn)點(diǎn)集中各元素以分號(hào)進(jìn)行拼接得到其風(fēng)險(xiǎn)描述。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南威軟件股份有限公司;福建南威軟件有限公司,未經(jīng)南威軟件股份有限公司;福建南威軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011461438.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門(mén)票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報(bào)文關(guān)聯(lián)方法、報(bào)文關(guān)聯(lián)裝置及報(bào)文關(guān)聯(lián)系統(tǒng)
- VEGF受體融合蛋白在制備治療伴隨VEGF升高的炎癥反應(yīng)的藥物中的應(yīng)用
- VEGF受體融合蛋白在制備抑制眼表新生血管生長(zhǎng)的藥物中的應(yīng)用
- VEGF受體融合蛋白在制備治療膿毒癥藥物中的應(yīng)用
- 圖案或FP的特征值作成方法、作成程序以及作成裝置
- 圖案的評(píng)價(jià)方法、多成分物質(zhì)的評(píng)價(jià)方法、評(píng)價(jià)程序以及評(píng)價(jià)裝置
- 建立控制通道的方法、轉(zhuǎn)發(fā)設(shè)備和控制設(shè)備
- 雙舍入組合浮點(diǎn)乘法和加法
- 一種基于浮點(diǎn)像素?cái)?shù)據(jù)的圖像Alpha混合方法
- 使用浮點(diǎn)乘法-累加結(jié)果的模糊-J位位置
- 集成側(cè)向調(diào)制器的FP激光器





