[發明專利]一種基于全連接神經網絡的僵尸企業識別方法及其系統在審
| 申請號: | 202010711180.X | 申請日: | 2020-07-22 |
| 公開(公告)號: | CN111861758A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 李志敏;毛浩地;蔡承佑;何真可;李瑩;杜楠楠 | 申請(專利權)人: | 浙江中醫藥大學 |
| 主分類號: | G06Q40/06 | 分類號: | G06Q40/06;G06Q40/04;G06Q50/26;G06N3/08 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310053 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 連接 神經網絡 僵尸 企業 識別 方法 及其 系統 | ||
本發明涉及一種基于全連接神經網絡的僵尸企業識別方法,包括以下步驟:步驟S1:采集若干樣本企業數據;步驟S2:進行數據預處理,提取樣本企業特征并添加標簽,劃分訓練數據集、測試數據集;步驟S3:利用Sequential模型構建全連接神經網絡;步驟S4:根據訓練數據集,初始化并訓練全連接神經網絡模型,直到到達預設最大訓練次數,得到訓練后的全連接神經網絡模型;步驟S5:將待測企業數據輸入訓練后的全連接神經網絡模型,識別是否為僵尸企業。本發明還包括實施本發明方法的系統。本發明具有高效準確、自動化的特點,對推進企業風險監察具有重大意義。
【技術領域】
本發明屬于信息技術領域,涉及一種工商管理系統的僵尸企業識別方法。
【背景技術】
僵尸企業是指缺乏盈利能力卻能夠以低于市場最優利率成本獲得信貸資源,依靠外界輸血的企業,地方政府不斷給瀕臨破產的僵尸企業進行各種形式的“輸血”,然后再通過補貼貸款來維持其局面,帶來嚴重的資源配置問題。
僵尸企業的識別標準主要有CHK標準,FN-CHK標準以及各類FN-CHK修正標準等。CHK標準的核心是企業是否接受信貸補貼,FN-CHK標準則包含“真實利潤原則”以及“常青貸款原則”,相關的FN-CHK修正方法大部分都是對以上兩類標準的修正,對企業利潤與資產負債率等指標進行調整,將企業的經營管理費用、凈資產水平、企業效率和創新等指標引入僵尸企業的識別標準體系中,力求從更加多維的層次反映僵尸企業的經營特征。通過各類標準分類識別僵尸企業均有其局限性,尤其是標準的制定有其主觀性。
隨著經濟社會的不斷發展,企業數量急劇增加,但企業經營質量參差不齊, 通過對企業從業人數、成立年限、注冊資本、營業收入、風險信息,行政處罰、 納稅信用等級、黑名單、上市信息、電商信息等數據關聯處理,按需進行權重分 割,對這些數據進行基于機器學習的綜合分析并識別僵尸企業。
【發明內容】
本發明要克服現有技術的上述缺點,的目的在于提供一種基于全連接神經網絡的僵尸企業識別與分類方法。具有高效準確、自動化的特點,對推進企業風險監察具有重大意義。
為實現上述目的,本發明采用如下技術方案。
一種基于全連接神經網絡的僵尸企業識別方法,其特征在于,包括以下步驟:
步驟S1:采集若干樣本企業數據(數據來源:上海證券交易所、深圳證券交易所、企業財報、國家知識產權局);
步驟S2:提取樣本企業特征并添加標簽,并進行數據預處理,劃分訓練數據集、測試數據集;
步驟S3:利用Sequential模型構建全連接神經網絡;
步驟S4:根據訓練數據集,初始化并訓練全連接神經網絡模型,直到測試誤差達到預設值或者到達預設最大訓練次數,得到訓練后的全連接神經網絡模型;
步驟S5:將待測企業數據輸入訓練后的全連接神經網絡模型,識別是否為僵尸企業。
進一步的,步驟S2所述DE數據預處理和特征提取過程,包括缺失值插補、數據歸一化、均值代換和時間序列化。
所述的缺失值插補包括以下步驟:
若融資額度或融資成本其中一項為0,另一項缺失,則將另一項置為0;若融資額度和融資成本均缺失則將兩項都置為0;若融資額度或融資成本其中一項為實數,另一項缺失,則由以下公式計算缺失值:
k1≈k2≈…≈kn≈K,K為常數
對所有數據按行計算主營業務收入/營業總收入比例,并按如下公式計算平均比例:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江中醫藥大學,未經浙江中醫藥大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010711180.X/2.html,轉載請聲明來源鉆瓜專利網。





