[發明專利]一種企業經營風險特征數據信息提取方法和提取系統有效
| 申請號: | 201911194769.0 | 申請日: | 2019-11-28 |
| 公開(公告)號: | CN110889556B | 公開(公告)日: | 2022-08-12 |
| 發明(設計)人: | 莊莉;梁懿;陳江海;蘇江文;王秋琳;宋立華;謝可;邱鎮 | 申請(專利權)人: | 福建億榕信息技術有限公司;國網信息通信產業集團有限公司;國網浙江省電力有限公司;國家電網有限公司;國網信通億力科技有限責任公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06F16/36;G06F16/951 |
| 代理公司: | 福州科揚專利事務所(普通合伙) 35001 | 代理人: | 李曉芬 |
| 地址: | 350000 福建省福*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 企業 經營風險 特征 數據 信息 提取 方法 系統 | ||
1.一種企業經營風險特征數據信息提取方法,其特征在于,包括以下步驟:
S11、利用網絡爬蟲技術采集所需進行風險預測的企業信息數據以及其關聯企業的信息數據;采集進行風險預測的企業內部信息數據以及外部信息數據;所述的內部信息數據包括所有格式的財務數據、報賬信息數據、合同信息數據、HR數據、招投標數據以及其他企業內部相關的辦公電子文檔;所述的外部信息數據包括了企業互聯網輿情數據、外部公開招投標信息數據、工商信息數據、政策信息數據以及其他與企業相關的網頁數據;
S12、對于所收集到的企業內部信息數據和外部信息數據進行數據融合處理,將非結構化或者半結構化數據轉化為結構化的數據并且儲存至圖形數據庫內;
S13、根據所收集到的所需進行風險預測的企業信息數據和其關聯企業的信息數據進行知識圖譜構建及繪制;將知識圖譜看作是一張圖,使用圖嵌入法,用低維、稠密、實值的向量表示網絡中的節點且將異質信息投影到同一個低維空間中進行下游計算;下游計算即為深度學習模型接受降維后的數據,進行訓練或者預測;將圖之間的關系轉化為通過word2vec中的詞序列類挖掘圖節點之間的關系;
S14、采集經營風險特征數據信息;使用深度學習方法從知識圖譜里獲取與預先設定的風險特征詞相同或者類似的風險特征標簽詞,然后利用深度學習方法找到經營風險特征數據信息進行提取;深度學習是一種機器學習的方法,它通過多個隱含層的神經網絡結果來學習目標;
其中,所述的所收集到的所需企業以及其關聯企業的信息數據進行知識圖譜構建及繪制包含以下步驟:
S21、利用自然語言處理技術對不同企業的相關聯的實體信息數據進行命名實體識別,進而得到與所需進行經營風險預測的企業的相關聯實體信息數據;并進行實體消歧,獲得明確名稱指代的具體實體信息數據;
S22、對實體之間的語義關系進行提取,從而獲得不同實體間的實體關系信息數據;
S23、整合S21中的實體信息數據以及S22中的實體關系信息數據進行知識圖譜的構建以及繪制,通過圖的方式表達實體與實體之間的復雜關系。
2.一種采用權利要求1所述的企業經營風險特征數據信息提取方法的企業經營風險特征數據信息提取系統,其特征在于:所述的系統包括了數據采集模塊,知識圖譜模塊,模型構建模塊以及預測模塊;
所述的數據采集模塊,利用網絡爬蟲腳本獲取不同平臺上的相關企業內外部數據;再將所獲取的數據進行數據融合,整合;
所述的知識圖譜模塊,利用數據采集模塊上所獲取的數據構建知識圖譜,利用所述的圖譜對圖譜內的事件進行聚類和風險等級劃分,并把相關的數據導入模型構建模塊中;
所述的模型構建模塊利用所述圖譜構建的圖內信息數據,構建訓練集和測試集,從而進行持續的迭代訓練,得出最優模型;
所述的預測模塊,利用所述模型板塊內得到的最優模型以及將要預測的企業當前相關數據,能夠對所需企業的未來風險進行分析預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建億榕信息技術有限公司;國網信息通信產業集團有限公司;國網浙江省電力有限公司;國家電網有限公司;國網信通億力科技有限責任公司,未經福建億榕信息技術有限公司;國網信息通信產業集團有限公司;國網浙江省電力有限公司;國家電網有限公司;國網信通億力科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911194769.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





