[發明專利]一種評估債券風險影響指標的方法在審
| 申請號: | 202010464996.7 | 申請日: | 2020-05-28 |
| 公開(公告)號: | CN111612627A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 袁豪 | 申請(專利權)人: | 深圳博普科技有限公司 |
| 主分類號: | G06Q40/04 | 分類號: | G06Q40/04;G06Q10/06;G06N3/00 |
| 代理公司: | 深圳市智勝聯合知識產權代理有限公司 44368 | 代理人: | 齊文劍 |
| 地址: | 518000 廣東省深圳市福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 評估 債券 風險 影響 指標 方法 | ||
本發明實施例提供了一種評估債券風險影響指標的方法,包括:獲取債券樣本的數據源;根據所述數據源,構建數據特征和分類目標;采用隨機森林算法,計算所述數據特征的重要性,生成所述數據特征的重要性排序;按照所述重要性排序的順序,逐一向分類模型添加所述數據特征,計算相應的準確率,選取達到最高準確率的特征子集;根據所述特征子集,獲得重要影響指標。本發明實施例的方法對債券樣本的數據集進行特征重要性排序,并通過分類模型計算準確率,找到最佳特征子集,在保證特征子集分類能力的情況下,去除了數據集中的冗余特征,從而篩選出對債券風險造成影響的重要指標,減少了債券信息采集的工作量。
技術領域
本發明涉及大數據技術領域,特別是涉及一種評估債券風險影響指標的方法。
背景技術
近兩年來,債券違約事件頻繁發生,隨著政策的變更債券違約將會成為常見的風險事件。現有的債券風險預測技術主要從廣泛類型的債券數據中提取有用的數據特征,以機器學習的方式對債券進行訓練,從而得到能夠預測債券違約的分類模型。其中,征信信息、財務數據、第三方信用評級報告和研究報告等因素都有可能對債券風險造成影響,如何從海量數據中采集有效指標,對債券風險進行評估成為了一個亟待解決的問題。
現有技術主要運用隨機森林算法對多個數據特征進行評價分析,從中發現重要性高的特征,再回溯到其數據來源,以此確定哪些可以獲取的指標對預測債券發生違約比較重要。
但是,現有的數據特征評估方法難以準確界定有效特征和冗余特征,采用分類模型進行風險預測工作之前仍需收集大量包含冗余特征的指標信息,使得數據采集工作耗時較長。
發明內容
本發明的主要目的為提供一種評估債券風險影響指標的方法,以解決現有指標信息中包含大量冗余特征的技術問題。
本發明提供了一種評估債券風險影響指標的方法,包括:
獲取債券樣本的數據源;
根據所述數據源,構建數據特征和分類目標;
采用隨機森林算法,計算所述數據特征的重要性,生成所述數據特征的重要性排序;
按照所述重要性排序的順序,逐一向分類模型添加所述數據特征,計算相應的準確率,選取達到最高準確率的特征子集;
根據所述特征子集,獲得重要影響指標。
優選的,所述獲取債券樣本的數據源包括:獲取債券樣本的包含兩個及以上的指標信息和所述債券樣本的違約記錄的數據源。
優選的,所述根據所述數據源,構建數據特征和分類目標包括:
根據所述指標信息構建所述數據特征;
根據所述違約記錄構建所述分類目標。
優選的,所述采用隨機森林算法,計算所述數據特征的重要性,生成所述數據特征的重要性排序包括:
根據所述數據特征和所述分類目標,構建決策樹,生成隨機森林;
通過所述隨機森林計算所述數據特征的重要性;
按照所述重要性由高到低的順序將所述數據特征進行排列,生成所述數據特征的重要性排序。
優選的,所述分類模型由采用SVM算法、隨機森林算法、樸素貝葉斯算法、CART算法或Bagging算法對債券樣本的數據進行訓練獲得。
本發明實施例的方法對債券樣本的數據集進行特征重要性排序,并通過分類模型計算準確率,找到最佳特征子集,在保證特征子集分類能力的情況下,去除了數據集中的冗余特征,從而篩選出對債券風險造成影響的重要指標,減少了債券信息采集的工作量。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳博普科技有限公司,未經深圳博普科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010464996.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:高空多層道路
- 下一篇:一種非平衡數據集的分類方法及系統





