[發明專利]一種混合值屬性審批數據的分類方法及系統在審
| 申請號: | 201910014482.9 | 申請日: | 2019-01-07 |
| 公開(公告)號: | CN109740680A | 公開(公告)日: | 2019-05-10 |
| 發明(設計)人: | 賈晉;何玉林 | 申請(專利權)人: | 深圳中創華安科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06Q40/02 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 杜陽陽 |
| 地址: | 518000 廣東省深圳市龍華*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 屬性數據 數據集 審批 分類 熱編碼 編碼數據 神經網絡 數值屬性 不確定性 分類結果 實際輸出 數據包括 損失函數 最小化 集合 融合 輸出 轉換 | ||
1.一種混合值屬性審批數據的分類方法,其特征在于,包括:
獲取待分類的混合值屬性的審批數據;所述審批數據包括離散值屬性數據集和連續值屬性數據集;
采用獨熱編碼方法對所述離散值屬性數據集進行轉換,得到獨熱編碼數據集;
基于神經網絡對所述獨熱編碼數據集進行深度編碼,得到深度編碼數據集;
將所述深度編碼數據集和所述連續值屬性數據集合并,得到實數值屬性數據集;
采用連續值屬性數據的分類方法對所述實數值屬性數據集進行分類,得到所述審批數據的分類結果。
2.根據權利要求1所述的混合值屬性審批數據的分類方法,其特征在于,所述待分類的混合值屬性的審批數據為信用卡審批數據。
3.根據權利要求1所述的混合值屬性審批數據的分類方法,其特征在于,所述采用獨熱編碼方法對所述離散值屬性數據集進行轉換,得到獨熱編碼數據集,具體包括:
利用公式將所述離散值屬性數據集中的第n個樣本的第m2個離散值屬性對應的數據值進行轉換;其中,為離散值屬性數據集中第n個樣本的第m2個離散值屬性對應的數據值,為離散值屬性數據集中第n個樣本的第m2個離散值屬性對應的數據值轉換后的第k個數據值,離散值屬性數據集中所有樣本的第m2個離散值屬性對應的數據值集合為表示所述離散值屬性數據集中所有樣本的第m2個離散值屬性的取值的個數,為數據值集合中的第k個元素,表示所述離散值屬性數據集中離散值屬性的個數,代表審批數據中樣本的個數;
依次得到所述離散值屬性數據集中每一個樣本的每一個離散值屬性對應的數據值轉換后的數據值,進而得到獨熱編碼數據集。
4.根據權利要求1所述的混合值屬性審批數據的分類方法,其特征在于,所述基于神經網絡對所述獨熱編碼數據集進行深度編碼,得到深度編碼數據集,具體包括:
獲取編碼神經網絡;所述編碼神經網絡包括多個隱含層;
將所述獨熱編碼數據集輸入所述編碼神經網絡;所述編碼神經網絡的輸入層節點的個數為表示所述離散值屬性數據集中離散值屬性的個數,表示所述離散值屬性數據集中所有樣本的第m2個離散值屬性的取值的個數,所述編碼神經網絡的損失函數為其中,λ為增強因子,λ>0;為深度編碼數據集的實際輸出與真實輸出之間的誤差,為的不確定性;為所述編碼神經網絡隱含層的輸出矩陣,為所述編碼神經網絡隱含層的個數;所述編碼神經網絡隱含層的輸出矩陣使得所述損失函數最小化;
根據所述編碼神經網絡隱含層的輸出矩陣的數值,確定所述深度編碼數據集。
5.根據權利要求4所述的混合值屬性審批數據的分類方法,其特征在于,所述連續值屬性數據的分類方法包括支持向量機和神經網絡。
6.一種混合值屬性審批數據的分類系統,其特征在于,包括:
審批數據獲取模塊,用于獲取待分類的混合值屬性的審批數據;所述審批數據包括離散值屬性數據集和連續值屬性數據集;
獨熱編碼轉換模塊,用于采用獨熱編碼方法對所述離散值屬性數據集進行轉換,得到獨熱編碼數據集;
深度編碼模塊,用于基于神經網絡對所述獨熱編碼數據集進行深度編碼,得到深度編碼數據集;
合并模塊,用于將所述深度編碼數據集和所述連續值屬性數據集合并,得到實數值屬性數據集;
分類模塊,用于采用連續值屬性數據的分類方法對所述實數值屬性數據集進行分類,得到所述審批數據的分類結果。
7.根據權利要求6所述的混合值屬性審批數據的分類系統,其特征在于,所述待分類的混合值屬性的審批數據為信用卡審批數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳中創華安科技有限公司,未經深圳中創華安科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910014482.9/1.html,轉載請聲明來源鉆瓜專利網。





