[發明專利]結構化數據處理方法及裝置有效
| 申請號: | 201910258145.4 | 申請日: | 2019-04-01 |
| 公開(公告)號: | CN110162558B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 袁錦程;王維強;許遼薩;趙聞飆;席云;易燦 | 申請(專利權)人: | 創新先進技術有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25;G06F16/242;G06F18/243;G06N3/04 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許振新;朱文杰 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 結構 數據處理 方法 裝置 | ||
1.一種結構化數據處理方法,其特征在于,包括:
獲取結構化數據,并對所述結構化數據進行預處理;
將所述預處理之后的結構化數據轉換成文本數據,并對所述文本數據進行拼接,得到所述結構化數據對應的自然語言;
基于所述自然語言生成所述結構化數據對應的向量;
基于所述向量進行文本模型訓練,調整神經網絡的參數,得到用于加入樹模型的分數,并截取所述神經網絡的部分向量,將截取到的所述神經網絡的部分向量作為用于加入所述樹模型的變量;
還包含:
將所述變量與所述分數加入所述樹模型,所述樹模型用于接入MPS部署,引用stacking模型進行部署。
2.如權利要求1所述的方法,其特征在于,在所述截取所述神經網絡的部分向量的步驟中,從全連接層、或循環神經網絡、或長短期記憶網絡、或卷積神經網絡截取部分向量。
3.如權利要求1所述的方法,其特征在于,所述結構化數據是以下之一或它們的任意組合:夜間賭博交易次數、夜間交易金額、交易時候是否有短時間的返現。
4.如權利要求1所述的方法,其特征在于,在所述基于所述自然語言生成所述結構化數據對應的向量的步驟中,通過以下任意一種方式生成所述向量:word2vec,或cw2vec,或cwe。
5.如權利要求1所述的方法,其特征在于,在所述基于所述向量進行文本模型訓練,調整神經網絡的參數,得到用于加入樹模型的分數,并截取所述神經網絡的部分向量,以將截取到的所述神經網絡的部分向量作為用于加入所述樹模型的變量的步驟中,進一步包含:使用所述神經網絡進行調參,以得到一個最佳參數,所述參數是指所述神經網絡的神經元數。
6.一種結構化數據處理裝置,其特征在于,包括:
預處理模塊:用于獲取結構化數據,并對所述結構化數據進行預處理;
轉換模塊:用于將所述預處理之后的結構化數據轉換成文本數據,并對所述文本數據進行拼接,得到所述結構化數據對應的自然語言;
向量生成模塊:用于基于所述自然語言生成所述結構化數據對應的向量;
調參與截取模塊:用于基于所述向量進行文本模型訓練,調整神經網絡的參數,得到用于加入樹模型的分數,并截取所述神經網絡的部分向量,將截取到的所述神經網絡的部分向量作為用于加入所述樹模型的變量;
還包含:
加入模塊:用于將所述變量與所述分數加入所述樹模型,所述樹模型用于接入MPS部署,引用stacking模型進行部署。
7.一種用于模型構建的變量的生成設備,其特征在于,包括:
存儲器,用于存儲計算機可執行指令;以及,
處理器,用于在執行所述計算機可執行指令時實現如權利要求1至5中任意一項所述的方法中的步驟。
8.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機可執行指令,所述計算機可執行指令被處理器執行時實現如權利要求1至5中任意一項所述的方法中的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新先進技術有限公司,未經創新先進技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910258145.4/1.html,轉載請聲明來源鉆瓜專利網。





