[發(fā)明專利]處理交易數(shù)據(jù)的方法及裝置在審
| 申請?zhí)枺?/td> | 201810146777.7 | 申請日: | 2018-02-12 |
| 公開(公告)號: | CN108446978A | 公開(公告)日: | 2018-08-24 |
| 發(fā)明(設(shè)計)人: | 趙科科;趙星 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06Q40/04 | 分類號: | G06Q40/04;G06F17/30;G06F21/62 |
| 代理公司: | 北京億騰知識產(chǎn)權(quán)代理事務所 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)集 交易數(shù)據(jù) 明細數(shù)據(jù) 神經(jīng)網(wǎng)絡(luò) 特征向量 時間段 方法和裝置 時間順序 有效地 遞歸 交易 挖掘 分析 | ||
本說明書實施例提供一種處理交易數(shù)據(jù)的方法和裝置,方法包括,首先獲取與連續(xù)的n個時間段分別對應的n個數(shù)據(jù)集,其中各個數(shù)據(jù)集i包括對應的時間段中用戶的交易明細數(shù)據(jù)。然后,基于對應的數(shù)據(jù)集i中的交易明細數(shù)據(jù)衍生出衍生變量,并基于衍生變量形成與各數(shù)據(jù)集對應的特征向量。基于此,將各個特征向量按照時間順序輸入時間遞歸的神經(jīng)網(wǎng)絡(luò),從該神經(jīng)網(wǎng)絡(luò)獲得處理結(jié)果。如此,更加有效地對交易數(shù)據(jù)進行挖掘和分析。
技術(shù)領(lǐng)域
本說明書一個或多個實施例涉及計算機技術(shù)領(lǐng)域,尤其涉及處理交易數(shù)據(jù)的方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們越來越頻繁地利用互聯(lián)網(wǎng)和電子錢包進行各種交易,由此形成了交易數(shù)據(jù)。交易數(shù)據(jù)是具有很高價值的數(shù)據(jù)資產(chǎn),特別是在目前的大數(shù)據(jù)背景下,如何深入挖掘交易數(shù)據(jù),提煉出數(shù)據(jù)價值,在技術(shù)提升和業(yè)務提升方面都有重要的意義。
進一步地,在對數(shù)據(jù)進行深入挖掘的同時,還需要考慮應用場景問題和安全性問題。交易數(shù)據(jù)一般反映用戶的交易歷史,如果能通過交易數(shù)據(jù)的挖掘和處理,將交易數(shù)據(jù)的信息應用在更廣泛的應用場景,例如信用業(yè)務場景,將進一步提升數(shù)據(jù)的利用率。此外,在許多情況下,存在與其他機構(gòu)共建模型的可能,這就需要將初步處理的數(shù)據(jù)發(fā)給其他機構(gòu)。此時,既希望挖掘的數(shù)據(jù)有較高的數(shù)據(jù)價值和數(shù)據(jù)含義,又要考慮數(shù)據(jù)泄露的系統(tǒng)風險和用戶隱私的保護,而盡量隱藏業(yè)務含義。如此,對數(shù)據(jù)的挖掘和處理提出很高的要求。
因此,希望能有改進的方案,更有效地對交易數(shù)據(jù)進行處理。
發(fā)明內(nèi)容
本說明書一個或多個實施例描述了一種方法和裝置,通過結(jié)合變量衍生的初步數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡(luò)的進一步數(shù)據(jù)分析,更有效地對交易數(shù)據(jù)進行處理。
根據(jù)第一方面,提供了一種處理交易數(shù)據(jù)的方法,包括:
獲取與連續(xù)的n個預設(shè)時間段分別對應的n個數(shù)據(jù)集,其中各個數(shù)據(jù)集i包括對應的時間段中用戶的交易明細數(shù)據(jù);
形成與所述n個數(shù)據(jù)集分別對應的n個特征向量,其中各個特征向量Fi分別包括,基于對應的數(shù)據(jù)集i中的交易明細數(shù)據(jù)衍生出的衍生變量;
將所述n個特征向量按照時間順序輸入時間遞歸的神經(jīng)網(wǎng)絡(luò),從所述時間遞歸的神經(jīng)網(wǎng)絡(luò)獲得處理結(jié)果。
根據(jù)一個實施例,交易明細數(shù)據(jù)包括多個字段,所述多個字段至少包括:交易時間字段,交易金額字段,以及至少一個類別字段。
在一種可能的設(shè)計中,形成特征向量的步驟包括:獲取數(shù)據(jù)集i中所述交易明細數(shù)據(jù)的所述多個字段;對所述多個字段的數(shù)據(jù)進行聚合操作,從而獲得衍生變量;將所述衍生變量作為所述特征向量Fi的向量元素。
根據(jù)一個實施例,對多個字段中的數(shù)據(jù)進行聚合操作包括:從所述多個字段中選擇至少一部分字段進行組合,得到組合字段;對組合字段的數(shù)據(jù)進行運算操作,從而得到衍生變量。
進一步地,在一個實施例中,上述運算操作包括以下中的一項或多項:數(shù)值判斷、計數(shù)、求和、求平均、求標準差、求分位數(shù)、分布統(tǒng)計。
根據(jù)一種可能的設(shè)計,形成特征向量的步驟還包括:獲取數(shù)據(jù)集i中所述至少一個類別字段的內(nèi)容;利用詞嵌入模型,將所述至少一個類別字段的內(nèi)容轉(zhuǎn)換為詞向量;將所述詞向量作為所述特征向量Fi的一部分。
在一個實施例中,上述時間遞歸的神經(jīng)網(wǎng)絡(luò)采用循環(huán)神經(jīng)網(wǎng)絡(luò)RNN,長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM,門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)GRU之一。
在一個實施例中,時間遞歸的神經(jīng)網(wǎng)絡(luò)還包括至少一個全連接層。
根據(jù)一個實施例,所述時間遞歸的神經(jīng)網(wǎng)絡(luò)利用已標定數(shù)據(jù)集進行訓練,所述已標定數(shù)據(jù)集包括歷史交易數(shù)據(jù),且具有是否發(fā)生信用違約的標簽。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810146777.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風險分析或養(yǎng)老金
- 數(shù)據(jù)集及數(shù)據(jù)集“異或”的DMA傳送
- 數(shù)據(jù)處理的方法和系統(tǒng)
- 鏈接數(shù)據(jù)集
- 數(shù)據(jù)處理方法及其設(shè)備
- VR視頻轉(zhuǎn)碼方法及裝置
- 數(shù)據(jù)匹配方法以及裝置
- 一種非平衡數(shù)據(jù)集的分類方法
- 處理數(shù)據(jù)的方法、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 基于數(shù)據(jù)傾斜的關(guān)聯(lián)查詢方法、裝置、設(shè)備及存儲介質(zhì)
- 一種實體識別模型的建立方法、系統(tǒng)、電子設(shè)備及介質(zhì)
- 數(shù)據(jù)庫、管理服務器和管理程序
- 一種數(shù)據(jù)處理方法及裝置
- 明細數(shù)據(jù)的顯示方法及裝置
- 基于FP-growth的跳閘明細數(shù)據(jù)與氣象數(shù)據(jù)關(guān)聯(lián)分析及預警方法
- 一種數(shù)據(jù)處理方法及裝置、一種計算設(shè)備及存儲介質(zhì)
- 財務明細數(shù)據(jù)生成方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種確定血透藥品明細數(shù)據(jù)的方法和設(shè)備
- 數(shù)據(jù)庫表的更新方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 一種保險明細數(shù)據(jù)報送方法及裝置
- 一種數(shù)據(jù)核算方法、裝置及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





