[發明專利]數據交換方法、數據交換裝置及計算裝置有效
| 申請號: | 201610088146.5 | 申請日: | 2016-02-17 |
| 公開(公告)號: | CN105760932B | 公開(公告)日: | 2018-04-06 |
| 發明(設計)人: | 陳雨強;戴文淵 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 北京睿邦知識產權代理事務所(普通合伙)11481 | 代理人: | 張麗新 |
| 地址: | 100090 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 交換 方法 裝置 計算 | ||
技術領域
本發明總體地涉及數據交換技術,具體說來,涉及一種針對機器學習任務在數據的提供方和獲取方之間進行數據交換的數據交換方法、數據交換裝置及計算裝置。
背景技術
隨著大數據、云計算和人工智能等技術的發展,機器學習被廣泛地用來從海量數據中挖掘其中隱藏的有用信息。
為了應用機器學習,通常需要從給定的訓練數據集中學習出一個由函數和參數組成的模型,當新數據到來時,可以針對該新數據應用這個模型。為了更好地學習或應用模型,往往還需要來自外部的數據參與到模型的學習(例如,訓練)或應用,這些數據可從外部購買或以其它方式從外部獲得。
例如,當銀行希望通過數據挖掘技術來預測用戶申請信用卡的欺詐風險時,可將過往大量用戶在申請信用卡時填寫的各項信息及其相應的真實信用記錄作為歷史數據,通過機器學習算法訓練欺詐風險預測模型。這樣,當新的用戶申請信用卡時,可基于新用戶填寫的各項信息,利用預測模型來預測新用戶申請信用卡的欺詐風險。
然而,在某些情況下,用戶填寫的各項信息并不足以精細地刻畫出用戶的形象,相應地,僅依據銀行所擁有的用戶數據,不能夠精確地判斷出用戶是否有欺詐動機。為此,銀行需要結合各種外部數據來進行模型的訓練,作為示例,外部數據可包括:移動互聯網行為數據(包括手機號碼、通訊錄數據、手機型號、生產廠商、硬件信息、經常使用的APP、社交分享的內容等等)、移動設備通信數據(包括手機號碼、通訊錄數據和通話記錄)、移動運營商數據(包括手機號碼、上網瀏覽行為和APP使用行為)。
應注意的是,在以明文(或者加密)進行上述數據的交換時,很容易泄露用戶的隱私信息或其它不適于披露的信息,并且,明文交換的數據很容易在未經授權的情況下被再次使用或出售,難以從技術上保障數據的合法使用。例如,當數據提供方將上述外部數據提供給銀行使用時,會擔心用戶的隱私被無端泄露,也會擔心數據不經授權而被再次使用或出售。
發明內容
根據本發明示例性實施例的一個方面,提供了一種在提供方與獲取方之間針對機器學習進行數據交換的方法,所述方法包括:(a)獲得提供方機器學習模型;(b)利用提供方機器學習模型,將提供方的數據樣本之中將要提供給獲取方的輸出數據樣本分別變換為相應的輸出特征向量;(c)將變換后的輸出特征向量與相應的標識符組合成交換樣本,其中,所述交換樣本能夠被獲取方應用于機器學習。
進一步地,根據本發明示例性實施例所述的方法,其中,步驟(a)包括:基于來自提供方的提供方訓練樣本,學習提供方機器學習模型,其中,所述提供方機器學習模型包括以下項之中的至少一項:有監督機器學習模型、無監督機器學習模型、半監督機器學習模型。
進一步地,根據本發明示例性實施例所述的方法,其中,輸出數據樣本包括提供方訓練樣本,并且,在步驟(b)中,對于提供方訓練樣本,利用學習過程中的提供方機器學習模型,將提供方訓練樣本分別變化為相應的輸出特征向量。
進一步地,根據本發明示例性實施例所述的方法,其中,在步驟(b)中,對于不作為提供方訓練樣本的輸出數據樣本,利用學習完畢的提供方機器學習模型,將輸出數據樣本分別變換為相應的輸出特征向量。
進一步地,根據本發明示例性實施例所述的方法,其中,交換樣本能夠被獲取方用于獲得獲取方機器學習模型,或者,交換樣本能夠被獲取方用于利用獲取方機器學習模型進行預測。
進一步地,根據本發明示例性實施例所述的方法,其中,所述方法由提供方執行,并且,所述方法還包括:(d)將交換樣本提供給獲取方以應用于機器學習;或者,所述方法由除了提供方和獲取方之外的第三方執行,并且,所述提供方訓練樣本和/或所述輸出數據樣本的各個特征是經過哈希變換的,并且,所述方法還包括:(d)將交換樣本提供給獲取方以應用于機器學習;或者,所述方法由獲取方執行,并且,所述提供方訓練樣本和/或所述輸出數據樣本是經過加密的,其中,獲取方通過調用由除了提供方和獲取方之外的第三方提供的服務將加密的提供方訓練樣本和/或輸出數據樣本解密并執行步驟(a)和步驟(b)。
進一步地,根據本發明示例性實施例所述的方法,其中,在步驟(b)中,將每條輸出數據樣本輸入提供方機器學習模型,并將提供方機器學習模型針對所述每條輸出數據樣本的中間結果作為與所述每條輸出數據樣本相應的輸出特征向量。
進一步地,根據本發明示例性實施例所述的方法,其中,提供方機器學習模型基于深度神經網絡算法,并且,在步驟(b)中,將提供方機器學習模型針對每條輸出數據樣本的中間層和/或輸出層的節點值作為與所述每條輸出數據樣本相應的輸出特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610088146.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種專利技術預測方法及系統
- 下一篇:有源智能卡的制造方法及有源智能卡
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





