[發(fā)明專利]數(shù)據(jù)融合的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201910362476.2 | 申請(qǐng)日: | 2019-04-30 |
| 公開(公告)號(hào): | CN110119413A | 公開(公告)日: | 2019-08-13 |
| 發(fā)明(設(shè)計(jì))人: | 孟垂實(shí);吳博文;胡安民;鄭宇 | 申請(qǐng)(專利權(quán))人: | 京東城市(南京)科技有限公司 |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/215;G06F16/22 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 張一軍;張效榮 |
| 地址: | 210014 江蘇省南京市南*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)源 關(guān)聯(lián) 方法和裝置 數(shù)據(jù)融合 維度 融合 標(biāo)簽 計(jì)算機(jī)技術(shù)領(lǐng)域 安全快速 高效處理 評(píng)分體系 特征分析 梯度建立 字段添加 構(gòu)建 字段 抽取 篩選 合并 統(tǒng)一 | ||
1.一種數(shù)據(jù)融合的方法,其特征在于,包括:
對(duì)各個(gè)數(shù)據(jù)源的原始數(shù)據(jù)表進(jìn)行篩選合并,得到每個(gè)數(shù)據(jù)源的關(guān)聯(lián)數(shù)據(jù)表,并為所述關(guān)聯(lián)數(shù)據(jù)表中的字段添加維度標(biāo)簽;
對(duì)所述關(guān)聯(lián)數(shù)據(jù)表中的字段進(jìn)行特征分析,選取待用特征;
根據(jù)所述維度標(biāo)簽和所述待用特征從各個(gè)所述關(guān)聯(lián)數(shù)據(jù)表中抽取梯度;
基于所述梯度建立融合模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)各個(gè)數(shù)據(jù)源的原始數(shù)據(jù)表進(jìn)行篩選合并,得到每個(gè)數(shù)據(jù)源的關(guān)聯(lián)數(shù)據(jù)表包括:
從各個(gè)數(shù)據(jù)源收集原始數(shù)據(jù)表;
分析所述原始數(shù)據(jù)表的樣本數(shù)量、字段數(shù)量和空值數(shù)量;
基于所述樣本數(shù)量、所述字段數(shù)量和所述空值數(shù)量從所述原始數(shù)據(jù)表篩選出基礎(chǔ)數(shù)據(jù)表;
基于所述基礎(chǔ)數(shù)據(jù)表的主鍵將同一數(shù)據(jù)源的所述基礎(chǔ)數(shù)據(jù)表合并為關(guān)聯(lián)數(shù)據(jù)表。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對(duì)所述關(guān)聯(lián)數(shù)據(jù)表中的字段進(jìn)行特征分析,選取待用特征之前還包括:
剔除所述關(guān)聯(lián)數(shù)據(jù)表中含有空值字段或空值字段的數(shù)量超過空字段閾值的樣本;
利用箱線圖結(jié)合字段意義的方式去除異常字段;
采用平均數(shù)、眾數(shù)或預(yù)測(cè)值補(bǔ)充空值字段;以及
對(duì)所述關(guān)聯(lián)數(shù)據(jù)表進(jìn)行離散化處理。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述關(guān)聯(lián)數(shù)據(jù)表中的字段進(jìn)行特征分析,選取待用特征包括:
對(duì)所述關(guān)聯(lián)數(shù)據(jù)表中的字段進(jìn)行特征衍生,得到數(shù)據(jù)特征和高維非線性特征;
分別計(jì)算所述數(shù)據(jù)特征和所述高維非線性特征的皮爾遜系數(shù);
基于所述皮爾遜系數(shù)從所述數(shù)據(jù)特征和所述高維非線性特征中選取待用特征。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述維度標(biāo)簽和所述待用特征從各個(gè)所述關(guān)聯(lián)數(shù)據(jù)表中抽取梯度包括:
根據(jù)所述待用特征對(duì)各個(gè)數(shù)據(jù)源對(duì)應(yīng)的所述關(guān)聯(lián)數(shù)據(jù)表進(jìn)行對(duì)齊操作,并為目標(biāo)分配統(tǒng)一標(biāo)識(shí);
根據(jù)所述維度標(biāo)簽和所述待用特征從各個(gè)所述關(guān)聯(lián)數(shù)據(jù)表中抽取數(shù)據(jù)源的參數(shù)的梯度和所述關(guān)聯(lián)數(shù)據(jù)表的損失,并基于各個(gè)所述關(guān)聯(lián)數(shù)據(jù)表的損失計(jì)算融合損失;
若所述融合損失小于損失閾值,則終止抽??;
若所述融合損失大于或等于損失閾值,則將更新各個(gè)數(shù)據(jù)源的參數(shù),并重新抽取數(shù)據(jù)源的參數(shù)的梯度和所述關(guān)聯(lián)數(shù)據(jù)表的損失。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
從各個(gè)所述關(guān)聯(lián)數(shù)據(jù)表中提取目標(biāo)的待用特征信息,基于所述待用特征信息生成融合信息;
將所述融合信息輸入所述融合模型,以根據(jù)所述待用特征和所述梯度對(duì)所述融合信息進(jìn)行計(jì)算,得到目標(biāo)的融合分值;以及
在目標(biāo)的融合分值變化時(shí),對(duì)所述待用特征信息進(jìn)行迭代計(jì)算,得到所述待用特征對(duì)目標(biāo)的影響權(quán)重。
7.一種數(shù)據(jù)融合的裝置,其特征在于,包括:
合并模塊,用于對(duì)各個(gè)數(shù)據(jù)源的原始數(shù)據(jù)表進(jìn)行篩選合并,得到每個(gè)數(shù)據(jù)源的關(guān)聯(lián)數(shù)據(jù)表,并為所述關(guān)聯(lián)數(shù)據(jù)表中的字段添加維度標(biāo)簽;
分析模塊,用于對(duì)所述關(guān)聯(lián)數(shù)據(jù)表中的字段進(jìn)行特征分析,選取待用特征;
抽取模塊,用于根據(jù)所述維度標(biāo)簽和所述待用特征從各個(gè)所述關(guān)聯(lián)數(shù)據(jù)表中抽取梯度;
建模模塊,用于基于所述梯度建立融合模型。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括計(jì)算模塊,用于:
從各個(gè)所述關(guān)聯(lián)數(shù)據(jù)表中提取目標(biāo)的待用特征信息,基于所述待用特征信息生成融合信息;
將所述融合信息輸入所述融合模型,以根據(jù)所述待用特征和所述梯度對(duì)所述融合信息進(jìn)行計(jì)算,得到目標(biāo)的融合分值;以及
在目標(biāo)的融合分值變化時(shí),對(duì)所述待用特征信息進(jìn)行迭代計(jì)算,得到所述待用特征對(duì)目標(biāo)的影響權(quán)重。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于京東城市(南京)科技有限公司,未經(jīng)京東城市(南京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362476.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)同步處理方法、裝置和單點(diǎn)登錄系統(tǒng)
- 數(shù)據(jù)同步方法和裝置
- 切換數(shù)據(jù)源的方法及系統(tǒng)
- 多數(shù)據(jù)源的數(shù)據(jù)遷移方法
- 數(shù)據(jù)源補(bǔ)充方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)源切換方法及系統(tǒng)
- 一種基于多個(gè)數(shù)據(jù)源調(diào)節(jié)工業(yè)自動(dòng)化的操作系統(tǒng)
- 從不同數(shù)據(jù)源中獲取數(shù)據(jù)的方法、裝置及計(jì)算機(jī)設(shè)備
- 一種動(dòng)態(tài)數(shù)據(jù)源查詢方法及裝置
- 一種訪問多數(shù)據(jù)源的方法及系統(tǒng)
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報(bào)文關(guān)聯(lián)方法、報(bào)文關(guān)聯(lián)裝置及報(bào)文關(guān)聯(lián)系統(tǒng)
- 數(shù)據(jù)源融合的方法和裝置
- 一種脫敏數(shù)據(jù)集的數(shù)據(jù)融合方法及裝置
- 一種數(shù)據(jù)融合方法及裝置
- 用于從異構(gòu)裝置感測(cè)的多種不同格式的數(shù)據(jù)的多模式融合處理的設(shè)備、方法和系統(tǒng)
- 一種政務(wù)數(shù)據(jù)統(tǒng)一融合系統(tǒng)
- 一種道路數(shù)據(jù)處理方法及其裝置
- 一種數(shù)據(jù)融合方法和裝置
- 一種規(guī)則引擎驅(qū)動(dòng)的數(shù)據(jù)融合方法
- 多數(shù)據(jù)來源的數(shù)據(jù)融合方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 航空數(shù)據(jù)融合方法、航空數(shù)據(jù)融合裝置和存儲(chǔ)介質(zhì)





