[發明專利]一種缺失值的確定方法、裝置及電子設備在審
| 申請號: | 201811628390.1 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN109634939A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 郭佳敏;吳慧;袁帥;郭帥 | 申請(專利權)人: | 中國農業銀行股份有限公司 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06Q40/02 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100005 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標實體 裝置及電子設備 缺失數據 數據可靠性 實體參考 數據缺失 業務數據 向量 客戶 | ||
本發明提供了一種缺失值的確定方法、裝置及電子設備,首先確定出與目標實體相似的其他實體,然后采用與存在數據缺失的目標實體相似的其他客戶的實體參考向量的業務數據,來確定目標實體的缺失數據,減少由于人工確定缺失數據帶來的降低數據可靠性的問題。
技術領域
本發明涉及數據處理領域,更具體的說,涉及一種缺失值的確定方法、裝置及電子設備。
背景技術
目前,銀行在建立全行客戶級的信用憑借模型時,需要對客戶的交易數據、資產數據、客戶信息等數據進行處理,但是在處理過程中,發現客戶的數據存在缺失的問題。
現有技術中,當出現客戶的數據缺失問題時,采用人工確定缺失數據的方式,但這樣會增加人為干涉,降低數據可靠性。
發明內容
有鑒于此,本發明提供一種缺失值的確定方法、裝置及電子設備,以解決采用人工確定缺失數據的方式,增加人為干涉,降低數據可靠性的問題。
為解決上述技術問題,本發明采用了如下技術方案:
一種缺失值的確定方法,包括:
確定存在數據缺失的目標實體的實體向量;所述實體向量為所述目標實體的向量表示;
確定與所述實體向量相似的實體參考向量集合;所述實體參考向量集合中的實體參考向量與所述實體向量的相似度大于第一預設數值;
基于所述實體參考集合中的實體參考向量的業務數據,確定所述目標實體的缺失數據。
優選地,確定存在數據缺失的目標實體的實體向量,包括:
獲取知識圖譜;所述知識圖譜包括所述目標實體的三元組和多個實體樣本的三元組;每一所述三元組包括頭實體、尾實體、所述頭實體和所述尾實體的事實性關系;
隨機設定每一所述三元組的向量組;所述向量組包括所述三元組中的頭實體的初始實體向量、尾實體的初始實體向量以及事實性關系對應的向量矩陣;
多次修改每一所述三元組的向量組中的至少一個數據,得到相應的三元組的多個負例向量組;
基于每一所述三元組的向量組和負例向量組,確定存在數據缺失的目標實體的實體向量。
優選地,基于每一所述三元組的向量組和負例向量組,確定存在數據缺失的目標實體的實體向量,包括:
通過初始評分模型確定每一所述三元組的評分值;所述初始評分模型用于計算為每一所述三元組隨機設定的向量組的準確度;
基于每一所述三元組的評分值,計算所述初始評分模型的損失值;
判斷所述損失值是否小于第二預設數值;
若不小于,調整每一所述三元組的向量組和負例向量組,并返回所述判斷所述損失值是否小于第二預設數值這一步驟;
若小于,將所述目標實體的三元組的向量組中對頭實體的初始實體向量進行調整后的向量作為所述目標實體的實體向量。
優選地,確定與所述實體向量相似的實體參考向量集合,包括:
依據預設余弦相似度計算公式,計算所述實體向量與每一實體樣本的實體向量的相似度;
篩選出相似度大于所述第一預設數值的實體向量,并組成所述實體參考向量集合。
優選地,基于所述實體參考集合中的實體參考向量的業務數據,確定所述目標實體的缺失數據,包括:
獲取所述實體參考向量的業務數據中與所述缺失數據相應的參考數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業銀行股份有限公司,未經中國農業銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811628390.1/2.html,轉載請聲明來源鉆瓜專利網。





