[發(fā)明專利]一種缺失值的確定方法、裝置及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201811628390.1 | 申請(qǐng)日: | 2018-12-28 |
| 公開(kāi)(公告)號(hào): | CN109634939A | 公開(kāi)(公告)日: | 2019-04-16 |
| 發(fā)明(設(shè)計(jì))人: | 郭佳敏;吳慧;袁帥;郭帥 | 申請(qǐng)(專利權(quán))人: | 中國(guó)農(nóng)業(yè)銀行股份有限公司 |
| 主分類號(hào): | G06F16/21 | 分類號(hào): | G06F16/21;G06Q40/02 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100005 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標(biāo)實(shí)體 裝置及電子設(shè)備 缺失數(shù)據(jù) 數(shù)據(jù)可靠性 實(shí)體參考 數(shù)據(jù)缺失 業(yè)務(wù)數(shù)據(jù) 向量 客戶 | ||
1.一種缺失值的確定方法,其特征在于,包括:
確定存在數(shù)據(jù)缺失的目標(biāo)實(shí)體的實(shí)體向量;所述實(shí)體向量為所述目標(biāo)實(shí)體的向量表示;
確定與所述實(shí)體向量相似的實(shí)體參考向量集合;所述實(shí)體參考向量集合中的實(shí)體參考向量與所述實(shí)體向量的相似度大于第一預(yù)設(shè)數(shù)值;
基于所述實(shí)體參考集合中的實(shí)體參考向量的業(yè)務(wù)數(shù)據(jù),確定所述目標(biāo)實(shí)體的缺失數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的確定方法,其特征在于,確定存在數(shù)據(jù)缺失的目標(biāo)實(shí)體的實(shí)體向量,包括:
獲取知識(shí)圖譜;所述知識(shí)圖譜包括所述目標(biāo)實(shí)體的三元組和多個(gè)實(shí)體樣本的三元組;每一所述三元組包括頭實(shí)體、尾實(shí)體、所述頭實(shí)體和所述尾實(shí)體的事實(shí)性關(guān)系;
隨機(jī)設(shè)定每一所述三元組的向量組;所述向量組包括所述三元組中的頭實(shí)體的初始實(shí)體向量、尾實(shí)體的初始實(shí)體向量以及事實(shí)性關(guān)系對(duì)應(yīng)的向量矩陣;
多次修改每一所述三元組的向量組中的至少一個(gè)數(shù)據(jù),得到相應(yīng)的三元組的多個(gè)負(fù)例向量組;
基于每一所述三元組的向量組和負(fù)例向量組,確定存在數(shù)據(jù)缺失的目標(biāo)實(shí)體的實(shí)體向量。
3.根據(jù)權(quán)利要求2所述的確定方法,其特征在于,基于每一所述三元組的向量組和負(fù)例向量組,確定存在數(shù)據(jù)缺失的目標(biāo)實(shí)體的實(shí)體向量,包括:
通過(guò)初始評(píng)分模型確定每一所述三元組的評(píng)分值;所述初始評(píng)分模型用于計(jì)算為每一所述三元組隨機(jī)設(shè)定的向量組的準(zhǔn)確度;
基于每一所述三元組的評(píng)分值,計(jì)算所述初始評(píng)分模型的損失值;
判斷所述損失值是否小于第二預(yù)設(shè)數(shù)值;
若不小于,調(diào)整每一所述三元組的向量組和負(fù)例向量組,并返回所述判斷所述損失值是否小于第二預(yù)設(shè)數(shù)值這一步驟;
若小于,將所述目標(biāo)實(shí)體的三元組的向量組中對(duì)頭實(shí)體的初始實(shí)體向量進(jìn)行調(diào)整后的向量作為所述目標(biāo)實(shí)體的實(shí)體向量。
4.根據(jù)權(quán)利要求3所述的確定方法,其特征在于,確定與所述實(shí)體向量相似的實(shí)體參考向量集合,包括:
依據(jù)預(yù)設(shè)余弦相似度計(jì)算公式,計(jì)算所述實(shí)體向量與每一實(shí)體樣本的實(shí)體向量的相似度;
篩選出相似度大于所述第一預(yù)設(shè)數(shù)值的實(shí)體向量,并組成所述實(shí)體參考向量集合。
5.根據(jù)權(quán)利要求1所述的確定方法,其特征在于,基于所述實(shí)體參考集合中的實(shí)體參考向量的業(yè)務(wù)數(shù)據(jù),確定所述目標(biāo)實(shí)體的缺失數(shù)據(jù),包括:
獲取所述實(shí)體參考向量的業(yè)務(wù)數(shù)據(jù)中與所述缺失數(shù)據(jù)相應(yīng)的參考數(shù)據(jù);
若所述缺失數(shù)據(jù)為數(shù)值型數(shù)據(jù),將每一所述實(shí)體參考向量對(duì)應(yīng)的參考數(shù)據(jù)與相應(yīng)的相似度的乘積之和作為所述目標(biāo)實(shí)體的缺失數(shù)據(jù);
若所述缺失數(shù)據(jù)為類別型數(shù)據(jù),將所有的所述實(shí)體參考向量對(duì)應(yīng)的參考數(shù)據(jù)中出現(xiàn)次數(shù)最多的參考數(shù)據(jù)作為所述目標(biāo)實(shí)體的缺失數(shù)據(jù)。
6.一種缺失值的確定裝置,其特征在于,包括:
向量確定模塊,用于確定存在數(shù)據(jù)缺失的目標(biāo)實(shí)體的實(shí)體向量;所述實(shí)體向量為所述目標(biāo)實(shí)體的向量表示;
集合確定模塊,用于確定與所述實(shí)體向量相似的實(shí)體參考向量集合;所述實(shí)體參考向量集合中的實(shí)體參考向量與所述實(shí)體向量的相似度大于第一預(yù)設(shè)數(shù)值;
數(shù)據(jù)確定模塊,用于基于所述實(shí)體參考集合中的實(shí)體參考向量的業(yè)務(wù)數(shù)據(jù),確定所述目標(biāo)實(shí)體的缺失數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的確定裝置,其特征在于,所述向量確定模塊包括:
圖譜獲取子模塊,用于獲取知識(shí)圖譜;所述知識(shí)圖譜包括所述目標(biāo)實(shí)體的三元組和多個(gè)實(shí)體樣本的三元組;每一所述三元組包括頭實(shí)體、尾實(shí)體、所述頭實(shí)體和所述尾實(shí)體的事實(shí)性關(guān)系;
向量組設(shè)定子模塊,用于隨機(jī)設(shè)定每一所述三元組的向量組;所述向量組包括所述三元組中的頭實(shí)體的初始實(shí)體向量、尾實(shí)體的初始實(shí)體向量以及事實(shí)性關(guān)系對(duì)應(yīng)的向量矩陣;
數(shù)據(jù)修改子模塊,用于多次修改每一所述三元組的向量組中的至少一個(gè)數(shù)據(jù),得到相應(yīng)的三元組的多個(gè)負(fù)例向量組;
向量確定子模塊,用于基于每一所述三元組的向量組和負(fù)例向量組,確定存在數(shù)據(jù)缺失的目標(biāo)實(shí)體的實(shí)體向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)農(nóng)業(yè)銀行股份有限公司,未經(jīng)中國(guó)農(nóng)業(yè)銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811628390.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種相關(guān)實(shí)體確定方法、裝置及計(jì)算設(shè)備
- 信息查詢方法及裝置
- 一種實(shí)體嵌入方法及裝置
- 一種實(shí)體嵌入方法、裝置、介質(zhì)及設(shè)備
- 實(shí)體確定方法、裝置及存儲(chǔ)介質(zhì)
- 核心實(shí)體確定方法及其系統(tǒng)、服務(wù)器和計(jì)算機(jī)可讀介質(zhì)
- 文本的實(shí)體識(shí)別方法、設(shè)備及存儲(chǔ)介質(zhì)
- 資源分配方法、裝置、可讀存儲(chǔ)介質(zhì)和電子設(shè)備
- 實(shí)體對(duì)齊方法、裝置、計(jì)算機(jī)可讀介質(zhì)及電子設(shè)備
- 實(shí)體關(guān)系抽取方法、實(shí)體關(guān)系學(xué)習(xí)模型的獲取方法及設(shè)備
- 在線媒體播放方法、系統(tǒng)、服務(wù)器及客戶端
- 數(shù)據(jù)處理的方法及裝置
- 缺失數(shù)據(jù)的恢復(fù)方法和裝置
- 基于張量分解的城市交通缺失數(shù)據(jù)填補(bǔ)方法
- 用于生成信息的方法和裝置
- 電子裝置、基于XGBoost的電力數(shù)據(jù)缺失值填充方法及存儲(chǔ)介質(zhì)
- 基于聚類算法的數(shù)據(jù)填充方法、裝置及計(jì)算機(jī)設(shè)備
- 智能化的缺失數(shù)據(jù)填充方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于缺失數(shù)據(jù)的樣本分析方法、裝置、電子設(shè)備及介質(zhì)
- 一種MES背景下的數(shù)據(jù)庫(kù)數(shù)據(jù)缺失的填補(bǔ)方法及系統(tǒng)





