[發(fā)明專利]數(shù)據(jù)關(guān)聯(lián)方法及裝置、電子設(shè)備在審
| 申請?zhí)枺?/td> | 201910363224.1 | 申請日: | 2019-04-30 | 
| 公開(公告)號: | CN110222141A | 公開(公告)日: | 2019-09-10 | 
| 發(fā)明(設(shè)計)人: | 王曉鵬 | 申請(專利權(quán))人: | 北京品友互動信息技術(shù)股份公司 | 
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/36 | 
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 趙囡囡 | 
| 地址: | 100020 北京市朝*** | 國省代碼: | 北京;11 | 
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 字段數(shù)據(jù) 字段 電子設(shè)備 數(shù)據(jù)關(guān)聯(lián) 同一用戶 權(quán)重 連通 集合 語義 關(guān)聯(lián)性 關(guān)聯(lián) | ||
1.一種數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,包括:
獲取多個字段集,其中,每個所述字段集包含有語義相同的多個字段數(shù)據(jù);
確定每兩個所述字段數(shù)據(jù)在對應(yīng)的所述字段集中的字段值,并確定每兩個所述字段數(shù)據(jù)是否屬于同一用戶的權(quán)重值;
根據(jù)所述字段值和所述權(quán)重值,確定每個用戶的連通集合,其中,所述連通集合中包含的各個字段數(shù)據(jù)相互關(guān)聯(lián)且都屬于同一用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取多個字段集的步驟,包括:
提取多個數(shù)據(jù)源的字段數(shù)據(jù),得到字段總集合;
利用預(yù)設(shè)的語義數(shù)據(jù)庫和/或預(yù)設(shè)的語義分辨規(guī)則,確定所述字段總集合中每個所述字段數(shù)據(jù)所屬的字段集,得到所述多個字段集。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定每兩個所述字段數(shù)據(jù)是否屬于同一用戶的權(quán)重值的步驟,包括:
獲取每個所述字段數(shù)據(jù)所在的字段集以及每個所述字段集所屬的目標(biāo)領(lǐng)域;
根據(jù)每個所述字段數(shù)據(jù)所在的字段集和每個所述字段集所屬的目標(biāo)領(lǐng)域,構(gòu)建語義學(xué)習(xí)模型;
利用所述語義學(xué)習(xí)模型,確定每兩個所述字段數(shù)據(jù)是否屬于同一用戶的權(quán)重值。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述權(quán)重值為正權(quán)重值或負(fù)權(quán)重值,其中,所述正權(quán)重值用于指示兩個不同數(shù)據(jù)源的所述字段數(shù)據(jù)在同一個同義字段集的字段值相同,且該兩個所述字段數(shù)據(jù)屬于同一用戶;所述負(fù)權(quán)重值用于指示兩個不同數(shù)據(jù)源的所述字段數(shù)據(jù)在同一個同義字段集的字段值不相同,且該兩個所述字段數(shù)據(jù)不屬于同一用戶。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述字段值和所述權(quán)重值,確定每個用戶的連通集合的步驟,包括:
對所述字段值和所述權(quán)重值進(jìn)行排序,得到排序結(jié)果;
根據(jù)所述排序結(jié)果,確定每個用戶的連通集合。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述排序結(jié)果,確定每個用戶的連通集合的步驟,包括:
確定所述排序結(jié)果中字段值高于預(yù)設(shè)閾值的字段數(shù)據(jù);
將所述字段值高于預(yù)設(shè)閾值的字段數(shù)據(jù)確定為同一用戶的連通集合。
7.一種數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,包括:
獲取單元,用于獲取多個字段集,其中,每個所述字段集包含有語義相同的多個字段數(shù)據(jù);
第一確定單元,用于確定每兩個所述字段數(shù)據(jù)在對應(yīng)的所述字段集中的字段值,并確定每兩個所述字段數(shù)據(jù)是否屬于同一用戶的權(quán)重值;
第二確定單元,用于根據(jù)所述字段值和所述權(quán)重值,確定每個用戶的連通集合,其中,所述連通集合中包含的各個字段數(shù)據(jù)相互關(guān)聯(lián)且都屬于同一用戶。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述獲取單元包括:
第一提取模塊,用于提取多個數(shù)據(jù)源的字段數(shù)據(jù),得到字段總集合;
第一確定模塊,用于利用預(yù)設(shè)的語義數(shù)據(jù)庫和/或預(yù)設(shè)的語義分辨規(guī)則,確定所述字段總集合中每個所述字段數(shù)據(jù)所屬的字段集,得到所述多個字段集。
9.一種電子設(shè)備,其特征在于,包括:
處理器;以及
存儲器,用于存儲所述處理器的可執(zhí)行指令;
其中,所述處理器配置為經(jīng)由執(zhí)行所述可執(zhí)行指令來執(zhí)行權(quán)利要求1至6中任意一項所述的數(shù)據(jù)關(guān)聯(lián)方法。
10.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)用于存儲程序,其中,所述程序在被處理器執(zhí)行時控制所述存儲介質(zhì)所在設(shè)備執(zhí)行權(quán)利要求1至6中任意一項所述的數(shù)據(jù)關(guān)聯(lián)方法。
11.一種處理器,其特征在于,所述處理器用于運(yùn)行程序,其中,所述程序運(yùn)行時執(zhí)行權(quán)利要求1至6中任意一項所述的數(shù)據(jù)關(guān)聯(lián)方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京品友互動信息技術(shù)股份公司,未經(jīng)北京品友互動信息技術(shù)股份公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910363224.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息處理設(shè)備和信息處理方法
- 一種操作日志生成方法、服務(wù)器及業(yè)務(wù)運(yùn)營支撐系統(tǒng)
- 一種大字段數(shù)據(jù)的處理方法及裝置
- 一種大字段數(shù)據(jù)的處理方法及裝置
- 動態(tài)字段數(shù)據(jù)返回接口的測試系統(tǒng)、方法、電子設(shè)備和可讀存儲介質(zhì)
- 用于生成多工作表導(dǎo)出的系統(tǒng)和方法
- 大數(shù)據(jù)文件讀取方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 數(shù)據(jù)關(guān)聯(lián)方法及裝置、電子設(shè)備
- 多源異構(gòu)數(shù)據(jù)處理方法及裝置
- 數(shù)據(jù)導(dǎo)入方法、裝置、系統(tǒng)及計算機(jī)可讀存儲介質(zhì)
- 關(guān)聯(lián)數(shù)據(jù)處理方法和關(guān)聯(lián)數(shù)據(jù)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 導(dǎo)航裝置
- 關(guān)聯(lián)信息生成方法及關(guān)聯(lián)信息生成裝置
- 關(guān)聯(lián)信息傳播系統(tǒng)
- 一種碼值數(shù)據(jù)隨機(jī)關(guān)聯(lián)方法與關(guān)聯(lián)系統(tǒng)
- 一種數(shù)據(jù)保護(hù)方法及服務(wù)器
- 關(guān)聯(lián)LIDAR數(shù)據(jù)和圖像數(shù)據(jù)
- 關(guān)聯(lián)復(fù)雜數(shù)據(jù)
- 一種基于云平臺的海量數(shù)據(jù)關(guān)聯(lián)管理方法及裝置





