日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法在審

專利信息
申請?zhí)枺?/td> 202010036184.2 申請日: 2020-01-14
公開(公告)號: CN111275081A 公開(公告)日: 2020-06-12
發(fā)明(設計)人: 虞慧婷;王春芳;臧嘉捷;崔欣;陳國武 申請(專利權(quán))人: 上海市疾病預防控制中心
主分類號: G06K9/62 分類號: G06K9/62;G06F16/2458
代理公司: 上海智信專利代理有限公司 31002 代理人: 王潔;鄭暄
地址: 200336 上*** 國省代碼: 上海;31
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 貝葉斯 概率 模型 實現(xiàn) 來源 數(shù)據(jù) 鏈接 處理 方法
【權(quán)利要求書】:

1.一種基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的方法包括以下步驟:

(1)對源數(shù)據(jù)的數(shù)據(jù)進行預處理,分析可進行比對的字段;

(2)對全鏈接數(shù)據(jù)集的字符型變量和非字符型變量進行比對;

(3)對閾值進行設定,構(gòu)建貝葉斯先驗概率模型;

(4)進行模型評估。

2.根據(jù)權(quán)利要求1所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(1)具體包括以下步驟:

(1.1)對不同來源的數(shù)據(jù)庫的字段屬性進行統(tǒng)一;

(1.2)合并生成全鏈接集合。

3.根據(jù)權(quán)利要求1所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(2)具體包括以下步驟:

(2.1)對全鏈接數(shù)據(jù)集的字符型變量進行比對;

(2.2)對全鏈接數(shù)據(jù)集的非字符型變量進行比對。

4.根據(jù)權(quán)利要求3所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(2.1)具體包括以下步驟:

(2.1.1)將兩個字符串中包含的字符從左邊開始比較,判斷是否相同,如果是,則繼續(xù)比對下一組字符;否則,換位至下一個字符繼續(xù)比較,直至完成所有字符的比對;并計算兩個字符串的Jaro距離得分;

(2.1.2)設置字符串進行匹配計算時限定范圍的匹配窗口;

(2.1.3)計算Jaro-Winkler距離。

5.根據(jù)權(quán)利要求4所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(2.1.1)中計算兩個字符串的Jaro距離得分,具體為:

根據(jù)以下公式計算兩個字符串的Jaro距離得分:

其中,s1和s2為字符串,m為s1和s2匹配的字符數(shù),t為換位的數(shù)目,dj為Jaro距離得分。

6.根據(jù)權(quán)利要求4所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(2.1.3)中計算Jaro-Winkler距離,具體為:

根據(jù)以下公式計算Jaro-Winkler距離:

dw=dj+lp(1-dj);

其中,dj為Jaro距離,l為兩個字符串的共同前綴字符個數(shù),p為縮放因子常量,用來調(diào)整共同前綴對于相似度的權(quán)重,p取值不超過0.25,默認值為0.1。

7.根據(jù)權(quán)利要求4所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(2.1)中還包括對中文字符處理的步驟,具體包括以下步驟:

(1-2.1)將中文字符串的漢字轉(zhuǎn)換成拼音;

(1-2.2)通過Jaro-Winkler算法計算拼音的相似度;

(1-2.3)設定漢字距離的權(quán)重,將加權(quán)距離作為字段的綜合距離。

8.根據(jù)權(quán)利要求3所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(2.2)具體包括以下步驟:

(2.2.1)對所有變量的比較值進行標準化處理,并計算變量距離;

(2.2.2)將變量距離轉(zhuǎn)化為字符串;

(2.2.3)設定數(shù)值距離的權(quán)重,綜合數(shù)值距離和Jaro-Winkler距離來計算變量間的綜合相似度。

9.根據(jù)權(quán)利要求1所述的基于貝葉斯概率模型實現(xiàn)多來源數(shù)據(jù)鏈接處理的方法,其特征在于,所述的步驟(3)具體包括以下步驟:

(3.1)計算兩兩比較的所有比對字段的距離之和;

(3.2)將計算的求和值按降序排列,由上至下記錄第x%位比對上記錄的求和值,即為x%分位閾值;其中,x至少大于75;

(3.3)將大于閾值的求和值納入訓練數(shù)據(jù)集,生成訓練數(shù)據(jù)集。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海市疾病預防控制中心,未經(jīng)上海市疾病預防控制中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010036184.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結(jié)構(gòu)示意圖流程工藝圖技術構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91高跟紫色丝袜呻吟在线观看| 91免费视频国产| 国产一区不卡视频| 色噜噜狠狠色综合中文字幕| 日韩精品在线一区二区三区| 欧美一区二区三区免费在线观看| 国产大片一区二区三区| 精品国产一级| 日本道欧美一区二区aaaa| 国产精品国产三级国产专区55| 国产欧美日韩二区| 日韩国产精品一区二区| 欧美日韩亚洲国产一区| 日本一区欧美| 国产精品高潮呻| 日本精品一二三区| freexxxxxxx| 国产精品理人伦一区二区三区| 国产偷久久一区精品69| 久久久精品a| 国产精品美女www爽爽爽视频| 欧美在线观看视频一区二区| 精品福利一区| 欧美福利一区二区| 国内久久精品视频| 国产精品5区| 亚洲精品乱码久久久久久高潮| 国产91丝袜在线| 少妇又紧又色又爽又刺激视频网站| 欧美一区免费| 性视频一区二区三区| 蜜臀久久精品久久久用户群体| 久久国产精品99国产精| 色噜噜狠狠色综合中文字幕| 99久久婷婷国产综合精品草原| 狠狠色依依成人婷婷九月| 91麻豆国产自产在线观看hd| 鲁丝一区二区三区免费观看| 午夜伦情电午夜伦情电影| 国产精品影音先锋| 99久久免费精品国产免费高清| 精品一区二区三区视频?| 91麻豆精品国产91久久久久| 97人人模人人爽人人喊小说| xxxx国产一二三区xxxx| 欧美精品国产精品| 日韩精品1区2区3区| 国产91白嫩清纯初高中在线| 欧美一区二区三区四区夜夜大片| 欧美性猛交xxxxxⅹxx88| 激情aⅴ欧美一区二区三区| 亚洲精品无吗| 日本免费电影一区二区三区| 欧美性受xxxx狂喷水| 国产一区二区三区四区五区七| 久久国产精久久精产国| 亚洲精品久久久中文| 日本少妇高潮xxxxⅹ| 亚洲日韩欧美综合| 欧美日韩激情一区| 91一区在线| 亚洲精品一区中文字幕| 欧美在线一级va免费观看| 国产精品96久久久久久久 | 国产在线精品区| 午夜电影一区| 一区二区欧美精品| 精品国产1区2区| 三上悠亚亚洲精品一区二区| 97人人揉人人捏人人添| 日韩精品免费一区| 国产精品美乳在线观看| 日本护士hd高潮护士| xoxoxo亚洲国产精品| 99久久婷婷国产综合精品电影| 国产91免费在线| 正在播放国产一区二区| 国产欧美一区二区三区视频| 狠狠躁狠狠躁视频专区| 狠狠色丁香久久婷婷综| 亚洲乱亚洲乱妇28p| 亚洲伊人久久影院| 精品久久久久久中文字幕| 精品一区中文字幕| 91热精品| 人人玩人人添人人澡97| 免费看大黄毛片全集免费| 97久久精品人人做人人爽| 国产1区2区3区中文字幕| 国产一二三区免费| 欧美亚洲国产日韩| 久久乐国产精品| 欧美一区二区三区黄| 久久99精品久久久秒播| 香蕉av一区二区三区| 国产在线观看二区| 国产精品亚洲精品| 久久99中文字幕| 午夜毛片在线观看| 日韩久久影院| 伊人av中文av狼人av| 国产精品自拍不卡| 国产激情视频一区二区| 91狠狠操| 久久国产激情视频| 久久综合激情网| 精品国产一区在线| 午夜电影一区二区三区| 男女午夜爽爽| 欧美色图视频一区| 中文乱码字幕永久永久电影| 香蕉视频一区二区三区| 中文字幕一区二区三区乱码视频 | 欧美精品乱码视频一二专区| 国产色一区二区| 亚洲精品国产久| 色一情一乱一乱一区99av白浆| 欧美一区二区三区另类| 福利片午夜| 国产91视频一区| 久久99精品久久久噜噜最新章节| 日韩精品中文字幕一区二区| 久久午夜鲁丝片| 夜夜躁狠狠躁日日躁2024| 欧美精品六区| 国产精品二区一区| 性国产videofree极品| 国产精品视频二区不卡| 国产99久久久久久免费看| 亚洲乱码av一区二区三区中文在线: | 国产精品综合久久| 97久久精品人人做人人爽| 欧美精品久久一区二区| 亚洲欧美制服丝腿| 日韩精品一区二区亚洲| 国产婷婷色一区二区三区在线| 国产一区=区| 波多野结衣巨乳女教师| 日本亚洲国产精品| 欧美乱码精品一区二区三| 久久国产精彩视频| 91免费国产视频| xxxx18hd护士hd护士| 久久午夜无玛鲁丝片午夜精品| 国产一区免费播放| 午夜片在线| 蜜臀久久99静品久久久久久 | 国产一区免费在线| 国产不卡一二三区| 国产色99| 中文乱码在线视频| 国产在线卡一卡二| 大桥未久黑人强制中出| 91午夜精品一区二区三区| 国久久久久久| 国产88在线观看入口| 99久久婷婷国产精品综合| 日韩av视屏在线观看| 国产一区二区三区精品在线| 年轻bbwwbbww高潮| 国产精品高潮在线| 91精品一区| 国产精品一区二区在线看| 日韩中文字幕亚洲精品欧美| 欧美一区二区三区久久久精品 | 久久中文一区| 国产日韩精品一区二区| 2021天天干夜夜爽| 69久久夜色精品国产69乱青草 | 国产老妇av| 国产精品视频久久久久久| av毛片精品| 欧美日韩乱码| 国产精品美女一区二区视频| 最新国产精品自拍| 欧美午夜羞羞羞免费视频app | 日本精品99| 国产日韩一区二区三免费| 国产一区二区在线免费| 亚洲国产精品网站| 狠狠躁天天躁又黄又爽| 国产欧美三区| 日本精品一二区| 一区二区三区中文字幕| 精品国产一区二区三区免费| 国产高清一区在线观看| 久久国产精品久久| 国产偷久久一区精品69| 一区二区免费播放| 国产日韩欧美一区二区在线观看| 日本一区二区三区中文字幕| 国产色99| 色婷婷综合久久久久中文| 国产女人好紧好爽| 国产综合久久精品| 十八无遮挡| bbbbb女女女女女bbbbb国产| 亚洲欧美色图在线| 国产精品久久国产三级国电话系列| 国产欧美一二三区| 国产一区二区三区午夜| 高清人人天天夜夜曰狠狠狠狠| 国产一区二区麻豆| 97精品久久人人爽人人爽| 欧美日韩国产一区在线| 欧美三区视频| 欧美日韩久久一区二区| 国产欧美精品一区二区三区-老狼| 国产性生交xxxxx免费| 欧美日韩国产专区| 亚洲自偷精品视频自拍| 日韩精品中文字幕在线| 国产白嫩美女在线观看| 国产91一区二区在线观看| 亚洲自拍偷拍中文字幕| 国产一区二区三区色噜噜小说| 在线国产二区| 四虎影视亚洲精品国产原创优播| 97精品国产97久久久久久| 国产欧美精品一区二区三区-老狼| 99久久国产免费,99久久国产免费大片| 国产精品久久免费视频| 欧美日韩一级黄| 日韩av在线电影网| 久爱精品视频在线播放| 国产精品日本一区二区不卡视频 | 国产区91| 亚洲va欧美va国产综合先锋| 福利片91| 中文字幕日韩有码| 久久99亚洲精品久久99果| 日韩欧美国产高清91| 欧美日韩激情在线| 97香蕉久久国产超碰青草软件| 国产1区2区3区| 在线精品国产一区二区三区88| 热re99久久精品国99热蜜月| 国产区精品| 日本精品一区二区三区在线观看视频| 日韩一区二区中文字幕| 欧美一区二区三区在线免费观看| 日本一级中文字幕久久久久久| 久久福利免费视频| 午夜码电影| 日韩精品一区二区免费| 国产男女乱淫真高清视频免费|