[發(fā)明專利]一種識(shí)別實(shí)體的數(shù)據(jù)處理系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202210466016.6 | 申請(qǐng)日: | 2022-04-29 |
| 公開(公告)號(hào): | CN114580392B | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 張正義;傅曉航;常鴻宇;劉羽 | 申請(qǐng)(專利權(quán))人: | 中科雨辰科技有限公司 |
| 主分類號(hào): | G06F40/279 | 分類號(hào): | G06F40/279 |
| 代理公司: | 北京鍾維聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 11579 | 代理人: | 安娜 |
| 地址: | 100093 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識(shí)別 實(shí)體 數(shù)據(jù)處理系統(tǒng) | ||
1.一種識(shí)別實(shí)體的數(shù)據(jù)處理系統(tǒng),其特征在于,所述系統(tǒng)包括:數(shù)據(jù)庫(kù)、處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,其中,所述數(shù)據(jù)庫(kù)包括樣本實(shí)體集B={B1,……,Bi,……,Bm},Bi是指第i個(gè)樣本實(shí)體的特征列表,i=1……m,m為樣本實(shí)體數(shù)量,當(dāng)所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)以下步驟:
S100、獲取目標(biāo)實(shí)體的特征列表A={A1,……,Aj,……,An},Aj是指目標(biāo)實(shí)體的第j特征的特征字符串,j=1……n,n為特征類型數(shù)量;
S200、從數(shù)據(jù)庫(kù)中獲取任一Bi={Bi1,……,Bij,……,Bin},Bij是指第i個(gè)樣本實(shí)體對(duì)應(yīng)的第j個(gè)特征的特征字符串;
S300、根據(jù)A,獲取到目標(biāo)實(shí)體的第一目標(biāo)特征列表C={C1,……,Cr,……,Cs},Cr是指目標(biāo)實(shí)體對(duì)應(yīng)的第r個(gè)第一目標(biāo)特征的特征字符串,r=1……s,s為目標(biāo)實(shí)體的第一目標(biāo)特征數(shù)量;
S400、根據(jù)Bi,獲取到樣本實(shí)體的第二目標(biāo)特征列表Di={Di1,……,Dir,……,Dis},Di r是指樣本實(shí)體對(duì)應(yīng)的第r個(gè)第二目標(biāo)特征的特征字符串;
S500、根據(jù)C和Di,獲取目標(biāo)實(shí)體與第i個(gè)樣本實(shí)體之間的相似度Fi,以構(gòu)建目標(biāo)實(shí)體的相似度列表F={F1,……,F(xiàn)i,……,F(xiàn)m},其中,F(xiàn)i符合如下條件:
,F(xiàn)ir是指Cr與Dir之間的相似度,Wr是指Fir對(duì)應(yīng)的權(quán)重值;
在S500步驟中還包括如下步驟:
S501、獲取預(yù)設(shè)特征列表;
S503、遍歷C且當(dāng)Cr對(duì)應(yīng)的特征與預(yù)設(shè)特征類型列表中任一預(yù)設(shè)特征一致時(shí),獲取Fir,以根據(jù)Fir獲取Fi,F(xiàn)ir符合如下條件:
,其中,λir是指Cr和Dir之間的編輯距離,Uir是指在Cr對(duì)應(yīng)的特征字符串中字符數(shù)量與Dir對(duì)應(yīng)的特征字符串中字符數(shù)量之間的最大字符數(shù)量;
S505、當(dāng)Cr對(duì)應(yīng)的特征與預(yù)設(shè)特征類型列表中任一預(yù)設(shè)特征不一致時(shí),獲取預(yù)設(shè)映射表,其中,所述預(yù)設(shè)映射表存儲(chǔ)在數(shù)據(jù)庫(kù)中,所述預(yù)設(shè)映射表是指任一非預(yù)設(shè)特征的特征值與相關(guān)特征值之間的映射關(guān)系列表,所述相關(guān)特征值是指任一非預(yù)設(shè)特征對(duì)應(yīng)的相近特征值和/或者相似特征值;
S507、根據(jù)預(yù)設(shè)映射表且當(dāng)Cr對(duì)應(yīng)的特征與Dir對(duì)應(yīng)的特征之間存在映射關(guān)系,則確定Fir=1,以根據(jù)Fir且獲取Fi;
S509、當(dāng)Cr對(duì)應(yīng)的特征與Dir對(duì)應(yīng)的特征之間無(wú)映射關(guān)系,則將Cr對(duì)應(yīng)的特征與Dir對(duì)應(yīng)的特征輸入至預(yù)設(shè)相似度模型中獲取Fir,以根據(jù)Fir獲取Fi;
S600、遍歷F且根據(jù)Fi,獲取目標(biāo)實(shí)體的目標(biāo)相似度;
S700、根據(jù)目標(biāo)相似度,獲取到目標(biāo)相似度對(duì)應(yīng)的樣本實(shí)體且將目標(biāo)實(shí)體確定為目標(biāo)相似度對(duì)應(yīng)的樣本實(shí)體。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中科雨辰科技有限公司,未經(jīng)中科雨辰科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210466016.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體關(guān)系識(shí)別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于實(shí)體對(duì)齊的屬性融合方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲(chǔ)介質(zhì)
- 在數(shù)據(jù)處理系統(tǒng)中基于所需電池壽命的計(jì)算機(jī)電源管理
- 在網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)中安裝軟件的方法和系統(tǒng)
- 遠(yuǎn)程數(shù)據(jù)處理系統(tǒng)的配置
- 多個(gè)子據(jù)處理系統(tǒng)之間在線切換的方法
- 跨境多幣種數(shù)據(jù)處理系統(tǒng)和方法
- 用于批量和實(shí)時(shí)數(shù)據(jù)處理的設(shè)備、系統(tǒng)和方法
- 動(dòng)態(tài)地調(diào)整品牌和平臺(tái)界面元素
- 基于銀行卡交易的數(shù)據(jù)處理方法以及數(shù)據(jù)處理系統(tǒng)
- 數(shù)據(jù)處理方法、裝置和設(shè)備
- 用于批量和實(shí)時(shí)數(shù)據(jù)處理的設(shè)備、系統(tǒng)和方法





