[發(fā)明專利]一種模型訓(xùn)練方法、裝置、實(shí)現(xiàn)對(duì)標(biāo)處理的方法及裝置在審

申請(qǐng)?zhí)枺?/td>	201911111324.1	申請(qǐng)日：	2019-11-14
公開(kāi)（公告）號(hào)：	CN110955781A	公開(kāi)（公告）日：	2020-04-03
發(fā)明（設(shè)計(jì)）人：	張靜;徐大磊;張曉波;馮亞?wèn)\|;劉振華	申請(qǐng)（專利權(quán)）人：	北京明略軟件系統(tǒng)有限公司
主分類號(hào)：	G06F16/36	分類號(hào)：	G06F16/36;G06F40/151
代理公司：	北京安信方達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11262	代理人：	王康;栗若木
地址：	100084 北京市海淀區(qū)***	國(guó)省代碼：	北京;11
權(quán)利要求書(shū)：	查看更多	說(shuō)明書(shū)：	查看更多
摘要：
搜索關(guān)鍵詞：	一種模型訓(xùn)練方法裝置實(shí)現(xiàn) 處理
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門(mén)專利

【說(shuō)明書(shū)】：

一種模型訓(xùn)練方法、裝置、實(shí)現(xiàn)對(duì)標(biāo)處理的方法及裝置，實(shí)現(xiàn)對(duì)標(biāo)處理的方法包括：獲取預(yù)設(shè)數(shù)量的映射配置數(shù)據(jù)；對(duì)獲取的映射配置數(shù)據(jù)進(jìn)行特征提取，獲得對(duì)標(biāo)特征；根據(jù)映射配置數(shù)據(jù)對(duì)提取獲得的對(duì)標(biāo)特征進(jìn)行訓(xùn)練，獲得用于自動(dòng)對(duì)標(biāo)的對(duì)標(biāo)模型；根據(jù)獲得的對(duì)標(biāo)模型對(duì)標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行自動(dòng)對(duì)標(biāo)處理；其中，所述對(duì)標(biāo)特征包括以下一項(xiàng)或任意組合：源表中文名、目標(biāo)表中文名、源表英文名、目標(biāo)表英文名、源表字段中文含義、目標(biāo)表字段中文含義、源表字段英文名、目標(biāo)表字段英文名。本發(fā)明實(shí)施例提取對(duì)標(biāo)特征后，基于對(duì)標(biāo)特征訓(xùn)練獲得對(duì)標(biāo)模型，實(shí)現(xiàn)了標(biāo)準(zhǔn)化數(shù)據(jù)的自動(dòng)對(duì)標(biāo)，提升了對(duì)標(biāo)速度和準(zhǔn)確度。

技術(shù)領(lǐng)域

本文涉及但不限于知識(shí)圖譜技術(shù)，尤指一種模型訓(xùn)練方法、裝置、實(shí)現(xiàn)對(duì)標(biāo)處理的方法及裝置。

背景技術(shù)

目前，多數(shù)知識(shí)圖譜的構(gòu)建一般涉及非標(biāo)準(zhǔn)化和標(biāo)準(zhǔn)化的多源數(shù)據(jù)，構(gòu)建知識(shí)圖譜包括對(duì)多源數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理、對(duì)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)進(jìn)行對(duì)標(biāo)等過(guò)程；圖1為相關(guān)技術(shù)構(gòu)建知識(shí)圖譜的流程圖，如圖1所示，包括：步驟101、對(duì)多源數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理，獲得標(biāo)準(zhǔn)化數(shù)據(jù)；步驟102、對(duì)標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行手動(dòng)對(duì)標(biāo)，獲得映射配置數(shù)據(jù)；其中，對(duì)標(biāo)包括源表中文名和目標(biāo)表中文名、源表英文名和目標(biāo)表英文名、源表字段中文含義和目標(biāo)表字段中文含義、以及源表字段英文名和目標(biāo)表字段英文名的對(duì)標(biāo)；步驟103、根據(jù)獲得的映射配置數(shù)據(jù)，通過(guò)計(jì)算機(jī)引擎確定實(shí)體、實(shí)體屬性、實(shí)體間關(guān)系及實(shí)體軌跡數(shù)據(jù)等，實(shí)現(xiàn)知識(shí)圖譜構(gòu)建。

在數(shù)據(jù)源種類多、數(shù)據(jù)量大時(shí)，相關(guān)技術(shù)中對(duì)標(biāo)過(guò)程存在以下問(wèn)題：1、手動(dòng)對(duì)標(biāo)，效率低、耗時(shí)長(zhǎng)；2、人為對(duì)標(biāo)容易發(fā)生錯(cuò)漏，影響準(zhǔn)確率；此外，對(duì)標(biāo)過(guò)程需要技術(shù)人員具備專業(yè)業(yè)務(wù)能力，因此，無(wú)法通過(guò)引入大量技術(shù)人員的方式來(lái)提升對(duì)比效率。

綜上，如何提升對(duì)標(biāo)速度和準(zhǔn)確度，成為構(gòu)建知識(shí)圖譜過(guò)程中有待解決的問(wèn)題。

發(fā)明內(nèi)容

以下是對(duì)本文詳細(xì)描述的主題的概述。本概述并非是為了限制權(quán)利要求的保護(hù)范圍。

本發(fā)明實(shí)施例提供一種模型訓(xùn)練方法、裝置、實(shí)現(xiàn)對(duì)標(biāo)處理的方法及裝置，能夠提升對(duì)標(biāo)速度和準(zhǔn)確度。

本發(fā)明實(shí)施例還提供一種模型訓(xùn)練方法，包括：

獲取預(yù)設(shè)數(shù)量的映射配置數(shù)據(jù)；

對(duì)獲取的映射配置數(shù)據(jù)進(jìn)行特征提取，獲得對(duì)標(biāo)特征；

根據(jù)映射配置數(shù)據(jù)對(duì)提取獲得的對(duì)標(biāo)特征進(jìn)行訓(xùn)練，獲得用于自動(dòng)對(duì)標(biāo)的對(duì)標(biāo)模型；

其中，所述對(duì)標(biāo)特征包括以下一項(xiàng)或任意組合：源表中文名、目標(biāo)表中文名、源表英文名、目標(biāo)表英文名、源表字段中文含義、目標(biāo)表字段中文含義、源表字段英文名、目標(biāo)表字段英文名。

在一種示例性實(shí)施例中，所述對(duì)獲取的映射配置數(shù)據(jù)進(jìn)行特征提取之后，所述模型訓(xùn)練方法還包括：

對(duì)獲得的所述對(duì)標(biāo)特征進(jìn)行預(yù)處理；

所述預(yù)處理包括空值和/或異常值處理。

在一種示例性實(shí)施例中，所述根據(jù)映射配置數(shù)據(jù)對(duì)提取獲得的對(duì)標(biāo)特征進(jìn)行訓(xùn)練，包括：

根據(jù)所述預(yù)設(shè)配置信息遍歷確定對(duì)標(biāo)特征之間的對(duì)標(biāo)關(guān)系；

根據(jù)確定的所述對(duì)標(biāo)特征之間的對(duì)標(biāo)關(guān)系，獲得用于自動(dòng)對(duì)標(biāo)的對(duì)標(biāo)模型。

在一種示例性實(shí)施例中，所述根據(jù)所述預(yù)設(shè)配置信息遍歷確定對(duì)標(biāo)特征之間的映射關(guān)系，包括：

所述對(duì)標(biāo)特征包括所述源表中文名和所述目標(biāo)表中文名時(shí)，對(duì)每一個(gè)源表中文名，分別進(jìn)行以下處理：根據(jù)所述預(yù)設(shè)配置信息，遍歷確定與當(dāng)前源表中文名對(duì)標(biāo)的所有目標(biāo)表中文名，建立當(dāng)前源表中文名與所有對(duì)標(biāo)的目標(biāo)表的中文名之間的對(duì)標(biāo)關(guān)系；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明略軟件系統(tǒng)有限公司，未經(jīng)北京明略軟件系統(tǒng)有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201911111324.1/2.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

上一篇：一種利用赤泥和原煤制備碳納米管復(fù)合碳材料的方法
下一篇：一種變焦電影鏡頭和攝像裝置

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

滑坡模型實(shí)驗(yàn)?zāi)Ｐ图?/a>

專利文獻(xiàn)下載

說(shuō)明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū)；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】