[發(fā)明專利]一種實(shí)體關(guān)系識(shí)別模型訓(xùn)練、實(shí)體關(guān)系識(shí)別方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201911104115.4 | 申請(qǐng)日: | 2019-11-13 |
| 公開(公告)號(hào): | CN110825827B | 公開(公告)日: | 2022-10-25 |
| 發(fā)明(設(shè)計(jì))人: | 徐猛;付驍弈 | 申請(qǐng)(專利權(quán))人: | 北京明略軟件系統(tǒng)有限公司 |
| 主分類號(hào): | G06F16/28 | 分類號(hào): | G06F16/28;G06F16/36 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100000 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 實(shí)體 關(guān)系 識(shí)別 模型 訓(xùn)練 方法 裝置 | ||
本申請(qǐng)?zhí)峁┝艘环N實(shí)體關(guān)系識(shí)別模型訓(xùn)練、實(shí)體關(guān)系識(shí)別方法及裝置,包括:獲取帶有實(shí)體標(biāo)注的樣本語(yǔ)料,并基于樣本語(yǔ)料的實(shí)體標(biāo)注信息,確定樣本語(yǔ)料的關(guān)系矩陣;將樣本語(yǔ)料輸入至待訓(xùn)練的識(shí)別模型中,識(shí)別模型包括特征提取模型、第一預(yù)測(cè)模型、以及第二預(yù)測(cè)模型,將樣本語(yǔ)料輸入至待訓(xùn)練的識(shí)別模型中,得到樣本語(yǔ)料中的每一個(gè)字對(duì)應(yīng)的實(shí)體預(yù)測(cè)結(jié)果、以及樣本語(yǔ)料對(duì)應(yīng)的預(yù)測(cè)關(guān)系矩陣:基于樣本語(yǔ)料中的每一個(gè)字對(duì)應(yīng)的實(shí)體預(yù)測(cè)結(jié)果、以及預(yù)測(cè)關(guān)系矩陣、樣本語(yǔ)料的實(shí)體標(biāo)注、以及樣本語(yǔ)料的關(guān)系矩陣,對(duì)識(shí)別模型進(jìn)行訓(xùn)練,得到實(shí)體關(guān)系識(shí)別模型。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其是涉及一種實(shí)體關(guān)系識(shí)別模型訓(xùn)練、實(shí)體關(guān)系識(shí)別方法及裝置。
背景技術(shù)
知識(shí)圖譜技術(shù)是人工智能技術(shù)的組成部分,其強(qiáng)大的語(yǔ)義處理和互聯(lián)組織能力,為智能化信息應(yīng)用提供了基礎(chǔ)。而實(shí)體抽取和實(shí)體關(guān)系抽取是只是圖譜的構(gòu)建和知識(shí)抽取中的一個(gè)重要環(huán)節(jié),可以為多種應(yīng)用提供重要的技術(shù)支持。從語(yǔ)料數(shù)據(jù)中提取出實(shí)體以及實(shí)體之間的實(shí)體關(guān)系的精度將直接影響到知識(shí)圖譜構(gòu)建的精度。
現(xiàn)有技術(shù)中主要通過(guò)流水線模型提取語(yǔ)料數(shù)據(jù)中的實(shí)體以及實(shí)體關(guān)系,然而這種方法容易導(dǎo)致誤差累計(jì),精度較低。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)的目的在于提供實(shí)體關(guān)系識(shí)別模型訓(xùn)練、實(shí)體關(guān)系識(shí)別方法及裝置。
第一方面,本申請(qǐng)實(shí)施例提供了一種實(shí)體關(guān)系識(shí)別模型訓(xùn)練方法,包括:
獲取帶有實(shí)體標(biāo)注的樣本語(yǔ)料,并基于所述樣本語(yǔ)料的實(shí)體標(biāo)注信息,確定所述樣本語(yǔ)料的關(guān)系矩陣,其中,所述實(shí)體標(biāo)注用于表示所述樣本語(yǔ)料中的每一個(gè)字所屬的實(shí)體類型,所述關(guān)系矩陣用于表示所述樣本語(yǔ)料中實(shí)體之間的實(shí)體關(guān)系;
將所述樣本語(yǔ)料輸入至待訓(xùn)練的識(shí)別模型中,所述識(shí)別模型包括特征提取模型、第一預(yù)測(cè)模型、以及第二預(yù)測(cè)模型,將所述樣本語(yǔ)料輸入至待訓(xùn)練的識(shí)別模型中,執(zhí)行以下操作,直至得到所述樣本語(yǔ)料中的每一個(gè)字對(duì)應(yīng)的實(shí)體預(yù)測(cè)結(jié)果、以及所述樣本語(yǔ)料對(duì)應(yīng)的預(yù)測(cè)關(guān)系矩陣:
將所述樣本語(yǔ)料轉(zhuǎn)換為樣本語(yǔ)料矩陣,并基于所述樣本語(yǔ)料矩陣、以及所述特征提取模型,確定所述樣本語(yǔ)料矩陣對(duì)應(yīng)的樣本語(yǔ)料特征矩陣;
基于所述樣本語(yǔ)料特征矩陣、以及所述第一預(yù)測(cè)模型,預(yù)測(cè)所述樣本語(yǔ)料中的每一個(gè)字對(duì)應(yīng)的實(shí)體預(yù)測(cè)結(jié)果;以及,
基于所述樣本語(yǔ)料特征矩陣、以及所述第二預(yù)測(cè)模型,預(yù)測(cè)所述樣本語(yǔ)料對(duì)應(yīng)的預(yù)測(cè)關(guān)系矩陣;
基于所述樣本語(yǔ)料中的每一個(gè)字對(duì)應(yīng)的實(shí)體預(yù)測(cè)結(jié)果、以及所述預(yù)測(cè)關(guān)系矩陣、所述樣本語(yǔ)料的實(shí)體標(biāo)注、以及所述樣本語(yǔ)料的關(guān)系矩陣,對(duì)所述識(shí)別模型進(jìn)行訓(xùn)練,得到實(shí)體關(guān)系識(shí)別模型。
結(jié)合第一方面,本申請(qǐng)實(shí)施例提供了第一方面的第一種可能的實(shí)施方式,其中,所述特征提取模型為雙向長(zhǎng)短記憶網(wǎng)絡(luò)模型;
所述基于所述樣本語(yǔ)料矩陣、以及所述特征提取模型,確定所述樣本語(yǔ)料矩陣對(duì)應(yīng)的樣本語(yǔ)料特征矩陣,包括:
將所述樣本語(yǔ)料矩陣輸入至所述特征提取模型中,得到第一樣本語(yǔ)料特征矩陣和第二樣本語(yǔ)料特征矩陣;
將所述第一樣本語(yǔ)料特征矩陣和所述第二樣本語(yǔ)料特征矩陣進(jìn)行拼接,得到所述樣本語(yǔ)料特征矩陣。
結(jié)合第一方面,本申請(qǐng)實(shí)施例提供了第一方面的第二種可能的實(shí)施方式,其中,所述基于所述樣本語(yǔ)料特征矩陣、以及所述第一預(yù)測(cè)模型,預(yù)測(cè)所述樣本語(yǔ)料中的每一個(gè)字對(duì)應(yīng)的實(shí)體預(yù)測(cè)結(jié)果,包括:
將所述樣本語(yǔ)料特征矩陣進(jìn)行線性轉(zhuǎn)換,并將線性轉(zhuǎn)換后的所述樣本語(yǔ)料特征矩陣輸入至所述第一預(yù)測(cè)模型中,輸出得到所述樣本語(yǔ)料中每一個(gè)字屬于每種實(shí)體類型的概率;
基于所述樣本語(yǔ)料中每一個(gè)字屬于每種實(shí)體類型的概率,確定所述樣本語(yǔ)料中的每一個(gè)字對(duì)應(yīng)的實(shí)體預(yù)測(cè)結(jié)果,所述實(shí)體預(yù)測(cè)結(jié)果包括預(yù)測(cè)實(shí)體類型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明略軟件系統(tǒng)有限公司,未經(jīng)北京明略軟件系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911104115.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體關(guān)系識(shí)別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于實(shí)體對(duì)齊的屬性融合方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲(chǔ)介質(zhì)
- 關(guān)系視圖
- 位置關(guān)系檢測(cè)裝置以及位置關(guān)系檢測(cè)系統(tǒng)
- 關(guān)系建模
- 關(guān)系分析方法、關(guān)系分析程序、以及關(guān)系分析裝置
- 實(shí)體關(guān)系分類裝置和實(shí)體關(guān)系分類方法
- 用戶關(guān)系抽取方法和用戶關(guān)系抽取系統(tǒng)
- 融合依存關(guān)系與篇章修辭關(guān)系的事件時(shí)序關(guān)系識(shí)別方法
- 開關(guān)系統(tǒng)
- 視頻視覺(jué)關(guān)系檢測(cè)的關(guān)系片段連接方法
- 開關(guān)系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





