[發(fā)明專利]知識圖譜構(gòu)建方法、裝置、設備和介質(zhì)有效
| 申請?zhí)枺?/td> | 202010074569.8 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111291205B | 公開(公告)日: | 2023-06-13 |
| 發(fā)明(設計)人: | 馮知凡;王海峰;汪琦;朱勇;呂雅娟 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/483 | 分類號: | G06F16/483;G06N3/0464;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 構(gòu)建 方法 裝置 設備 介質(zhì) | ||
本申請實施例公開了一種知識圖譜構(gòu)建方法、裝置、設備和介質(zhì),涉及數(shù)據(jù)處理領域,尤其涉及知識圖譜技術。具體實現(xiàn)方案為:從描述目標事件的目標文本中提取所述目標事件關聯(lián)的目標動作以及所述目標動作關聯(lián)的目標實體;將所述目標動作和所述目標實體作為節(jié)點,將所述目標動作和所述目標實體之間的關系作為邊,構(gòu)建知識圖譜。本申請實施例提供了一種知識圖譜構(gòu)建方法、裝置、設備和介質(zhì),以豐富知識圖譜中的知識。
技術領域
本申請實施例涉及數(shù)據(jù)處理領域,尤其涉及知識圖譜技術。具體地,本申請實施例提供一種知識圖譜構(gòu)建方法、裝置、設備和介質(zhì)。
背景技術
針對短視頻推薦的產(chǎn)品,為了提升短視頻的點擊率,需要對短視頻進行一個全方位、結(jié)構(gòu)化的語義理解。
知識圖譜(knowledge?graph)是指以實體作為節(jié)點,以語義關系作為邊的語義網(wǎng)絡。知識圖譜使得知識獲取更直接,因此知識圖譜能夠為短視頻的理解提供關聯(lián)的知識。
但是,當前知識圖譜為短視頻的理解所能提供的知識比較有限,無法實現(xiàn)對短視頻進行全方位的語義理解。
發(fā)明內(nèi)容
本申請實施例提供了一種知識圖譜構(gòu)建方法、裝置、設備和介質(zhì),以豐富知識圖譜中的知識。
本申請實施例提供了一種知識圖譜構(gòu)建方法,該方法包括:
從描述目標事件的目標文本中提取所述目標事件關聯(lián)的目標動作以及所述目標動作關聯(lián)的目標實體;
將所述目標動作和所述目標實體作為節(jié)點,將所述目標動作和所述目標實體之間的關系作為邊,構(gòu)建知識圖譜。
本申請實施例通過從描述目標事件的目標文本中挖掘目標事件關聯(lián)的目標動作以及所述目標動作關聯(lián)的目標實體,然后將目標動作作為節(jié)點,目標動作與目標實體之間的關聯(lián)關系作為邊,添加至現(xiàn)有知識圖譜的結(jié)構(gòu)中,以豐富圖譜中的知識,提高基于圖譜知識的查找效率。
進一步地,所述從描述目標事件的目標文本中提取所述目標事件關聯(lián)的目標動作以及所述目標動作關聯(lián)的目標實體,包括:
將所述目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征;
根據(jù)所述目標動作特征和所述目標文本特征,確定目標實體特征;
根據(jù)所述目標動作特征和所述目標文本,確定所述目標動作;
根據(jù)所述目標實體特征和所述目標文本,確定所述目標實體。
基于該技術特征,本申請實施例通過將目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征;根據(jù)所述目標動作特征和所述目標文本確定所述目標動作,從而實現(xiàn)對目標事件中目標動作的挖掘。
通過根據(jù)所述目標動作特征和所述目標文本特征,確定目標實體特征;根據(jù)所述目標實體特征和所述目標文本,確定所述目標實體,從而實現(xiàn)對目標事件中目標動作與目標實體之間關系的挖掘。
基于挖掘的目標動作,以及目標動作與目標實體之間的關系構(gòu)建知識圖譜,使得知識圖譜中的知識更豐富,進而可以實現(xiàn)對視頻、圖像、音頻等多模態(tài)對象的全方位語義理解。
進一步地,所述將所述目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征之前,所述方法還包括:
根據(jù)樣本動作在樣本文本中的位置和所述樣本文本的字符數(shù)量,確定樣本動作特征;
根據(jù)所述樣本文本和所述樣本動作特征,訓練得到所述事件提取模型。
基于該技術特征,本申請實施例通過根據(jù)樣本動作在樣本文本中的位置和所述樣本文本的字符數(shù)量,確定樣本動作特征,并根據(jù)所述樣本動作特征,訓練得到事件提取模型,從而使得模型輸出的目標動作特征也與目標動作在目標文本中的位置和目標文本的字符數(shù)量有關。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010074569.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 構(gòu)建墊、實體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設備
- 并行構(gòu)建的方法、裝置及設備
- 構(gòu)建肺癌預測模型構(gòu)建方法





