[發明專利]數據處理方法、裝置、設備、可讀存儲介質及程序產品在審
| 申請號: | 202210090399.1 | 申請日: | 2022-01-25 |
| 公開(公告)號: | CN114417875A | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 黃劍輝 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06K9/62 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 設備 可讀 存儲 介質 程序 產品 | ||
本申請公開了一種數據處理方法、裝置、設備、可讀存儲介質及程序產品,涉及人工智能領域的深度學習技術,該方法包括:獲取第一對象實體所包括的第一模態特征,獲取第二對象實體所包括的第二模態特征,獲取第一對象實體與第二對象實體之間的候選關系特征;n為正整數,m為正整數;將n個第一模態特征進行特征融合處理,得到第一融合特征;將m個第二模態特征進行特征融合處理,得到第二融合特征;預測第一融合特征、第二融合特征與候選關系特征之間的置信度,基于置信度確定第一對象實體與第二對象實體之間的目標關聯關系。采用本申請,可以更加精準的確定第一對象實體與第二對象實體之間的目標關聯關系,提高實體間關系識別效率。
技術領域
本申請涉及互聯網技術領域,尤其涉及一種數據處理方法、裝置、設備、可讀存儲介質及程序產品。
背景技術
隨著數字化時代的來臨,信息數量增長速度越加快速,人們對于梳理信息的效率有著越來越高的要求。匹配兩個對象之間的關系一般基于一些通用模型。常用的通用模型有翻譯模型、引文分析模型、多元統計分析模型和深度神經網絡模型。
這些模型,具有并不高的使用門檻,這些模型在語言學、文學及部分計算機學科方面有較好的應用效果,這些模型通常都是只基于文本內容匹配兩個對象之間的關系,這樣就會導致所匹配的關系類型過于片面,延長了兩個對象之間真實關系的匹配過程。
發明內容
本申請實施例提供一種數據處理方法、裝置、設備、可讀存儲介質及程序產品,可以更加精準的確定第一對象實體與第二對象實體之間的目標關聯關系,提高實體間關系識別效率。
本申請實施例一方面提供了一種數據處理方法,包括:
獲取第一對象實體所包括的n個第一對象模態分別對應的第一模態特征,獲取第二對象實體所包括的m個第二對象模態分別對應的第二模態特征,獲取第一對象實體與第二對象實體之間的候選關系特征;n為正整數,m為正整數;
將n個第一模態特征進行特征融合處理,得到第一融合特征;將m個第二模態特征進行特征融合處理,得到第二融合特征;
預測第一融合特征、第二融合特征與候選關系特征之間的置信度,基于置信度確定第一對象實體與第二對象實體之間的目標關聯關系。
進一步地,預測第一融合特征、第二融合特征與候選關系特征之間的置信度,包括:
將第一融合特征、第二融合特征與候選關系特征輸入關系預測模型,基于關系預測模型,將第一融合特征、第二融合特征與候選關系特征映射到同一向量空間,得到第一融合特征對應的第一融合向量、第二融合特征對應的第二融合向量,以及候選關系特征對應的候選關系向量;
將第一融合向量與候選關系向量融合得到的向量,與第二融合向量的差值,確定為第一融合特征、第二融合特征與候選關系特征之間的置信度。
進一步地,預測第一融合特征、第二融合特征與候選關系特征之間的置信度,包括:
將第一融合特征、第二融合特征與候選關系特征輸入關系預測模型,采用關系預測模型中的關系權重,對第一融合特征及第二融合特征進行特征融合轉換,得到第一融合特征與第二融合特征之間的預測關系向量;
獲取預測關系向量與候選關系特征之間的特征距離,將特征距離確定為第一融合特征、第二融合特征與候選關系特征之間的置信度。
進一步地,候選關系特征的數量為d,d為正整數;
預測第一融合特征、第二融合特征與候選關系特征之間的置信度,包括:
預測第一融合特征和第二融合特征,分別與d個候選關系特征之間的置信度;
基于置信度確定第一對象實體與第二對象實體之間的目標關聯關系,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210090399.1/2.html,轉載請聲明來源鉆瓜專利網。





