[發(fā)明專利]圖譜構建方法、裝置、電子設備及存儲介質在審
| 申請?zhí)枺?/td> | 202310403733.9 | 申請日: | 2023-04-14 |
| 公開(公告)號: | CN116561335A | 公開(公告)日: | 2023-08-08 |
| 發(fā)明(設計)人: | 李美燕;李林;王秀文;楊典;陳鵬云;楊菁林;徐丹丹;秦韜;李婭強;曾宣瑋;張棟;王峰;李政達;秦愷 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/901;G06F16/35;G06F40/211 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 由東媛 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖譜 構建 方法 裝置 電子設備 存儲 介質 | ||
1.一種圖譜構建方法,其特征在于,所述方法包括:
從預設的產業(yè)數據庫中確定與目標產業(yè)匹配的產業(yè)數據;
根據所述產業(yè)數據確定產業(yè)鏈圖譜中各實體之間的上下位關系;
獲取所述目標產業(yè)的企業(yè)信息;
根據所述上下位關系及所述企業(yè)信息,構建所述目標產業(yè)的產業(yè)鏈圖譜。
2.根據權利要求1所述的方法,其特征在于,所述根據所述產業(yè)數據確定產業(yè)鏈圖譜中各實體之間的上下位關系,包括:
獲取預先訓練的關系確定模型;
將所述產業(yè)數據輸入至所述關系確定模型中,得到用于構建產業(yè)鏈圖譜的各實體之間的上下位關系。
3.根據權利要求2所述的方法,其特征在于,所述將所述產業(yè)數據輸入至所述關系確定模型中,得到用于構建產業(yè)鏈圖譜的各實體之間的上下位關系,包括:
針對產業(yè)數據中每一句文本,對所述產業(yè)數據進行數據分類處理,得到分類后的文本;
在確定所述文本中包含上下位關系的情況下,對所述文本進行句法分析,得到包含上下位關系的詞組集合;
確定與所述詞組集合對應的詞組向量;
對所述詞組向量進行層次聚類處理,得到聚類后的詞組簇;
根據預設的關系庫,確定所述詞組簇之間的上下位關系為實體之間的上下位關系。
4.根據權利要求2所述的方法,其特征在于,所述關系確定模型通過以下方式訓練得到:
針對訓練樣本中每一句文本,對所述訓練樣本進行數據分類處理,得到分類后的文本樣本;
在確定所述文本樣本中包含上下位關系的情況下,對所述文本樣本進行句法分析,得到包含上下位關系的詞組樣本集合;
確定與所述詞組樣本集合對應的詞組向量樣本為訓練數據;
根據所述訓練數據對預設的初始模型進行訓練,得到關系確定模型。
5.根據權利要求3所述的方法,其特征在于,所述對所述產業(yè)數據進行數據分類處理,得到分類后的文本,包括:
將所述產業(yè)數據輸入至預設的文本處理模型中,得到所述文本處理模型提取出的文本特征向量;
將所述文本特征向量輸入至預設的分類模型,得到分類后的文本。
6.根據權利要求3所述的方法,其特征在于,所述對所述詞組向量進行層次聚類處理,得到聚類后的詞組簇,包括:
從多個所述詞組向量中確定多個待處理的詞組向量對;
針對每一待處理的詞組向量對,利用預設的距離算法確定所述詞組向量對中詞組向量之間的距離值;
判斷所述距離值是否達到預設的距離閾值;
若所述距離值未達到預設的距離閾值,則確定所述詞組向量對中詞組向量為同一詞組簇;
若所述距離值達到預設的距離閾值,則確定所述詞組向量對中詞組向量為不同的詞組簇。
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
從所述產業(yè)數據庫中獲取更新后的新產業(yè)數據;
基于所述新產業(yè)數據執(zhí)行確定產業(yè)鏈圖譜中各實體之間的上下位關系的步驟。
8.一種圖譜構建裝置,其特征在于,所述裝置包括:
數據確定模塊,用于從預設的產業(yè)數據庫中確定與目標產業(yè)匹配的產業(yè)數據;
關系確定模塊,用于根據所述產業(yè)數據確定產業(yè)鏈圖譜中各實體之間的上下位關系;
信息獲取模塊,用于獲取所述目標產業(yè)的企業(yè)信息;
圖譜構建模塊,用于根據所述上下位關系及所述企業(yè)信息,構建所述目標產業(yè)的產業(yè)鏈圖譜。
9.一種電子設備,其特征在于,包括:處理器和存儲器,所述處理器用于執(zhí)行所述存儲器中存儲的圖譜構建程序,以實現權利要求1~7中任一項所述的圖譜構建方法。
10.一種存儲介質,其特征在于,所述存儲介質存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行,以實現權利要求1~7中任一項所述的圖譜構建方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310403733.9/1.html,轉載請聲明來源鉆瓜專利網。





