[發(fā)明專利]并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換方法和裝置在審
| 申請?zhí)枺?/td> | 202211514992.0 | 申請日: | 2022-11-30 |
| 公開(公告)號: | CN115809344A | 公開(公告)日: | 2023-03-17 |
| 發(fā)明(設(shè)計)人: | 黃嚴(yán);黃俊 | 申請(專利權(quán))人: | 北交金科金融信息服務(wù)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/289;G06F40/284;G06F16/215;G06F16/951 |
| 代理公司: | 成都蓉創(chuàng)智匯知識產(chǎn)權(quán)代理有限公司 51276 | 代理人: | 趙雷 |
| 地址: | 610000 四川省成都市中國(四川)自由貿(mào)*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 并購 知識 圖譜 基礎(chǔ) 圖庫 數(shù)據(jù) 采集 轉(zhuǎn)換 方法 裝置 | ||
1.并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換方法,其特征在于,具體包括以下步驟:
從并購信息數(shù)據(jù)庫中獲取原始語料信息;
對原始語料信息進行數(shù)據(jù)清洗和信息提取,得到若干條具有三元組結(jié)構(gòu)的語料文本;
將語料文本依次裝填到事件數(shù)據(jù)表中;
將事件數(shù)據(jù)表中的數(shù)據(jù)按照基礎(chǔ)圖庫數(shù)據(jù)模板轉(zhuǎn)換為基礎(chǔ)圖庫數(shù)據(jù),根據(jù)基礎(chǔ)圖庫數(shù)據(jù)構(gòu)建并購知識圖譜。
2.根據(jù)權(quán)利要求1所述的并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換方法,其特征在于,并購信息數(shù)據(jù)庫包括工商系統(tǒng)記錄的文本信息和自建并購事件數(shù)據(jù)庫文本信息,其中所述自建并購事件數(shù)據(jù)庫文本信息為利用數(shù)據(jù)爬蟲技術(shù)從網(wǎng)絡(luò)新聞資訊中爬取的數(shù)據(jù)源中的文本信息。
3.根據(jù)權(quán)利要求2所述的并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換,其特征在于,對原始語料信息進行數(shù)據(jù)清洗和信息提取包括:
將原始語料信息進行劃分,以句號為劃分依據(jù),將原始語料信息劃分為多條語句,將每條語句進行分詞,并進行詞性標(biāo)注預(yù)處理,得到若干條具有主語-賓語-內(nèi)容結(jié)構(gòu)的初始文本;
對于每條初始文本:
抽取出初始文本中的主語作為實體一、賓語作為實體二;
抽取初始文本中的內(nèi)容,組成實體一-內(nèi)容-實體二的三元組結(jié)構(gòu)的語料文本。
4.根據(jù)權(quán)利要求3所述的并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換,其特征在于,所述基礎(chǔ)圖庫數(shù)據(jù)模板包括主節(jié)點、子節(jié)點和邊,每個基礎(chǔ)圖庫數(shù)據(jù)的主節(jié)點、邊和子節(jié)點分別對應(yīng)于每條語料文本的實體一、內(nèi)容和實體二。
5.根據(jù)權(quán)利要求4所述的并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換,其特征在于,對基礎(chǔ)圖庫數(shù)據(jù)進行知識計算,得到并購知識圖譜,知識計算包括:
本體構(gòu)建:從所有基礎(chǔ)圖庫數(shù)據(jù)中篩選出主節(jié)點相同的所有基礎(chǔ)圖庫數(shù)據(jù)作為一個本體;
數(shù)據(jù)篩選:在每個本體中,去除主節(jié)點、邊和子節(jié)點均相同的基礎(chǔ)圖庫數(shù)據(jù);
本體連接:對于每個經(jīng)過數(shù)據(jù)篩選的本體,合并主節(jié)點相同的所有基礎(chǔ)圖庫數(shù)據(jù),以主節(jié)點為中點,主節(jié)點-邊-子節(jié)點的結(jié)構(gòu)連接本體中的其他子節(jié)點;
知識推理:通過基于邏輯的推理、基于圖的推理和基于深度學(xué)習(xí)的推理,對各個本體的主節(jié)點之間進行上下位關(guān)系抽取、關(guān)系缺失補齊;
圖譜生成:將經(jīng)過知識推理后的各個本體相互連接,形成知識圖譜。
6.并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換裝置,其特征在于,包括:
一個或多個處理器;
存儲單元,用于存儲一個或多個程序,當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行時,能使得所述一個或多個處理器實現(xiàn)權(quán)利要求1-5所述的并購知識圖譜基礎(chǔ)圖庫數(shù)據(jù)采集及轉(zhuǎn)換方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北交金科金融信息服務(wù)有限公司,未經(jīng)北交金科金融信息服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211514992.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 物流配送車輛路徑優(yōu)化方法
- 互聯(lián)網(wǎng)并購資源整合系統(tǒng)
- 互聯(lián)網(wǎng)并購業(yè)務(wù)審核系統(tǒng)
- 互聯(lián)網(wǎng)并購風(fēng)險管理系統(tǒng)
- 基于能力存量的企業(yè)并購創(chuàng)新績效評價方法
- 一種標(biāo)的企業(yè)對象的篩選方法、裝置及計算設(shè)備
- 一種衡量汽車企業(yè)并購的財務(wù)績效評價系統(tǒng)
- 一種基于區(qū)塊鏈技術(shù)的企業(yè)并購與融資信息服務(wù)平臺
- 一種戶外高壓電纜頭接地結(jié)構(gòu)及方法
- 上市公司并購交易的數(shù)據(jù)處理方法
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





