[發(fā)明專利]一種創(chuàng)建知識(shí)圖譜的方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710890548.1 | 申請(qǐng)日: | 2017-09-27 |
| 公開(公告)號(hào): | CN107665252B | 公開(公告)日: | 2020-08-25 |
| 發(fā)明(設(shè)計(jì))人: | 毛瑞彬;朱菁;張俊;王仁勇;鄧永翠;趙洪杰 | 申請(qǐng)(專利權(quán))人: | 深圳證券信息有限公司 |
| 主分類號(hào): | G06F16/31 | 分類號(hào): | G06F16/31;G06F16/36;G06F40/295;G06N3/04 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 創(chuàng)建 知識(shí) 圖譜 方法 裝置 | ||
1.一種創(chuàng)建知識(shí)圖譜的方法,所述方法應(yīng)用于數(shù)據(jù)分析裝置,其特征在于,所述方法包括:
獲取數(shù)據(jù)源,所述數(shù)據(jù)源包括多個(gè)實(shí)體;
對(duì)所述數(shù)據(jù)源進(jìn)行語義分析和聚類分析,從所述數(shù)據(jù)源中提取實(shí)體集合和屬性集合,所述屬性集合包括所述實(shí)體集合中各實(shí)體的實(shí)體屬性;
獲取所述實(shí)體集合中各實(shí)體與屬性之間的關(guān)聯(lián)關(guān)系;
根據(jù)所述實(shí)體集合、屬性集合、以及實(shí)體與屬性之間的關(guān)聯(lián)關(guān)系創(chuàng)建并輸出知識(shí)圖譜,所述知識(shí)圖譜包括實(shí)體、實(shí)體屬性、實(shí)體與屬性之間的關(guān)聯(lián)關(guān)系、以及實(shí)體間的關(guān)聯(lián)關(guān)系;
所述方法還包括:
對(duì)所述實(shí)體集合中的各實(shí)體分別進(jìn)行向量化,得到訓(xùn)練向量;
所述對(duì)所述實(shí)體集合中的各實(shí)體分別進(jìn)行向量化,得到訓(xùn)練向量,包括:
采用多層神經(jīng)網(wǎng)絡(luò)對(duì)所述實(shí)體集合中的各實(shí)體進(jìn)行命名實(shí)體識(shí)別,得到各實(shí)體的實(shí)體上下文;
從得到各實(shí)體的實(shí)體上下文中抽取各實(shí)體間的關(guān)聯(lián)關(guān)系;
根據(jù)所述各實(shí)體的實(shí)體上下文和所述各實(shí)體間的關(guān)聯(lián)關(guān)系,得到所述訓(xùn)練向量;
所述從得到各實(shí)體的實(shí)體上下文中抽取各實(shí)體間的關(guān)聯(lián)關(guān)系,包括:
根據(jù)所述屬性集合、所述實(shí)體集合和時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)模型,分別對(duì)所述實(shí)體集合中的各實(shí)體進(jìn)行關(guān)聯(lián)關(guān)系標(biāo)注,標(biāo)注的關(guān)聯(lián)關(guān)系包括詞語在實(shí)體中的位置、關(guān)聯(lián)關(guān)系類型和關(guān)聯(lián)關(guān)系位置;
采用關(guān)聯(lián)關(guān)系嵌入法計(jì)算關(guān)系類型的權(quán)重值;
根據(jù)最近距離原則、關(guān)聯(lián)關(guān)系類型從標(biāo)注的關(guān)聯(lián)關(guān)系中篩選出候選關(guān)聯(lián)關(guān)系;
按照關(guān)聯(lián)關(guān)系類型的關(guān)鍵詞對(duì)對(duì)篩選出的候選關(guān)聯(lián)關(guān)系進(jìn)行分類,以得到所述實(shí)體間的關(guān)聯(lián)關(guān)系;
所述方法還包括:
通過實(shí)體屬性嵌入計(jì)算各實(shí)體間的相似度,對(duì)所述知識(shí)圖譜中實(shí)體類型相同或相似的實(shí)體進(jìn)行合并、去重和區(qū)分中的至少一項(xiàng);
所述方法還包括:
當(dāng)至少兩個(gè)同名實(shí)體之間在實(shí)體網(wǎng)絡(luò)中的的距離小于N,則將所述至少兩個(gè)所述同名實(shí)體合并為同一實(shí)體,并且,將至少兩個(gè)所述同名實(shí)體的關(guān)聯(lián)關(guān)系合并為同一關(guān)聯(lián),所述N的取值用于指示實(shí)體名稱的罕見程度;
所述知識(shí)圖譜基于時(shí)間維度,在時(shí)間維度上的每個(gè)時(shí)間窗口內(nèi)的聯(lián)通圖是所述時(shí)間窗口內(nèi)實(shí)體間的關(guān)聯(lián)關(guān)系,以及實(shí)體屬性的快照;
所述知識(shí)圖譜至少還滿足以下項(xiàng)之一:
在所述知識(shí)圖譜中,具有關(guān)聯(lián)關(guān)系的實(shí)體之間按照關(guān)聯(lián)關(guān)系強(qiáng)度從強(qiáng)至弱漸變顯示;
突出顯示所述知識(shí)圖譜中的特定實(shí)體,所述特定實(shí)體標(biāo)記風(fēng)險(xiǎn)評(píng)估值,所述特定實(shí)體是指風(fēng)險(xiǎn)評(píng)估值高于預(yù)設(shè)風(fēng)險(xiǎn)評(píng)估值的實(shí)體;
當(dāng)所述知識(shí)圖譜中的實(shí)體更新時(shí),區(qū)分更新的實(shí)體;
對(duì)存在時(shí)間更新的實(shí)體屬性增加時(shí)間軸,在時(shí)間軸上顯示更替的時(shí)間;
對(duì)于同一個(gè)實(shí)體的實(shí)體屬性,按照實(shí)體屬性的權(quán)重值從高至低,由深入淺著色。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采用多層神經(jīng)網(wǎng)絡(luò)對(duì)所述實(shí)體集合中的各實(shí)體進(jìn)行命名實(shí)體識(shí)別,得到各實(shí)體的實(shí)體上下文之后,所述從得到各實(shí)體的實(shí)體上下文中抽取各實(shí)體間的關(guān)聯(lián)關(guān)系之前,所述方法還包括:
采用最大對(duì)數(shù)似然法對(duì)得到的各實(shí)體的實(shí)體上下文分別進(jìn)行最大化處理。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從得到各實(shí)體的實(shí)體上下文中抽取各實(shí)體間的關(guān)聯(lián)關(guān)系之后,所述根據(jù)所述各實(shí)體的實(shí)體上下文和所述各實(shí)體間的關(guān)聯(lián)關(guān)系,得到所述實(shí)體訓(xùn)練向量之前,所述方法還包括:
采用最大對(duì)數(shù)似然法對(duì)得到的各實(shí)體的實(shí)體間的關(guān)聯(lián)關(guān)系分別進(jìn)行最大化處理。
4.根據(jù)權(quán)利要求1至3中任意一項(xiàng)所述的方法,其特征在于,所述數(shù)據(jù)源包括第一數(shù)據(jù)表和第二數(shù)據(jù)表,所述多個(gè)實(shí)體包括至少一個(gè)第一實(shí)體和至少一個(gè)第二實(shí)體,所述第一實(shí)體屬于第一數(shù)據(jù)表,所述第二實(shí)體屬于第二數(shù)據(jù)表,所述知識(shí)圖譜包括至少兩個(gè)聯(lián)通圖,所述至少兩個(gè)聯(lián)通圖之間存在子孫關(guān)系和/或父子關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳證券信息有限公司,未經(jīng)深圳證券信息有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710890548.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 圖冊(cè)創(chuàng)建設(shè)備、圖冊(cè)創(chuàng)建方法和圖冊(cè)創(chuàng)建程序
- 一種使用創(chuàng)建接口來靈活創(chuàng)建對(duì)象的方法
- 報(bào)告創(chuàng)建系統(tǒng)、報(bào)告創(chuàng)建裝置以及報(bào)告創(chuàng)建方法
- 文本創(chuàng)建系統(tǒng)、文本創(chuàng)建裝置、文本創(chuàng)建方法
- 文檔創(chuàng)建設(shè)備、文檔創(chuàng)建系統(tǒng)及文檔創(chuàng)建方法
- 剪報(bào)創(chuàng)建方法和剪報(bào)創(chuàng)建系統(tǒng)
- 數(shù)據(jù)創(chuàng)建裝置、數(shù)據(jù)創(chuàng)建方法及數(shù)據(jù)創(chuàng)建程序
- 信息創(chuàng)建方法及信息創(chuàng)建裝置
- 報(bào)告創(chuàng)建系統(tǒng)和報(bào)告創(chuàng)建方法
- 創(chuàng)建改進(jìn)的顏色的顏色創(chuàng)建裝置及顏色創(chuàng)建方法
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





