[發明專利]一種基于Neo4j和大數據的初等數學知識圖譜構建方法有效
| 申請號: | 202110774302.4 | 申請日: | 2021-07-08 |
| 公開(公告)號: | CN113360678B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 鐘秀琴;符紅光;鄧力華;林恭祺 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F8/30;G06F16/25;G06F16/28;G06F40/194;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 北京正華智誠專利代理事務所(普通合伙) 11870 | 代理人: | 何凡 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 neo4j 數據 初等 數學知識 圖譜 構建 方法 | ||
1.一種基于Neo4j和大數據的初等數學知識圖譜構建方法,其特征在于,包括如下步驟:
S1、根據Neo4j圖形數據庫分別對實體、關系以及屬性的定義,自上而下構建初始知識圖譜;
所述步驟S1包括如下子步驟:
S11、根據初等數學知識體系獲取知識圖譜數據;
S12、根據知識圖譜數據構建初始數據庫;
S13、將初始數據庫中的實體和關系轉換得到Neo4j數據庫中的各實體關系三元組,完成初始知識圖譜構建;
S2、根據大數據和深度學習自下而上的構建方法完善所述初始知識圖譜,得到完整的初等數學知識圖譜;
所述步驟S2包括如下子步驟:
S21、利用大數據技術獲取非結構化初等數學數據;
S22、利用自然語言處理技術抽取非結構化初等數學數據中的實體和關系;
所述步驟S22抽取非結構化初等數學數據中的實體和關系的方法如下:
B1、根據語言技術平臺LTP和類型遞進邏輯采用流水線方式命名非結構化初等數學數據中實體;
B2、利用雙向長短期記憶網絡和條件隨機場建立初等數學實體類型識別模型;
B3、利用初等數學實體類型識別模型識別非結構化初等數學數據中的實體,完成抽取非結構化初等數學數據的實體;
B4、根據非結構化初等數學數據中包含實體關系三元組的若干條數學文本構建初等數學關系庫;
B5、利用BERT模型對待抽取關系的數學文本與初等數學關系庫中已有數學文本進行相似度計算,并將最相似的待抽取關系的數學文本的實體關系三元組抽取出,得到抽取出文本,完成非結構化初等數學數據中的實體和關系的抽取;
S23、將抽取得到非結構化初等數學數據中的實體和關系進行數據預處理和相似度比對,得到相似度對比結果;
所述步驟S23中得到的相似度對比結果包括若干實體、若干關系以及若干屬性;
所述步驟S23包括以下步驟:
D1、非中文數據預處理:通過正則表達式判斷非結構化初等數學數據中的非中文字符,并使用成對的美元符號將其包括在中間,得到非中文數據預處理結果;
D2、新定義和命題題目數據預處理:將非中文數據預處理結果中的新定義和命題題目的實體關系三元組封裝為已知和結論兩部分,得到新定義和命題題目處理預結果;
D3、短截分割數據預處理:將新定義和命題題目處理預結果根據中文標點逗號、分號以及句號進行短句分割,得到若干短句分割處理結果;
D4、實體相似度比對:將各短句分割處理結果中實體名稱和實體包含屬性抽取出,得到若干實體;
D5、關系相似度比對:將各短句分割處理結果中的首實體、尾實體、關系名稱以及關系包含屬性抽取出,得到若干關系;
D6、屬性相似度比對:將各短句分割處理結果中屬性key值和value值抽取出,得到若干屬性;
S24、判斷相似度對比結果是否滿足與初始知識圖譜數據存在不同實體、不同關系和不同屬性之一或任意組合的情況,若是,則得到待添加非結構化初等數學數據并進入步驟S25,否則結束流程;
S25、將待添加非結構化初等數學數據添加至所述初始知識圖譜,得到完整初等數學知識圖譜。
2.根據權利要求1所述的基于Neo4j和大數據的初等數學知識圖譜構建方法,其特征在于,所述步驟S13包括如下步驟:
A1、在Java項目中建立實體包和關系包;
A2、將實體包和關系包中的實體和關系劃分入初始數據庫中初等數學知識體系的各知識點模塊中;
A3、利用Java語言反射機制獲取各知識點模塊中實體類的名稱和屬性,以及各知識點模塊中關系類的首實體、尾實體和關系的屬性;
A4、根據Java語言反射機制獲取結果,利用Neo4j Cypher Java API創建各實體間的關系,得到Neo4j數據庫的各實體關系三元組,完成初始知識圖譜構建,其中,所述Neo4jCypher Java API自定義cypher并進行封裝。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110774302.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種牙線簽模內豎直整切水口結構
- 下一篇:一種樓房養殖用多模態氣樓系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





