[發明專利]一種基于圖數據庫的知識森林構建方法有效
| 申請號: | 201810068490.7 | 申請日: | 2018-01-24 |
| 公開(公告)號: | CN108304519B | 公開(公告)日: | 2020-08-18 |
| 發明(設計)人: | 劉均;任若清;段海夢;劉文強;鄭元浩;石磊;楊寬 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/34;G06F16/31;G06F40/279;G06F40/30 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 徐文權 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據庫 知識 森林 構建 方法 | ||
1.一種基于圖數據庫的知識森林構建方法,其特征在于,包括構建實例化知識主題分面樹的步驟、生成知識主題間認知關系的步驟以及存儲知識森林數據的步驟;
構建實例化知識主題分面樹的步驟為:
采集不同課程的數據,構建課程數據集;根據知識主題及分面數據集,構建知識主題分面樹;對課程知識碎片數據集基于層次進行多次分類,確定課程知識碎片和知識主題分面樹葉子節點之間的映射關系,由此構建出實例化知識主題分面樹;
構建實例化知識主題分面樹時,首先對課程內每一個知識主題,依據該主題的分面及該主題分面間的語義關系,構建以該知識主題名為樹根、以該主題各分面名為樹干的知識主題分面樹;然后對課程知識碎片基于知識主題和分面信息進行多次分類,建立知識主題分面樹葉子節點與課程知識碎片之間的映射關系集合,從而構建得到實例化知識主題分面樹;
構建實例化知識主題分面樹具體包括以下步驟:
1.1將采集到的課程相關數據分類構建數據集,分別為知識主題數據集Topic,分面數據集Facet,分面間語義關系集合的數據集FRelation,知識碎片數據集Fragment;
1.2對構建好的知識主題數據集Topic中的每一個知識主題,構建三元組KT=(ku,TF,R),其中根節點ku表示知識主題,TF表示知識主題的分面集合,表示知識主題的分面間語義關系集合,開始TF和R為空;對知識主題ku,遍歷數據集Facet和FRelation,將ku的所有分面加入集合TF,把ku所有分面間語義關系加入集合R;為每個知識主題ku,以該知識主題的三元組KT=(ku,TF,R)為基礎,構建以主題名ku為樹根、主題各分面TF為樹干的主題分面樹;
1.3對知識碎片數據集Fragment中每一個碎片fg,構造長度為Topic數組大小的向量,向量每一維對應Topic中相同位置的主題,每一維的值置為fg碎片內容中出現該維對應主題名的次數;向量構造完成后,將fg分類到向量值最大的維對應的知識主題;類似的,將fg繼續按知識主題分面分類;
1.4對已構建的知識主題分面樹集合KFT,根據對知識碎片數據集Fragment中每一個知識碎片的分類,得到知識主題分面樹葉子節點Leaf(KFT)與知識碎片間的對應關系MP,即從而完成實例化知識主題分面樹的構建,實例化的知識主題分面樹表示為三元組KTI=(KFT,Fragment,MP);
生成知識主題間認知關系的步驟為:
以經過預處理的各知識主題下知識碎片文本內容為輸入,輸出課程內任意兩個知識主題間具有認知關系的可能性;根據人工設置的閾值,若兩個知識主題間具有認知關系的可能性大于閾值,則在這兩個知識主題間生成認知關系;以課程數據目錄為補充數據源對認知關系進行補充,最終生成課程內知識主題間所有的認知關系;
存儲知識森林數據的步驟為:
制定知識森林數據三元組存儲格式,將知識森林數據按照對應存儲格式構建為三元組形式并存入圖數據庫,從而得到存儲各課程數據的知識森林數據庫;
存儲知識森林數據時,首先根據所生成知識森林數據的特點,制定知識森林數據三元組存儲格式;其次將課程下的知識主題、分面、知識碎片和認知關系按對應的格式進行轉換,構建得到三元組形式的知識森林數據;最后將構建好三元組的數據存入圖數據庫;
存儲知識森林數據具體包括如下步驟;
3.1基于資源描述框架,結合知識森林數據特點,制定知識森林數據三元組存儲格式;
3.2對課程domain,遍歷其知識主題數據集Topic,對其中每一個主題ku,構建三元組格式的知識主題數據<ku,subject_to,domain>;
3.3對碎片數據集Fragment中每一個碎片fg,確定碎片fg對應的知識主題ku和分面facet,構建三元組格式的知識碎片數據<ku,facet,fg>;
3.4根據所生成的知識主題間認知關系數據,對其中每一條認知關系構建三元組格式的認知關系數據<ku1,dependence,ku2>;
3.5將構建好的三元組知識森林數據存入圖數據庫,完成知識森林數據的構建。
2.根據權利要求1所述基于圖數據庫的知識森林構建方法,其特征在于:構建實例化知識主題分面樹時,以課程書籍和百科類、社區問答類網站內容作為信息來源。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810068490.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多媒體文件處理方法、服務器及存儲介質
- 下一篇:智能電視搜索平臺及搜索方法





