[發明專利]軟件項目知識圖譜自動構造方法與系統在審
| 申請號: | 201711307630.3 | 申請日: | 2017-12-11 |
| 公開(公告)號: | CN108196880A | 公開(公告)日: | 2018-06-22 |
| 發明(設計)人: | 謝冰;沈琦;林澤琦;鄒艷珍;趙俊峰 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F8/74 | 分類號: | G06F8/74 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100871 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 軟件項目 基礎知識 圖譜 關聯 軟件資源 自動構造 解析 數據庫 存儲 提煉 插件形式 多源異構 可擴展性 原始軟件 資源數據 插件 | ||
本發明涉及一種軟件項目知識圖譜自動構造方法與系統。該方法包括:1)對原始軟件資源數據進行解析,得到軟件項目的基礎知識實體及其關聯,并以頂點和邊的形式存儲在圖數據庫中;2)在已有基礎知識實體及其關聯的基礎上,采用知識提煉方法在實體之間建立新的關聯,和/或在知識圖譜中添加新的基礎知識實體及其關聯,并以頂點和邊的形式存儲在圖數據庫中;3)選擇部分或全部基礎知識實體及其關聯,構成軟件項目知識圖譜。每種軟件資源數據的解析方法以及知識提煉方法以插件形式存在,通過選擇并運行需要的插件來生成軟件項目知識圖譜。本發明解決了從多源異構的軟件資源中提取和組織領域特定知識的問題,適用范圍廣,可擴展性強。
技術領域
本發明屬于計算機軟件技術領域,涉及軟件項目知識圖譜自動構造技術,具體涉及對包含多源異構資源的軟件項目的知識圖譜自動構造方法與系統。
背景技術
一個軟件項目通常包含多種類型的軟件資源,比如源代碼、問答文檔、需求/設計文檔、缺陷報告、郵件列表等。在軟件復用過程中,為了幫助用戶快速、有效獲得其需要的軟件資源,需要挖掘、利用豐富的領域特定知識。目前,獲取軟件項目中領域特定知識對復用者而言是一個費時費力的過程,過程中包含如下兩個主要困難:
1)軟件資源數據通常是多源異構的。多種類型的數據并存帶來了信息孤島問題,軟件資源數據之間隱含的多種關聯關系有待挖掘;
2)許多軟件資源數據以自然語言的形式存在,機器并不能很好理解其語義信息,這給相關資源的檢索帶來了很大困難。
鑒于以上,由于現有技術并不能有效組織、關聯軟件項目中的領域特定知識,導致復用者在獲取軟件項目資源的過程中耗費大量精力。因此,研究一種軟件項目知識圖譜自動構造方法是十分必要的。
知識圖譜本質上是一種語義網絡,其頂點代表實體和概念,邊代表實體/概念之間的各種語義關系。它實現了對客觀世界從字符串描述到結構化語義描述的轉換,是對客觀世界的知識映射。
發明內容
本發明提供了一種軟件項目知識圖譜自動構造方法與系統。該方法能適用于不同數據類型的軟件資源,適用范圍廣,可擴展性強。
本發明旨在自動構造軟件項目知識圖譜,將知識圖譜的優勢發揮在軟件開發領域。特別的,在軟件項目知識圖譜中,可以直接通過對單類型軟件資源解析得到的知識定義為基礎知識;將通過數據挖掘方法,對基礎知識進行關聯和擴展而得的知識定義為衍生知識。
本發明的技術方案為:
一種軟件項目知識圖譜自動構造方法,其步驟為:
1)添加數據解析插件。對原始軟件資源數據進行解析,得到軟件項目的基礎知識實體及其關聯,以頂點和邊的形式存儲在圖數據庫(例如Neo4j)中。優選地,每種軟件資源數據的解析方法以插件形式存在。
2)添加知識提煉插件。在已有基礎知識實體及其關聯的基礎上,利用插件在基礎知識實體之間建立新的關聯,和/或在知識圖譜中添加新的基礎知識實體及其關聯。以頂點和邊的形式存儲在圖數據庫(例如Neo4j)中。優選地,知識提煉方法同樣以插件形式存在。
3)選擇步驟1)、步驟2)得到的部分或全部基礎知識實體及其關聯,構成軟件項目知識圖譜。該步驟可通過選擇需要的插件,運行生成軟件項目知識圖譜。
進一步地,本發明提出的軟件項目知識圖譜自動構造方法基于開源的Spring框架,支持動態靈活地添加兩種類型的插件(數據解析插件、知識提煉插件)。以下介紹本發明實現的插件。在使用中,也可以按照用戶需要動態選擇部分插件運行。
進一步地,步驟1)包括以下子步驟:
1-1)軟件項目源代碼解析。具體可分為以下三個步驟:
1-1-1)使用Eclipse JDT將Java編寫的軟件項目源代碼解析為抽象語法樹;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711307630.3/2.html,轉載請聲明來源鉆瓜專利網。





