[發明專利]面向軟件系統的軟件項目及第三方庫知識圖譜構造方法在審
| 申請號: | 202010077130.0 | 申請日: | 2020-01-23 |
| 公開(公告)號: | CN111241307A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 陳碧歡;彭鑫;趙文耘 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/951;G06F8/36 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 軟件 系統 項目 第三 知識 圖譜 構造 方法 | ||
本發明屬于軟件工程技術領域,具體為面向軟件生態系統的軟件項目及第三方庫知識圖譜構造方法。本發明包括:通過爬取和解析軟件項目的基本信息和版本發布通知獲取軟件項目和軟件項目發布版本的基本知識;通過代碼克隆檢測分析獲取不同軟件項目的發布版本之間的代碼克隆知識;通過爬取和解析軟件項目的缺陷追蹤系統獲取軟件項目發布版本中的缺陷與缺陷修復知識,并分析缺陷與第三方庫API以及代碼克隆的鏈接知識。本發明所構造的軟件項目知識圖譜包括軟件項目、軟件項目發布版本、缺陷與代碼克隆之間的關系等;本發明所構造的面向軟件生態系統的軟件項目及第三方庫知識圖譜能夠支持軟件項目成熟度評估、第三方庫更新推薦、沖突檢測等智能化應用。
技術領域
本發明屬于軟件工程技術領域,具體涉及一種面向軟件生態系統的軟件項目及第三方庫知識圖譜構造方法。
背景技術
開源社區以及企業內部眾多的軟件系統分屬相關的業務領域或分類中,相互競爭、相互依賴,同時存在大量重復代碼和相似功能,構成了復雜的軟件生態系統。從這種軟件生態系統中選擇合適的項目以代碼或第三方庫等方式進行復用是提高軟件開發效率和軟件產品質量的一種重要手段。開發人員在決定是否要復用一個軟件項目時,不僅需要考慮一個軟件項目的多維度知識(例如,軟件項目的業務分類、功能特性、許可證、缺陷等),而且需要考慮類似軟件項目之間的關系(例如,軟件項目之間的功能特性差異、派生關系、代碼克隆等)。此外,在開發人員已經復用了一個軟件項目之后(例如,通過第三方庫依賴的方式、或者通過二次開發的方式),需要根據該軟件項目的版本演化進行產品代碼的協同演化。由此可見,面向軟件生態系統的軟件項目的復用決策和復用演化都需要大量的軟件項目知識。然而,這些知識往往是多源異構的,導致開發人員難以全面地、有效地獲得復用決策和復用演化的知識支持。
知識圖譜將現實世界中的實體、以及實體之間的關聯以圖的形式進行表示,其中節點表示實體,而邊表示實體之間的關聯關系。知識圖譜為知識的表示與理解提供了基礎,從而支持上層的智能化應用。目前,知識圖譜已經在搜索、金融、電商、醫療、安全等領域得到了廣泛應用,例如,谷歌利用知識圖譜提高搜索引擎的效果。
發明內容
本發明的目的在于提供一種面向軟件生態系統的軟件項目及第三方庫知識圖譜構造方法,從而自動構建一個支持軟件項目成熟度評估、自動分類與自動推薦、以及第三方庫更新推薦、缺陷預警與沖突檢測等智能化應用的軟件項目及第三方庫知識圖譜。
本發明提供的面向軟件生態系統的軟件項目及第三方庫知識圖譜構造方法,包括,通過爬取和解析軟件項目的基本信息和版本發布通知獲取軟件項目和軟件項目發布版本的基本知識;在軟件項目是第三方庫的情況下,通過靜態分析第三方庫發布版本的源代碼或者二進制包獲取第三方庫發布版本的API知識、API演化知識、以及API調用知識;在軟件項目是非第三方庫的情況下,通過靜態分析軟件項目發布版本的源代碼或者二進制包獲取軟件項目發布版本調用第三方庫API的知識;通過代碼克隆檢測分析獲取不同軟件項目的發布版本之間的代碼克隆知識;通過爬取和解析軟件項目的缺陷追蹤系統獲取軟件項目發布版本中的缺陷與缺陷修復知識,并分析缺陷與第三方庫API以及代碼克隆的鏈接知識。具體步驟如下。
(1)軟件項目基本知識抽取
軟件項目的基本知識包括編程語言、業務分類、標簽、以及軟件項目之間的派生關系。通過爬蟲爬取項目托管網站或者第三方庫倉庫網站上的所有軟件項目;針對每一個軟件項目,通過網頁包裝器解析結構化的項目托管網站或者第三方庫倉庫網站頁面,從中抽取軟件項目的編程語言、標簽、以及軟件項目之間的派生關系,并通過主題模型從軟件項目的基本描述中提取業務分類。
(2)軟件項目發布版本基本知識抽取
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010077130.0/2.html,轉載請聲明來源鉆瓜專利網。





