[發明專利]基于LDA模型和PageRank算法建立特征接口有向圖的方法有效
| 申請號: | 201410156746.1 | 申請日: | 2014-04-18 |
| 公開(公告)號: | CN103927177B | 公開(公告)日: | 2017-01-25 |
| 發明(設計)人: | 孫小兵;施偉;李斌;李云 | 申請(專利權)人: | 揚州大學 |
| 主分類號: | G06F9/44 | 分類號: | G06F9/44 |
| 代理公司: | 南京蘇科專利代理有限責任公司32102 | 代理人: | 董旭東 |
| 地址: | 225009 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 lda 模型 pagerank 算法 建立 特征 接口 方法 | ||
1.一種基于LDA模型和PageRank算法建立特征接口有向圖的方法,其特征在于,包括如下步驟:
步驟1)?選取適當的開源軟件庫作為代碼支持;
步驟2)?對選取的開源軟件庫中的項目,通過LDA主題模型提取出項目對應的主題作為該項目的特征集合;
步驟3)?檢索各項目中的接口信息,與各項目對應的特征集合建立聯系,構成由項目特征集合指向項目接口集合的特征-接口有向圖,利用PageRank算法計算接口在項目內部的調用次數作為特征-接口有向圖中邊的權值;
步驟4)?在構成特征-接口有向圖后,程序開發人員根據待開發項目的特征與所述特征-接口有向圖中的特征進行匹配,根據有向圖邊的指向關系推薦可能的最優接口列表供開發人員選擇使用。
2.根據權利要求1所述的基于LDA模型和PageRank算法建立特征接口有向圖的方法,其特征在于,步驟2)的具體方法如下:LDA模型對開源軟件庫中的項目提取主題時,通過對于LDA參數設置,實現每次只提取一個項目,以該項目為一個文檔庫,通過LDA模型提取出該項目的主題,然后,依次對開源軟件庫中的其他開源項目使用同樣的方法提取主題;在當前需要提取主題的項目中使用LDA模型提取主題時,將分布值最高的前兩個主題作為最佳特征集合BestFi,最佳特征集合BestFi作為步驟4)中接口的匹配對象。
3.根據權利要求2所述的基于LDA模型和PageRank算法建立特征接口有向圖的方法,其特征在于,步驟3)的具體方法如下:遍歷當前項目,檢索出項目文件中的接口并以“文件名.接口名”的形式定位該接口,建立由最佳特征集合BestFi指向接口集合的特征-接口有向圖;特征-接口有向圖建立之后,使用PageRank算法統計項目中各接口的調用次數,同時,依據計算值大小對接口進行排序。
4.根據權利要求3所述的基于LDA模型和PageRank算法建立特征接口有向圖的方法,其特征在于,步驟4)的具體方法如下:當程序開發人員進行特征匹配時,將開發人員選擇的待開發項目的特征集合f與權利要求2中的最佳特征集合BestFi進行匹配,匹配方法為:將特征集合f中的每一個詞依次匹配BestFi中對應的詞語,當匹配成功詞數占特征集合f總詞數的百分比大于等于50%時,判定特征集合f與所述最佳特征集合BestFi匹配成功,并根據特征-接口有向圖中邊的指向為程序開發人員推薦接口列表供程序開發人員自行選擇;當程序開發人員選擇某個接口之后,根據權利要求3中的定位方式確定具體的接口,并為開發人員推薦該接口。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于揚州大學,未經揚州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410156746.1/1.html,轉載請聲明來源鉆瓜專利網。





