[發(fā)明專利]基于LDA模型和PageRank算法建立特征接口有向圖的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410156746.1 | 申請(qǐng)日: | 2014-04-18 |
| 公開(kāi)(公告)號(hào): | CN103927177B | 公開(kāi)(公告)日: | 2017-01-25 |
| 發(fā)明(設(shè)計(jì))人: | 孫小兵;施偉;李斌;李云 | 申請(qǐng)(專利權(quán))人: | 揚(yáng)州大學(xué) |
| 主分類號(hào): | G06F9/44 | 分類號(hào): | G06F9/44 |
| 代理公司: | 南京蘇科專利代理有限責(zé)任公司32102 | 代理人: | 董旭東 |
| 地址: | 225009 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 lda 模型 pagerank 算法 建立 特征 接口 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種項(xiàng)目接口選取方法,特別涉及一種建立特征接口有向圖的方法,屬于軟件工程領(lǐng)域。?
背景技術(shù)
當(dāng)開(kāi)發(fā)人員在開(kāi)發(fā)新的程序時(shí),首先會(huì)根據(jù)需求分析進(jìn)行功能模塊的劃分,之后設(shè)定數(shù)據(jù)單元考慮數(shù)據(jù)庫(kù)等步驟。程序開(kāi)發(fā)過(guò)程中接口的設(shè)置往往也會(huì)出現(xiàn)在開(kāi)發(fā)人員的考慮范疇中,那么在這樣的背景之下,開(kāi)發(fā)人員在進(jìn)行了功能模塊劃分之后,根據(jù)開(kāi)發(fā)人員對(duì)程序的功能描述來(lái)為開(kāi)發(fā)人員推薦程序合適的接口,供開(kāi)發(fā)人員選擇,提高軟件開(kāi)發(fā)效率。目前在軟件開(kāi)發(fā)時(shí),通常會(huì)由項(xiàng)目負(fù)責(zé)人根據(jù)項(xiàng)目需求文檔手動(dòng)設(shè)置接口,在搜索接口時(shí)根據(jù)關(guān)鍵字查找,該方法存在查找不全面,檢索效率不高,對(duì)于代碼重用的實(shí)現(xiàn)不理想。?
本發(fā)明的核心技術(shù)是生成“特征-接口”有向圖,通過(guò)生成的有向圖可以實(shí)現(xiàn)根據(jù)需求的開(kāi)發(fā)的項(xiàng)目特征推薦接口的功能。本發(fā)明的核心技術(shù)需要提取出項(xiàng)目的特征與開(kāi)源軟件庫(kù)中的項(xiàng)目接口的重要性,所使用的技術(shù)包括LDA主題模型和PageRank算法。LDA主題模型是一種概率語(yǔ)言模型,場(chǎng)應(yīng)用于文本建模,從文本中發(fā)現(xiàn)隱藏的主題信息,本發(fā)明中使用LDA主題模型對(duì)開(kāi)源軟件庫(kù)中項(xiàng)目的主題特征進(jìn)行提取。PageRank算法是一種搜索引擎算法,用于衡量特定網(wǎng)頁(yè)相對(duì)于搜索引擎索引中的其他網(wǎng)頁(yè)的重要程度,PageRank算法實(shí)現(xiàn)了鏈接價(jià)值概念作為排名因素,本發(fā)明中PageRank算法應(yīng)用于計(jì)算某個(gè)項(xiàng)目特征下的不同接口的調(diào)用次數(shù),進(jìn)行排名。?
根據(jù)LDA主題的特性,使用該模型提取項(xiàng)目特征。通過(guò)主題模型技術(shù)能夠識(shí)別開(kāi)發(fā)人員的需求特征,同時(shí)獲取開(kāi)源軟件庫(kù)中開(kāi)源項(xiàng)目的特征(主題);利用簡(jiǎn)單的遍歷技術(shù)查找出開(kāi)源軟件中的接口構(gòu)成有向圖。而類比于網(wǎng)頁(yè)鏈接重要性的計(jì)算形式,使用PageRank算法來(lái)計(jì)算項(xiàng)目中接口的重要程度,將項(xiàng)目的主題特征作為主頁(yè)面,而接口作為由主頁(yè)面鏈接的子頁(yè)面。利用PageRank技術(shù)檢索出開(kāi)發(fā)人員需要的對(duì)應(yīng)特征的接口,反饋給開(kāi)發(fā)人員,供其選擇使用。?
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于LDA模型和PageRank算法建立特征接口有向圖的方法,根據(jù)開(kāi)發(fā)人員提供的程序特征,自動(dòng)從軟件庫(kù)中推薦適合該特征的程序接口供開(kāi)發(fā)人員使用,從而提高了軟件開(kāi)發(fā)的效率,實(shí)現(xiàn)代碼的接口重用。?
本發(fā)明的目的是這樣實(shí)現(xiàn)的:一種基于LDA模型和PageRank算法建立特征接口有向圖的方法,其特征在于,包括如下步驟:?
步驟1)?選取適當(dāng)?shù)拈_(kāi)源軟件庫(kù)作為代碼支持;
步驟2)?對(duì)選取的開(kāi)源軟件庫(kù)中的項(xiàng)目,通過(guò)LDA主題模型提取出項(xiàng)目對(duì)應(yīng)的主題作為該項(xiàng)目的特征集合;
步驟3)?檢索各項(xiàng)目中的接口信息,與各項(xiàng)目對(duì)應(yīng)的特征集合建立聯(lián)系,構(gòu)成由項(xiàng)目特征集合指向項(xiàng)目接口集合的特征-接口有向圖,利用PageRank算法計(jì)算接口在項(xiàng)目?jī)?nèi)部的調(diào)用次數(shù)作為特征-接口有向圖中邊的權(quán)值;
步驟4)?在構(gòu)成特征-接口有向圖后,程序開(kāi)發(fā)人員根據(jù)待開(kāi)發(fā)項(xiàng)目的特征與所述特征-接口有向圖中的特征進(jìn)行匹配,根據(jù)有向圖邊的指向關(guān)系推薦可能的最優(yōu)接口列表供開(kāi)發(fā)人員選擇使用。
作為本發(fā)明的進(jìn)一步限定,簡(jiǎn)化步驟,提高效率,步驟2)的具體方法如下:LDA模型分別對(duì)開(kāi)源軟件庫(kù)中的項(xiàng)目提取主題時(shí),通過(guò)對(duì)于LDA參數(shù)設(shè)置,實(shí)現(xiàn)每次只提取一個(gè)項(xiàng)目,以該項(xiàng)目為一個(gè)文檔庫(kù),通過(guò)LDA模型提取出該項(xiàng)目的主題,然后,依次對(duì)開(kāi)源軟件庫(kù)中的其他開(kāi)源項(xiàng)目使用同樣的方法提取主題;在當(dāng)前需要提取主題的項(xiàng)目中使用LDA模型主題時(shí),將分布值最高的前兩個(gè)主題作為最佳特征集合BestFi,最佳特征集合BestFi作為步驟4)中接口的匹配對(duì)象。?
作為本發(fā)明的進(jìn)一步限定,簡(jiǎn)化步驟,提高效率,步驟3)的具體方法如下:遍歷當(dāng)前項(xiàng)目,檢索出項(xiàng)目文件中的接口并以“文件名.接口名”的形式定位該接口,建立由最佳特征集合BestFi指向接口集合的特征-接口有向圖;特征-接口有向圖建立之后,使用PageRank算法統(tǒng)計(jì)項(xiàng)目中各接口的調(diào)用次數(shù),同時(shí),依據(jù)計(jì)算值大小對(duì)接口進(jìn)行排序。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于揚(yáng)州大學(xué),未經(jīng)揚(yáng)州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410156746.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 光掃描裝置以及圖像形成裝置
- 基于LDA主題模型的中醫(yī)藥數(shù)據(jù)挖掘方法
- 一種用于LDA的外腔鎖模波長(zhǎng)合束裝置和方法
- 高功率板條激光放大器
- 一種基于潛在狄利克雷分配(LDA)模型的關(guān)鍵詞推薦方法和系統(tǒng)
- 一種基于K-means和LDA雙向驗(yàn)證的網(wǎng)絡(luò)行為習(xí)慣聚類方法
- 一種基于word2vec?LDA模型的文本主題詞提取方法
- 一種基于平行語(yǔ)料庫(kù)的跨語(yǔ)種新聞主題相似性對(duì)比方法
- 信息推薦方法及裝置
- 興趣點(diǎn)數(shù)據(jù)獲取方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 信息推薦方法和信息推薦系統(tǒng)
- 一種社交網(wǎng)絡(luò)關(guān)鍵用戶的挖掘方法
- 一種基于SDN的負(fù)載均衡方法、裝置和系統(tǒng)
- 賭博群組的識(shí)別方法和裝置
- 一種基于PageRank算法的路網(wǎng)重要路段篩選方法
- 一種基于耦合鏈接PageRank差異指標(biāo)的提高相互依存網(wǎng)絡(luò)魯棒性的方法
- 一種通過(guò)計(jì)算集群進(jìn)行網(wǎng)頁(yè)排序的方法及裝置
- 一種動(dòng)態(tài)網(wǎng)絡(luò)PageRank值的實(shí)時(shí)跟蹤方法
- 一種識(shí)別核心專利的評(píng)價(jià)方法
- 一種文本分類方法





