[發(fā)明專利]開源社區(qū)中輔助工具停用的預(yù)測方法及裝置有效
| 申請?zhí)枺?/td> | 202010989416.6 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112114795B | 公開(公告)日: | 2022-02-11 |
| 發(fā)明(設(shè)計)人: | 蔣競;劉征宇;王鑫;張莉 | 申請(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號: | G06F8/33 | 分類號: | G06F8/33;G06F40/289 |
| 代理公司: | 北京天達知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11386 | 代理人: | 龐許倩 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 社區(qū) 輔助工具 停用 預(yù)測 方法 裝置 | ||
本發(fā)明涉及一種開源社區(qū)中輔助工具停用的預(yù)測方法及裝置,屬于計算機科學(xué)技術(shù)領(lǐng)域,解決了現(xiàn)有的預(yù)測方法中項目對輔助工具使用/停用定義較為模糊且獲取的特征較少,造成無法準(zhǔn)確合理的預(yù)測輔助工具停用的問題。方法包括:獲取項目數(shù)據(jù)和項目使用輔助工具的數(shù)據(jù),得到歷史數(shù)據(jù)集;基于歷史數(shù)據(jù)集提取項目使用輔助工具的有效特征,生成特征向量,并基于特征向量得到輸入矩陣;基于輸入矩陣及XGBoost算法分類器構(gòu)建輔助工具停用預(yù)測模型PATPredict;利用輔助工具停用預(yù)測模型PATPredict對目標(biāo)項目使用的目標(biāo)輔助工具進行停用預(yù)測,得到停用預(yù)測結(jié)果,能夠快速高效的得到預(yù)測結(jié)果,提高了預(yù)測結(jié)果的精確度。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機科學(xué)技術(shù)領(lǐng)域,尤其涉及一種開源社區(qū)中輔助工具停用的預(yù)測方法及裝置。
背景技術(shù)
開源社區(qū)又稱開放源代碼社區(qū),是根據(jù)相應(yīng)的開源軟件許可證協(xié)議公布軟件源代碼的平臺,同時也是開發(fā)人員自由學(xué)習(xí)交流的空間。典型的開源軟件社區(qū)有GitHub、開源中國等,其中GitHub是全球最大的開源軟件項目托管平臺。
現(xiàn)有的研究表明項目使用開源社區(qū)中的輔助工具是一個普遍現(xiàn)象,并且輔助工具停用也是一個重要現(xiàn)象,但仍具有以下缺陷:現(xiàn)有技術(shù)中選取的用于開源社區(qū)輔助工具停用預(yù)測的相關(guān)信息較少,導(dǎo)致對大量輔助工具停用預(yù)測得到的預(yù)測結(jié)果準(zhǔn)確率低;開源社區(qū)項目對輔助工具使用/停用情況較為模糊,現(xiàn)有技術(shù)提出的模型無法準(zhǔn)確合理的預(yù)測輔助工具停用現(xiàn)象的發(fā)生。
發(fā)明內(nèi)容
鑒于上述的分析,本發(fā)明實施例旨在提供一種開源社區(qū)中輔助工具停用的預(yù)測方法,用以解決現(xiàn)有的方法中獲取的特征較少造成無法準(zhǔn)確合理的預(yù)測輔助工具停用的問題。
一方面,本發(fā)明實施例提供了一種開源社區(qū)中輔助工具停用的預(yù)測方法,包括如下步驟:
獲取項目數(shù)據(jù)和項目使用輔助工具的數(shù)據(jù),得到歷史數(shù)據(jù)集;
基于所述歷史數(shù)據(jù)集提取項目使用輔助工具的有效特征,生成特征向量,并基于所述特征向量得到輸入矩陣;
基于所述輸入矩陣及XGBoost算法分類器構(gòu)建輔助工具停用預(yù)測模型PATPredict;
利用所述輔助工具停用預(yù)測模型PATPredict對目標(biāo)項目使用的目標(biāo)輔助工具進行停用預(yù)測,得到停用預(yù)測結(jié)果。
進一步,從項目屬性、項目使用目標(biāo)輔助工具的效果、輔助工具屬性和項目使用輔助工具的特點四個維度提取所述歷史數(shù)據(jù)集的有效特征。
進一步,基于所述項目屬性維度提取的有效特征包括:項目使用的編程語言、項目是否為組織項目、項目是否有wiki介紹網(wǎng)站、項目是否有官方網(wǎng)站、項目在GitHub是否有主頁、項目年齡、項目創(chuàng)建年份,項目包含的開源許可證、未停用輔助工具的項目描述的最大文本相似度、未停用輔助工具的項目描述的平均文本相似度、停用輔助工具的項目描述的最大文本相似度、停用輔助工具的項目描述的平均文本相似度;
基于所述項目使用目標(biāo)輔助工具的效果維度提取的有效特征包括:項目使用輔助工具執(zhí)行結(jié)果的成功占比、失敗占比、錯誤占比、輔助工具執(zhí)行狀態(tài)為pending占任務(wù)數(shù)量的比例、輔助工具執(zhí)行的最長任務(wù)時間、平均任務(wù)時間、項目使用輔助工具的commit數(shù)量、貢獻請求數(shù)量、項目包含輔助工具名稱關(guān)鍵字的貢獻請求數(shù)量、項目貢獻者數(shù)量;
基于所述輔助工具屬性維度提取的有效特征包括:輔助工具名稱、輔助工具類別、輔助工具是否在GitHub商店中注冊;
基于所述項目使用輔助工具的特點維度提取的有效特征包括:項目使用的輔助工具數(shù)量、項目停用的輔助工具數(shù)量。
進一步,基于所述輸入矩陣及XGBoost算法構(gòu)建輔助工具停用預(yù)測模型PATPredict,包括如下步驟:
為所述輸入矩陣添加項目是否停用輔助工具的標(biāo)簽,所述標(biāo)簽包括停用和不停用;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010989416.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





