[發明專利]開源社區中輔助工具停用的預測方法及裝置有效
| 申請號: | 202010989416.6 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112114795B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 蔣競;劉征宇;王鑫;張莉 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F8/33 | 分類號: | G06F8/33;G06F40/289 |
| 代理公司: | 北京天達知識產權代理事務所(普通合伙) 11386 | 代理人: | 龐許倩 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社區 輔助工具 停用 預測 方法 裝置 | ||
1.一種開源社區中輔助工具停用的預測方法,其特征在于,包括如下步驟:
獲取開源社區中的項目數據和項目使用輔助工具的數據,得到歷史數據集;從項目屬性、項目使用目標輔助工具的效果、輔助工具屬性和項目使用輔助工具的特點四個維度提取所述歷史數據集的有效特征;
基于所述項目屬性維度提取的有效特征包括:項目使用的編程語言、項目是否為組織項目、項目是否有wiki介紹網站、項目是否有官方網站、項目在GitHub是否有主頁、項目年齡和項目創建年份,項目包含的開源許可證、未停用輔助工具的項目描述的最大文本相似度、未停用輔助工具的項目描述的平均文本相似度、停用輔助工具的項目描述的最大文本相似度和停用輔助工具的項目描述的平均文本相似度;
基于所述項目使用目標輔助工具的效果維度提取的有效特征包括:項目使用輔助工具執行結果的成功占比、失敗占比和錯誤占比,輔助工具執行狀態為pending占任務數量的比例,輔助工具執行的最長任務時間和平均任務時間,項目使用輔助工具的commit數量和貢獻請求數量,項目包含輔助工具名稱關鍵字的貢獻請求數量和項目貢獻者數量;
基于所述輔助工具屬性維度提取的有效特征包括:輔助工具名稱、輔助工具類別和輔助工具是否在GitHub商店中注冊;
基于所述項目使用輔助工具的特點維度提取的有效特征包括:項目使用的輔助工具數量和項目停用的輔助工具數量;
所述停用指使用過輔助工具的項目在最后活動的90天內沒有使用所述輔助工具;
基于所述歷史數據集提取項目使用輔助工具的有效特征,生成特征向量,并基于所述特征向量得到輸入矩陣;
基于所述輸入矩陣及XGBoost算法分類器構建輔助工具停用預測模型PATPredict;
利用所述輔助工具停用預測模型PATPredict對目標項目使用的目標輔助工具進行停用預測,得到停用預測結果。
2.根據權利要求1所述的開源社區中輔助工具停用的預測方法,其特征在于,基于所述輸入矩陣及XGBoost算法構建輔助工具停用預測模型PATPredict,包括如下步驟:
為所述輸入矩陣添加項目是否停用輔助工具的標簽,所述標簽包括停用和不停用;
將所述輸入矩陣及對應的標簽輸入XGBoost算法分析器進行模型訓練,得到輔助工具停用預測模型PATPredict。
3.根據權利要求1所述的開源社區中輔助工具停用的預測方法,其特征在于,利用所述輔助工具停用預測模型PATPredict對目標項目使用的輔助工具進行停用預測,得到停用預測結果,包括如下步驟:
獲取所述目標項目對應的項目數據及目標項目使用輔助工具的數據,得到待預測歷史數據集;
基于所述待預測歷史數據集提取目標項目使用輔助工具的有效特征,生成待預測特征向量,并基于所述待預測特征向量得到待預測輸入矩陣;
將所述待預測輸入矩陣輸入輔助工具停用預測模型PATPredict,得到預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010989416.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電力配電線路轉換裝置
- 下一篇:一種智能化控制的大數據圖像拍攝裝置





