[發明專利]一種采用加權優化訓練集增強自動Bug報告分配的方法在審
| 申請號: | 201811033587.0 | 申請日: | 2018-09-05 |
| 公開(公告)號: | CN109255029A | 公開(公告)日: | 2019-01-22 |
| 發明(設計)人: | 魏苗苗;陳榮;李輝;郭世凱;唐文君 | 申請(專利權)人: | 大連海事大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/332 |
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
| 地址: | 116026 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 優化訓練 加權 分配 特征選擇算法 工作效率 加權處理 人力成本 時間成本 實例選擇 頻度 數據集 訓練集 冗余 準確率 算法 單詞 噪音 分類 | ||
1.一種采用加權優化訓練集增強自動Bug報告分配的方法,其特征在于:包括以下步驟:
S1:從Bug倉庫中獲取原始訓練集數據,對原始訓練集進行預處理:從原始訓練集中過濾掉低效開發者處理的bug報告,對篩選出的數據集中的bug報告分別提取短描述及第一個長描述作為該bug報告的描述信息,對每個bug報告的描述信息進行分詞去停用詞處理,再將bug報告的短描述和長描述分別處理成文本矩陣SBR和文本矩陣LBR;
S2:對預處理后的Bug報告進行加權處理:即對短描述生成的文本矩陣SBR乘以一個權重值η再與長描述生成的文本矩陣LBR相加,將加權處理后的文本矩陣作為訓練集文本矩陣WBR;
S3:對訓練集文本矩陣WBR進行約簡處理:首先用4種特征選擇算法和4種實例選擇算法分別對訓練集文本矩陣WBR進行維度和行數的約簡,從特征選擇和實例選擇算法中分別挑選最佳約簡算法,將兩個最佳約簡算法進行組合對訓練集文本矩陣WBR進行約簡獲得最終訓練集文本;
S4:對最終訓練集文本采用樸素貝葉斯算法進行學習訓練獲得分類模型;
S5:將新bug報告輸入分類模型內進行分類處理輸出該bug報告的指派開發者。
2.根據權利要求1所述的一種采用加權優化訓練集增強自動Bug報告分配的方法,其特征還在于:所述S2中對預處理后的Bug報告進行加權處理采用如下算法:
上式中η表示對短描述生成的文本矩陣的權重值,m表示訓練集中的bug報告數目,n表示訓練集中不同單詞的數目。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連海事大學,未經大連海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811033587.0/1.html,轉載請聲明來源鉆瓜專利網。





