[發明專利]適用于海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法在審
| 申請號: | 202110281981.1 | 申請日: | 2021-03-16 |
| 公開(公告)號: | CN112905478A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 陳翔;葛驊;陳曉紅;賈焱鑫;林浩 | 申請(專利權)人: | 南通大學 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F16/35;G06F40/284;G06F40/211 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 沈海霞 |
| 地址: | 226019 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 適用于 海量 均衡 缺陷 報告 軟件 嚴重 程度 預測 方法 | ||
1.一種適用于海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法,其特征在于,所述預測方法包括以下步驟:
步驟1.構建缺陷報告數據集DBR:
從項目所托管的軟件缺陷跟蹤系統中搜集歷史缺陷報告,針對每一份缺陷報告抽取所述缺陷報告中描述信息summary和嚴重程度severity兩個屬性的信息,構建缺陷報告數據集DBR;
步驟2.構建缺陷報告樣本集:
對所述缺陷報告數據集DBR的嚴重程度severity進行預處理得到新缺陷報告數據集D′BR,利用訓練好的bert模型處理新缺陷報告數據集D′BR中描述信息summary得到句子向量集,利用句子向量集和嚴重程度severity構建缺陷報告樣本集,所述構建缺陷報告樣本集中的單個樣本由句子向量和嚴重程度severity組成;
步驟3.利用borderline-smote算法實現建缺陷報告樣本集中的樣本均衡;
步驟4.利用均衡后的缺陷報告樣本集訓練邏輯回歸模型得到缺陷報告嚴重程度預測模型;
步驟5.利用缺陷報告嚴重程度預測模型對新缺陷報告進行預測:
利用步驟2中訓練好的Bert模型,得到新缺陷報告對應的句子向量,然后輸入步驟4所構建的缺陷報告嚴重程度預測模型,得到新缺陷報告所對應的嚴重程度。
2.根據權利要求1所述的海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法,其特征在于,所述步驟2包含以下步驟:
步驟21:僅保留缺陷報告數據集DBR中嚴重程度severity取值為Blocker、Critical、Major、Minor、Trivial的缺陷報告,忽略嚴重程度severity取值為Normal、Enhancement的缺陷報告,從而形成新缺陷報告數據集D′BR;
步驟22:對新缺陷報告數據集D′BR中嚴重程度severity取值重新定義類別,即將嚴重程度severity取值為Blocker、Critical、Major這三種類別合并為類別1,將嚴重程度severity取值為Minor、Trivial這兩種類別合并為類別0;
步驟23:利用訓練好的bert模型處理新缺陷報告數據集D′BR中的描述信息summary得到句子向量集,利用句子向量集和嚴重程度構建缺陷報告樣本集,所述構建缺陷報告樣本集中的單個樣本由句子向量和嚴重程度組成;其中,在將新缺陷報告數據集D′BR中的描述信息summary輸入到bert模型之前,對描述信息summary進行文本預處理形成分詞向量,所述文本預處理包括對所述描述信息summary進行分詞,還原詞根,去除特殊符號,過濾停用詞。
3.根據權利要求2所述的海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法,其特征在于,所述步驟3包含以下步驟:
步驟31:根據嚴重程度severity獲得缺陷報告樣本集中的較少類樣本,將較少類樣本分為3類,分別為Safe、Danger和Noise類;其中,Safe類是指樣本周圍一半以上均為較少類樣本,Danger類是指樣本周圍一半以上均為較多類樣本,Noise類是指樣本周圍均為較多類樣本;
步驟32:分別對上述3類樣本進行處理,具體步驟如下:
步驟321:針對所述少數類樣本中的每一個Safe類樣本xi及每一個Noise類樣本xi,不進行任何操作;
步驟322:針對所述少數類樣本中的每一個Danger類樣本xi,按采樣倍率N(1≤N≤K)從xi的K近鄰中隨機選擇N個樣本{xyi|1≤y≤N},在xyi和xi之間隨機合成新樣本xn,直至較少樣本的數量和較多樣本的數量相等,從而得到均衡后的缺陷報告樣本集,所述新樣本xn合成公式如下:
xn=xi+β×(xyi-xi);
其中,β為0-1之間的隨機數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學,未經南通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110281981.1/1.html,轉載請聲明來源鉆瓜專利網。





