[發明專利]適用于海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法在審
| 申請號: | 202110281981.1 | 申請日: | 2021-03-16 |
| 公開(公告)號: | CN112905478A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 陳翔;葛驊;陳曉紅;賈焱鑫;林浩 | 申請(專利權)人: | 南通大學 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F16/35;G06F40/284;G06F40/211 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 沈海霞 |
| 地址: | 226019 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 適用于 海量 均衡 缺陷 報告 軟件 嚴重 程度 預測 方法 | ||
本發明公開了一種適用于海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法,包括以下步驟:1.構建缺陷報告數據集DBR;步驟2.構建缺陷報告樣本集;步驟3.利用borderline?smote算法實現建缺陷報告樣本集中的樣本均衡;步驟4.利用均衡后的缺陷報告樣本集訓練邏輯回歸模型得到缺陷報告嚴重程度預測模型;步驟5.利用缺陷報告嚴重程度預測模型對新缺陷報告進行預測:利用引入了維基百科的語料庫的bert模型將缺陷報告中描述信息生成僅有768維句子向量,同時利用borderline?smote算法實現了由句子向量及嚴重程度構成的樣本集中各類樣本的均衡,提高軟件缺陷嚴重程度預模型的訓練效率及檢測準確性。
技術領域
本發明屬于軟件質量保障領域,尤其涉及適用于海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法。
背景技術
軟件缺陷報告嚴重程度預測通過挖掘軟件歷史庫(例如版本控制系統、缺陷跟蹤系統等),構建軟件缺陷報告嚴重程度預測模型,來自動標注軟件缺陷報告嚴重程度,通過根據軟件缺陷報告嚴重程度將相應的軟件缺陷分配給合適的開發人員,可以優化軟件缺陷修復資源的分配,從而有效地提高軟件產品的質量。
邏輯回歸模型屬于分類模型,利用邏輯回歸算法構建軟件缺陷報告嚴重程度預測模型時,軟件在使用過程中由于使用者、運行環境的各異性造成了大量的缺陷報告,如果直接對缺陷報告簡單地去除特殊字符,分詞,詞頻統計,向量化(數值向量)會形成海量的訓練樣本,導致了軟件缺陷報告嚴重程度預測模型訓練效率低下;另外由于大量的缺陷報告構建的訓練樣本存在正負樣本不均衡問題,經過不均勻樣本訓練出來的軟件缺陷報告嚴重程度預測模型在后期進行預測時會導致預測不準確的問題。
發明內容
為了解決上述問題,本發明提供一種適用于海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法,利用引入了維基百科的語料庫的bert模型將缺陷報告中描述信息summary生成僅有768維句子向量,同時利用borderline-smote算法實現了由句子向量及嚴重程度severity構成的樣本集中各類樣本的均衡,本發明在bert模型訓練階段,引入外部大型語料庫,可以使缺陷報告的語義信息被充分利用同時大大降低了樣本集的維度,提高了后面軟件缺陷報告嚴重程度預測模型的訓練效率;另外borderline-smote算法緩解了缺陷報告數據集各類別數量不平衡問題給模型性能帶來的負面影響,提高軟件缺陷嚴重程度預模型的訓練效率及檢測準確性。
為了實現以上目的,本發明采取的一種技術方案是:
一種適用于海量不均衡缺陷報告的軟件缺陷嚴重程度預測方法,所述預測方法包括以下步驟:
步驟1.構建缺陷報告數據集DBR:
從項目所托管的軟件缺陷跟蹤系統中搜集歷史缺陷報告,針對每一份缺陷報告抽取所述缺陷報告中描述信息summary和嚴重程度severity兩個屬性的信息,構建缺陷報告數據集DBR;
步驟2.構建缺陷報告樣本集:
對所述缺陷報告數據集DBR的嚴重程度severity進行預處理得到新缺陷報告數據集D′BR,利用訓練好的bert模型處理新缺陷報告數據集D′BR中描述信息summary得到句子向量集,利用句子向量集和嚴重程度severity構建缺陷報告樣本集,所述構建缺陷報告樣本集中的單個樣本由句子向量和嚴重程度severity組成;
步驟3.利用borderline-smote算法實現建缺陷報告樣本集中的樣本均衡;
步驟4.利用均衡后的缺陷報告樣本集訓練邏輯回歸模型得到缺陷報告嚴重程度預測模型;
步驟5.利用缺陷報告嚴重程度預測模型對新缺陷報告進行預測:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學,未經南通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110281981.1/2.html,轉載請聲明來源鉆瓜專利網。





