[發明專利]一種組合式軟件缺陷報告分類方法有效
| 申請號: | 201410250512.3 | 申請日: | 2014-06-09 |
| 公開(公告)號: | CN104021180B | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 周宇;童燕翔;古睿航 | 申請(專利權)人: | 南京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F9/44 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙)32249 | 代理人: | 賈郡 |
| 地址: | 210016*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 組合式 軟件 缺陷 報告 分類 方法 | ||
技術領域
本發明涉及一種軟件缺陷報告分類方法,屬于計算機軟件開發領域。
背景技術
軟件缺陷是衡量軟件質量的重要指標,缺陷的及時修復對提高用戶滿意度相當重要。為了有效的管理軟件缺陷,通常使用缺陷跟蹤系統(BTS)來管理軟件缺陷以及需求。當一個軟件發布以后,相應的BTS就負責收集程序測試人員或者終端用戶提交的對軟件缺陷的描述報告,軟件的開發人員可以通過這些報告對軟件進行適當的維護和完善。
軟件開發人員最需要維護的是修正性缺陷(bug),這些缺陷涉及到代碼的修改,對系統的運行至關重要。相對而言,那些對系統功能的期望,即提高型或者完善型的缺陷(non-bug)可緩一步進行或者可不需維護。然而,提交缺陷報告人員的軟件知識水平參差不齊,大多數非軟件行業的終端用戶對于任何使用過程中出現的不盡如人意的地方都會認為是修正性缺陷,這就向BTS里添加了很多維護的噪聲,同時也為基于軟件缺陷報告的科學研究引入了偏差。
過去的缺陷預測重點在于模型的建立,通過改良模型不斷的提高預測的精確度,卻忽視了數據源本身的優良。缺陷預測所使用的大多數的數據庫都是由BTS等提供源數據。由上述可知,數據庫里存在可觀的噪聲。眾所周知,軟件缺陷預測的關鍵就是訓練集和測試集,數據庫里的噪聲必然引入誤差。為了減少誤差,數據源的降噪處理變得尤為重要。
近年,缺陷預測開始涉及到對數據的處理上。目前通過人工標記和監督式學習,已經可以高效的預測缺陷報告是否為修正型缺陷。一般地,軟件缺陷報告的特征屬性分為結構型屬性,如編號ID、優先級(priority)、嚴重性(severity)等和非結構型或者是半結構型屬性,如小結(summary)、描述(div)、討論(discussion)。一般對于它的預測要么是基于結構型的屬性,利用機器學習的方法進行預測;要么是基于非結構型屬性,利用文本挖掘的技術進行預測;或者是將結構性的屬性與非結構型的屬性處理成文本信息,在進行文本挖掘。
發明內容
本發明的目的在于提供一個組合式缺陷報告分類方法,通過濾除非修正性缺陷報告,達到降低缺陷數據庫的噪聲、提高缺陷預測研究精確度的目的。
為了達到上述目的,本發明組合式軟件缺陷報告分類方法包括以下步驟:
1)提取該軟件缺陷報告的非結構型特征屬性,并進行預處理而得到特征詞集合;
2)利用監督式的文本挖掘技術預測所述特征詞集合所描述的內容傾向于修正性缺陷報告的程度等級;
3)將所述程度等級的預測結果與該軟件缺陷報告的編號與有用的結構型特征屬性相結合,生成一新的軟件缺陷報告;
4)利用數據挖掘的方法預測新的軟件缺陷報告是否為修正性缺陷報告。
進一步的,步驟1)中僅提取非結構型特征屬性的小結。
進一步的,對所述小結進行分詞、去停用詞和提取詞干的處理,且停用詞根據文本特性自由添加。
進一步的,利用貝葉斯多項式預測非結構型屬性偏向于修正性缺陷的程度等級,并使用十倍交叉驗證。而且,在所述十倍交叉驗證中,每次迭代都有九份數據是人工標引的實例,且所述人工標引的實例由相應特征詞集合和對應的程度等級標引組成。
進一步的,所述非結構型屬性的十倍交叉驗證的十份數據由編寫的代碼完成分割,從而便于對對應的軟件缺陷報告編號ID進行追蹤。
進一步的,在步驟4)中利用貝葉斯網絡對缺陷報告進行預測,并使用十倍交叉驗證,且所述十倍交叉由機器學習工具完成。且在該十倍交叉驗證中,每次迭代都有九份數據是人工標引的實例,且所述人工標引的實例是由相應新的軟件缺陷報告的有用的結構型特征屬性以及新的缺陷報告是否為修正性缺陷的分類組成。
由上可知,本發明通過分析軟件缺陷報告來判斷缺陷的類型是否為修正性缺陷,通過濾除非修正性的缺陷,降低缺陷數據庫的噪聲,從而提高基于缺陷報告數據庫的缺陷預測研究的精確度。
附圖說明
圖1是本發明組合式軟件缺陷報告分類方法的流程圖;
圖2是圖1實施例的數據嫁接算法的偽代碼實現;
圖3是圖1實施例中合成新軟件缺陷報告的示意圖。
具體實施方式
下面結合附圖對本發明作更進一步的說明。
以下將結合附圖1,對本發明的技術方案進行詳細說明。
1、第一階段
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410250512.3/2.html,轉載請聲明來源鉆瓜專利網。





