[發明專利]一種面向軟件缺陷預測的特征聚類選擇方法在審
| 申請號: | 201710788664.2 | 申請日: | 2017-09-04 |
| 公開(公告)號: | CN107577605A | 公開(公告)日: | 2018-01-12 |
| 發明(設計)人: | 江國華;李麗媛 | 申請(專利權)人: | 南京航空航天大學 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 211106 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 軟件 缺陷 預測 特征 選擇 方法 | ||
1.一種應用于軟件缺陷預測的特征聚類選擇方法,其特征在于:
1)本發明首次提出一種結合聚類和特征子集選擇的特征降維方法,顯著提高了軟件預測模型的預測精度;
2)本方法首先對樣本數據集進行聚類分析,得到聚類結果;
3)本方法基于樣本聚類的結果,進行包裝式特征子集選擇,得到最優特征子集。
2.如權利要求1所述,本發明首次提出一種特征選擇方法,結合了聚類和特征子集選擇的方法。本方法的特征在于以下幾個步驟:
步驟一:從軟件項目集中抽取軟件模塊和特征數據,標記部分缺陷信息,形成初始可預測樣本數據集;
步驟二:對樣本數據集進行聚類分析,聚類算法可以將樣本數據分成不同的簇;
步驟三:利用聚類結果輔助特征選擇,在不同簇中使用特征子集選擇方法,選出最優子集;
步驟四:利用最優特征子集,削減構成新的樣本數據集,構建軟件缺陷預測模型。
此方法首先通過特征聚類可以將相似的樣本數據集中在相同簇中,然后,本發明在簇中采用了包裝式的特征子集選擇方法。因為聚類方法是將相關性強的樣本聚為一簇,那么相同簇中的特征,尤其是與類標間相關性較大的一些特征,有較大概率存在冗余。而本發明采用在簇中進行包裝式的特征子集選擇將會進一步降低特征間冗余度,并且選出預測能力更強的特征,提高軟件缺陷分類精確度。
3.如權利要求2所述的特征聚類方法,其特征在于:本聚類方法的主要目的是通過聚類減小不同簇中樣本的相關性。為了區分軟件模塊有無缺陷,將樣本聚為兩簇,同一簇中樣本相關性較強,有較大概率存在冗余,不同簇中樣本間相關性較低。以此為基礎進行后續特征子集的選擇,不僅區分了樣本間的相關性,得出冗余關系;而且降低了子集搜索的空間,化大為小,使得算法效率更高。
4.如權利要求3所述,基于特征聚類的結果進行特征子集選擇,不僅能有效去除無關特征,而且降低了特征間的冗余度。搜索時根據特征的預測能力以及它們之間的相關性進行評估,傾向于選擇預測能力強且相互間冗余度低的特征。我們使用啟發式搜索算法,以后續分類器的性能作為評價標準。最終得出包含更少特征的最優特征子集。最后可以基于選擇出的最優特征子集,構建缺陷預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710788664.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種提升電器柜外觀規范程度的標識貼附模具
- 下一篇:一種不干膠貼標機





