[發明專利]基于皮爾森相關性加權關聯分類規則的軟件缺陷預測方法有效
| 申請號: | 201911114620.7 | 申請日: | 2019-11-14 |
| 公開(公告)號: | CN111090579B | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 王世海;邵元勛;劉斌;嚴瀟波 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06K9/62 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 曹鵬飛 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 皮爾森 相關性 加權 關聯 分類 規則 軟件 缺陷 預測 方法 | ||
1.一種基于皮爾森相關性加權關聯分類規則的軟件缺陷預測方法,其特征在于,包括:
S1、根據相應靜態代碼分析工具,提取待檢測軟件度量元數據集;
S2、基于皮爾森相關性的特征選擇方法評價每個度量元與類別之間的相關性,并對相關性進行排序,將排序值較大的前30%-50%作為被選擇的度量元;所述類別表示有缺陷傾向類或無缺陷傾向類;
S3、將選擇的度量元與相應的類別,代入基于皮爾森相關性加權關聯分類規則的軟件缺陷預測模型,進行預測并輸出預測結果:
所述基于皮爾森相關性加權關聯分類規則的軟件缺陷預測模型,構建步驟包括:
S31、將獲取的軟件缺陷數據進行預處理,獲得軟件缺陷訓練集和軟件缺陷測試集;所述軟件缺陷訓練集為有缺陷傾向訓練集和無缺陷傾向訓練集;
S32、分別設置有缺陷傾向類最小加權支持度和無缺陷傾向類最小加權支持度,利用加權Apriori算法分別對有缺陷傾向訓練集和無缺陷傾向訓練集構建有缺陷傾向關聯規則集和無缺陷傾向關聯規則集;
S33、對有缺陷傾向關聯規則集和無缺陷傾向關聯規則集進行排序;
S34、利用沖突規則剪枝和冗余規則剪枝方法同時對有缺陷傾向關聯規則集和無缺陷傾向關聯規則集進行規則剪枝優化;
S35、利用優化后的有缺陷傾向關聯規則集和無缺陷傾向關聯規則集對軟件模塊進行預測。
2.如權利要求1所述的預測方法,其特征在于,所述構建步驟還包括:
S36、通過所述測試集對所述基于皮爾森相關性加權關聯分類規則的軟件缺陷預測模型進行驗證。
3.如權利要求1所述的預測方法,其特征在于,所述步驟S31,包括:
S311、根據類別對每個數據集D進行第一次水平劃分,分為有缺陷傾向數據集TS和無缺陷傾向數據集FS;其滿足公式D=TS∪FS和TS∩FS=φ;
S312、對有缺陷傾向數據集TS和無缺陷傾向數據集FS進行第一次垂直劃分,分為有缺陷傾向訓練集TTS、有缺陷傾向測試集Ttest和無缺陷傾向訓練集FTS、無缺陷傾向測試集Ftest;且滿足TS=TTS∪Ttest,TTS∩Ttest=φ,FS=FTS∪Ftest,FTS∩Ftest=φ,D=TTS∪Ttest∪FTS∪Ftest”;所述有缺陷傾向訓練集TTS和無缺陷傾向訓練集FTS構成一個完整的訓練集;
S313、采用基于皮爾森相關性的特征選擇方法,評價所述訓練集的每個特征與類別之間的相關性,并對相關性進行排序,將排序值較大的前30%-50%作為被選擇的特征;
S314、利用5階等頻方法對特征選擇后的訓練集進行離散化處理,將每個特征按著數值屬性的大小順序,將訓練集平均分為五個區間;
S315、將離散化的訓練集DS進行第二次水平劃分,將其劃分為離散化的有缺陷傾向訓練集FDS和離散化的無缺陷傾向訓練集TDS,且滿足DS=FDS∪TDS和FDS∩TDS=φ。
4.如權利要求3所述的預測方法,其特征在于,所述步驟S312包括:
采用5折交叉驗證進行評估,各選取4折作為訓練集,1折作為測試集,每次對數據進行隨機化,并重復10次,對有缺陷傾向數據集TS和無缺陷傾向數據集FS進行第一次垂直劃分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911114620.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于水表止回閥門開度的測速方法
- 下一篇:金屬氧化物薄膜的制備方法





