[發(fā)明專(zhuān)利]基于P-K的軟件缺陷預(yù)測(cè)方法、裝置、電子設(shè)備及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011077409.5 | 申請(qǐng)日: | 2020-10-10 |
| 公開(kāi)(公告)號(hào): | CN114428720A | 公開(kāi)(公告)日: | 2022-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 王婷婷 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)石油化工股份有限公司;中國(guó)石油化工股份有限公司石油物探技術(shù)研究院 |
| 主分類(lèi)號(hào): | G06F11/36 | 分類(lèi)號(hào): | G06F11/36;G06K9/62 |
| 代理公司: | 北京思創(chuàng)畢升專(zhuān)利事務(wù)所 11218 | 代理人: | 孫向民;廉莉莉 |
| 地址: | 100027 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 軟件 缺陷 預(yù)測(cè) 方法 裝置 電子設(shè)備 介質(zhì) | ||
本申請(qǐng)公開(kāi)了一種基于P?K的軟件缺陷預(yù)測(cè)方法、裝置、電子設(shè)備及介質(zhì)。該方法可以包括:收集軟件歷史缺陷數(shù)據(jù),將軟件歷史缺陷數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集;針對(duì)訓(xùn)練數(shù)據(jù)集內(nèi)的度量元進(jìn)行降維,獲得特征向量;根據(jù)降維后的訓(xùn)練數(shù)據(jù)集與特征向量,進(jìn)行KNN分類(lèi)訓(xùn)練;調(diào)整降維參數(shù)與KNN參數(shù),獲得最優(yōu)模型;根據(jù)最優(yōu)模型,針對(duì)測(cè)試數(shù)據(jù)集內(nèi)的度量元進(jìn)行降維,并進(jìn)行KNN分類(lèi)訓(xùn)練,預(yù)測(cè)測(cè)試數(shù)據(jù)集的缺陷。本發(fā)明解決了度量元的維數(shù)問(wèn)題,較好的解決軟件缺陷預(yù)測(cè)的準(zhǔn)確度,為軟件缺陷預(yù)測(cè)提供可行方法,能夠?qū)浖到y(tǒng)做出缺陷數(shù)目預(yù)測(cè),為制定軟件測(cè)試計(jì)劃提供參考指標(biāo),更好的規(guī)劃人力和時(shí)間。
技術(shù)領(lǐng)域
本發(fā)明涉及軟件測(cè)試及數(shù)據(jù)挖掘領(lǐng)域,更具體地,涉及一種基于P-K的軟件缺陷預(yù)測(cè)方法、裝置、電子設(shè)備及介質(zhì)。
背景技術(shù)
從1970年開(kāi)始,軟件缺陷預(yù)測(cè)技術(shù)開(kāi)始發(fā)展;隨著軟件系統(tǒng)規(guī)模變得越來(lái)越大,邏輯日趨復(fù)雜,軟件缺陷也勢(shì)必增加,影響軟件質(zhì)量,由于軟件缺陷預(yù)測(cè)幫助測(cè)試人員了解軟件的狀態(tài)和質(zhì)量,幫助制定交付標(biāo)準(zhǔn),所以軟件缺陷的預(yù)測(cè)也變得重要起來(lái)。
目前,軟件缺陷預(yù)測(cè)分為靜態(tài)和動(dòng)態(tài)兩種預(yù)測(cè)方法。隨著軟件迭代更新次數(shù)以及同類(lèi)軟件的增多,基于軟件歷史開(kāi)發(fā)數(shù)據(jù)及發(fā)現(xiàn)的缺陷數(shù),進(jìn)行缺陷數(shù)目、類(lèi)型、分布的預(yù)測(cè)成為一種切實(shí)可行方法。研究指出影響缺陷預(yù)測(cè)有3個(gè)因素,度量元的選取、缺陷預(yù)測(cè)模型的構(gòu)建方法和數(shù)據(jù)集。也就是根據(jù)缺陷相關(guān)的度量元數(shù)據(jù)(代碼行數(shù)、類(lèi)數(shù)、方法數(shù)等),選擇適當(dāng)預(yù)測(cè)模型,選擇適當(dāng)?shù)臄?shù)據(jù)集可以有效的提高缺陷預(yù)測(cè)的轉(zhuǎn)去額度。本文就基于以上靜態(tài)缺陷預(yù)測(cè)方法展開(kāi)研究。
怎么樣從大量的開(kāi)發(fā)歷史數(shù)據(jù)中找到與缺陷相關(guān)的數(shù)據(jù),也就是度量元選取問(wèn)題變成首要問(wèn)題,這就涉及到數(shù)據(jù)挖掘領(lǐng)域。現(xiàn)在主要運(yùn)用的是PCA,LDA,LLE以及ICA等方法。其中PCA(Principle Component Analysis),主成分分析法,常用于提取數(shù)據(jù)的主要特征分量,用來(lái)對(duì)高維數(shù)據(jù)進(jìn)行降維,提高運(yùn)算效率。
對(duì)于靜態(tài)軟件缺陷預(yù)測(cè)技術(shù),有分類(lèi)、回歸和基于神經(jīng)網(wǎng)絡(luò)的貝葉斯、CNN、DNN等方法,這就涉及預(yù)測(cè)模型選取問(wèn)題。由于基于復(fù)雜神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型的時(shí)間會(huì)較長(zhǎng),對(duì)機(jī)器性能要求較高,所以本文暫不探索研究。KNN(k-NearestNeighbor),k最近鄰是監(jiān)督型分類(lèi)器,對(duì)有標(biāo)記的數(shù)據(jù)進(jìn)行訓(xùn)練得到模型,根據(jù)此模型對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測(cè),得到標(biāo)簽(label)。
因此,有必要開(kāi)發(fā)一種基于PCA-KNN的軟件缺陷預(yù)測(cè)方法、裝置、電子設(shè)備及介質(zhì)。
公開(kāi)于本發(fā)明背景技術(shù)部分的信息僅僅旨在加深對(duì)本發(fā)明的一般背景技術(shù)的理解,而不應(yīng)當(dāng)被視為承認(rèn)或以任何形式暗示該信息構(gòu)成已為本領(lǐng)域技術(shù)人員所公知的現(xiàn)有技術(shù)。
發(fā)明內(nèi)容
本發(fā)明提出了一種基于P-K的軟件缺陷預(yù)測(cè)方法、裝置、電子設(shè)備及介質(zhì),其能夠解決了度量元的維數(shù)問(wèn)題,較好的解決軟件缺陷預(yù)測(cè)的準(zhǔn)確度,為軟件缺陷預(yù)測(cè)提供可行方法,能夠?qū)浖到y(tǒng)做出缺陷數(shù)目預(yù)測(cè),為制定軟件測(cè)試計(jì)劃提供參考指標(biāo),更好的規(guī)劃人力和時(shí)間。
第一方面,本公開(kāi)實(shí)施例提供了一種基于P-K的軟件缺陷預(yù)測(cè)方法,包括:
收集軟件歷史缺陷數(shù)據(jù),將所述軟件歷史缺陷數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集;
針對(duì)所述訓(xùn)練數(shù)據(jù)集內(nèi)的度量元進(jìn)行降維,獲得特征向量;
根據(jù)降維后的訓(xùn)練數(shù)據(jù)集與所述特征向量,進(jìn)行KNN分類(lèi)訓(xùn)練;
調(diào)整降維參數(shù)與KNN參數(shù),獲得最優(yōu)模型;
根據(jù)所述最優(yōu)模型,針對(duì)所述測(cè)試數(shù)據(jù)集內(nèi)的度量元進(jìn)行降維,并進(jìn)行KNN分類(lèi)訓(xùn)練,預(yù)測(cè)所述測(cè)試數(shù)據(jù)集的缺陷。
優(yōu)選地,針對(duì)所述訓(xùn)練數(shù)據(jù)集內(nèi)的度量元進(jìn)行降維,獲得特征向量包括:
通過(guò)PCA主成分分析技術(shù),將高維數(shù)據(jù)進(jìn)行特征選擇,去冗余,獲得前k個(gè)特征值對(duì)應(yīng)的特征向量。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)石油化工股份有限公司;中國(guó)石油化工股份有限公司石油物探技術(shù)研究院,未經(jīng)中國(guó)石油化工股份有限公司;中國(guó)石油化工股份有限公司石油物探技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011077409.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 一種基于應(yīng)用軟件散布的軟件授權(quán)與保護(hù)方法及系統(tǒng)
- 一種用于航空機(jī)載設(shè)備的軟件在線(xiàn)加載系統(tǒng)及方法
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 惡意軟件檢測(cè)方法及裝置
- 一種基于軟件基因的軟件同源性分析方法和裝置
- 軟件引入系統(tǒng)、軟件引入方法及存儲(chǔ)介質(zhì)
- 軟件驗(yàn)證裝置、軟件驗(yàn)證方法以及軟件驗(yàn)證程序
- 使用靜態(tài)和動(dòng)態(tài)惡意軟件分析來(lái)擴(kuò)展惡意軟件的動(dòng)態(tài)檢測(cè)
- 一種工業(yè)控制軟件構(gòu)建方法和軟件構(gòu)建系統(tǒng)
- 可替換游戲軟件與測(cè)驗(yàn)軟件的裝置與方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類(lèi)預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





