[發(fā)明專利]一種基于混合式主動(dòng)學(xué)習(xí)策略的軟件缺陷預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811319619.3 | 申請(qǐng)日: | 2018-11-07 |
| 公開(kāi)(公告)號(hào): | CN109656808B | 公開(kāi)(公告)日: | 2022-03-11 |
| 發(fā)明(設(shè)計(jì))人: | 曲豫賓;李芳 | 申請(qǐng)(專利權(quán))人: | 江蘇工程職業(yè)技術(shù)學(xué)院 |
| 主分類號(hào): | G06F11/36 | 分類號(hào): | G06F11/36;G06K9/62 |
| 代理公司: | 北京一格知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11316 | 代理人: | 滑春生 |
| 地址: | 226000 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 混合式 主動(dòng) 學(xué)習(xí) 策略 軟件 缺陷 預(yù)測(cè) 方法 | ||
本發(fā)明公開(kāi)了一種基于混合式主動(dòng)學(xué)習(xí)策略的軟件缺陷預(yù)測(cè)方法,采用基于代價(jià)敏感的信息熵與相對(duì)熵協(xié)同主動(dòng)學(xué)習(xí)方法,該方法使用常見(jiàn)的信息熵作為優(yōu)質(zhì)樣例的評(píng)價(jià)指標(biāo),對(duì)于信息熵較高的樣例手工標(biāo)注,同時(shí)使用相對(duì)熵來(lái)進(jìn)一步分析低信息熵的樣例,更加有效的擴(kuò)充標(biāo)注數(shù)據(jù)集。通過(guò)實(shí)驗(yàn)表明,本發(fā)明可以提高軟件缺陷預(yù)測(cè)性能,減少人工標(biāo)注成本,更加高效。
技術(shù)領(lǐng)域
本發(fā)明涉及主動(dòng)學(xué)習(xí)技術(shù)領(lǐng)域,特別是涉及一種基于混合式主動(dòng) 學(xué)習(xí)策略的軟件缺陷預(yù)測(cè)方法。
背景技術(shù)
軟件缺陷模塊會(huì)造成企業(yè)生產(chǎn)過(guò)程中的操作失敗,導(dǎo)致企業(yè)出現(xiàn) 重大損失,降低客戶的滿意度。軟件缺陷預(yù)測(cè)模型用于在軟件開(kāi)發(fā)階 段盡早發(fā)現(xiàn)軟件缺陷模塊,常見(jiàn)模型包括有監(jiān)督的模型以及無(wú)監(jiān)督的 模型等等。
如果軟件項(xiàng)目具有豐富的歷史標(biāo)注數(shù)據(jù),那么就可以通過(guò)建立有 監(jiān)督的機(jī)器學(xué)習(xí)模型,來(lái)構(gòu)建同項(xiàng)目軟件缺陷預(yù)測(cè)(within-project defect prediction)模型,評(píng)估軟件模塊缺陷的概率或者計(jì)算某個(gè)模塊的 缺陷個(gè)數(shù)等等。在實(shí)際軟件開(kāi)發(fā)過(guò)程中,如果軟件項(xiàng)目為全新的項(xiàng)目, 或者這個(gè)項(xiàng)目的訓(xùn)練數(shù)據(jù)比較少,那么需要企業(yè)對(duì)于缺陷模塊標(biāo)記工作投入大量時(shí)間,同時(shí)該工作是專業(yè)性相對(duì)較強(qiáng)的工作,對(duì)于軟件模 塊標(biāo)注需要較為專業(yè)的人員來(lái)進(jìn)行,因此軟件缺陷預(yù)測(cè)模型的建立需 要花費(fèi)大量的時(shí)間,投入較多的人力,提升了軟件開(kāi)發(fā)的成本。
主動(dòng)學(xué)習(xí)為解決樣例標(biāo)注問(wèn)題提供多種查詢策略,使得企業(yè)可以 在面對(duì)海量標(biāo)注模塊時(shí)候主動(dòng)選擇某個(gè)樣例進(jìn)行標(biāo)注,將待標(biāo)注樣例 人工標(biāo)注完成以后加入到標(biāo)注樣例數(shù)據(jù)集中,快速建立軟件缺陷預(yù)測(cè) 模型。主動(dòng)學(xué)習(xí)的選擇策略被用于從軟件缺陷預(yù)測(cè)數(shù)據(jù)集中選擇優(yōu)質(zhì) 樣例,樣例由人工標(biāo)注以后擴(kuò)展訓(xùn)練數(shù)據(jù)集,同時(shí)聯(lián)合使用維度縮減, 特征選擇等其他機(jī)器學(xué)習(xí)方法提升軟件缺陷預(yù)測(cè)的性能。
使用的選擇策略包括不確定度信息熵等常見(jiàn)策略,然而這些研究 中并未關(guān)注低信息熵的樣例,即確定度較高的樣例,在主動(dòng)學(xué)習(xí)一次 查詢過(guò)程中往往低信息熵的樣例被拋棄,對(duì)于低信息熵樣例的利用很 少涉及。
專利號(hào)CN201710271035.2公開(kāi)了一種基于條件依賴標(biāo)簽集的多 標(biāo)簽主動(dòng)學(xué)習(xí)方法,通過(guò)同時(shí)對(duì)樣本信息熵和相對(duì)熵整合,篩選信息 量大的樣本作為主動(dòng)學(xué)習(xí)的對(duì)象,該方法盡管使用了信息熵與相對(duì)熵 共同工作的原理,但在信息熵處理階段同時(shí)加入相對(duì)熵計(jì)算,反而會(huì) 對(duì)系統(tǒng)的運(yùn)行效率及效果產(chǎn)生不利影響,另外低信息熵樣例也沒(méi)有被 很好的利用。
發(fā)明內(nèi)容
為解決人工標(biāo)注成本高,預(yù)測(cè)性能低的問(wèn)題,本發(fā)明提供了一種 基于混合式主動(dòng)學(xué)習(xí)策略的軟件缺陷預(yù)測(cè)方法。
一種基于混合式主動(dòng)學(xué)習(xí)策略的軟件缺陷預(yù)測(cè)方法,其特征在 于,所述基于混合式主動(dòng)學(xué)習(xí)策略的軟件缺陷預(yù)測(cè)方法采用基于代價(jià) 敏感的信息熵與相對(duì)熵協(xié)同主動(dòng)學(xué)習(xí)方法,簡(jiǎn)稱為 UNCERTAINTYKL模型,所述UNCERTAINTYKL模型使用信息熵 作為優(yōu)質(zhì)樣例的評(píng)價(jià)指標(biāo),從未標(biāo)記樣例數(shù)據(jù)中選取信息熵較高的樣 例手工標(biāo)注,同時(shí)使用相對(duì)熵來(lái)進(jìn)一步分析低信息熵的樣例,進(jìn)一步 擴(kuò)充已標(biāo)記數(shù)據(jù)集。
優(yōu)選的,所述UNCERTAINTYKL模型包括以下步驟:
步驟1:通過(guò)信息熵計(jì)算公式計(jì)算每個(gè)未標(biāo)記樣例數(shù)據(jù)的信息熵; 步驟2:通過(guò)計(jì)算公式(1)從未標(biāo)記樣例數(shù)據(jù)中選擇信息熵最高的 數(shù)據(jù)樣例交由領(lǐng)域?qū)<疫M(jìn)行人工標(biāo)注,標(biāo)注完成后加入已標(biāo)記數(shù)據(jù) 集;
步驟3:篩選步驟2中剩余信息熵最低的未標(biāo)記樣例數(shù)據(jù),利用相對(duì) 熵計(jì)算方式進(jìn)行標(biāo)注;
步驟4:預(yù)先設(shè)置一個(gè)相對(duì)熵閾值,若相對(duì)熵低于閾值,則加入該樣 例到已標(biāo)記數(shù)據(jù)集,同時(shí)用預(yù)測(cè)結(jié)果的標(biāo)記作為該數(shù)據(jù)的偽標(biāo)記;若 相對(duì)熵高于閾值,則放棄對(duì)該樣例的處理。
優(yōu)選的,步驟2中所述信息熵最高的數(shù)據(jù)樣例的計(jì)算方式如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇工程職業(yè)技術(shù)學(xué)院,未經(jīng)江蘇工程職業(yè)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811319619.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:基于信息安全的接口mock測(cè)試方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 下一篇:一種應(yīng)用程序接口檢測(cè)方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 主動(dòng)元件及主動(dòng)元件陣列基板
- 主動(dòng)降噪系統(tǒng)、主動(dòng)降噪耳機(jī)及主動(dòng)降噪方法
- 主動(dòng)定位方法及主動(dòng)定位系統(tǒng)
- 主動(dòng)降噪系統(tǒng)及主動(dòng)降噪耳機(jī)
- 主動(dòng)清除系統(tǒng)和主動(dòng)清除方法
- 主動(dòng)筆控制方法及主動(dòng)筆
- 筆尖、主動(dòng)筆和主動(dòng)筆系統(tǒng)
- 主動(dòng)降噪耳機(jī)和主動(dòng)降噪方法
- 主動(dòng)導(dǎo)管及主動(dòng)導(dǎo)管系統(tǒng)
- 主動(dòng)降噪算法及主動(dòng)降噪耳機(jī)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





