[發(fā)明專利]一種基于聯(lián)合概率域適應(yīng)的跨項(xiàng)目軟件老化缺陷預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011476590.7 | 申請(qǐng)日: | 2020-12-15 |
| 公開(kāi)(公告)號(hào): | CN112463640B | 公開(kāi)(公告)日: | 2022-06-03 |
| 發(fā)明(設(shè)計(jì))人: | 向劍文;李滴萌;梁夢(mèng)婷;趙冬冬;周俊偉;石兵;鐘忺 | 申請(qǐng)(專利權(quán))人: | 武漢理工大學(xué) |
| 主分類號(hào): | G06F11/36 | 分類號(hào): | G06F11/36;G06K9/62;G06N20/00 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 張惠玲 |
| 地址: | 430070 湖*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 聯(lián)合 概率 適應(yīng) 項(xiàng)目 軟件 老化 缺陷 預(yù)測(cè) 方法 | ||
本發(fā)明公開(kāi)了一種基于聯(lián)合概率域適應(yīng)的跨項(xiàng)目軟件老化缺陷預(yù)測(cè)方法,對(duì)源項(xiàng)目和目標(biāo)項(xiàng)目中的數(shù)據(jù)進(jìn)行預(yù)處理,采用主成分分析法進(jìn)行降維處理,采用基于聚類的合成少數(shù)類樣本法緩解類不平衡問(wèn)題,使用機(jī)器學(xué)習(xí)分類器(邏輯回歸等)進(jìn)行預(yù)測(cè)。本發(fā)明考慮了軟件老化缺陷數(shù)據(jù)集源項(xiàng)目和目標(biāo)項(xiàng)目間的可遷移性(不同域同一類間的距離)以及可判別性(不同域不同類之間的聚類),并進(jìn)一步采用主成分分析法進(jìn)行降維處理,減少特征冗余程度。本發(fā)明提高了傳統(tǒng)跨項(xiàng)目軟件老化缺陷預(yù)測(cè)方法的精度以及健壯性,有助于開(kāi)發(fā)者在開(kāi)發(fā)測(cè)試階段發(fā)現(xiàn)軟件老化相關(guān)缺陷并移除,一定程度上避免軟件老化問(wèn)題帶來(lái)的損失。
技術(shù)領(lǐng)域
本發(fā)明屬于軟件老化預(yù)測(cè)技術(shù)領(lǐng)域,具體涉及一種基于聯(lián)合概率域適應(yīng)的跨項(xiàng)目軟件老化缺陷預(yù)測(cè)方法。
背景技術(shù)
長(zhǎng)期運(yùn)行的軟件系統(tǒng)會(huì)出現(xiàn)逐步的性能下降或者突然失效的現(xiàn)象,這些現(xiàn)象被稱為老化現(xiàn)象。老化現(xiàn)象被發(fā)現(xiàn)存在于多種系統(tǒng),如Android、Linux、Windows等。老化現(xiàn)象的發(fā)生主要由軟件老化相關(guān)缺陷(Aging-Related Bugs,ARB)引起,如內(nèi)存泄漏,未釋放的文件鎖,存儲(chǔ)問(wèn)題等。老化相關(guān)缺陷激活與系統(tǒng)失效之間存在一段較長(zhǎng)的延時(shí),當(dāng)老化相關(guān)缺陷被激活后,老化錯(cuò)誤狀態(tài)將在軟件系統(tǒng)內(nèi)部積累,但積累的錯(cuò)誤狀態(tài)不會(huì)立刻導(dǎo)致系統(tǒng)失效。這種延時(shí)性導(dǎo)致老化問(wèn)題的檢測(cè)具有一定的困難。故在開(kāi)發(fā)測(cè)試階段預(yù)測(cè)并移除軟件老化相關(guān)缺陷能有效降低軟件老化所帶來(lái)的損失。
老化缺陷占比較少,如Linux老化缺陷數(shù)據(jù)集中老化缺陷僅占比0.59%。針對(duì)訓(xùn)練數(shù)據(jù)過(guò)少這個(gè)問(wèn)題,部分學(xué)者提出了跨項(xiàng)目軟件老化缺陷預(yù)測(cè),利用其它項(xiàng)目的數(shù)據(jù)訓(xùn)練模型來(lái)預(yù)測(cè)目標(biāo)項(xiàng)目的老化缺陷。其中,目前提出的主要方法是通過(guò)遷移學(xué)習(xí)來(lái)減少不同項(xiàng)目間的數(shù)據(jù)分布差異,并針對(duì)老化項(xiàng)目的嚴(yán)重的類不平衡問(wèn)題進(jìn)行處理。然而,傳統(tǒng)的方法中僅考慮了縮小不同項(xiàng)目同一類之間的距離(可遷移性),忽略了增大不同項(xiàng)目不同類之間的距離(可判別性),降低了遷移效果。對(duì)于類不平衡問(wèn)題,僅考慮了類間不平衡,未考慮類內(nèi)不平衡,影響分類效果。
發(fā)明內(nèi)容
為了克服上述背景技術(shù)的缺陷,本發(fā)明提供一種基于聯(lián)合概率域適應(yīng)的跨項(xiàng)目軟件老化缺陷預(yù)測(cè)方法。
為了解決上述技術(shù)問(wèn)題本發(fā)明的所采用的技術(shù)方案為:
本發(fā)明提供了一種基于聯(lián)合概率域適應(yīng)的跨項(xiàng)目軟件老化缺陷預(yù)測(cè)方法,包括:
步驟1,對(duì)源項(xiàng)目和目標(biāo)項(xiàng)目數(shù)據(jù)進(jìn)行預(yù)處理;
步驟2,采用聯(lián)合概率域適應(yīng)(JPDA)處理預(yù)處理后的源項(xiàng)目和目標(biāo)項(xiàng)目數(shù)據(jù),減小分布差異;
步驟3,采用主成分分析法(PCA)進(jìn)行降維,保留高維度數(shù)據(jù)最重要的特征,去除噪聲和不重要特征;
步驟4,采用基于聚類的合成少數(shù)類樣本法(Kmeans-SMOTE)處理嚴(yán)重的類不平衡問(wèn)題;
步驟5,對(duì)步驟4處理后的數(shù)據(jù),采用機(jī)器學(xué)習(xí)方法訓(xùn)練預(yù)測(cè)模型并在目標(biāo)項(xiàng)目上進(jìn)行老化缺陷預(yù)測(cè)。
其中,步驟1中采用z-score數(shù)據(jù)標(biāo)準(zhǔn)化方法進(jìn)行數(shù)據(jù)預(yù)處理,每個(gè)樣本的每個(gè)特征減去該項(xiàng)目該特征的均值后除以該項(xiàng)目特征度量的方差。
其中,在采用聯(lián)合概率域適應(yīng)(JPDA)處理預(yù)處理后的源項(xiàng)目和目標(biāo)項(xiàng)目數(shù)據(jù),減小分布差異的步驟中,減小分布差異的方式包括最小化不同域同類別之間的分布差異,以及最大化不同域不同類別間的差異。
其中,在采用主成分分析法(PCA)進(jìn)行降維,保留高維度數(shù)據(jù)最重要的特征,去除噪聲和不重要特征的步驟中,采用主成分分析法PCA對(duì)數(shù)據(jù)集進(jìn)行降維處理,計(jì)算數(shù)據(jù)矩陣的協(xié)方差矩陣,得到協(xié)方差矩陣的特征值特征向量,選擇特征值最大的5個(gè)特征所對(duì)應(yīng)的特征向量組成新矩陣。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢理工大學(xué),未經(jīng)武漢理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011476590.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動(dòng)臺(tái)
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動(dòng)臺(tái)
- 便攜信息終端、以及便攜信息終端的控制方法
- 電法與地震同步聯(lián)合反演方法及系統(tǒng)
- 銀行聯(lián)合放款的放款方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于自主學(xué)習(xí)群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 一種基于多目標(biāo)種群群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 聯(lián)合貸款中的罰息與利息結(jié)算方法、裝置、介質(zhì)和設(shè)備
- 一種基坑支護(hù)用H型鋼構(gòu)件
- 用于云環(huán)境的語(yǔ)義元聯(lián)合代理
- 適應(yīng)速度和適應(yīng)病人的假膝
- 帶寬適應(yīng)
- 自適應(yīng)均衡電路和自適應(yīng)均衡方法
- 適應(yīng)均衡裝置和適應(yīng)均衡方法
- 標(biāo)準(zhǔn)模式適應(yīng)裝置、標(biāo)準(zhǔn)模式適應(yīng)方法和標(biāo)準(zhǔn)模式適應(yīng)程序
- 攝像模組自適應(yīng)系統(tǒng)及其自適應(yīng)方法
- 彎頭自適應(yīng)耳塞及自適應(yīng)耳機(jī)
- 算法自適應(yīng)裝置和算法自適應(yīng)方法
- 域適應(yīng)
- 自適應(yīng)辨識(shí)系統(tǒng)、自適應(yīng)辨識(shí)裝置及自適應(yīng)辨識(shí)方法





