[發(fā)明專利]基于遷移學(xué)習(xí)和缺陷數(shù)量信息的跨公司軟件缺陷預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710253504.8 | 申請(qǐng)日: | 2017-04-18 |
| 公開(公告)號(hào): | CN107025503A | 公開(公告)日: | 2017-08-08 |
| 發(fā)明(設(shè)計(jì))人: | 井溢洋;劉進(jìn);余嘯;崔曉暉;張建升 | 申請(qǐng)(專利權(quán))人: | 武漢大學(xué) |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06Q10/06 |
| 代理公司: | 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 遷移 學(xué)習(xí) 缺陷 數(shù)量 信息 公司 軟件 預(yù)測(cè) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于跨公司軟件缺陷預(yù)測(cè)技術(shù)領(lǐng)域,特別是涉及一種基于遷移學(xué)習(xí)和缺陷數(shù)量信息的跨公司軟件缺陷預(yù)測(cè)方法。
背景技術(shù)
(1)軟件項(xiàng)目缺陷預(yù)測(cè)技術(shù)
軟件產(chǎn)業(yè)作為信息產(chǎn)業(yè)的重要組成部分,在促進(jìn)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、經(jīng)濟(jì)發(fā)展方式轉(zhuǎn)變、工業(yè)化與信息化融合及維護(hù)國(guó)家安全方面均發(fā)揮著重要作用。然而隨著軟件應(yīng)用領(lǐng)域的不斷擴(kuò)展,和設(shè)計(jì)復(fù)雜度的不斷提升,軟件項(xiàng)目的質(zhì)量問題越來越難把控。在這種需求背景下,高效的軟件缺陷預(yù)測(cè)技術(shù)越來越引起人們的關(guān)注。
軟件缺陷預(yù)測(cè)技術(shù)可以在軟件系統(tǒng)開發(fā)早期,高效的預(yù)測(cè)系統(tǒng)各個(gè)軟件模塊是否存在缺陷,并根據(jù)預(yù)測(cè)結(jié)果,合理分配測(cè)試人力資源,從而有效降低測(cè)試成本并減小測(cè)試周期。此外,對(duì)于每個(gè)具體的軟件項(xiàng)目來說,不同時(shí)期修復(fù)缺陷的成本是完全不同的,一般來說,其修復(fù)成本是隨時(shí)間呈正比例上升的。比如,文獻(xiàn)1其中提到,1985到1987年,Therac-25輻射治療設(shè)備卷入多宗因輻射劑量嚴(yán)重超標(biāo)引發(fā)的醫(yī)療事故,其罪魁禍?zhǔn)资轻t(yī)療設(shè)備電力軟件的bug,導(dǎo)致大量患者接受了高達(dá)100倍的預(yù)定治療劑量,其中三人直接死于輻射劑量超標(biāo),。假定我們能在軟件測(cè)試的早期就發(fā)現(xiàn)并修復(fù)這個(gè)bug,上述悲劇將不再重演。
現(xiàn)有的缺陷預(yù)測(cè)技術(shù)主要包括:缺陷數(shù)量預(yù)測(cè)技術(shù)、缺陷分布預(yù)測(cè)技術(shù)和軟件預(yù)測(cè)模型技術(shù)。
其中缺陷數(shù)量預(yù)測(cè)技術(shù)一般用來確定整體項(xiàng)目缺陷的個(gè)數(shù),如文獻(xiàn)2,其中akahashi將代碼與具體的文檔數(shù)量對(duì)應(yīng)起來,給出了缺陷密度的估計(jì)式:§=67.98+0.46f1-9.69f2-0.08f3,其中§為缺陷率(單位:The number of errors/KLOC,KLOC為千行代碼),f1為程序規(guī)約變更的頻率(單位:The number of pages/KLOC),f2為程序員技能(單位:Years),f3為程序設(shè)計(jì)文檔頁(yè)數(shù)(單位:The number of pages/KLOC)。
缺陷分布預(yù)測(cè)技術(shù)則利用分類或回歸技術(shù),如線性判別分析LDA(1inear discriminant analysis),分類回歸樹CART(classification and regression tree),支持向量機(jī)SVM(support vector machine),人工神經(jīng)網(wǎng)絡(luò)ANN(artificial neural network),邏輯回歸LR(logistic regression),多元線性回歸MLR(multiple linear regression)等方法,來對(duì)模塊是否存在缺陷進(jìn)行預(yù)測(cè)。
不同于上述兩種技術(shù)一般選定一些特殊度量元來通過分類回歸找到缺陷模塊的方法,軟件預(yù)測(cè)模型技術(shù)則基于歷史缺陷數(shù)據(jù)構(gòu)建模型。相比而言,這種方法更能將一些其他的缺陷影響因素考慮在內(nèi),比如團(tuán)隊(duì)因素等,且無需人為的參數(shù)調(diào)整。因此,軟件預(yù)測(cè)模型技術(shù)也成為了當(dāng)今主流的軟件缺陷預(yù)測(cè)技術(shù)。
(2)跨公司軟件項(xiàng)目缺陷預(yù)測(cè)技術(shù)
然而在一些實(shí)際測(cè)試場(chǎng)景中,當(dāng)需要用軟件模型預(yù)測(cè)技術(shù)來對(duì)一些新的公司的軟件項(xiàng)目進(jìn)行缺陷預(yù)測(cè)時(shí),并沒有大量的歷史的缺陷數(shù)據(jù)來供我們來訓(xùn)練模型。但在網(wǎng)絡(luò)上存在很多高質(zhì)量的開源軟件項(xiàng)目缺陷數(shù)據(jù)集,因此就有學(xué)者試圖從這些跨公司的開源項(xiàng)目缺陷數(shù)據(jù)集出發(fā),來訓(xùn)練預(yù)測(cè)模型從而對(duì)新的公司的軟件項(xiàng)目進(jìn)行缺陷預(yù)測(cè)。然而直接使用跨項(xiàng)目的缺陷數(shù)據(jù)集來對(duì)新公司的軟件項(xiàng)目進(jìn)行缺陷預(yù)測(cè)還存在一些問題,原因是不同項(xiàng)目之間可能存在著不同的特征分布,直接套用跨公司的軟件缺陷預(yù)測(cè)經(jīng)驗(yàn)可能會(huì)導(dǎo)致預(yù)測(cè)精度過低。
文獻(xiàn)3中馬櫻等人提出了一種Transfer Naive Bayes(TNB)算法,TNB算法考慮了源數(shù)據(jù)和目標(biāo)數(shù)據(jù)來自不同公司的跨公司預(yù)測(cè)場(chǎng)景,為了較好利用跨公司數(shù)據(jù),TNB運(yùn)用了遷移學(xué)習(xí)的方法來建立一個(gè)更有效的預(yù)測(cè)模型。遷移學(xué)習(xí)的目標(biāo)是將從一個(gè)環(huán)境中學(xué)習(xí)到的知識(shí)用來解決新環(huán)境中的任務(wù)。因此,遷移學(xué)習(xí)用來解決跨項(xiàng)目缺陷預(yù)測(cè)過程中出現(xiàn)的問題尤為合適。遷移學(xué)習(xí)處理原始跨項(xiàng)目缺陷數(shù)據(jù)的基本思路是:對(duì)于原始的跨項(xiàng)目缺陷數(shù)據(jù),其與待預(yù)測(cè)數(shù)據(jù)之間的相似度越高,賦予的權(quán)重越高。在此基礎(chǔ)上,那些跟我們待預(yù)測(cè)數(shù)據(jù)相似度高的跨項(xiàng)目缺陷數(shù)據(jù)就能在預(yù)測(cè)結(jié)果中起到更大的作用,同時(shí)也能削弱不相關(guān)的跨項(xiàng)目缺陷數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果的影響。
(3)樸素貝葉斯
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710253504.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 遷移方法和裝置
- 移動(dòng)邊緣系統(tǒng)中遷移應(yīng)用方法、相關(guān)設(shè)備及系統(tǒng)
- 虛擬機(jī)的遷移方法及裝置
- 數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 計(jì)算任務(wù)遷移方法及計(jì)算任務(wù)遷移器
- 文件遷移方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于遷移工具的國(guó)產(chǎn)化應(yīng)用系統(tǒng)遷移方法
- 數(shù)據(jù)遷移方法及裝置
- 文件遷移方法及裝置
- 一種數(shù)據(jù)遷移方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





