[發(fā)明專利]一種基于遷移性分析的跨項目缺陷預(yù)測方法有效
| 申請?zhí)枺?/td> | 201910524720.0 | 申請日: | 2019-06-18 |
| 公開(公告)號: | CN110175726B | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設(shè)計)人: | 余躍;張迅暉;毛新軍;曾雅蓉;王濤;李志星;范強 | 申請(專利權(quán))人: | 中國人民解放軍國防科技大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06F17/18;G06F11/36 |
| 代理公司: | 長沙國科天河知識產(chǎn)權(quán)代理有限公司 43225 | 代理人: | 邱軼 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 遷移性 分析 項目 缺陷 預(yù)測 方法 | ||
1.一種基于遷移性分析的跨項目缺陷預(yù)測方法,其特征在于:
S1.根據(jù)開源社區(qū)中開源項目包含的pull request數(shù)量及開源語言種類,選取開源社區(qū)中開源項目作為遷移分析的項目集合,進行數(shù)據(jù)采集;
其中數(shù)據(jù)采集內(nèi)容包括:項目源代碼、歷史代碼提交信息、代碼提交更改信息、代碼提交歷史軌跡、代碼提交更改的文件、代碼提交更改的文件對應(yīng)的歷史開發(fā)人員數(shù)量、代碼提交更改文件的平均時間間隔以及缺陷信息;其中缺陷信息包括缺陷報告、缺陷報告標(biāo)記位和缺陷報告對應(yīng)的編號,pull request、ReadMe文件;
S2.提取遷移分析項目集合中的每個開源項目對應(yīng)的歷史代碼提交信息和缺陷信息,將S1中采集到的數(shù)據(jù)分為引入缺陷的代碼提交和未引入缺陷的代碼提交;
S3.將S2中得到的引入缺陷的代碼提交分別提取在擴散維度、代碼維度、代碼更改目的維度、文本信息維度和歷史維度下代碼提交可能引入缺陷的項目內(nèi)度量因素,得到代碼提交可能引入缺陷的項目內(nèi)多維度量因素;
S4.利用S2中得到的引入缺陷的代碼提交以及S3中提取的可能引入缺陷的項目內(nèi)多維度量因素,利用隨機森林方法訓(xùn)練遷移分析項目集合中每個項目的項目內(nèi)缺陷預(yù)測模型;
S5.統(tǒng)計遷移分析項目集合中不同項目間,在項目維度、技術(shù)維度和人員維度下影響項目間缺陷預(yù)測的項目間關(guān)聯(lián)關(guān)系多維度量因素;
S6.根據(jù)S4中得到的遷移分析項目集合中每個項目的項目內(nèi)缺陷預(yù)測模型,計算遷移分析項目集合中每個項目的項目內(nèi)缺陷預(yù)測模型對其他項目缺陷預(yù)測的準(zhǔn)確率,得到項目間缺陷預(yù)測準(zhǔn)確率;
S7.利用S5中提取的項目間關(guān)聯(lián)關(guān)系多維度量因素以及S6中計算得到的項目間缺陷預(yù)測準(zhǔn)確率,設(shè)計回歸分析模型,得出在項目維度、技術(shù)維度和人員維度下對跨項目缺陷預(yù)測效果的影響;
S8.根據(jù)S7中得出的在項目維度、技術(shù)維度和人員維度下對跨項目缺陷預(yù)測效果的影響,對待預(yù)測項目進行跨項目預(yù)測模型的選取,通過集體投票的方式得出待預(yù)測項目的缺陷預(yù)測結(jié)果。
2.如權(quán)利要求1所述的一種基于遷移性分析的跨項目缺陷預(yù)測方法,其特征在于:
S1中所述缺陷報告中缺陷標(biāo)記位為0時,表示缺陷,當(dāng)標(biāo)記位為1時表示非缺陷信息。
3.如權(quán)利要求2所述的一種基于遷移性分析的跨項目缺陷預(yù)測方法,其特征在于:
所述S2包括:
S21.找到缺陷標(biāo)記位為0的缺陷報告對應(yīng)的代碼提交;
S22.遍歷S21中所有的代碼提交,通過歷史代碼提交信息篩選出所有已經(jīng)修復(fù)了缺陷的代碼提交;
S23.找到S22中所有已經(jīng)修復(fù)了缺陷的代碼提交對應(yīng)的代碼源文件;
S24.查看步驟S23中找到的代碼源文件,上一次被更改時對應(yīng)的代碼提交被認(rèn)為是引入缺陷的代碼提交,其余的代碼提交被認(rèn)為是未引入缺陷的代碼提交。
4.如權(quán)利要求1所述的一種基于遷移性分析的跨項目缺陷預(yù)測方法,其特征在于:
所述S3包括:
S3.1.擴散維度下,代碼提交可能引入缺陷的項目內(nèi)度量因素包括代碼提交更改的代碼源文件數(shù)量和代碼更改分布熵;
S3.2.代碼維度下,代碼提交可能引入缺陷的項目內(nèi)度量因素包括代碼提交前代碼文件的行數(shù)、新增加的代碼行數(shù)和刪除的代碼行數(shù);
S3.3.代碼更改目的維度下,代碼提交可能引入缺陷的項目內(nèi)度量因素包括引入當(dāng)前缺陷的代碼提交是否修復(fù)了一個缺陷以及引入當(dāng)前缺陷的代碼提交關(guān)聯(lián)的缺陷報告數(shù)量;
S3.4.文本信息維度下,代碼提交可能引入缺陷的項目內(nèi)度量因素包括代碼提交信息的長度和引入缺陷的可能性;
S3.5.歷史維度下,代碼提交可能引入缺陷的項目內(nèi)度量因素包括代碼提交者的歷史代碼貢獻次數(shù)、代碼提交更改的代碼源文件對應(yīng)的歷史開發(fā)人員數(shù)量、本次代碼提交更改的代碼源文件與上一次代碼提交更改的代碼源文件之間交集的大小和代碼提交更改代碼源文件的平均時間間隔。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科技大學(xué),未經(jīng)中國人民解放軍國防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910524720.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





