[發明專利]一種基于新項目的即時缺陷定位方法及系統有效
| 申請號: | 202011070832.2 | 申請日: | 2020-10-09 |
| 公開(公告)號: | CN112380111B | 公開(公告)日: | 2021-08-10 |
| 發明(設計)人: | 戴宏明;奚建清;戴宏亮 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F40/284;G06K9/62 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 胡輝 |
| 地址: | 510641 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 新項目 即時 缺陷 定位 方法 系統 | ||
1.一種基于新項目的即時缺陷定位方法,其特征在于,所述方法依據相近項目的歷史變更數據的缺陷報告對新項目的變更數據進行即時缺陷定位;
所述依據相近項目的歷史變更數據的缺陷報告對新項目的變更數據進行即時缺陷定位的方法包括:
對變更數據進行特征提取,得出特征詞集合;
依據特征詞集合構建空間詞向量模型;
依據空間詞向量模型將歷史變更數據中每個缺陷報告中有缺陷的代碼行表示成基于特征詞的缺陷詞向量;
依據空間詞向量模型將變更數據中的每行代碼表示成基于特征詞的源文件詞向量;
依次計算每個缺陷詞向量與源文件詞向量的相似度,輸出相似度大于預設值的源文件詞向量及其所在位置完成缺陷的定位。
2.如權利要求1所述的一種基于新項目的即時缺陷定位方法,其特征在于,相近項目的歷史變更數據為同一開發團隊基于相同語言開發的軟件的歷史變更數據。
3.如權利要求1所述的一種基于新項目的即時缺陷定位方法,其特征在于,所述對變更數據進行特征提取,得出特征詞集合的方法,即:
對變更數據進行預處理,包括分詞、去停用詞和提取詞干,停用詞可根據文本特性自由添加,經預處理后,得到特征詞集合。
4.如權利要求1所述的一種基于新項目的即時缺陷定位方法,其特征在于,所述依據特征詞集合構建空間詞向量模型的方法,即:
利用信息檢索技術,以特征詞集合為索引詞建立空間詞向量模型。
5.如權利要求1所述的一種基于新項目的即時缺陷定位方法,其特征在于,所述依次計算每個缺陷詞向量與源文件詞向量的相似度,輸出相似度大于預設值的源文件詞向量及其所在位置完成缺陷的定位的方法包括:
計算缺陷詞向量與源文件詞向量之間的余弦值;
將余弦值作為相似度判定缺陷詞向量最相似的源文件詞向量及其所在位置。
6.如權利要求1所述的一種基于新項目的即時缺陷定位方法,其特征在于,所述的基于新項目的軟件缺陷定位方法還包括:對歷史變更數據進行除雜。
7.如權利要求6所述的一種基于新項目的即時缺陷定位方法,其特征在于,所述對歷史變更數據進行除雜的方法包括:
計算歷史變更數據中的每個缺陷報告中有缺陷的代碼行與變更數據中每行代碼的歐式距離;
為變更數據中的每行代碼選出距離最近的k個歷史變更數據中有缺陷的代碼行作為新的歷史變更數據,完成對歷史變更數據的除雜;其中,k為正整數。
8.一種基于新項目的即時缺陷定位系統,其特征在于,包括:
數據獲取模塊,適于獲取歷史變更數據;
特征提取模塊,適于對新項目的變更數據進行特征提取,得出特征詞集合;
模型構建模塊,適于依據特征詞集合構建空間詞向量模型;
第一詞向量獲取模塊,適于依據空間詞向量模型將歷史變更數據中每個缺陷報告中有缺陷的代碼行表示成基于特征詞的缺陷詞向量;
第二詞向量獲取模塊,適于依據空間詞向量模型將變更數據中的每行代碼表示成基于特征詞的源文件詞向量;
計算模塊,適于依次計算每個缺陷詞向量與源文件詞向量的相似度,輸出相似度大于預設值的源文件詞向量及其所在位置完成缺陷的定位。
9.如權利要求8所述的一種基于新項目的即時缺陷定位系統,其特征在于,所述歷史變更數據為同一開發團隊基于相同語言開發的軟件的歷史變更數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011070832.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種離型膜基材
- 下一篇:一種電化學氟化外循環柔性電解系統





