[發明專利]結合句嵌入和粒子群優化算法的軟件缺陷定位方法在審
| 申請號: | 202011118127.5 | 申請日: | 2020-10-19 |
| 公開(公告)號: | CN112286799A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 陳信;俞東進;范旭麟;郭世明 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F40/211;G06F40/284;G06N3/00 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 結合 嵌入 粒子 優化 算法 軟件 缺陷 定位 方法 | ||
1.結合句嵌入和粒子群優化算法的軟件缺陷定位方法,其特征在于包括如下步驟:
步驟(1)給定n個軟件缺陷報告集合R=(R1,R2,...,Rn),將其中每個缺陷報告表示成Ri=reportId,description,summary,i=1,2...,n,其中reportId表示缺陷報告編號,description表示缺陷報告的詳細描述信息,summary表示缺陷報告的摘要信息;
步驟(2)給定m個源代碼文件集合S=(S1,S2,...,Sm),利用JDT解析每一個源代碼文件,將每一個源代碼文件處理成Si=className,method,property,comment形式,j=1,2,...,m,其中className表示源代碼文件的類名,method表示每個源代碼文件的方法集合,property表示源代碼文件的屬性名集合,comment表示源代碼文件的注釋集合;
步驟(3)對每一個缺陷報告Ri和源代碼文件Sj進行預處理:
步驟(4)將經過預處理后所有的缺陷報告和所有的源代碼文件組成一個語料庫Q=(R1,R2...,RN,S1,S2,...,SM),并用l表示語料庫中包含的單詞個數,然后將每個缺陷報告與每個源代碼文件組對,即pair=Ri,Sj;
步驟(5)構建平滑逆頻率模型:
步驟(6)計算表面詞匯相似度分數:
步驟(7)計算缺陷的修復歷史記錄分數RScore:
步驟(8)計算缺陷修復頻率分數:將軟件缺陷報告提交之前源代碼文件被修復的次數記為FScore;
步驟(9)計算協同過濾分數CFScore:
步驟(10)將多個不同層面的缺陷報告與源代碼文件的分數進行線性組合形成一個最終得分,然后根據每個缺陷報告相關的最終得分,對源代碼文件進行排序;
步驟(11)利用粒子群優化算法優化5個分數的線性權重;
步驟(12)根據得到的最優權重計算目標缺陷報告和所有的源代碼文件的finalScore并進行排序,finalScore最高的源代碼文件最可能是導致該缺陷出現的源代碼文件。
2.根據權利要求1所述的結合句嵌入和粒子群優化算法的軟件缺陷定位方法,其特征在于步驟(3)具體實現如下:
首先對Ri中的description和summary以及Sj中的所有元素進行提取,然后用空格對Ri和Sj中提取的信息初步區分成單詞,并刪除其中的符號;
然后基于停用詞列表移除其中的停用詞,將初步區分后單詞中的組合詞再次進行分離,得到最終的單詞集合;
最后將單詞集合中的每個單詞轉為原型。
3.根據權利要求1或2所述的結合句嵌入和粒子群優化算法的軟件缺陷定位方法,其特征在于步驟(5)具體實現如下:
首先使用GloVe詞嵌入技術對語料庫Q中的單詞進行訓練,得到每個單詞Wk(k=1,2,...,l)的詞向量
然后計算每個單詞的權重ω(Wk);在此基礎上分別計算Ri和Sj對應的句向量和
最后計算每一組句向量之間的余弦相似度作為平滑逆頻率模型的分數值SIFScore。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011118127.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種便于礦渣微粉制造的生產工藝
- 下一篇:顯示面板以及其像素電路





