[發明專利]一種基于文本和開發者活躍度的軟件缺陷輔助分派方法有效
| 申請號: | 201710753984.4 | 申請日: | 2017-08-29 |
| 公開(公告)號: | CN107480141B | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 呂建;徐鋒;姚遠;席圣渠 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F11/36;G06N3/02 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 李玉平 |
| 地址: | 210046 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文本 開發者 活躍 軟件 缺陷 輔助 分派 方法 | ||
本發明公開了一種基于文本和開發者活躍度的軟件缺陷輔助分派方法,通過考慮缺陷報告的文本信息以及開發者的活躍程度,一方面利用雙向循環網絡加池化方法提取缺陷報告的文本特征,一方面利用單向循環網絡提取特定時刻的開發者活躍度特征,并融合兩者,給出了一個新的基于缺陷報告文本和開發者活躍度的缺陷分派模型,從而較好地提高了輔助缺陷分派準確率低的問題。在Eclipse等四個不同的開源項目數據集上的實驗結果表明,本方法較同類工作在缺陷分派預測準確率上有顯著提升。
技術領域
本發明涉及一種基于文本和開發者活躍度的軟件缺陷輔助分派方法,屬于軟件輔助缺陷分派技術領域。本發明利用包含詞序關系的文本信息,以及開發者活躍度信息,基于循環神經網絡訓練模型,有效增強了對新缺陷報告分派開發者的能力,提高了輔助缺陷分派系統的推薦精度。
背景技術
近年來,隨著軟件規模不斷擴大,大型軟件項目往往使用缺陷追蹤系統進行統一管理。當一份缺陷報告提交到缺陷追蹤系統,管理人員(高級開發者或者項目負責人)需要瀏覽缺陷報告,并為其選擇適合的開發者。這種為缺陷報告指定開發者的過程,被稱為缺陷分派。
然而,缺陷分派是一項耗時耗力的事情。一方面,大型項目每天收到的缺陷報告數量較多,如Eclipse項目平均每天收到91份缺陷報告、Redhat項目平均每天收到222份缺陷報告;另一方面,大型項目的開發與維護往往需要大量的開發者,對于Eclipse、Mozilla項目,分別有超過1800名開發者參與到缺陷修復的工作中。如果由人工進行缺陷分派,會消耗大量的時間和人力資源。
為解決此問題,一種可行的辦法是輔助缺陷分派,即通過統計、學習歷史數據,自動地為新的缺陷報告推薦開發者。目前主流的輔助缺陷分派方法,主要使用缺陷報告的文本和元數據信息。文本信息方面,主要包括用戶對缺陷的類型、引發缺陷的步驟等自然文本描述,很多方法使用向量空間模型,將缺陷報告的文本信息表示為單詞計數的向量;另外一些方法則使用主題模型,利用單詞在文本中的共現關系將文檔表示為不同主題下的分布。元數據信息方面,主要包括產品、組件、操作系統類型、平臺等字段,這些字段可以由用戶在提交缺陷報告時,通過列表的方式選擇,該信息對開發者有著較強的劃分作用,近期的方法利用了這些信息進一步提高了輔助缺陷分派的準確率。
然而,目前的輔助缺陷分派技術依然存在著一定的不足,主要體現在如下兩個方面。首先,自然語言文本更強調文字序列中前后元素之間的相互影響,元素之間次序的不同會導致文本含義的變化,而現有的缺陷分派方法都沒有考慮詞序信息。其次,已有工作大多忽略了對開發者活躍度的考慮,使得對具有相似特征的開發者進行缺陷報告分派預測時表現較差。
綜合上述兩個問題,本發明采用分類的方法,考慮了文本詞序和開發者活躍度,給出了一個新的輔助缺陷分派模型AutoTriager。通過循環神經網絡提取文本和開發者活躍度的高層特征,并將高層特征融合,共同為新缺陷報告預測適合的開發者。
發明內容
發明目的:由于目前主流的輔助缺陷分派方法,在文本特征的刻畫上未考慮詞序關系,且難以區分具有相似特征的開發者,預測準確率較低。而開發者在不同時間段,具有不同的活躍程度。為此,本發明同時考慮了文本詞序和開發者活躍度,有效地提高了輔助缺陷分派的預測準確率。
許多大型軟件項目都使用缺陷追蹤系統。一方面,用戶提交的缺陷報告采用自然語言描述,其詞序關系的不同會導致文本含義的變化;另一方面,負責修復缺陷的開發者受工作安排、個人興趣等影響,在不同時間段,對不同的領域有不同的活躍程度。本發明將兩項觀察進行建模,提出了輔助缺陷分派模型——AutoTriager。
技術方案:一種基于文本和開發者活躍度的軟件缺陷輔助分派方法,分為訓練和推薦兩個階段:訓練階段,通過學習歷史已經包含修復開發者的缺陷報告建立模型;預測階段,向模型輸入新的、未分派的缺陷報告,模型將輸出候選開發者列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710753984.4/2.html,轉載請聲明來源鉆瓜專利網。





