[發明專利]一種基于異質信息網絡的重復缺陷報告檢測方法有效
| 申請號: | 202010413134.1 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111737107B | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 肖冠平;鄭征;杜曉婷 | 申請(專利權)人: | 南京航空航天大學;北京航空航天大學 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F40/194;G06K9/62;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 信息網絡 重復 缺陷 報告 檢測 方法 | ||
1.一種基于異質信息網絡的重復缺陷報告檢測方法,其特征在于,包括以下步驟:
(1)從缺陷報告文件中提取結構化的異質屬性當作節點,根據異質屬性節點之間的關系構建缺陷報告異質信息網絡;
(2)對建立的缺陷報告異質信息網絡進行網絡表示學習,得到每個屬性節點的向量表示;
(3)從缺陷報告文件中提取文本信息并進行預處理,然后使用大量的無標簽的缺陷報告文本信息訓練缺陷報告文本語義模型,得到缺陷報告文本中每個單詞的向量表示;
(4)從缺陷倉庫中識別缺陷報告組,同一個缺陷報告組中的缺陷報告描述相同的失效現象;
(5)從步驟(4)中識別的缺陷報告組中生成重復和非重復缺陷報告對數據;并將該數據劃分成訓練、驗證和測試數據;
(6)將步驟(2)、(3)中的得到的異質屬性節點向量和文本單詞向量分別用于表示缺陷報告的結構化特征和非結構化特征,用于構建重復缺陷報告檢測模型;
(7)使用步驟(5)中得到的訓練和驗證數據對步驟(6)建立的重復缺陷報告檢測模型進行訓練;
(8)使用步驟(7)中訓練得到的重復缺陷報告檢測模型對測試數據進行自動檢測,得到重復缺陷報告的檢測結果。
2.根據權利要求1所述的一種基于異質信息網絡的重復缺陷報告檢測方法,其特征在于,所述步驟(1)包括以下步驟:
(11)從缺陷報告文件中提取六類異質屬性當作節點,即缺陷報告標識號BID、產品PRO、組件COM、版本VER、嚴重性SEV和修復優先級PRI;
(12)將六類屬性節點建立連邊:
每個缺陷報告記錄一個位于特定軟件項目功能組件的缺陷,分別使用L和L-1來表示缺陷報告和組件之間的關系R1,即和
每個組件屬于一個產品,分別使用B和B-1來表示組件和產品之間的關系R2,即和
描述一個缺陷出現在一個具體的版本,使用O和O-1來表示缺陷報告與版本之間的關系R3,即和
每個缺陷報告都有一個開發者處理的優先級,分別使用H和H-1來表示缺陷報告與修復優先級之間的關系R4,即和
每個缺陷報告都會對用戶有一定程度的嚴重性影響,分別使用I和I-1來表示缺陷報告與嚴重性之間的關系R5,即和
3.根據權利要求1所述的一種基于異質信息網絡的重復缺陷報告檢測方法,其特征在于,步驟(3)中所述的預處理包括單詞分割、停用詞刪除和單詞標準化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學;北京航空航天大學,未經南京航空航天大學;北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010413134.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:作品排序方法、裝置和存儲介質
- 下一篇:作用于輸送帶上的電路板翻轉設備





