[發明專利]一種基于程序分析和神經網絡的注釋定位方法在審
| 申請號: | 201911321441.0 | 申請日: | 2019-12-19 |
| 公開(公告)號: | CN111104159A | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 張衛豐;李小滿;周國強;王子元;張迎周 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F8/73 | 分類號: | G06F8/73 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 程序 分析 神經網絡 注釋 定位 方法 | ||
1.一種基于程序分析和神經網絡的注釋定位方法,其特征在于,包括步驟如下:
S1、下載Java開源項目,提取項目中方法級別的注釋;
S2、根據步驟S1中取到的注釋數據,進行人工標注注釋類別,組成注釋,注釋類別>對的集合,作為注釋分類的訓練集;
S3、對步驟S2生成的訓練集進行預處理,利用神經網絡模型,進行注釋分類器的訓練;
S4、將項目中每個方法的注釋使用分類器進行分類,提取How類型的注釋,并且從方法體內找出對應的代碼,組成注釋,代碼片段對的集合,作為注釋定位模型的訓練集;
S5、對步驟S4所構建的訓練集進行預處理,并且利用神經網絡模型,進行注釋定位模型的訓練;
S6、注釋定位模型訓練完成后,給定Java方法中的一條注釋語句和多個代碼片段,輸出與這條注釋最相似的代碼片段,組成注釋和代碼片段的映射關系。
2.根據權利要求1所描述的一種基于程序分析和神經網絡的注釋定位方法,其特征在于,所述步驟S2中,Java方法級別的注釋包括What型注釋和How型注釋。其中What型注釋是描述方法功能的注釋,How型注釋是描述方法具體實現的注釋。
3.根據權利要求1所描述的一種基于程序分析和神經網絡的注釋定位方法,其特征在于,所述步驟S3中,對訓練集進行預處理是指,將注釋文本進行分詞,并且刪除其中的稀有符號和停用詞,構建一個注釋詞匯表,并將注釋文本轉化成數字列表。
4.根據權利要求1所描述的一種基于程序分析和神經網絡的注釋定位方法,其特征在于,所述步驟S4中,構建注釋定位模型的訓練集,具體方法為:首先獲取方法體內的所有變量,然后與方法的How類型注釋進行匹配,找出注釋中存在的變量,再根據這些變量從方法體內找出與之相關的代碼片段。一條注釋可能對應多個代碼判斷,故需要通過人工判斷哪段代碼片段與注釋意思最相近,從而組成注釋,代碼片段對的集合,作為注釋定位模型的訓練集。
5.根據權利要求1所描述的一種基于程序分析和神經網絡的注釋定位方法,其特征在于,所述步驟S5中,注釋定位模型是使用的是循環神經網絡,將代碼與注釋映射到一個向量空間,然后通過計算注釋向量和代碼向量的余弦相似度,來構建注釋與代碼的映射關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911321441.0/1.html,轉載請聲明來源鉆瓜專利網。





