[發(fā)明專利]一種基于問題報告的軟件語義摘要自動生成方法有效
| 申請?zhí)枺?/td> | 201710380665.3 | 申請日: | 2017-05-25 |
| 公開(公告)號: | CN107133079B | 公開(公告)日: | 2019-12-20 |
| 發(fā)明(設(shè)計(jì))人: | 余躍;王濤;尹剛;王懷民;宋晨希;張迅輝;李志星 | 申請(專利權(quán))人: | 中國人民解放軍國防科學(xué)技術(shù)大學(xué) |
| 主分類號: | G06F8/41 | 分類號: | G06F8/41;G06F16/953 |
| 代理公司: | 11350 北京科億知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人: | 湯東鳳 |
| 地址: | 410000 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 問題 報告 軟件 語義 摘要 自動 生成 方法 | ||
1.一種基于問題報告的軟件語義摘要自動生成方法,其特征在于,包括如下步驟:
S1、構(gòu)建開源軟件信息數(shù)據(jù)庫,所述開源軟件信息數(shù)據(jù)庫包含問題報告數(shù)據(jù)表、代碼變更記錄數(shù)據(jù)表和軟件語義摘要數(shù)據(jù)表;
S2、獲取項(xiàng)目托管社區(qū)中的問題報告數(shù)據(jù)和代碼變更記錄數(shù)據(jù),并將之存儲在數(shù)據(jù)庫的問題報告數(shù)據(jù)表和代碼變更記錄數(shù)據(jù)表中;
S3、使用正則表達(dá)式從代碼變更記錄中抽取其出現(xiàn)的問題報告id;
S4、問題報告與軟件代碼位置匹配:通過代碼變更記錄數(shù)據(jù)將問題報告中的描述信息和代碼位置關(guān)聯(lián),具體包括:
S401、問題報告與代碼變更記錄匹配:使用代碼變更記錄中出現(xiàn)的#id尋找相關(guān)id的問題報告;
S402、語義信息合并:將問題報告中的標(biāo)題和描述,以及代碼變更記錄的描述信息合并記作d,將其作為文件或代碼片段f的原始語義信息,寫入數(shù)據(jù)庫的軟件語義摘要數(shù)據(jù)表中;
S5、語義提取與聚類:對于原始語義信息d,使用文檔主題生成模型生成若干主題詞或短語,生成的主題詞或短語作為文件或代碼片段f的語義摘要存儲在數(shù)據(jù)庫的軟件語義摘要數(shù)據(jù)表中。
2.如權(quán)利要求1所述的方法,其特征在于,步驟S1中,問題報告數(shù)據(jù)表的存儲格式為[標(biāo)題,描述,#id],代碼變更記錄數(shù)據(jù)表的存儲格式為[描述,變更信息,變更位置],軟件語義摘要數(shù)據(jù)表的存儲格式為[代碼位置,原始語義信息,語義摘要]。
3.如權(quán)利要求1所述的方法,其特征在于,步驟S2中,軟件問題報告信息包括:問題報告的標(biāo)題、描述和ID;代碼變更記錄的信息包括:描述、變更信息和變更位置。
4.如權(quán)利要求1所述的方法,其特征在于,步驟S2中,社區(qū)問題報告和代碼變更記錄數(shù)據(jù)可通過官方API獲得或通過通用的網(wǎng)絡(luò)爬蟲獲取。
5.如權(quán)利要求1所述的方法,其特征在于,步驟S2中,開發(fā)人員在提交的代碼變更記錄的描述信息中注明此次代碼變更相關(guān)的問題報告,以“close#id”或“fix#id”的形式記錄。
6.如權(quán)利要求1所述的方法,其特征在于,步驟S402中,將代碼位置和原始語義信息以[代碼位置,原始語義信息]的格式存儲于數(shù)據(jù)庫的軟件語義摘要數(shù)據(jù)表。
7.如權(quán)利要求1所述的方法,其特征在于,步驟S402中,語義摘要信息以[代碼位置,語義摘要]的格式存儲于數(shù)據(jù)庫的軟件語義摘要數(shù)據(jù)表。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科學(xué)技術(shù)大學(xué),未經(jīng)中國人民解放軍國防科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710380665.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于應(yīng)用軟件散布的軟件授權(quán)與保護(hù)方法及系統(tǒng)
- 一種用于航空機(jī)載設(shè)備的軟件在線加載系統(tǒng)及方法
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 惡意軟件檢測方法及裝置
- 一種基于軟件基因的軟件同源性分析方法和裝置
- 軟件引入系統(tǒng)、軟件引入方法及存儲介質(zhì)
- 軟件驗(yàn)證裝置、軟件驗(yàn)證方法以及軟件驗(yàn)證程序
- 使用靜態(tài)和動態(tài)惡意軟件分析來擴(kuò)展惡意軟件的動態(tài)檢測
- 一種工業(yè)控制軟件構(gòu)建方法和軟件構(gòu)建系統(tǒng)
- 可替換游戲軟件與測驗(yàn)軟件的裝置與方法





