[發(fā)明專利]目標代碼的生成方法及裝置在審
| 申請?zhí)枺?/td> | 202210397342.6 | 申請日: | 2022-04-15 |
| 公開(公告)號: | CN114661616A | 公開(公告)日: | 2022-06-24 |
| 發(fā)明(設計)人: | 林文杰;陸楊芳;霍華仔;張健雯 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F8/30 |
| 代理公司: | 北京康信知識產(chǎn)權代理有限責任公司 11240 | 代理人: | 周春枚 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 代碼 生成 方法 裝置 | ||
1.一種目標代碼的生成方法,其特征在于,包括:
確定被測對象的代碼標注信息;
將所述代碼標注信息輸入訓練完成的生成模型,由所述生成模型輸出對應的輸出代碼信息,其中,所述生成模型是先后通過第一數(shù)據(jù)集進行預訓練,以及通過第二數(shù)據(jù)集進行調(diào)整訓練得到的,所述第一數(shù)據(jù)集包括部分代碼和對應的完整代碼,所述第二數(shù)據(jù)集包括輸入的代碼標注信息以及對應的輸出代碼信息;
根據(jù)所述輸出代碼信息確定所述被測對象的目標代碼,其中,所述目標代碼用于對所述被測對象進行測試。
2.根據(jù)權利要求1所述的方法,其特征在于,將所述代碼標注信息輸入訓練完成的生成模型,由所述生成模型輸出對應的輸出代碼信息包括:
將所述代碼標注信息輸入所述生成模型的目標網(wǎng)絡,由所述目標網(wǎng)絡輸出所述輸出代碼信息,其中,所述目標網(wǎng)絡有多層,每層都設置有密集解碼模塊,相鄰的密集解碼模塊之間設置有連接模塊,多層密集解碼模塊按照解碼捷徑機制進行連接。
3.根據(jù)權利要求2所述的方法,其特征在于,將所述代碼標注信息輸入所述生成模型的目標網(wǎng)絡,由所述目標網(wǎng)絡輸出所述輸出代碼信息包括:
將所述代碼標注信息輸入第一層的第一密集解碼模塊,由所述第一密集解碼模塊進行處理得到第一處理結(jié)果,并將處理結(jié)果發(fā)送給第二層的第二密集解碼模塊,以及后續(xù)的多個連接模塊,其中,所述第一密集解碼模塊與所述第二密集解碼模塊之間直接連接;
通過所述第二密集解碼模塊將所述第一處理結(jié)果繼續(xù)進行處理,得到第二處理結(jié)果,并將所述第二處理結(jié)果發(fā)送給第二層與第三層之間的第一連接模塊,以及后續(xù)的其他連接模塊,由所述第一連接模塊將所述第二處理結(jié)果處理后發(fā)送給第三層的第三密集解碼模塊;
通過所述第三密集解碼模塊將所述第二處理結(jié)果繼續(xù)進行處理,得到第三處理結(jié)果,并將所述第二處理結(jié)果發(fā)送給第三層與第四層之間的第二連接模塊,以及后續(xù)的其他連接模塊;
通過后續(xù)的密集解碼模塊進行處理,由最后一層的密集解碼模塊和最后一個連接模塊輸出所述輸出代碼信息。
4.根據(jù)權利要求3所述的方法,其特征在于,將所述代碼標注信息輸入第一層的第一密集解碼模塊,由所述第一密集解碼模塊進行處理得到第一處理結(jié)果包括:
將所述代碼標注信息輸入到所述第一密集解碼模塊的自注意力模塊,由所述自注意力模塊處理后得到第一解碼信息;
將所述第一解碼信息發(fā)送給第一切換正則化模塊,得到第二解碼信息,其中,所述自注意力模塊與所述第一切換正則化模塊之間為殘差連接,所述第一切換正則化模塊為層正則化函數(shù)和實例正則化函數(shù)組合確定的;
將所述第二解碼信息發(fā)送給前饋模塊,得到第三解碼信息;
將所述第一解碼信息,所述第二解碼信息和所述第三解碼信息輸入第二切換正則化模塊,由所述第二切換正則化模塊輸出所述第一處理結(jié)果。
5.根據(jù)權利要求1所述的方法,其特征在于,確定被測對象的代碼標注信息包括:
確定所述被測對象的類文件;
提取所述類文件中的代碼標注信息。
6.根據(jù)權利要求5所述的方法,其特征在于,將所述代碼標注信息輸入訓練完成的生成模型,由所述生成模型輸出對應的輸出代碼信息之前,所述方法還包括:
根據(jù)所述代碼標注信息,生成預設數(shù)據(jù)格式的輸入信息,其中,所述預設數(shù)據(jù)格式包括開始標志,結(jié)束標志以及所述代碼標注信息;
根據(jù)所述輸出代碼信息確定所述被測對象的目標代碼包括:
從所述預設數(shù)據(jù)格式的輸出代碼信息提取所述目標代碼。
7.一種目標代碼的生成模型的訓練方法,其特征在于,包括:
獲取第一數(shù)據(jù)集和第二數(shù)據(jù)集,其中,所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集的來源不同;
根據(jù)所述第一數(shù)據(jù)集對生成模型進行預訓練,其中,所述第一數(shù)據(jù)集包括部分代碼和對應的完整代碼;
在預訓練完成的情況下,根據(jù)所述第二數(shù)據(jù)集對所述生成模型進行調(diào)整訓練,其中,所述第二數(shù)據(jù)集包括輸入的代碼標注信息以及對應的輸出代碼信息;
在所述調(diào)整訓練驗證通過的情況下,訓練完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經(jīng)中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210397342.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





