[發(fā)明專利]一種基于LSTM自動補全代碼的裝置有效
| 申請?zhí)枺?/td> | 201810231329.7 | 申請日: | 2018-03-20 |
| 公開(公告)號: | CN108563433B | 公開(公告)日: | 2021-01-26 |
| 發(fā)明(設計)人: | 李戈;金芝 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F8/30 | 分類號: | G06F8/30;G06F8/41 |
| 代理公司: | 北京辰權知識產(chǎn)權代理有限公司 11619 | 代理人: | 劉廣達 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lstm 自動 代碼 裝置 | ||
1.一種基于LSTM自動補全代碼的裝置,其特征在于,包括:
源代碼處理單元,使用抽象語法樹解析源代碼;
線下訓練單元,使用LSTM模型訓練語言模型,所述LSTM模型包括約束字符級LSTM和使用前上下文標識符編碼器的標識符級LSTM;所述使用前上下文標識符編碼器的標識符級LSTM通過以下四種途徑中的一種或多種編碼標識符:
(1)索引,一個程序中不同位置的相同標識符代表相同的索引;
(2)類型加索引,將標識符的類型和索引結合使用;
(3)前標識符,通過評價一個、兩個或三個前標識符來分別編碼標識符;
(4)標識符ID,使用標識符ID替換所有標識符;
線上代碼補全單元,根據(jù)訓練過的語言模型補全代碼;
所述約束字符級LSTM用于引入標識符以完成方法調用預測,所述方法調用預測的過程為:
加入約束,提取意圖援引方法的對象和類;
通過遍歷所述抽象語法樹獲得所有的類聲明的方法;
預測方法名的第一個字符,并依次預測該方法的后續(xù)字符。
2.根據(jù)權利要求1所述的基于LSTM自動補全代碼的裝置,其特征在于:
所述源代碼處理單元將所述源代碼被解析為不同形式,以獲得代碼的類、方法列表、代碼標識符。
3.根據(jù)權利要求1所述的基于LSTM自動補全代碼的裝置,其特征在于:
所述線下訓練單元使用LSTM模型引入解析源代碼得到的標識符,并在不同場景中分別訓練語言模型。
4.根據(jù)權利要求2所述的基于LSTM自動補全代碼的裝置,其特征在于:
所述LSTM模型為串聯(lián)的兩層LSTM模型,所述兩層LSTM模型位于隱藏層。
5.根據(jù)權利要求1所述的基于LSTM自動補全代碼的裝置,其特征在于:
所述線下訓練單元引入所述標識符后,將所述源代碼的序列輸入到所述LSTM模型中,所述語言模型根據(jù)給定的部分程序的可能性分布來生成后續(xù)標識符。
6.根據(jù)權利要求1所述的基于LSTM自動補全代碼的裝置,其特征在于:
所述線上代碼補全單元將部分代碼片段輸入已經(jīng)訓練過的語言模型,從而根據(jù)編程環(huán)境輸出推薦的代碼元素。
7.根據(jù)權利要求1所述的基于LSTM自動補全代碼的裝置,其特征在于:
所述裝置進一步包括顯示單元,所述顯示單元根據(jù)每個字符的生成方式不同而進行區(qū)分顯示。
8.根據(jù)權利要求7所述的基于LSTM自動補全代碼的裝置,其特征在于:
所述顯示單元的顯示方式如下:
對于自動補全但尚未被用戶確認的代碼,顯示為底部填充為淺灰色的推薦待確認代碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經(jīng)北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810231329.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 用于高階長短期記憶網(wǎng)絡的系統(tǒng)和方法
- 基于深度學習LSTM的空調故障診斷方法
- 基于注意力機制的時間序列預測方法、裝置及存儲介質
- 一種基于PCA-LSTM網(wǎng)絡的廢水處理智能監(jiān)控方法
- 一種基于FAF-LSTM深度神經(jīng)網(wǎng)絡的居民負荷預測方法及系統(tǒng)
- 用于預測血糖水平的循環(huán)神經(jīng)網(wǎng)絡裝置和系統(tǒng)
- 基于情景LSTM結構網(wǎng)絡的微博情感分析方法
- 語音信號處理方法、裝置、電子設備和存儲介質
- 基于約束并行LSTM分位數(shù)回歸的電力負荷概率預測方法
- 基于深度網(wǎng)絡AS-LSTM的命名實體識別系統(tǒng)及識別方法





