[發明專利]基于OpenCL的優化分類模型的建立、優化分類方法及系統有效
| 申請號: | 202110277166.8 | 申請日: | 2021-03-15 |
| 公開(公告)號: | CN113157917B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 湯戰勇;張宇翔;趙佳棋;張成;葉貴鑫;房鼎益 | 申請(專利權)人: | 西北大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/253;G06F40/30;G06N3/0464 |
| 代理公司: | 西安恒泰知識產權代理事務所 61216 | 代理人: | 王芳 |
| 地址: | 710069 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 opencl 優化 分類 模型 建立 方法 系統 | ||
1.基于OpenCL的優化分類模型的建立方法,其特征在于,包括如下步驟:
步驟1:獲取源代碼數據集和源代碼類別集,所述的源代碼數據集包括多個源代碼,所述的源代碼類別集包括源代碼數據集中所有源代碼的類別,根據源代碼數據集建立AST圖集和IR圖集,其中,根據源代碼數據集中任意一個源代碼生成多張AST圖和多張IR圖滿足如下子步驟:
步驟1.1:將源代碼進行預處理,獲得標準化源代碼;
步驟1.2:獲取標準化源代碼中的主函數,對標準化源代碼中的主函數進行AST解析,獲得標準化源代碼的AST樹,對標準化源代碼中的主函數進行IR轉換,獲得中間指令集;
步驟1.3:對步驟1.2得到的AST樹根據深度優先遍歷添加AST邊,生成多張AST圖,其中,每張AST圖包含一種AST邊且不同AST圖包含的AST邊的種類不同,所述的AST邊的種類包括:Child邊、Next_Token邊、Guarded邊、Jump邊和Compute_From邊;
步驟1.4:對步驟1.2得到的中間指令集添加IR邊,生成多張IR圖,其中,每張IR圖包含一種IR邊且不同IR圖包含的IR邊的種類不同,所述的IR邊的種類包括:順序流邊、數據流邊和控制流邊;
步驟2:建立RGNN模型,所述的RGNN模型包括嵌入層、批標準化層和全連接層,將AST圖集和IR圖集作為訓練集,將源代碼類別集作為標簽集,對RGNN模型進行訓練,將訓練好的RGNN模型作為優化分類模型;
所述的嵌入層用于獲取每個源代碼的特征矩陣、每個源代碼的所有AST圖的鄰接矩陣和每個源代碼的所有IR圖的鄰接矩陣,生成每個源代碼的嵌入層向量;
所述的批標準化層用于獲取每個源代碼的嵌入向量并進行歸一化,得到每個源代碼的歸一化向量;
所述的全連接層用于獲取每個源代碼的歸一化向量進行分類,輸出源代碼的類別;
所述特征矩陣的構建方法如下:(1)學習AST樹中節點的特征,獲得每種屬性的特征向量,每個屬性的特征向量形式為1*100的一維向量;每個AST樹節點都有對應的屬性,屬性使用字符串表明該節點的作用;對每個AST樹中訪問到的節點屬性進行打印保存,最終獲得所有圖的節點屬性集合,使用Word2Vec的Skip-Gram算法去學習節點類型和節點上下文之間的關系;設置上下文長度設為1,嵌入長度設為100;(2)節點向量重組:根據節點類型進行特征抽取重組,假如一個Kernel轉換的圖有50個AST節點,則會根據節點的類型抽取對應向量進行拼接生成一個50*100的特征矩陣;至此完成所有Cl2Graph的流程;
具體的,所述的嵌入層中,AST圖的鄰接矩陣可以表示為:
G1=GASTChild,GNextToken,GGuardedBy,GJump,GComputedFrom,其中任意G=V,EV代表節點集合,E代表邊的集合;
根據邊類型進行特征提取,獲得AST圖的特征μ1,μ1=GASTChild*X+GNextToken*X+,GGuardedBy*X+...+GComputedFrom,特征矩陣X與每種邊構建的圖做卷積操作,生成每種邊獨有的新的節點特征,最終將五種特征矩陣進行聚合,完邊類型的特征提??;同理,IR圖同樣進行上述操作,得到IR圖的鄰接矩陣G2,IR圖的特征μ2,將μ1和μ2進行拼接得到節點特征向量μ。
2.如權利要求1所述的基于OpenCL的優化分類模型的建立方法,其特征在于,所述的源代碼的類別為運行設備種類或分配線程數的種類,所述的運行設備種類包括2種,所述的分配線程數的種類為6種。
3.如權利要求2所述的基于OpenCL的優化分類模型的建立方法,其特征在于,所述的全連接層包括兩層,第一層為16個神經,第二層為N個神經元,N為大于等于2的正整數,若源代碼的類別為運行設備種類,則N=2,若源代碼的類別為分配線程數的種類,則N=6。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北大學,未經西北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110277166.8/1.html,轉載請聲明來源鉆瓜專利網。





