[發明專利]URL提取方法及裝置有效
| 申請號: | 202110258227.6 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112632423B | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 徐國愛;徐國勝;齊向東;紀勝龍;王少杰;王晨宇;張洪盈;毛慶梅 | 申請(專利權)人: | 北京郵電大學;奇安信科技集團股份有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 鄭穎穎 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | url 提取 方法 裝置 | ||
1.一種URL提取方法,其特征在于,包括:
獲取源代碼文件;
基于源代碼文件構建抽象語法樹;
遍歷所述抽象語法樹,獲取Web-API;
根據Web-API,確定目標參數;
再次遍歷所述抽象語法樹,判斷目標參數是否存在于源代碼文件中;
若是,進行第一處理,得到URL;若否,進行第二處理,得到URL;
其中,所述根據Web-API,確定目標參數具體包括:根據Web-API調用模塊的信息,解析Web-API依賴的節點,得到調用方法所依賴的對象及其參數,即得目標參數;
所述第一處理包括:根據目標參數的賦值類型,進行對應的提取處理;其中,所述目標參數的賦值類型包括常量賦值、函數賦值和用戶輸入;在所述第一處理中:當目標參數為常量賦值時,進行第一提取處理:直接提取目標參數對應的常量字符串;當目標參數為用戶輸入時,進行第二提取處理:設定用戶輸入,提取設定用戶輸入對應的常量字符串;當目標參數為函數賦值時,進行第三提取處理;所述第三提取處理包括:跟蹤目標參數依賴的構造函數對應的參數的賦值和方法調用構造,解析目標參數的值,獲得常量字符串;按照構造函數執行所得常量字符串,得到完整常量字符串;
所述第二處理包括:根據源代碼文件引入的外部資源文件的類型,進行對應的提取處理;所述第二處理具體包括:當外部資源文件的類型為源代碼型時,循環基于源代碼文件構建抽象語法樹至得到URL的步驟;當外部資源文件的類型為非源代碼型時,搜索目標參數的值,得到常量字符串。
2.根據權利要求1所述的URL提取方法,其特征在于,跟蹤目標參數依賴的構造函數對應的參數的賦值和方法調用構造,解析目標參數的值,獲得常量字符串具體包括:
判斷目標參數依賴的構造函數對應的參數的賦值類型;
當參數為常量賦值時,進行所述第一提取處理;當參數為用戶輸入時,進行所述第二提取處理;當參數為函數輸入時,進行所述第三提取處理。
3.根據權利要求1所述的URL提取方法,其特征在于,還包括,存儲URL至文件中,并輸出URL及URL所在的文件路徑。
4.一種URL提取裝置,其特征在于,包括:
源代碼文件獲取模塊,用于獲取源代碼文件;
抽象語法樹構建模塊,用于基于源代碼文件構建抽象語法樹;
Web-API獲取模塊,用于遍歷所述抽象語法樹,獲取Web-API;
目標參數確定模塊,用于根據Web-API,確定目標參數;
目標參數位置判斷模塊,用于再次遍歷所述抽象語法樹,判斷目標參數是否存在于源代碼文件中;
處理模塊,用于若目標參數存在于源代碼文件中為是,進行第一處理,得到URL;若目標參數存在于源代碼文件中為否,進行第二處理,得到URL;
其中,所述根據Web-API,確定目標參數具體包括:根據Web-API調用模塊的信息,解析Web-API依賴的節點,得到調用方法所依賴的對象及其參數,即得目標參數;
所述第一處理包括:根據目標參數的賦值類型,進行對應的提取處理;其中,所述目標參數的賦值類型包括常量賦值、函數賦值和用戶輸入;在所述第一處理中:當目標參數為常量賦值時,進行第一提取處理:直接提取目標參數對應的常量字符串;當目標參數為用戶輸入時,進行第二提取處理:設定用戶輸入,提取設定用戶輸入對應的常量字符串;當目標參數為函數賦值時,進行第三提取處理;所述第三提取處理包括:跟蹤目標參數依賴的構造函數對應的參數的賦值和方法調用構造,解析目標參數的值,獲得常量字符串;按照構造函數執行所得常量字符串,得到完整常量字符串;
所述第二處理包括:根據源代碼文件引入的外部資源文件的類型,進行對應的提取處理;所述第二處理具體包括:當外部資源文件的類型為源代碼型時,循環基于源代碼文件構建抽象語法樹至得到URL的步驟;當外部資源文件的類型為非源代碼型時,搜索目標參數的值,得到常量字符串。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學;奇安信科技集團股份有限公司,未經北京郵電大學;奇安信科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110258227.6/1.html,轉載請聲明來源鉆瓜專利網。





