[發明專利]安卓應用程序中非權限相關隱私數據的識別方法有效
| 申請號: | 201510374683.1 | 申請日: | 2015-07-01 |
| 公開(公告)號: | CN104966031B | 公開(公告)日: | 2018-02-27 |
| 發明(設計)人: | 楊珉;楊哲慜;南雨宏;周順帆;張源 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F17/30;G06F17/27 |
| 代理公司: | 上海正旦專利代理有限公司31200 | 代理人: | 陸飛,盛志范 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 應用程序 中非 權限 相關 隱私 數據 識別 方法 | ||
技術領域
本發明屬于程序信息安全檢測技術領域,具體涉及利用自然語言處理、機器學習技術和靜態信息流分析技術,識別Android應用程序中非權限相關的隱私數據的方法。
背景技術
談及Android系統中的用戶隱私信息,大致可分為兩類,第一類為權限相關的用戶隱私,第二類為非權限相關的用戶隱私。其中,權限相關的用戶隱私指的是通過調用Android系統權限模型提供的函數接口所能獲得的用戶隱私信息,如通過調用getIMEI()函數獲取手機序列號、調用getLocation()函數獲取用戶地理位置信息等。由于安卓自身通過權限保護機制來管控這樣的隱私數據, 在調用此類函數獲取隱私信息之前必須聲明相應的權限,故稱此類隱私信息為權限相關的隱私信息。
相對而言,非權限相關的用戶隱私涉及范圍更廣,監控難度更大。此類隱私并非應用通過調用系統函數獲得,而是通過直接與用戶交互獲取。如用戶在使用購物類應用時所輸入的網銀賬號信息,或是其他用戶名、密碼等信息,都屬于非權限相關的用戶隱私范疇。應用在獲取到此類信息之后,可能將其以文件形式進行持久化存儲或通過網絡向服務器發送以實現特定功能。
對于權限相關的隱私數據,由于其敏感數據源固定(如上述getIMEI()、getLocation()等函數),故可通過傳統的靜態信息流分析,對數據進行追蹤和監控;而對于非權限相關的隱私數據而言,敏感數據源將隨著具體應用程序的不同而不同,敏感數據與普通數據混雜在用戶界面當中,因為它們均為用戶使用應用所產生的數據。故從程序分析的角度, 無法通過信息流分析、污點跟蹤技術等對其進行有效的檢測分析。
發明內容
本發明的目的是提供一種支持大規模批量、離線分析的,Android應用程序中非權限相關隱私數據的自動識別方法。
本發明提供的Android應用程序中非權限相關的隱私數據的識別方法,具有以下特點:
(1)僅憑借對代碼的靜態分析識別敏感數據源,無需額外的用戶交互信息;
(2)具備自適應能力,分析應用的速度快、資源消耗低;
(3)以界面元素為依據對用戶隱私進行識別,并自動判定界面元素與后臺函數的關系.
由于非權限相關的用戶隱私數據涉及范圍較廣,且不同類別的用戶隱私涉及的文本詞匯都有較大差異,為了便于解釋說明,本發明將用戶隱私數據總結為三類:
(1)Account Credentials and User Profiles(賬戶相關的認證信息以及用戶數據);
(2)Location(地理位置數據);
(3)Financial(金融支付類隱私數據)。
對于不同類別的隱私數據,本發明所關注的文本特征略有差別。
本發明提供的Android應用程序中非權限相關的隱私數據的識別方法,其架構如附圖1所示,整個識別過程分為四個階段:
1、數據預處理,包括:提取資源文件,文本預處理。
提取資源文件:首先對Android應用程序進行逆向工程,提取得到描述界面的資源文件。在Android應用程序中,用戶交互界面(UI)是由若干個界面元素所組成的,不同種類的界面元素提供了展示信息、接受輸入等不同功能。Android系統主要使用XML文件來描述用戶交互界面。
對于逆向后的Android應用程序,其描述界面的XML文件散布于不同的文件夾中。其中,用以描述UI界面的布局文件位于res/layout文件夾下;界面元素和其16進制ID的對應關系存儲于res/value/public.xml文件中;界面中所展示的文本(即界面文本)位于/res/values/strings.xml文件中。上述資源文件的內容如附圖2的樣例所示。
由于本發明分析的重點在于應用的界面元素,所以本發明關注的信息主要有兩類:界面文本和布局信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510374683.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于獲取圖像數據的條碼識讀引擎
- 下一篇:數據保護系統、方法和裝置





