[發(fā)明專利]可疑應(yīng)用檢測方法及裝置在審
| 申請?zhí)枺?/td> | 202010953285.6 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN112084489A | 公開(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計(jì))人: | 紀(jì)建芳 | 申請(專利權(quán))人: | 北京天融信網(wǎng)絡(luò)安全技術(shù)有限公司;北京天融信科技有限公司;北京天融信軟件有限公司 |
| 主分類號: | G06F21/51 | 分類號: | G06F21/51;G06F40/284 |
| 代理公司: | 北京金信知識產(chǎn)權(quán)代理有限公司 11225 | 代理人: | 韓岳松 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 可疑 應(yīng)用 檢測 方法 裝置 | ||
1.一種可疑應(yīng)用檢測方法,其特征在于,包括:
獲取應(yīng)用程序的開發(fā)者名稱;
對所述開發(fā)者名稱進(jìn)行分詞處理得到所述開發(fā)者名稱的分詞序列,其中,所述分詞序列包括多個(gè)分詞;
基于所述分詞序列計(jì)算所述開發(fā)者名稱的隨機(jī)值;
將所述隨機(jī)值與所述開發(fā)者名稱的隨機(jī)閾值比較,判斷所述開發(fā)者名稱是否隨機(jī);
若所述開發(fā)者名稱隨機(jī),則所述應(yīng)用程序?yàn)榭梢蓱?yīng)用程序。
2.根據(jù)權(quán)利要求1所述的可疑應(yīng)用檢測方法,其特征在于,基于所述分詞序列計(jì)算所述開發(fā)者名稱的隨機(jī)值,包括:
獲取所述分詞序列中每個(gè)分詞在其余每個(gè)分詞上的概率;
基于所述概率,計(jì)算所述開發(fā)者名稱的隨機(jī)值。
3.根據(jù)權(quán)利要求2所述的可疑應(yīng)用檢測方法,其特征在于,基于所述分詞序列利用二元語言模型計(jì)算所述開發(fā)者名稱的隨機(jī)值,所述方法包括:
獲取所述分詞序列中每個(gè)分詞的詞頻;
根據(jù)每個(gè)所述分詞的詞頻計(jì)算相鄰兩個(gè)分詞之間的條件概率;
根據(jù)相鄰兩個(gè)分詞之間的條件概率,計(jì)算所述開發(fā)者名稱的隨機(jī)值。
4.根據(jù)權(quán)利要求2所述的可疑應(yīng)用檢測方法,其特征在于,獲取分詞序列中每個(gè)分詞在其余每個(gè)分詞上的概率,還包括:
對所述概率進(jìn)行數(shù)據(jù)平滑處理。
5.根據(jù)權(quán)利要求1所述的可疑應(yīng)用檢測方法,其特征在于,基于所述分詞序列計(jì)算所述開發(fā)者名稱的隨機(jī)值,包括:
計(jì)算每個(gè)分詞的隨機(jī)值;
確定相鄰兩個(gè)所述分詞之間的相關(guān)關(guān)系;
根據(jù)每個(gè)所述分詞的隨機(jī)值和相鄰兩個(gè)所述分詞之間的相關(guān)關(guān)系,計(jì)算所述開發(fā)者名稱的隨機(jī)值。
6.根據(jù)權(quán)利要求1所述的可疑應(yīng)用檢測方法,其特征在于,所述開發(fā)者名稱的隨機(jī)閾值基于訓(xùn)練獲得,包括:
獲取訓(xùn)練語料樣本數(shù)據(jù),其中,所述訓(xùn)練語料樣本數(shù)據(jù)包括由非隨機(jī)字符串組成的第一樣本集和由隨機(jī)字符串組成的第二樣本集;
將所述第一樣本集分為多個(gè)第一樣本子集,計(jì)算第一樣本子集中各字符串的概率均值;
基于所述第一樣本子集中各字符串的概率均值,計(jì)算所述第一樣本集中非隨機(jī)字符串的第一概率均值;
將所述第二樣本集分為多個(gè)第二樣本子集,計(jì)算第二樣本子集中各字符串的概率均值;
基于所述第二樣本子集中各字符串的概率均值,計(jì)算所述第二樣本集中隨機(jī)字符串的第二概率均值;
將所述非隨機(jī)字符串的第一概率均值的最小值與所述隨機(jī)字符串的第二概率均值的最大值進(jìn)行比較,確定出隨機(jī)閾值,其中,所述第一概率均值和第二概率均值中的最小值為所述隨機(jī)閾值。
7.根據(jù)權(quán)利要求1所述的可疑應(yīng)用檢測方法,其特征在于,所述分詞序列包括至少兩個(gè)分詞,所述方法包括:
計(jì)算每個(gè)分詞的隨機(jī)值;
確定每個(gè)所述分詞對應(yīng)的隨機(jī)閾值;
將每個(gè)所述分詞的隨機(jī)值與對應(yīng)的隨機(jī)閾值依次進(jìn)行比較,判斷所述開發(fā)者名稱是否隨機(jī)。
8.根據(jù)權(quán)利要求1所述的可疑應(yīng)用檢測方法,其特征在于,在判斷出開發(fā)者名稱的隨機(jī)性后,所述方法還包括:
基于所述開發(fā)者名稱更新語料樣本庫。
9.一種可疑應(yīng)用檢測裝置,其特征在于,包括:
獲取模塊,其配置為獲取應(yīng)用程序的開發(fā)者名稱;
分詞模塊,其配置為對所述開發(fā)者名稱進(jìn)行分詞處理得到所述開發(fā)者名稱的分詞序列,其中,所述分詞序列包括多個(gè)分詞;
計(jì)算模塊,其配置為基于所述分詞序列計(jì)算所述開發(fā)者名稱的隨機(jī)值;
比較模塊,其配置為將所述隨機(jī)值與所述開發(fā)者名稱的隨機(jī)閾值比較,判斷所述開發(fā)者名稱是否隨機(jī);
確定模塊,其配置為若所述開發(fā)者名稱隨機(jī),則所述應(yīng)用程序?yàn)榭梢蓱?yīng)用程序。
10.根據(jù)權(quán)利要求9所述的可疑應(yīng)用檢測裝置,其特征在于,所述計(jì)算模塊還配置為:
獲取分詞序列中每個(gè)分詞在其余每個(gè)分詞上的概率;
基于所述概率,計(jì)算所述開發(fā)者名稱的隨機(jī)值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京天融信網(wǎng)絡(luò)安全技術(shù)有限公司;北京天融信科技有限公司;北京天融信軟件有限公司,未經(jīng)北京天融信網(wǎng)絡(luò)安全技術(shù)有限公司;北京天融信科技有限公司;北京天融信軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010953285.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 在線應(yīng)用平臺上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場
- 使用應(yīng)用的方法和應(yīng)用平臺
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠(yuǎn)程應(yīng)用進(jìn)行應(yīng)用安裝
- 應(yīng)用檢測方法及應(yīng)用檢測裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)





