[發明專利]基于行為的隱寫者檢測方法在審
| 申請號: | 201810996553.5 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN108985391A | 公開(公告)日: | 2018-12-11 |
| 發明(設計)人: | 張衛明;俞能海;李莉;姚遠志 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;鄭哲 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練數據 二分類 測試數據 輸入圖像 圖像 檢測 測試 社交平臺 隨機選取 行為特征 正常用戶 準確檢測 判定 發送 | ||
本發明公開了一種基于行為的隱寫者檢測方法,包括:從社交平臺選取一定數量的用戶,每個用戶爬取N張連續的圖像,并將一部分用戶的圖像作為訓練數據,其他作為測試數據;從訓練數據中隨機選取圖像來模擬隱寫者行為,生成隱寫者數據;分別從訓練數據與隱寫者數據中提取行為特征,并利用所提取的特征來訓練二分類器;利用測試數據對二分類器進行測試,并利用通過測試后的二分類器,對新輸入圖像進行檢測,從而判定發送新輸入圖像的用戶為正常用戶或隱寫者。基于該方法,可以準確檢測出隱寫者。
技術領域
本發明涉及社交網絡安全和隱寫分析領域,尤其涉及一種基于行為的隱寫者檢測方法。
背景技術
隱寫分析的目的是檢測圖像是否被隱寫術改動過。對于單張圖像的隱寫分析,通常看作是一個區分載體和載密的二分類問題,其中,設計能夠反映消息嵌入對載體統計特性影響的有效特征是其關鍵問題之一。Fridrich等人提出的富模型隱寫分析特征以及選擇信道攻擊模型使得單張圖像的隱寫分析性能得到很大的提升;近年來,隨著深度學習的發展,CNN、RNN、Res-Net、GAN也逐漸被用于隱寫分析。
雖然隱寫分析技術不斷進步,但目前的研究都是基于實驗室條件,即圖像一般為自然圖像,并且訓練分類器時要求嵌入率及嵌入算法的匹配。但在現實中通常無法滿足這種要求。首先對于圖像的嵌入率和嵌入算法是未知的。此外,在真實的社交平臺中,用戶發送的圖像內容及圖像的噪聲來源也是多樣的,這就會使得這種有監督學習的方式面臨各種失配的問題。即使隱寫分析特征高達幾萬維,在真實的場景中也難以發揮其效用。針對這種情況,Ker提出隱寫者檢測的概念,以發送圖像的用戶為單位而不是以單張圖像為單位進行檢測。在隱寫者檢測中,一般使用非監督學習方法。Ker首先提出使用聚類的方法檢測隱寫者,在2014年又將異常檢測中的局部異常因子(Local Outlier Factor)用于隱寫者檢測。2016年Li等人提出層次聚類和集成聚類的方法。Zheng等人嘗試使用深度神經網絡提取隱寫分析特征用于隱寫者檢測。雖然這些方法避免了有監督學習中的失配的問題,但其所采用的特征都是低維的傳統的隱寫分析特征,其本質依然是通過是否做過隱寫修改來做判定,對于不同的數據,其性能也會有所不同。圖1是使用Ker提出的local outlier factor(lof)的方法分別在BossBase和twitter數據上的實驗結果,橫坐標代表嵌入率,縱坐標代表隱寫者的lof值在100個隱寫者中的平均排名,越靠前說明效果越好。從圖中可以看出,在BossBase和twitter的數據上表現差異很大,受圖像源的影響很大。并且在嵌入率低的時候平均排名達到50,相當于基本檢測不到。
使用隱寫圖像進行通信的完整通信過程應該包括圖像載體的選擇,嵌入率的分配,嵌入算法的選擇,最后嵌入圖像并發送。在社交場景中,會涉及到多維度的行為信息,比如通信的頻率,通信的對象,發送圖像的內容相關性。而目前的隱寫術僅關注單維度的安全,即使得載體與載密不可區分。我們調研了上百種隱寫軟件,幾乎所有的軟件都只注重于隱寫算法的改進,而沒有考慮用戶在整個通信過程中的其他行為所泄露的信息,比如,所發送圖像的相關性。現有的隱寫軟件并不具備為用戶挑選載體的功能,相對友好的軟件會為用戶隨機的選擇載體或者允許用戶使用自己實時拍攝的圖像。但對于沒有專業知識的用戶來說,為了節省時間和精力,很可能會隨機挑選圖像作為載體。在這種情況下,使用用戶的行為信息來檢測隱寫者將會使得隱寫者檢測發生根本的改變。
發明內容
本發明的目的是提供一種基于行為的隱寫者檢測方法,可以準確檢測出隱寫者。
本發明的目的是通過以下技術方案實現的:
一種基于行為的隱寫者檢測方法,包括:
從社交平臺選取一定數量的用戶,每個用戶爬取N張連續的圖像,并將一部分用戶的圖像作為訓練數據,其他作為測試數據;
選取部分用戶的圖像作為隱寫者的數據庫,并從中隨機選取一定數量的圖像來模擬隱寫者行為,生成隱寫者數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810996553.5/2.html,轉載請聲明來源鉆瓜專利網。





