[發明專利]一種利用深度學習結合哈希編碼對圖片侵權內容的提取識別技術在審
| 申請號: | 201711432928.7 | 申請日: | 2017-12-26 |
| 公開(公告)號: | CN108171264A | 公開(公告)日: | 2018-06-15 |
| 發明(設計)人: | 沈家云;王松;吳澤鋒 | 申請(專利權)人: | 北京非斗數據科技發展有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100029 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 哈希 圖片內容 版權問題 比對識別 定位技術 技術手段 三個步驟 圖片編碼 圖片特征 圖片資源 比對 二層 并用 復制 擴散 學習 圖片 | ||
本發明涉及專門適用于利用技術手段實現侵權資源的提取及識別比對,防止圖片內容的侵權復制與擴散方法技術領域,特別是涉及保護圖片內容的版權問題方法。本發明采用的技術方法可分為三個步驟:步驟一、圖片資源爬取;步驟二、利用深度學習對圖片特征提取并用哈希編碼對圖片進行編碼;步驟三、利用二層哈希編碼定位技術對圖片編碼比對識別內容是否為侵權內容。
技術領域
本發明涉及專門適用于利用技術手段實現侵權資源的提取及識別比對,防止圖片內容的侵權復制與擴散方法技術領域,特別是涉及保護圖片內容的版權問題方法。
背景技術
隨著人們圖片權益物化意識的增強,版權糾紛案件迭起。國家版權局發布的《2015年中國網絡版權保護年度報告》指出:我國版權歸屬、交叉授權等方式混亂,權力人間的版權糾紛愈來愈多發,各種亂象亟待行業規范。據統計,2015年國內各省市政府開展的保護知識產權專項行動中,共查處涉及數字版權糾紛的行政案件383件,行政罰款450萬元,移送司法機關刑事處理59件。法院受理的著作權案件中,網絡著作權糾紛案件高達50%。每年因盜版導致的損失在10億元左右。基于此類問題,利用技術手段提取網絡中圖片侵權內容,及時防止侵權內容進一步傳播擴散對版權所有人或單位構成所有權侵犯,圖片內容的保護顯得尤為重要。
目前我國對互聯網環境下圖片權益保護的認識及處置技術的研究還處于初級階段,國民經濟、技術等方面的綜合水平較低,使得我國在數字圖片權益保護方面具有迫切性和必要性。我國已有的版權監測系統的建設規模與網絡規模相比來說還是捉襟見肘,且大部分的版權檢測采用傳統方法進行數據的采集和分析。局限性體現在采用網頁文字爬取方式,根據關鍵字對網頁進行搜索,對網頁中的內容無法進行監測,遇到標題與內容不符的情況下,無法自動判定;自行研發的特征值提取算法,精度與效率無法得到有效保障;檢測業務被動,需要用戶登錄至監測平臺中,單獨提交一份申請監測作品的資料,才能夠進行版權監測。
當下,深度學習的應用日趨廣泛,利用深度學習技術完成大規模數據量的智能化處理分析應用已經十分成熟。相比較目前火熱的機器學習用大量數據訓練模型替代專家經驗的方法,深度學習只需要學習訓練數據來修改模型參數即可達到令人滿意的處理效果,深度學習網絡典型模型為深度卷積網絡,其在圖像識別領域受到了廣泛重視。在對侵權資源的識別提取過程中,利用深度學習的方法對圖片的特征向量進行并行式多維度提取,將深層卷積神經網絡與LSH、SH、SKLSH、ITQ、PCA-RR、DSH六種哈希編碼策略進行結合,構建新的編碼策略對圖片多維度特征向量進行編碼。采用一種基于哈希編碼定位技術的二層對比方法并結合權屬信息或權威時間源,將疑似侵權資源的編碼與母帶的編碼進行對比,計算其相似度以判定是否確實侵權及實現篡改部位的提取。再利用機器學習對侵權圖片侵權使用的內容類型、用戶類型、傳播途徑進行數據分析,挖掘其擴散特點及受眾特點,為防止圖片侵權內容進一步傳播所制定保護方法提供了可靠地參考來源,提高了網絡圖屬性管理的科學性并加強了權利人合法權益的保護。
發明內容
本發明的主要目的是為了防止圖片侵權內容進一步傳播,保護圖片版權所屬人正當權益不受侵害,提供了一種基于數據驅動的對侵權圖片資源的比對、識別、提取技術并對數字侵權傳播使用的用戶、渠道、傳播方式進行分析,為圖片的有效監管提供準確的受眾分類模型。
通過深度學習對圖片進行并行式多維度特征提取,按照不同的應用場景對不同維度的特征重要性進行排序;制定哈希編碼策略,將特征向量進行編碼生成圖片唯一身份碼,為圖片的準確辨識提供科學依據;將圖片的編碼與權屬信息或權威時間源綁定,利用二層哈希編碼定位技術對圖片的編碼進行定位、比對、辨識以實現侵權圖片及其篡改部位的準確識別,為圖片的合法使用提供技術支持;。該項技術能夠大幅地提高對圖片侵權內容的取證效率,同時能夠實現對侵權圖片進行準確識別,比對侵權內容來源,從源頭上監管圖片內容,防止非法傳播,真正從技術層面上為圖片內容版權保護提供了有力保障。
為了實現上述目的,本發明采用的技術方法可分為三個步驟:
步驟一、圖片資源爬取;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京非斗數據科技發展有限公司,未經北京非斗數據科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711432928.7/2.html,轉載請聲明來源鉆瓜專利網。





