[發明專利]媒體文件識別方法、裝置、可讀介質及電子設備在審
| 申請號: | 202010495559.1 | 申請日: | 2020-06-03 |
| 公開(公告)號: | CN111639198A | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 黃鑫;白剛;董琦;宋旸;肖洋 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F16/432 | 分類號: | G06F16/432;G06F16/483;G06F16/45;G06N3/04;G06N3/08 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 曹寒梅 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 媒體文件 識別 方法 裝置 可讀 介質 電子設備 | ||
本公開涉及一種媒體文件識別方法、裝置、可讀介質及電子設備。所述方法包括:獲取待識別媒體文件的特征向量,作為第一特征向量;確定與所述第一特征向量對應的字符串,作為所述待識別媒體文件的第一指紋標識;根據所述第一指紋標識,確定所述數據庫中已存儲的媒體文件中是否存在與所述待識別媒體文件相匹配的目標媒體文件,以確定所述待識別媒體文件是否屬于所述數據庫。這樣,無需人工干預,就能識別出任意一媒體文件是否屬于數據庫,識別效率有所提升,并且,由于是基于媒體文件本身的特征進行識別,能夠保證識別準確性。另外,還可以將識別結果用于版權識別等場景,更好地保護原創內容不被濫用。
技術領域
本公開涉及計算機技術領域,具體地,涉及一種媒體文件識別方法、裝置、可讀介質及電子設備。
背景技術
隨著計算機技術的發展,數據共享也越來越便利,例如,通過復制并粘貼的方式直接使用他人的數據,即,復制他人分享到線上的內容后粘貼該內容為自己所用。一般情況下,線上的多媒體內容(例如,圖像、視頻)由用戶(或平臺)創作并分享,隨著線上多媒體內容的日益增加,用戶(或平臺)對自身原創內容的保護要求逐漸提高。因此,如何保護用戶(或平臺)的原創內容不被他人非法使用,是目前需要解決的重要問題。相關技術中,一般通過人工審核判斷某一多媒體內容是否與用戶(或平臺)的原創內容來源相同,在這個過程中,需要依賴大量人力,效率不高,并且,還可能會出現判斷錯誤的情況,準確率較低。
發明內容
提供該發明內容部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該發明內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
第一方面,本公開提供一種媒體文件識別方法,所述方法包括:
獲取待識別媒體文件的特征向量,作為第一特征向量;
確定與所述第一特征向量對應的字符串,作為所述待識別媒體文件的第一指紋標識;
根據所述第一指紋標識,確定所述數據庫中已存儲的媒體文件中是否存在與所述待識別媒體文件相匹配的目標媒體文件,以確定所述待識別媒體文件是否屬于所述數據庫。
第二方面,本公開提供一種媒體文件識別裝置,所述裝置包括:
獲取模塊,用于獲取待識別媒體文件的特征向量,作為第一特征向量;
第一確定模塊,用于確定與所述第一特征向量對應的字符串,作為所述待識別媒體文件的第一指紋標識;
第二確定模塊,用于根據所述第一指紋標識,確定所述數據庫中已存儲的媒體文件中是否存在與所述待識別媒體文件相匹配的目標媒體文件,以確定所述待識別媒體文件是否屬于所述數據庫。
第三方面,本公開提供一種計算機可讀介質,其上存儲有計算機程序,該程序被處理裝置執行時實現本公開第一方面所述方法的步驟。
第四方面,本公開提供一種電子設備,包括:
存儲裝置,其上存儲有計算機程序;
處理裝置,用于執行所述存儲裝置中的所述計算機程序,以實現本公開第一方面所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010495559.1/2.html,轉載請聲明來源鉆瓜專利網。





