[發明專利]媒體文件識別方法、裝置、可讀介質及電子設備在審
| 申請號: | 202010495559.1 | 申請日: | 2020-06-03 |
| 公開(公告)號: | CN111639198A | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 黃鑫;白剛;董琦;宋旸;肖洋 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F16/432 | 分類號: | G06F16/432;G06F16/483;G06F16/45;G06N3/04;G06N3/08 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 曹寒梅 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 媒體文件 識別 方法 裝置 可讀 介質 電子設備 | ||
1.一種媒體文件識別方法,其特征在于,所述方法包括:
獲取待識別媒體文件的特征向量,作為第一特征向量;
確定與所述第一特征向量對應的字符串,作為所述待識別媒體文件的第一指紋標識;
根據所述第一指紋標識,確定所述數據庫中已存儲的媒體文件中是否存在與所述待識別媒體文件相匹配的目標媒體文件,以確定所述待識別媒體文件是否屬于所述數據庫。
2.根據權利要求1所述的方法,其特征在于,所述獲取待識別媒體文件的特征向量,作為第一特征向量,包括:
將所述待識別媒體文件中的至少一圖像輸入至圖像分類模型中,并從所述圖像分類模型的特征提取層的輸出內容中獲取所述第一特征向量,其中,所述特征提取層為所述圖像分類模型中位于全連接層之前的一層。
3.根據權利要求1所述的方法,其特征在于,所述確定與所述第一特征向量對應的字符串,作為所述待識別媒體文件的第一指紋標識,包括:
對所述第一特征向量進行矢量量化,將所述第一特征向量轉換為預設維度的第二特征向量,其中,所述預設維度小于所述第一特征向量的維度;
對所述第二特征向量進行編碼轉換,以將所述第二特征向量轉換為預設位數的字符串,并將所述字符串作為所述第一指紋標識。
4.根據權利要求1所述的方法,其特征在于,所述根據所述第一指紋標識,確定所述數據庫中已存儲的媒體文件中是否存在與所述待識別媒體文件相匹配的目標媒體文件,以確定所述待識別媒體文件是否屬于所述數據庫,包括:
根據所述第一指紋標識和數據庫中已存儲的媒體文件各自對應的第二指紋標識,確定是否存在所述目標媒體文件,其中,所述第二指紋標識為與已存儲的媒體文件對應的字符串;
若存在所述目標媒體文件,確定所述待識別媒體文件屬于所述數據庫;
若不存在所述目標媒體文件,確定所述待識別媒體文件不屬于所述數據庫。
5.根據權利要求4所述的方法,其特征在于,所述根據所述第一指紋標識和數據庫中已存儲的媒體文件各自對應的第二指紋標識,確定是否存在與所述待識別媒體文件相匹配的目標媒體文件,包括:
分別計算所述第一指紋標識與每一所述第二指紋標識的相似度;
若所述相似度中存在大于預設相似度閾值的目標相似度,將所述目標相似度對應的已存儲的媒體文件確定為所述目標媒體文件;
若所述相似度中不存在所述目標相似度,確定不存在所述目標媒體文件。
6.根據權利要求4所述的方法,其特征在于,所述根據所述第一指紋標識和數據庫中已存儲的媒體文件各自對應的第二指紋標識,確定是否存在與所述待識別媒體文件相匹配的目標媒體文件,包括:
若所述第二指紋標識中存在與所述第一指紋標識相同的第二指紋標識,將所述與所述第一指紋標識相同的第二指紋標識對應的已存儲的媒體文件確定為所述目標媒體文件;
若不存在所述與所述第一指紋標識相同的第二指紋標識,確定不存在所述目標媒體文件。
7.根據權利要求1-6中任一項所述的方法,其特征在于,所述方法還包括:
若確定所述待識別媒體文件屬于所述數據庫,輸出提示信息,所述提示信息用于提示所述待識別媒體文件與所述目標媒體文件相同。
8.一種媒體文件識別裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取待識別媒體文件的特征向量,作為第一特征向量;
第一確定模塊,用于確定與所述第一特征向量對應的字符串,作為所述待識別媒體文件的第一指紋標識;
第二確定模塊,用于根據所述第一指紋標識,確定所述數據庫中已存儲的媒體文件中是否存在與所述待識別媒體文件相匹配的目標媒體文件,以確定所述待識別媒體文件是否屬于所述數據庫。
9.一種計算機可讀介質,其上存儲有計算機程序,其特征在于,該程序被處理裝置執行時實現權利要求1-7中任一項所述方法的步驟。
10.一種電子設備,其特征在于,包括:
存儲裝置,其上存儲有計算機程序;
處理裝置,用于執行所述存儲裝置中的所述計算機程序,以實現權利要求1-7中任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010495559.1/1.html,轉載請聲明來源鉆瓜專利網。





