[發明專利]視頻檢測方法、裝置、設備及介質在審
| 申請號: | 202210369060.5 | 申請日: | 2022-04-08 | 
| 公開(公告)號: | CN114724218A | 公開(公告)日: | 2022-07-08 | 
| 發明(設計)人: | 郝艷妮;馬先欽;王璋盛;王一剛;曹家;羅引;王磊 | 申請(專利權)人: | 北京中科聞歌科技股份有限公司 | 
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V40/40;G06V20/40;G06V10/82;G06N3/04;G06N3/08 | 
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 吳崇 | 
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 視頻 檢測 方法 裝置 設備 介質 | ||
本公開涉及一種視頻檢測方法、裝置、設備及介質。其中,視頻檢測方法包括:獲取待檢測的圖像序列,圖像序列包含同一視頻中的至少兩個視頻幀;針對圖像序列中的每個圖像,對圖像的臉部特征進行非線性變換處理,得到圖像對應的臉部多個區域的注意力特征;基于各個圖像對應的臉部多個區域的注意力特征,構建圖像序列對應的臉部多個區域之間的時序關系特征;基于時序關系特征,計算視頻為偽造臉部的視頻的概率。根據本公開實施例,能夠使得概率的計算結果的準確率更高、泛化能力更強,進而提高偽造臉部視頻檢測的精確度。
技術領域
本公開涉及視頻處理技術領域,尤其涉及一種視頻檢測方法、裝置、設備及介質。
背景技術
偽造臉部視頻是指視頻內容中的人臉、動物臉等臉部經過深度偽造算法(Deepfake)篡改的視頻。
因此,如何準確地檢測出偽造臉部視頻是亟需解決的技術問題。
發明內容
為了解決上述技術問題,本公開提供了一種視頻檢測方法、裝置、設備及介質。
第一方面,本公開提供了一種視頻檢測方法,包括:
獲取待檢測的圖像序列,圖像序列包含同一視頻中的至少兩個視頻幀;
針對圖像序列中的每個圖像,對所述圖像的臉部特征進行非線性變換處理,得到圖像對應的臉部多個區域的注意力特征;
基于各個圖像對應的臉部多個區域的注意力特征,構建圖像序列對應的臉部多個區域之間的時序關系特征;
基于時序關系特征,計算視頻為偽造臉部的視頻的概率。
第二方面,本公開提供了一種視頻檢測裝置,包括:
圖像獲取模塊,用于獲取待檢測的圖像序列,圖像序列包含同一視頻中的至少兩個視頻幀;
非線性變化模塊,用于針對圖像序列中的每個圖像,對圖像的臉部特征進行非線性變換處理,得到圖像對應的臉部多個區域的注意力特征;
特征構建模塊,用于基于各個圖像對應的臉部多個區域的注意力特征,構建圖像序列對應的臉部多個區域之間的時序關系特征;
概率計算模塊,用于基于時序關系特征,計算視頻為偽造臉部的視頻的概率。
第三方面,本公開提供了一種視頻檢測設備,包括:
處理器;
存儲器,用于存儲可執行指令;
其中,處理器用于從存儲器中讀取可執行指令,并執行可執行指令以實現第一方面的視頻檢測方法。
第四方面,本公開提供了一種計算機可讀存儲介質,該存儲介質存儲有計算機程序,當計算機程序被處理器執行時,使得處理器實現第一方面的視頻檢測方法。
本公開實施例提供的技術方案與現有技術相比具有如下優點:
本公開實施例的視頻檢測方法、裝置、設備及介質,能夠在獲取到待檢測的包含同一視頻中的至少兩個視頻幀的圖像序列之后,對圖像序列中的每個圖像的臉部特征進行非線性變換處理,得到每個圖像對應的臉部多個區域的注意力特征,并基于各個圖像對應的臉部多個區域的注意力特征,構建圖像序列對應的臉部多個區域之間的時序關系特征,進而基于時序關系特征,計算視頻為偽造臉部的視頻的概率,該概率可以用于判斷視頻是否為偽造臉部的視頻,由于在本公開實施例中可以基于圖像序列中的對應的臉部多個區域之間的時序關系特征計算該概率,可以在計算該概率時引入臉部多個區域之間的時序關系,進而檢測出視頻中臉部的時序不一致性,使得概率的計算結果的準確率更高、泛化能力更強,進而提高偽造臉部視頻檢測的精確度。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科聞歌科技股份有限公司,未經北京中科聞歌科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210369060.5/2.html,轉載請聲明來源鉆瓜專利網。





