[發明專利]視頻處理裝置、視頻處理方法和機器可讀存儲介質在審
| 申請號: | 202010230229.X | 申請日: | 2020-03-27 |
| 公開(公告)號: | CN113453067A | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 楊靜;李斐;汪君楚;劉汝杰 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | H04N21/44 | 分類號: | H04N21/44;H04N21/472;G06K9/00;G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 唐京橋;姜婷 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 處理 裝置 方法 機器 可讀 存儲 介質 | ||
本公開涉及一種視頻處理裝置、視頻處理方法和機器可讀存儲介質。視頻處理裝置包括:獲取單元,其基于動作視頻剪輯得到初始標記幀;設置單元,其基于關于所述動作視頻剪輯的信息來設置滑動窗;匹配單元,其將所述初始標記幀與所述動作視頻剪輯在所述滑動窗中的每個幀進行相似度匹配;以及選擇單元,其基于相似度匹配的結果,選擇所述動作視頻剪輯在所述滑動窗中的一個幀作為標記幀。該視頻處理裝置可以在周期動作片段中正確地捕捉某一次動作實例。
技術領域
本公開涉及視頻處理的技術領域,具體地涉及用于動作次數計數的視頻處理裝置、視頻處理方法和機器可讀存儲介質。
背景技術
這個部分提供了與本公開有關的背景信息,這不一定是現有技術。
周期性或準周期性的動作廣泛存在于視頻理解任務中。最近,在視頻監控、虛擬現實等領域,對這類動作進行檢測和周期性統計的需求逐漸增多。在現有技術中,基于深度學習的方法,能夠在時序上比較精確地定位不同動作的開始和結束,而當需要在重復多次的同一動作的視頻片斷中對其中一次動作實例的開始結束進行定位時,問題往往就會變得更具有挑戰性。如何在周期動作片段中正確地捕捉某一次動作實例成為了該領域研究中的重要課題。
發明內容
這個部分提供了本公開的一般概要,而不是其全部范圍或其全部特征的全面披露。
本公開的目的在于提供一種用于在周期動作片段中正確地捕捉某一次動作實例的視頻處理裝置、視頻處理方法和機器可讀存儲介質。
根據本公開的一方面,提供了一種視頻處理裝置,該裝置包括:獲取單元,其基于動作視頻剪輯得到初始標記幀;設置單元,其基于關于所述動作視頻剪輯的信息來設置滑動窗;匹配單元,其將所述初始標記幀與所述動作視頻剪輯在所述滑動窗中的每個幀進行相似度匹配;以及選擇單元,其基于相似度匹配的結果,選擇所述動作視頻剪輯在所述滑動窗中的一個幀作為標記幀。
根據本公開的另一方面,提供了一種視頻處理方法,包括:基于動作視頻剪輯得到初始標記幀;基于關于所述動作視頻剪輯的信息來設置滑動窗;將所述初始標記幀與所述動作視頻剪輯在所述滑動窗中的每個幀進行相似度匹配;以及基于相似度匹配的結果,選擇所述動作視頻剪輯在所述滑動窗中的一個幀作為標記幀。
根據本公開的另一方面,提供了一種機器可讀存儲介質,其上攜帶有包括存儲在其中的機器可讀指令代碼的程序產品,其中,所述指令代碼當由計算機讀取和執行時,能夠使所述計算機執行根據本公開的視頻處理方法。
使用根據本公開的視頻處理裝置、視頻處理方法和機器可讀存儲介質,可以通過在動作視頻剪輯中搜索符合條件的標記幀來在動作視頻剪輯中正確地捕捉某一次動作實例。
從在此提供的描述中,進一步的適用性區域將會變得明顯。這個概要中的描述和特定例子只是為了示意的目的,而不旨在限制本公開的范圍。
附圖說明
在此描述的附圖只是為了所選實施例的示意的目的而非全部可能的實施,并且不旨在限制本公開的范圍。在附圖中:
圖1為圖示根據本公開的實施例的視頻處理裝置的結構的框圖;
圖2為圖示根據本公開的另一實施例的視頻處理裝置的結構的框圖;
圖3為圖示根據本公開的實施例的視頻處理裝置中的獲取單元的結構的框圖;
圖4為圖示根據本公開的另一實施例的視頻處理裝置的結構的框圖;
圖5為圖示根據本公開的另一實施例的視頻處理裝置的部分詳細結構的框圖;
圖6為圖示根據本公開的實施例的視頻處理方法的流程圖;
圖7為圖示根據本公開的另一實施例的視頻處理方法的流程圖;以及
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010230229.X/2.html,轉載請聲明來源鉆瓜專利網。





