[發明專利]視頻處理裝置、視頻處理方法和機器可讀存儲介質在審
| 申請號: | 202010230229.X | 申請日: | 2020-03-27 |
| 公開(公告)號: | CN113453067A | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 楊靜;李斐;汪君楚;劉汝杰 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | H04N21/44 | 分類號: | H04N21/44;H04N21/472;G06K9/00;G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 唐京橋;姜婷 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 處理 裝置 方法 機器 可讀 存儲 介質 | ||
1.一種視頻處理裝置,包括:
獲取單元,其基于動作視頻剪輯得到初始標記幀;
設置單元,其基于關于所述動作視頻剪輯的信息來設置滑動窗;
匹配單元,其將所述初始標記幀與所述動作視頻剪輯在所述滑動窗中的每個幀進行相似度匹配;以及
選擇單元,其基于相似度匹配的結果,選擇所述動作視頻剪輯在所述滑動窗中的一個幀作為標記幀。
2.根據權利要求1所述的視頻處理裝置,還包括:
輸入視頻處理單元,其使用深度神經網絡DNN對輸入視頻進行深度學習處理,以得到所述動作視頻剪輯和關于所述動作視頻剪輯的信息。
3.根據權利要求1所述的視頻處理裝置,其中,所述獲取單元選擇所述動作視頻剪輯中的第一個幀作為所述初始標記幀,或者基于所述動作視頻剪輯中的每個幀的標記置信度和速度得分中的至少一個來確定所述初始標記幀。
4.根據權利要求1所述的視頻處理裝置,其中,
所述設置單元基于對所述標記幀的選擇來重新設置所述滑動窗;
所述匹配單元將所述標記幀與所述動作視頻剪輯在重新設置的滑動窗中的每個幀進行相似度匹配;以及
所述選擇單元基于相似度匹配的結果,選擇所述動作視頻剪輯在重新設置的滑動窗中的一個幀作為新的標記幀。
5.根據權利要求4所述的視頻處理裝置,還包括判定單元,其判定所述動作視頻剪輯是否被所述滑動窗完全滑過,并且
在所述動作視頻剪輯未被所述滑動窗完全滑過的情況下,針對新的標記幀,所述視頻處理裝置重復地進行以下處理:所述設置單元重新設置所述滑動窗,所述匹配單元進行相似度匹配,以及所述選擇單元選擇標記幀。
6.根據權利要求5所述的視頻處理裝置,進一步包括:
計算單元,其計算所述標記幀和新的標記幀的數目之和,作為所述動作視頻剪輯中的動作重復次數。
7.根據權利要求3所述的視頻處理裝置,其中,所述獲取單元使用基于光流的運動分析來計算所述速度得分。
8.根據權利要求1所述的視頻處理裝置,還包括:
感興趣區域ROI單元,其針對所述初始標記幀以及所述動作視頻剪輯在所述滑動窗中的每個幀,執行ROI檢測或分割。
9.一種視頻處理方法,包括:
基于動作視頻剪輯得到初始標記幀;
基于關于所述動作視頻剪輯的信息來設置滑動窗;
將所述初始標記幀與所述動作視頻剪輯在所述滑動窗中的每個幀進行相似度匹配;以及
基于相似度匹配的結果,選擇所述動作視頻剪輯在所述滑動窗中的一個幀作為標記幀。
10.一種機器可讀存儲介質,其上攜帶有包括存儲在其中的機器可讀指令代碼的程序產品,其中,所述指令代碼當由計算機讀取和執行時,能夠使所述計算機執行根據權利要求9所述的視頻處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010230229.X/1.html,轉載請聲明來源鉆瓜專利網。





