[發明專利]一種分布式教學視頻處理系統在審
| 申請號: | 202010114831.7 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111327939A | 公開(公告)日: | 2020-06-23 |
| 發明(設計)人: | 張凌;牟相霖;高曉東;李冠霖;成海秀 | 申請(專利權)人: | 華南理工大學;賽爾網絡有限公司 |
| 主分類號: | H04N21/431 | 分類號: | H04N21/431;H04N21/218;H04N21/4402;G06N3/08;G06K9/00 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分布式 教學 視頻 處理 系統 | ||
1.一種分布式教學視頻處理系統,其特征在于,包括:
教學視頻文件傳輸模塊,用于實現從視頻存儲服務器中下載原始視頻文件,并上傳視頻處理系統處理后的視頻文件;
教學視頻GPU加速處理模塊,用于實現根據用戶輸入的視頻名稱和視頻分辨率對視頻進行調整分辨率,根據用戶輸入的視頻名和視頻格式對視頻進行轉碼,根據用戶輸入的視頻名、起始時間和結束時間對視頻進行裁剪;
教學視頻自動人眼打馬賽克模塊,用于實現將教學視頻分解為圖像幀,檢測圖像中的人臉,檢測人臉中人眼特征點,對人眼特征點區域進行打馬賽克,把打碼后的圖像幀和音頻制作成視頻。
2.根據權利要求1所述的一種分布式教學視頻處理系統,其特征在于:所述教學視頻文件傳輸模塊包括用戶登錄模塊、Cookie處理模塊、視頻文件下載模塊、視頻文件上傳模塊,其中:
所述用戶登錄模塊根據用戶輸入的用戶名和密碼登錄視頻存儲服務器;
所述Cookie處理模塊負責保存視頻存儲服務器返回的Cookie到本地以及從本地加載Cookie;
所述視頻文件下載模塊負責從視頻存儲服務器中下載視頻文件;
所述視頻文件上傳模塊負責上傳處理后的視頻到視頻存儲服務器。
3.根據權利要求1所述的一種分布式教學視頻處理系統,其特征在于:所述教學視頻GPU加速處理模塊包括視頻分辨率調整模塊,視頻轉碼模塊,視頻裁剪模塊,其中:
所述視頻分辨率調整模塊對視頻分辨率進行調整:通過解析HTTP POST請求中的請求參數,從而得到視頻的目標分辨率,然后使用視頻處理工具FFMPEG對指定的視頻文件進行分辨率調整,在調整的過程中,充分挖掘GPU的并行計算能力,利用NVIDIA提供的NVENC、NVDEC加速視頻編碼解碼,實現GPU加速視頻處理,提高處理效率;
所述視頻轉碼模塊對視頻格式進行轉換:通過解析HTTP POST請求中的請求參數,從而得到目標的視頻格式,然后使用視頻處理工具FFMPEG對指定的視頻文件進行視頻格式的轉換,在轉換的過程中,充分挖掘GPU的并行計算能力,利用NVIDIA提供的NVENC、NVDEC加速視頻編碼解碼,實現GPU加速視頻處理,提高處理效率;
所述視頻裁剪模塊對視頻進行裁剪:通過解析HTTP POST請求中的請求參數,從而得到需要裁剪的視頻的起始時間和結束時間,然后使用視頻處理工具FFMPEG對指定的視頻文件進行裁剪。
4.根據權利要求1所述的一種分布式教學視頻處理系統,其特征在于:所述教學視頻自動人眼打馬賽克模塊包括圖像中人臉檢測模塊、人臉中人眼特征點檢測模塊、連續幀間人眼特征點追蹤模塊、人眼特征點區域打馬賽克模塊及圖像幀和音頻合成視頻模塊,其中:
所述圖像中人臉檢測模塊自動檢測一張圖像中的人臉區域的坐標點:預先訓練一個檢測人臉的基于深度學習的神經網絡模型,保存神經網絡的權重值到本地,在進行人臉檢測時,從本地加載神經網絡的權重值,當輸入一張圖像幀到模型中時,模型會自動檢測出圖像中人臉的坐標區域;
所述人臉中人眼特征點檢測模塊自動檢測人臉中人眼特征點的坐標點:預先訓練一個從人臉中檢測人眼特征點的基于深度學習的神經網絡模型,保存神經網絡的權重值到本地,在進行人眼特征點檢測時,從本地加載神經網絡的權重值,當輸入一張圖像幀中的人臉區域到模型中時,模型會自動檢測出人臉的人眼特征點;
所述連續幀間人眼特征點追蹤模塊對連續兩幀圖像的人眼特征點進行追蹤:預先訓練一個人眼特征點追蹤的基于深度學習的神經網絡模型,保存神經網絡的權重值到本地,在進行人眼特征點追蹤時,從本地加載神經網絡的權重值,當輸入下一幀的人臉區域到模型中時,追蹤器先進行人眼特征點追蹤,如果追蹤的人眼特征點結果符合預期,則繼續進行下一幀圖像的處理,否則交給人眼特征點檢測模塊重新進行人眼特征點檢測;
所述人眼特征點區域打馬賽克模塊對人眼特征點區域進行打馬賽克:在圖像中檢測出人眼特征點之后,根據人眼特征點計算對應的馬賽克區域,然后生成相應的人眼馬賽克;
所述圖像幀和音頻合成視頻模塊把打碼后的圖像幀和音頻合成視頻文件:得到打碼后的圖像幀之后,結合視頻中之前分離出的音頻,使用視頻處理工具工具FFMPEG將圖像幀和音頻合成最終的打碼后的視頻。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學;賽爾網絡有限公司,未經華南理工大學;賽爾網絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010114831.7/1.html,轉載請聲明來源鉆瓜專利網。





