[發明專利]一種視頻生成方法及相關裝置有效
| 申請號: | 202010480675.6 | 申請日: | 2020-05-30 |
| 公開(公告)號: | CN111669515B | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 邵濱;岳俊;錢莉;許松岑;黃雪妍;劉亞嬌 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | H04N5/265 | 分類號: | H04N5/265;H04L12/58;G06K9/62 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;李稷芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 生成 方法 相關 裝置 | ||
1.一種視頻生成方法,其特征在于,包括:
接收視頻生成指令,并響應于所述視頻生成指令從用戶偏好信息、用戶生理數據信息、當前環境信息中的一個或多個獲取文本信息,以及響應于所述視頻生成指令獲取圖片信息,所述當前環境信息包括當前天氣信息、當前時間信息、當前地理位置信息中的一個或多個,所述文本信息包括一個或多個關鍵字,所述圖片信息包括N張圖片,N為大于或等于1的正整數;
根據所述一個或多個關鍵字獲取所述N張圖片中與所述一個或多個關鍵字對應的圖像特征;
將所述一個或多個關鍵字和所述N張圖片的圖像特征輸入目標生成器網絡中,生成目標視頻,所述目標視頻包括M張圖片,所述M張圖片為基于所述圖像特征生成的、且與所述一個或多個關鍵字對應的圖片,M為大于1的正整數。
2.根據權利要求1所述方法,其特征在于,所述響應于所述視頻生成指令獲取圖片信息,包括:
響應于所述視頻生成指令,從預先存儲的多張圖片中,獲取與所述一個或多個關鍵字中至少一個關鍵字對應的圖片。
3.根據權利要求1所述方法,其特征在于,所述視頻生成指令包括人臉識別請求;所述響應于所述視頻生成指令獲取圖片信息,包括:
響應于所述視頻生成指令,進行人臉識別并獲得人臉識別結果;
根據所述人臉識別結果,從預先存儲的多張圖片中,獲取與所述人臉識別結果匹配的至少一張圖片。
4.根據權利要求1所述方法,其特征在于,所述視頻生成指令包括至少一個圖片標簽,所述至少一個圖片標簽中每一個圖片標簽與預先存儲的多張圖片中的至少一張圖片對應;所述響應于所述視頻生成指令獲取圖片信息,包括:
響應于所述視頻生成指令,根據所述至少一個圖片標簽,從預先存儲的多張圖片中,獲取與所述至少一個圖片標簽中每一個圖片標簽對應的至少一張圖片。
5.根據權利要求2-4所述的任意一項方法,其特征在于,所述獲取的所述N張圖片中每張圖片的圖片質量均大于預設閾值。
6.根據權利要求1-4所述的任意一項方法,其特征在于,所述方法還包括:
將獲取的所述N張圖片進行圖片質量評分,獲得所述N張圖片中每張圖片對應的圖片質量評分結果;
將所述圖片質量評分結果小于預設閾值的圖片進行圖片質量增強處理,并將圖片質量增強后的圖片更新至所述N張圖片中。
7.根據權利要求6所述方法,其特征在于,所述將所述一個或多個關鍵字和所述N張圖片的圖像特征輸入目標生成器網絡中,生成目標視頻,包括:
提取所述一個或多個關鍵字中每一個關鍵字在向量空間上對應的第一空間變量;
提取所述N張圖片的圖像特征分別在向量空間上對應的第二空間變量;
將所述第一空間變量和所述第二空間變量輸入所述目標生成器網絡中,生成所述目標視頻。
8.根據權利要求7所述方法,其特征在于,所述方法還包括:
獲取樣本文本信息、樣本圖片信息以及真實視頻數據集,并構建判別器網絡和基于視頻生成的生成器網絡;
將所述樣本文本信息和所述樣本圖片信息輸入所述生成器網絡中,生成樣本視頻;
將所述樣本視頻和所述真實視頻數據集作為所述判別器網絡的輸入,獲得判別損失結果,其中,在所述樣本視頻屬于所述真實視頻數據集時,所述判別損失結果為1;
根據所述判別損失結果,訓練所述生成器網絡獲得所述目標生成器網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010480675.6/1.html,轉載請聲明來源鉆瓜專利網。





