[發明專利]用于生成視頻的方法和裝置在審
| 申請號: | 202011270760.6 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112381926A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 湯本來;姚佳立;畢成;殷翔 | 申請(專利權)人: | 北京有竹居網絡技術有限公司 |
| 主分類號: | G06T17/00 | 分類號: | G06T17/00 |
| 代理公司: | 北京海智友知識產權代理事務所(普通合伙) 11455 | 代理人: | 吳京順 |
| 地址: | 101299 北京市平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 視頻 方法 裝置 | ||
本公開的實施例公開了用于生成視頻的方法和裝置。該方法的一具體實施方式包括:獲取從文本提取的文本特征;根據文本特征,確定目標人的特征,其中,目標人的特征包括目標人針對文本的人臉關鍵點;根據人臉關鍵點,生成目標人的視頻。該實施方式實現了從給定文本到目標人的視頻之間的便捷轉換。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及用于生成視頻的方法和裝置。
背景技術
隨著語音識別、自然語言處理、計算機視覺等人工智能技術的日益成熟,并且逐漸落地應用到許多實際場景中,如何進一步實現人工智能技術的普遍應用落地,以及如何進一步發展人工智能技術是許多研究者目前思考和探索的問題之一。
在這種思考和探索之下,多模態智能逐漸成為人工智能領域的重點研究方向之一。例如,有許多學者正在研究多模態虛擬人的合成技術和應用,以實現更自然、便利的人機交互。
近些年來,隨著在線教育和在線學習、網絡直播等行業的迅猛發展,出現了如虛擬人教學、虛擬人直播、虛擬人解說等場景。但是虛擬人技術在這些場景中的應用目前還不成熟,存在許多有待改進的地方。但是可以想象虛擬人技術在這些行業具有廣闊的應用空間和應用前景。
發明內容
本公開的實施例提出了用于生成視頻的方法和裝置。
第一方面,本公開的實施例提供了一種用于生成視頻的方法,該方法包括:獲取從文本提取的文本特征;根據文本特征,確定目標人的特征,其中,目標人的特征包括目標人針對文本的人臉關鍵點;根據人臉關鍵點,生成目標人的視頻。
第二方面,本公開的實施例提供了一種用于生成視頻的裝置,該裝置包括:獲取單元,被配置成獲取從文本提取的文本特征;確定單元,被配置成根據文本特征,確定目標人的特征,其中,目標人的特征包括目標人針對文本的人臉關鍵點;生成單元,被配置成根據人臉關鍵點,生成目標人的視頻。
第三方面,本公開的實施例提供了一種電子設備,該電子設備包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序;當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現如第一方面中任一實現方式描述的方法。
第四方面,本公開的實施例提供了一種計算機可讀介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現如第一方面中任一實現方式描述的方法。
本公開的實施例提供的用于生成視頻的方法和裝置,對于任意給定文本,利用該文本的文本特征生成如目標人在讀文本時的臉部的關鍵點等目標人的特征,然后利用目標人的特征制作目標人的視頻,從而實現從給定文本到目標人的視頻之間的便捷轉換,進而可以應用于許多給定文本以生成目標人讀該文本的視頻的場景中。而且和現有的基于人臉三維建模的視頻制作方法相比,降低了計算復雜度和時間成本。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本公開的其它特征、目的和優點將會變得更明顯:
圖1是本公開的一個實施例可以應用于其中的示例性系統架構圖;
圖2是根據本公開的用于生成視頻的方法的一個實施例的流程圖;
圖3是根據本公開的用于生成視頻的方法的又一個實施例的流程圖;
圖4是根據本公開的實施例的用于生成視頻的方法的一個應用場景的示意圖;
圖5是根據本公開的用于生成視頻的裝置的一個實施例的結構示意圖;
圖6是適于用來實現本公開的實施例的電子設備的結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京有竹居網絡技術有限公司,未經北京有竹居網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011270760.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:音頻合成方法、裝置、設備以及存儲介質
- 下一篇:一種改進型的儲氫罐結構





