[發明專利]文本風格處理方法、裝置、電子設備及存儲介質有效
| 申請號: | 201810943330.2 | 申請日: | 2018-08-17 |
| 公開(公告)號: | CN109189985B | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 申世偉 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06F16/73 | 分類號: | G06F16/73;G06F16/35;G06F16/43;G06N3/08 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 劉延喜 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 風格 處理 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種文本風格處理方法、裝置、電子設備及存儲介質,包括下述步驟:獲取目標媒體中的文本信息,識別文本信息中文字所表達的情緒信息,根據情緒信息對目標媒體進行圖像處理,以使目標媒體中的文本信息通過文字形態表征情緒信息,通過將不同的文本信息處理成不同風格化的圖像,并展示在視頻字幕或者音樂歌詞等目標媒體中,豐富了文字信息在目標媒體的展示效果,從而提高了文字信息的可觀賞性。
技術領域
本申請公開涉及文本圖像處理領域,尤其是一種文本風格處理方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網技術的不斷發展,音頻、視頻、文字作為不同的表現形式傳播的。在影視、音樂視頻或者直播中,視頻已經開始主導人們生活的各方各面,人們往往希望通過后期編輯視頻,使得編輯后的視頻更能引起用戶的注意,使用戶產生更大的觀看視頻興趣。
一般對視頻的處理很多時候只是對視頻畫面的處理,忽略了視頻字幕或者音樂歌詞等文字信息也是表達視頻內容最為直觀的載體之一,然而現有的文字展示風格單一、缺乏趣味性,導致視頻字幕或者音樂歌詞平淡無奇。
發明內容
為克服相關技術中存在的問題,本申請提供一種文本風格處理方法、裝置、電子設備及存儲介質。
根據本申請實施例的第一方面,提供一種文本風格處理方法,包括下述步驟:
獲取目標媒體中的文本信息;
識別所述文本信息中文字所表達的情緒信息;
根據所述情緒信息對所述目標媒體進行圖像處理,以使所述目標媒體中的文本信息通過文字形態表征所述情緒信息。
可選地,所述情緒信息為文本信息的情緒分類結果,所述識別所述文本信息中文字所表達的情緒信息的步驟包括:
將所述文本信息輸入到預設的文本分類模型中,其中,所述文本分類模型為訓練至收斂的用于文本分類的神經網絡模型;
獲取所述文本分類模型輸出的所述文本信息的情緒分類的置信度;
當所述置信度大于預設第一閾值時,確認所述置信度所表征的情緒分類結果為所述情緒信息。
可選地,所述根據所述情緒信息對所述目標媒體進行圖像處理,以使所述目標媒體中的文本信息通過文字形態表征所述情緒信息的步驟包括:
在預設的風格圖片數據庫中獲取與所述情緒信息具有對應關系的風格圖片;
將所述文本信息像素化生成內容圖片;
將所述內容圖片與所述風格圖片輸入到預設的圖像融合模型中,其中,所述圖像融合模型為訓練至收斂的用于圖像融合的神經網絡模型;
獲取所述圖像融合模型根據所述內容圖片與所述風格圖片生成的融合圖片,其中,所述融合圖片包括所述文本信息的文字圖像,且所述文字圖像的文字形態表征所述情緒信息。
可選地,所述獲取所述圖像融合模型根據所述內容圖片與所述風格圖片生成的融合圖片的步驟之后,還包括下述步驟:
通過格拉姆矩陣計算所述融合圖片與所述內容圖片之間的內容損失;
通過格拉姆矩陣計算所述融合圖片與所述風格圖片之間的風格損失;
通過所述內容損失與所述風格損失計算所述融合圖片的總損失值;
將所述總損失值與所述圖像融合模型的梯度損失函數的梯度閾值進行比對,當所述總損失值大于所述梯度閾值時,通過所述圖像融合模型的反向傳播算法校正所述圖像融合模型中的權值,至所述圖像融合模型輸出的融合圖片的總損失值小于或等于所述梯度損失函數的最小梯度閾值時為止。
可選地,所述總損失值的特征描述為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810943330.2/2.html,轉載請聲明來源鉆瓜專利網。





