[發明專利]字幕生成方法、裝置、電子設備和存儲介質在審
| 申請號: | 202110595267.X | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113345439A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 盧家輝 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G06F40/109 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 江舟 |
| 地址: | 100089 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字幕 生成 方法 裝置 電子設備 存儲 介質 | ||
本公開關于一種字幕生成方法、裝置、電子設備和存儲介質。其中,該方法包括:對目標音頻進行音頻內容識別,得到目標識別結果,其中,目標識別結果包括從目標音頻中識別到的各個字符以及與各個字符對應的音量,目標音頻為目標視頻中的音頻;根據各個字符對應的音量,確定各個字符的目標字體顏色,其中,各個字符的目標字體顏色與各個字符對應的音量匹配;根據各個字符的目標字體顏色,生成目標視頻的字幕信息,其中,字幕信息包括各個字符,各個字符的顯示顏色為各個字符的目標字體顏色。
技術領域
本公開涉及計算機領域,尤其涉及一種字幕生成方法、裝置、電子設備和存儲介質。
背景技術
相關技術中,在接收到音頻,將音頻轉換為字幕的過程中,僅僅能夠將音頻轉換為同一種大小顏色的字幕,然后顯示字幕。
然而,若是采用上述方法,音頻轉成的字幕所能表達的信息少,無法還原音頻的語氣等。
發明內容
本公開提供一種字幕生成方法、裝置、電子設備和存儲介質,以至少解決相關技術中音頻轉成的字幕所能表達的信息少,無法還原音頻的語氣的問題。本公開的技術方案如下:
根據本公開實施例的第一方面,提供一種字幕生成方法,包括對目標音頻進行音頻內容識別,得到目標識別結果,其中,所述目標識別結果包括從所述目標音頻中識別到的各個字符以及與所述各個字符對應的音量,所述目標音頻為目標視頻中的音頻;根據所述各個字符對應的音量,確定所述各個字符的目標字體顏色,其中,所述各個字符目標字體顏色與所述各個字符對應的音量匹配;根據所述各個字符的目標字體顏色,生成所述目標視頻的字幕信息,其中,所述字幕信息包括所述各個字符,所述各個字符的顯示顏色為所述各個字符的所述目標字體顏色。
作為一種可選的示例,所述方法還包括:根據所述各個字符對應的音量,確定所述各個字符的目標字體大小,其中,所述各個字符的目標字體大小與所述各個字符對應的音量匹配;所述根據所述各個字符的目標字體顏色,生成所述目標視頻的字幕信息,包括:根據所述各個字符的目標字體顏色以及所述目標字體大小,生成所述目標視頻的字幕信息,其中,所述字幕信息包括所述各個字符,所述各個字符的顯示顏色為所述各個字符的所述目標字體顏色,所述各個字符的顯示字體大小為所述各個字符的目標字體大小。
作為一種可選的示例,所述方法還包括:根據所述各個字符對應的時長,確定所述各個字符的目標字體大小和顏色,其中,所述各個字符的目標字體大小和顏色與所述各個字符對應的時長匹配;所述根據所述各個字符的目標字體顏色,生成所述目標視頻的字幕信息,包括:根據所述各個字符的目標字體顏色以及目標字體大小,生成所述目標視頻的字幕信息,其中,所述字幕信息包括所述各個字符,所述各個字符的顯示顏色為所述各個字符的所述目標字體顏色,所述各個字符的顯示字體大小為所述各個字符的目標字體大小。
根據本公開實施例的第二方面,提供一種字幕生成方法,包括:對目標音頻進行音頻內容識別,得到目標識別結果,其中,所述目標識別結果包括從所述目標音頻中識別到的各個字符以及與所述各個字符在所述目標音頻中的開始時間段和結束時間點;根據所述開始時間點和所述結束時間點,從所述目標音頻中確定所述各個字符的音量;根據所述各個字符對應的音量,確定所述各個字符的目標字體大小,其中,所述各個字符的目標字體大小與所述各個字符對應的音量匹配;根據所述各個字符的目標字體大小,生成目標視頻的字幕信息,其中,所述字幕信息包括所述各個字符,所述各個字符的顯示大小為所述各個字符的所述目標字體大小。
作為一種可選的示例,所述方法還包括:根據所述各個字符對應的音量,確定所述各個字符的目標字體顏色,其中,所述各個字符的目標字體顏色與所述各個字符對應的音量匹配;所述根據所述各個字符的目標字體大小,生成所述目標視頻的字幕信息,包括:根據所述各個字符的目標字體顏色以及目標字體大小,生成所述目標視頻的字幕信息,其中,所述字幕信息包括所述各個字符,所述各個字符的顯示顏色為所述各個字符的所述目標字體顏色,所述各個字符的顯示字體大小為所述各個字符的目標字體大小。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110595267.X/2.html,轉載請聲明來源鉆瓜專利網。





