[發明專利]文本處理方法、裝置、電子設備及存儲介質有效
| 申請號: | 202011011676.2 | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112118478B | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 華路延 | 申請(專利權)人: | 廣州虎牙科技有限公司 |
| 主分類號: | H04N21/431 | 分類號: | H04N21/431;H04N21/44;H04N21/488;G06K9/62;G06V20/62;G06V20/40;G06V30/19 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張欣欣 |
| 地址: | 511495 廣東省廣州市番禺*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 處理 方法 裝置 電子設備 存儲 介質 | ||
本發明提供了文本處理方法、裝置、電子設備及存儲介質,該方法包括:獲取目標幀的視頻圖像中提取的文本坐標以及與目標幀相鄰的至少一個歷史幀的視頻圖像的歷史文本坐標;該歷史文本坐標與歷史幀的視頻圖像中的文本區域匹配;若目標幀的視頻圖像中提取的文本坐標和歷史文本坐標的誤差在閾值范圍內,則將歷史文本坐標確定為目標文本坐標;若不在閾值范圍內,則將目標幀的視頻圖像中提取的文本坐標確定為目標文本坐標;根據目標文本坐標對目標幀的視頻圖像進行文本處理。本發明通過相鄰幀的對比對具有波動性的文本坐標進行校正,基于校正后的目標文本坐標進行文本處理,能夠提高準確度,降低文本處理過程中出現閃爍不穩定現象的風險。
技術領域
本發明涉及數據處理技術領域,具體而言,涉及一種文本處理方法、裝置、電子設備及存儲介質。
背景技術
隨著電子設備的快速發展,電子設備的功能逐漸完善,人們常使用電子設備獲取信息、存儲信息和觀看視頻等。電子設備在播放視頻時,在顯示視頻圖像的同時,還可以顯示字幕信息,以便于用戶理解視頻內容。
在觀看或者使用一些視頻時,有相當一部分觀眾出于不同的原因并不希望在視頻中看到字幕,因此,針對這部分群體就有遮擋或者去除字幕的需要。傳統的字幕處理方案字體區域識別準確率不高,導致在后續針對字幕的遮擋/去除操作時波動幅度較大,效果不自然,容易出現的閃爍不穩定現象。
發明內容
有鑒于此,本發明提供一種文本處理方法、裝置、電子設備及存儲介質,用以提高文本處理的準確度,降低出現的閃爍不穩定現象的風險,獲得理想的處理效果。
本發明實施例的技術方案如下:
第一方面,本發明提供一種文本處理方法,所述方法包括:獲取目標幀的視頻圖像中提取的文本坐標以及與所述目標幀相鄰的至少一個歷史幀的視頻圖像的歷史文本坐標;所述歷史文本坐標與所述歷史幀的視頻圖像中的文本區域匹配;當所述目標幀的視頻圖像中提取的文本坐標和所述歷史文本坐標的誤差在閾值范圍內,將所述歷史文本坐標確定為目標文本坐標;當所述目標幀的視頻圖像中提取的文本坐標與所述歷史文本坐標的誤差不在閾值范圍內,將所述目標幀的視頻圖像中提取的文本坐標確定為目標文本坐標;根據所述目標文本坐標對所述目標幀的視頻圖像進行文本處理。
可選地,所述根據所述目標文本坐標對所述目標幀的視頻圖像進行文本處理,包括:獲取所述目標幀的視頻圖像對應的掩模圖和遮擋圖;所述遮擋圖中與所述目標文本坐標匹配的區域具有模糊屬性;所述掩模圖中與所述目標文本坐標匹配的區域內的像素具有第一像素值;所述掩模圖中除與所述目標文本坐標匹配的區域的其他區域內的像素具有第二像素值;基于所述掩模圖和所述遮擋圖對所述目標幀的視頻圖像進行文本遮擋處理。
可選地,所述獲取所述目標幀的視頻圖像對應的掩模圖和遮擋圖,包括:根據所述目標文本坐標構建所述目標幀的視頻圖像對應的掩模圖;對所述目標幀的視頻圖像的復制圖進行均值模糊,獲得所述遮擋圖。
可選地,所述根據所述目標文本坐標對所述目標幀的視頻圖像進行文本處理,包括:根據所述目標文本坐標確定所述目標幀的視頻圖像中的至少一個字體區域;所述字體區域為字體的輪廓邊緣所包圍的區域;根據所述至少一個字體區域構建掩模圖;所述掩模圖中與所述字體區域匹配的區域內的像素具有第一像素值;所述掩模圖中除與所述目標文本坐標匹配的區域的其他區域內的像素具有第二像素值;基于所述掩模圖對所述目標幀的視頻圖像中的所述至少一個字體區域中進行消除處理。
可選地,所述根據所述目標文本坐標確定所述目標幀的視頻圖像中的至少一個字體區域,包括:在所述目標幀的視頻圖像中與所述目標文本坐標匹配的區域內提取字體顏色數據;所述字體顏色數據用于設定顏色閾值;基于所述顏色閾值對所述目標幀的視頻圖像進行像素篩選,獲得所述至少一個字體區域。
可選地,在根據所述目標文本坐標確定所述目標幀的視頻圖像中的至少一個字體區域之后,所述方法還包括:對所述至少一個字體區域進行腐蝕處理和膨脹處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州虎牙科技有限公司,未經廣州虎牙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011011676.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種農機用多級葉輪軸流泵
- 下一篇:粉末稱量設備和粉末稱量方法





