[發明專利]文本提取方法、裝置及存儲介質有效

申請號：	201810857110.8	申請日：	2018-07-31
公開（公告）號：	CN110163051B	公開（公告）日：	2023-03-10
發明（設計）人：	李洋	申請（專利權）人：	騰訊科技（深圳）有限公司
主分類號：	G06V20/40	分類號：	G06V20/40;G06V30/19
代理公司：	深圳翼盛智成知識產權事務所(普通合伙) 44300	代理人：	黃威
地址：	518057 廣東省深圳***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	文本提取方法裝置存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例公開了一種文本提取方法、裝置及存儲介質；本發明實施例在確定需要進行文本提取的視頻之后，解析視頻，以獲得視頻所包含的視頻幀，然后對視頻幀進行文本提取，生成視頻的初始文本集，之后根據文本相似度，對初始文本集中的文本進行優化處理生成有效文本集，最后對有效文本集中的有效文本進行合并生成視頻的視頻文本；在該過程中，以視頻幀為文本識別對象，不需要用戶進行手動截圖并進行人工識別等操作，與現有技術相比，操作簡單，識別效率高，實現難度小，解決了現有視頻文本提取技術存在的文本識別效率低的技術問題。

技術領域

本發明涉及文本識別領域，具體涉及一種文本提取方法、裝置及存儲介質。

背景技術

隨著視頻技術發展，用戶越來越多的通過視頻獲取外界信息，例如通過視頻進行遠程學習、觀看電子書等；在日常使用中，用戶往往會希望能夠獲取視頻內的文本進行保存或者記錄等。

為了獲取視頻內的文本，用戶往往需要對視頻進行手動截圖，然后人工識別截圖內的文本之后進行組合，這種方式操作復雜，識別效率低，不便于推廣。

即現有視頻文本提取技術需要用戶手動操作多次截屏并人工識別文本，操作復雜，識別效率低，實現難度大。

發明內容

本發明實施例提供一種文本提取方法、裝置及存儲介質，以解決現有視頻文本提取技術存在的文本識別效率低的技術問題。

為解決上述技術問題，本發明實施例提供以下技術方案：

本發明實施例提供了一種文本提取方法，其包括：

對視頻進行解析，得到所述視頻所包含的視頻幀；

對所述視頻幀進行文本提取處理，得到所述視頻的初始文本集；所述初始文本集包括至少一個視頻幀對應的初始文本；

獲取所述初始文本集中初始文本之間的文本相似度；

根據所述文本相似度，對所述初始文本集中的初始文本進行優化處理，得到有效文本集；所述有效文本集包括至少一個有效文本；

對所述有效文本集中的有效文本進行合并，生成所述視頻的視頻文本。

本發明實施例提供了一種文本提取裝置，其包括：

解析模塊，用于對視頻進行解析，得到所述視頻所包含的視頻幀；

提取模塊，用于對所述視頻幀進行文本提取處理，得到所述視頻的初始文本集；所述初始文本集包括至少一個視頻幀對應的初始文本；

獲取模塊，用于獲取所述初始文本集中初始文本之間的文本相似度；

優化模塊，用于根據所述文本相似度，對所述初始文本集中的初始文本進行優化處理，得到有效文本集；所述有效文本集包括至少一個有效文本；

合并模塊，用于對所述有效文本集中的有效文本進行合并，生成所述視頻的視頻文本。

本發明實施例提供了一種存儲介質，所述存儲介質存儲有多條指令，所述指令適于處理器進行加載，以執行上述文本提取方法中的步驟。

本發明實施例在確定需要進行文本提取的視頻之后，解析視頻，以獲得視頻所包含的視頻幀，然后對視頻幀進行文本提取，生成視頻的初始文本集，之后根據文本相似度，對初始文本集中的文本進行優化處理，生成有效文本集，最后對有效文本集中的有效文本進行合并，生成視頻的視頻文本；在該過程中，以視頻幀為文本識別對象，不需要用戶進行手動截圖并進行人工識別等操作，與現有技術相比，操作簡單，識別效率高，實現難度小，解決了現有視頻文本提取技術存在的文本識別效率低的技術問題，增強了用戶的使用體驗。

附圖說明

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于騰訊科技（深圳）有限公司，未經騰訊科技（深圳）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810857110.8/2.html，轉載請聲明來源鉆瓜專利網。