[發明專利]文本識別方法、終端及存儲介質在審
| 申請號: | 202111203921.4 | 申請日: | 2021-10-15 |
| 公開(公告)號: | CN113920292A | 公開(公告)日: | 2022-01-11 |
| 發明(設計)人: | 張恒;李銘瀚 | 申請(專利權)人: | 掌閱科技股份有限公司 |
| 主分類號: | G06V10/22 | 分類號: | G06V10/22;G06V30/148 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 吳崇 |
| 地址: | 100022 北京市朝陽區東三環中路3*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 識別 方法 終端 存儲 介質 | ||
本公開涉及一種文本識別方法、終端及存儲介質。其中,文本識別方法包括:獲取目標圖像;對目標圖像進行文本識別,得到目標圖像中的多個文本行和每個文本行在目標圖像中的文本位置;根據文本位置,計算每兩個文本行之間的相對位置關系;基于相對位置關系,對多個文本行進行段落合并,得到至少一個文本段落。本公開實施例中,可實現對目標圖像中的不可編輯文本進行分段提取,便于用戶后續按照段落對不可編輯文本進行再次編輯,提升了用戶的體驗。
技術領域
本公開涉及計算機技術領域,尤其涉及一種文本識別方法、終端及存儲介質。
背景技術
隨著計算機技術的發展,用戶存在需要對諸如文件掃描圖像、帶文字圖片、帶字幕視頻幀圖像等資源中的不可編輯文本進行再次編輯的需求。
但是,由于文本自身的復雜性、出版印刷需求的多樣性以及格式編輯的不規范性,導致目前無法準確地分段提取圖像中的不可編輯文本,進而使得用戶無法按照段落對圖像中的不可編輯文本進行再次編輯,降低了用戶的體驗。
發明內容
為了解決上述技術問題或者至少部分地解決上述技術問題,本公開提供了一種文本識別方法、終端及存儲介質。
第一方面,本公開提供了一種文本識別方法,包括:
獲取目標圖像;
對目標圖像進行文本識別,得到目標圖像中的多個文本行和每個文本行在目標圖像中的文本位置;
根據文本位置,計算每兩個文本行之間的相對位置關系;
基于相對位置關系,對多個文本行進行段落合并,得到至少一個文本段落。
第二方面,本公開還提供了一種終端,包括處理器和存儲器,存儲器用于存儲可執行指令,可執行指令使處理器執行以下操作:
獲取目標圖像;
對目標圖像進行文本識別,得到目標圖像中的多個文本行和每個文本行在目標圖像中的文本位置;
根據文本位置,計算每兩個文本行之間的相對位置關系;
基于相對位置關系,對多個文本行進行段落合并,得到至少一個文本段落。
第三方面,本公開還提供了一種計算機可讀存儲介質,存儲介質存儲有計算機程序,當計算機程序被處理器執行時,使得處理器實現上述第一方面的文本識別方法。
本公開實施例提供的技術方案與現有技術相比具有如下優點:
本公開實施例的文本識別方法、終端及存儲介質,能夠在獲取到目標圖像之后,對目標圖像進行文本識別,得到目標圖像中的多個文本行和每個文本行在目標圖像中的文本位置,并根據文本位置,計算每兩個文本行之間的相對位置關系,進而基于相對位置關系,對多個文本行進行段落合并,得到至少一個文本段落。如此,可基于文本識別技術將目標圖像中的不可編輯文本分行識別出來,并且基于各個文本行在目標圖像中的文本位置對識別到的多個文本行進行段落合并,以實現對目標圖像中的不可編輯文本進行分段提取,便于用戶后續按照段落對不可編輯文本進行再次編輯,提升了用戶的體驗。
附圖說明
此處的附圖被并入說明書中并構成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。
為了更清楚地說明本公開實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領域普通技術人員而言,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1示出了本公開實施例提供的一種文本識別方法的流程示意圖;
圖2示出了本公開實施例提供的一種文本識別界面的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于掌閱科技股份有限公司,未經掌閱科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111203921.4/2.html,轉載請聲明來源鉆瓜專利網。





