[發(fā)明專利]一種文本排版方法、裝置、存儲介質(zhì)及計算機設備在審
| 申請?zhí)枺?/td> | 202110194444.3 | 申請日: | 2021-02-20 |
| 公開(公告)號: | CN113591433A | 公開(公告)日: | 2021-11-02 |
| 發(fā)明(設計)人: | 伍敏慧;梅利健;林榆耿 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/109 | 分類號: | G06F40/109;G06F40/166;G06K9/00;G06K9/20 |
| 代理公司: | 深圳翼盛智成知識產(chǎn)權(quán)事務所(普通合伙) 44300 | 代理人: | 彭緒坤 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 排版 方法 裝置 存儲 介質(zhì) 計算機 設備 | ||
本申請公開一種文本排版方法、裝置、存儲介質(zhì)及計算機設備;本申請可以獲取目標文本圖像中的多個文本框,以及每個文本框的文本內(nèi)容;確定每個文本框的幾何信息;基于每個文本框的幾何信息,在目標文本圖像中按照目標排列方向?qū)λ形谋究蜻M行排序,得到每個文本框的順序信息;計算目標文本圖像中相鄰文本框之間的關聯(lián)信息;基于目標文本圖像中每個文本框的幾何信息、順序信息以及所有相鄰文本框之間的關聯(lián)信息,確定每個文本框的文本內(nèi)容的排版信息;根據(jù)每個文本框的文本內(nèi)容的排版信息,對目標文本圖像的所有文本內(nèi)容進行排版;本申請可以對目標文本圖像的文本內(nèi)容排版。
技術領域
本申請涉及數(shù)據(jù)處理領域,具體涉及一種文本排版方法、裝置、存儲介質(zhì)及計算機設備。
背景技術
隨著技術的發(fā)展,通過計算機視覺領域的相關技術,可以對包含文本的圖像進行識別,得到識別結(jié)果,現(xiàn)有技術中,識別結(jié)果可以包括可編輯文本,但是不能對可編輯文本在圖像中的排版信息進行有效識別,導致可編輯文本與其在圖像中的排版的差異較大。
在對現(xiàn)有技術的研究和實踐過程中,本申請的發(fā)明人發(fā)現(xiàn),由于可編輯文本與其在圖像中的排版的差異較大,導致用戶在使用可編輯文本之前,還需要手動對可編輯文本進行排版。
發(fā)明內(nèi)容
本申請實施例提供一種文本排版方法、裝置、存儲介質(zhì)及計算機設備,可以對目標文本圖像中的文本內(nèi)容進行排版。
本申請實施例提供一種文本排版方法,包括:
獲取目標文本圖像中的多個文本框,以及每個文本框的文本內(nèi)容;
確定每個文本框的幾何信息;
基于每個文本框的幾何信息,在所述目標文本圖像中按照目標排列方向?qū)λ形谋究蜻M行排序,得到每個文本框的順序信息;
計算所述目標文本圖像中相鄰文本框之間的關聯(lián)信息;
基于所述目標文本圖像中每個文本框的幾何信息、順序信息以及所有相鄰文本框之間的關聯(lián)信息,確定每個文本框的文本內(nèi)容的排版信息;
根據(jù)每個文本框的文本內(nèi)容的排版信息,對所述目標文本圖像的所有文本內(nèi)容進行排版。
相應地,本申請?zhí)峁┝艘环N文本排版裝置,包括:
獲取模塊,用于獲取目標文本圖像中的多個文本框,以及每個文本框的文本內(nèi)容;
幾何確定模塊,用于確定每個文本框的幾何信息;
排序模塊,用于基于每個文本框的幾何信息,在所述目標文本圖像中按照目標排列方向?qū)λ形谋究蜻M行排序,得到每個文本框的順序信息;
計算模塊,用于計算所述目標文本圖像中相鄰文本框之間的關聯(lián)信息;
信息確定模塊,用于基于所述目標文本圖像中每個文本框的幾何信息、順序信息以及所有相鄰文本框之間的關聯(lián)信息,確定每個文本框的文本內(nèi)容的排版信息;
排版模塊,用于根據(jù)每個文本框的文本內(nèi)容的排版信息,對所述目標文本圖像的所有文本內(nèi)容進行排版。
在一些實施例中,所述幾何信息包括邊框信息和特征信息,幾何確定模塊包括測量子模塊和確定子模塊,其中,
測量子模塊,用于對文本框進行測量,得到文本框的邊框信息;
確定子模塊,用于基于所述邊框信息,確定所述文本框的特征信息。
在一些實施例中,所述特征信息包括特征線、特征點以及所述特征線的角度值,確定子模塊具體用于:
基于所述邊框信息,在所述文本框所在區(qū)域內(nèi)確定所述文本框的特征點和特征線;
測量所述特征線在所述目標文本圖像的基準方向上的角度值。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110194444.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





