[發明專利]文本版面分析方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202010219551.2 | 申請日: | 2020-03-25 |
| 公開(公告)號: | CN111340037B | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 王曉珂 | 申請(專利權)人: | 上海智臻智能網絡科技股份有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張振軍 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 版面 分析 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種文本版面分析方法,其特征在于,所述方法包括:
獲取目標圖片;
對所述目標圖片進行版面區域分割,得到若干個分割區域;
根據所述目標圖片的紋理特征識別所述目標圖片的文字區域;
將所述目標圖片中的文字區域與所述若干個分割區域進行匹配,以得到各個分割區域包含的文字區域;
對每一分割區域包含的文字區域進行內容識別,得到該分割區域的文字內容;
輸出各個分割區域的文字內容。
2.根據權利要求1所述的方法,其特征在于,對每一分割區域包含的文字區域進行內容識別時,屬于同一分割區域的文字區域被一并傳輸至文本識別模型進行識別。
3.根據權利要求1所述的方法,其特征在于,所述對每一分割區域包含的文字區域進行內容識別,包括:
對每一分割區域中包含的各個文字區域分別進行內容識別,得到該文字區域的文字內容;
將各個文字區域的文字內容進行拼接,得到該分割區域的文字內容。
4.根據權利要求1所述的方法,其特征在于,所述根據所述目標圖片的紋理特征識別所述目標圖片的文字區域,包括:
將所述目標圖片通過多個卷積核進行卷積運算,以從所述目標圖片提取文字對應的若干個紋理特征層;
為所述若干個紋理特征層中部分或全部的紋理特征層分別分配多個不同感受野的錨點區域;
對所述分配的錨點區域進行回歸,得到所述目標圖片的文字區域。
5.根據權利要求1所述的方法,其特征在于,所述根據所述目標圖片的紋理特征識別所述目標圖片的文字區域,包括:
通過將所述目標圖片輸入紋理提取模型中,得到所述目標圖片不同特征維度的若干個紋理特征層,所述紋理提取模型是根據歷史圖片中的紋理特征進行分析得到的、用以提取輸入的圖片中的紋理特征層的模型;
從所述若干個紋理特征層中篩選出基礎紋理特征層;
將所述基礎紋理特征層進行特征疊加,得到所述目標圖片的文字特征層;
根據所述文字特征層獲取所述目標圖片的文字區域。
6.根據權利要求1所述的方法,其特征在于,所述文字區域為目標圖片中包含的每行文字對應的區域。
7.根據權利要求1所述的方法,其特征在于,輸出的各個分割區域的文字內容為字符串。
8.一種文本版面分析裝置,其特征在于,所述裝置包括:
圖片獲取模塊,用于獲取目標圖片;
版面分割模塊,用于對所述目標圖片進行版面區域分割,得到若干個分割區域;
區域識別模塊,用于根據所述目標圖片的紋理特征識別所述目標圖片的文字區域;
版面分析模塊,用于將所述目標圖片中的文字區域與所述若干個分割區域進行匹配,以得到各個分割區域包含的文字區域;
內容識別模塊,用于對每一分割區域包含的文字區域進行內容識別,得到該分割區域的文字內容;
輸出模塊,用于輸出各個分割區域的文字內容。
9.一種計算機設備,包括存儲器和處理器,所述存儲器上存儲有能夠在所述處理器上運行的計算機指令,其特征在于,所述處理器運行所述計算機指令時執行權利要求1至7任一項所述方法的步驟。
10.一種存儲介質,其上存儲有計算機指令,其特征在于,所述計算機指令運行時執行權利要求1至7任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智臻智能網絡科技股份有限公司,未經上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010219551.2/1.html,轉載請聲明來源鉆瓜專利網。





