[發明專利]一種版面圖片的處理方法、裝置、設備及存儲介質在審
| 申請號: | 202010943122.X | 申請日: | 2020-09-09 |
| 公開(公告)號: | CN113762260A | 公開(公告)日: | 2021-12-07 |
| 發明(設計)人: | 王曉燕;鄭志彤;戴鈺桀;桂創華 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100176 北京市大興區北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 版面 圖片 處理 方法 裝置 設備 存儲 介質 | ||
本發明實施例公開了一種版面圖片的處理方法、裝置、設備及存儲介質,其中該方法包括:將版面圖片輸入預先訓練的分割模型,基于分割模型對版面圖片進行區域分割,以及在分割區域包含表格區域時,對表格區域進行直線消除后進行文本分割,輸出版面圖片最終分割得到的元素位置和元素分割圖;將屬于文本類型的元素分割圖進行文字識別,得到文本內容;按預設展示方式,對版面圖片的元素位置、除文本類型外的元素分割圖和文本內容進行展示。實現了基于一個分割模型的端到端的版面圖片分割處理,與傳統方案相比,減少了多模型間數據傳輸的手動操作,提高了版面圖片的處理效率。
技術領域
本發明實施例涉及計算機技術領域,尤其涉及一種版面圖片的處理方法、裝置、設備及存儲介質。
背景技術
目前,電商商品詳情頁的版面圖片包含有豐富的內容,例如包含商品主體的圖像區域、表格區域和文字介紹區域等多種元素內容。通過自動挖掘商品詳情頁的版面信息,分析視覺上優質或者商品銷售量高的版面圖片,能夠對提取商品信息、自動設計商品詳情頁的版面圖片具有重要意義。
現有技術中,版面圖片的處理方法通常為,先使用版面識別模型識別版面圖片各區域及其位置關系,然后使用直線檢測模型對識別的表格區域進行直線檢測,使用光學字符識別(Optical Character Recognition,OCR)模型對表格區域和文字介紹區域進行文字檢測識別。
在實現本發明的過程中,發明人發現現有技術中至少存在以下技術問題:上述使用三種模型來對版面圖片進行處理的方案,處理效率較低。
發明內容
本發明實施例提供一種版面圖片的處理方法、裝置、設備及存儲介質,實現了端對端的版面圖片處理,提高了版面圖片的處理效率。
第一方面,本發明實施例提供了一種版面圖片的處理方法,包括:
將版面圖片輸入預先訓練的分割模型,基于所述分割模型對所述版面圖片進行區域分割,以及在分割區域包含表格區域時,對所述表格區域進行直線消除后進行文本分割,輸出所述版面圖片最終分割得到的元素位置和元素分割圖;
將屬于文本類型的元素分割圖進行文字識別,得到文本內容;
按預設展示方式,對所述版面圖片的元素位置、除文本類型外的元素分割圖和所述文本內容進行展示。
第二方面,本發明實施例提供了一種版面圖片的處理裝置,包括:
版面分割模塊,用于將版面圖片輸入預先訓練的分割模型,基于所述分割模型對所述版面圖片進行區域分割,以及在分割區域包含表格區域時,對所述表格區域進行直線消除后進行文本分割,輸出所述版面圖片最終分割得到的元素位置和元素分割圖;
文字識別模塊,用于將屬于文本類型的元素分割圖進行文字識別,得到文本內容;
結果展示模塊,用于按預設展示方式,對所述版面圖片的元素位置、除文本類型外的元素分割圖和所述文本內容進行展示。
第三方面,本發明實施例提供了一種終端設備,包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如本發明任意實施例所述的版面圖片的處理方法。
第四方面,本發明實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如本發明任意實施例所述的版面圖片的處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010943122.X/2.html,轉載請聲明來源鉆瓜專利網。





