[發明專利]垂直文本行識別方法、裝置、設備及計算機可讀存儲介質在審
| 申請號: | 202010025426.8 | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN113128306A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 盧永晨 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32 |
| 代理公司: | 上海光柵知識產權代理有限公司 31340 | 代理人: | 馬雯雯 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 垂直 文本 識別 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
1.一種垂直文本行識別方法,其特征在于,包括:
獲取待識別垂直文本行,其中,所述待識別垂直文本行中文字的閱讀方向垂直與水平方向;
將所述待識別垂直文本行向預設的第一方向旋轉預設的角度,獲得旋轉后的待識別垂直文本行;
通過預設的文本分割模型對所述旋轉后的待識別垂直文本行進行分割操作,獲得至少兩個旋轉后的文字;
將所述至少兩個旋轉后的文字向預設的第二方向進行旋轉預設的角度,獲得至少兩個水平方向的文字,其中,所述第一方向與所述第二方向相反;
對所述至少兩個水平方向的文字進行拼接操作,獲得水平方向的待識別垂直文本行,對所述水平方向的待識別垂直文本行進行識別操作。
2.根據權利要求1所述的方法,其特征在于,所述獲取待識別垂直文本行,包括:
獲取待處理圖像,確定所述待處理圖像中的目標文本;
通過預設的網絡模型確定所述目標文本中的待識別垂直文本行;或,
通過預設的標注信息確定所述目標文本中的待識別垂直文本行。
3.根據權利要求2所述的方法,其特征在于,所述通過預設的網絡模型確定所述目標文本中的待識別垂直文本行,包括:
將所述目標文本輸入至預設的網絡模型中,獲得所述目標文本對應的第一置信度,所述置信度用于表征所述目標文本的閱讀方向與所述水平方向之間的角度;
若所述第一置信度低于預設的閾值,則將所述目標文本旋轉預設的角度,獲得旋轉后的目標文本;
將所述旋轉后的目標文本輸入至所述網絡模型中,獲得所述目標文本對應的第二置信度;
若所述第二置信度低于預設的閾值,則將所述目標文本作為所述待識別垂直文本行。
4.根據權利要求2所述的方法,其特征在于,所述通過預設的標注信息確定所述目標文本中的待識別垂直文本行,包括:
確定所述目標文本對應的標注信息,所述標注信息用于表征所述目標文本中文字的閱讀方向;
若所述標注信息表征所述目標文本中文字的閱讀方向垂直與水平方向,則將所述目標文本作為所述待識別垂直文本行。
5.根據權利要求1-4任一項所述的方法,其特征在于,所述方法還包括:
確定各所述旋轉后的文字在所述待識別垂直文本行中的順序;
相應地,所述對所述至少兩個水平方向的文字進行拼接操作,包括:
根據所述順序對所述至少兩個水平方向的文字進行拼接操作。
6.根據權利要求1-4任一項所述的方法,其特征在于,所述對所述水平方向的待識別垂直文本行進行識別操作,包括:
通過OCR模型對所述水平方向的待識別垂直文本行進行識別操作。
7.根據權利要求1-4任一項所述的方法,其特征在于,所述對所述水平方向的待識別垂直文本行進行識別操作之后,還包括:
根據識別結果對所述待識別垂直文本行進行分類操作;或,
根據識別結果對所述待識別垂直文本行的合法性進行判斷。
8.一種垂直文本行識別裝置,其特征在于,包括:
獲取模塊,用于獲取待識別垂直文本行,其中,所述待識別垂直文本行中文字的閱讀方向垂直與水平方向;
旋轉模塊,用于將所述待識別垂直文本行向預設的第一方向旋轉預設的角度,獲得旋轉后的待識別垂直文本行;
分割模塊,用于通過預設的文本分割模型對所述旋轉后的待識別垂直文本行進行分割操作,獲得至少兩個旋轉后的文字;
旋轉模塊,用于將所述至少兩個旋轉后的文字向預設的第二方向進行旋轉預設的角度,獲得至少兩個水平方向的文字,其中,所述第一方向與所述第二方向相反;
識別模塊,用于對所述至少兩個水平方向的文字進行拼接操作,獲得水平方向的待識別垂直文本行,對所述水平方向的待識別垂直文本行進行識別操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010025426.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種液體火箭發動機液氧截止閥
- 下一篇:一種語音處理方法、介質及系統





