[發明專利]垂直文本行識別方法、裝置、設備及計算機可讀存儲介質在審
| 申請號: | 202010025426.8 | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN113128306A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 盧永晨 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32 |
| 代理公司: | 上海光柵知識產權代理有限公司 31340 | 代理人: | 馬雯雯 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 垂直 文本 識別 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
本公開提供一種垂直文本行識別方法、裝置、設備及計算機可讀存儲介質,方法包括:獲取待識別垂直文本行;將待識別垂直文本行向預設的第一方向旋轉預設的角度,獲得旋轉后的待識別垂直文本行;通過預設的文本分割模型對旋轉后的待識別垂直文本行進行分割操作,獲得至少兩個旋轉后的文字;將至少兩個旋轉后的文字向預設的第二方向進行旋轉預設的角度,獲得至少兩個水平方向的文字,第一方向與第二方向相反;對至少兩個水平方向的文字進行拼接操作,獲得水平方向的待識別垂直文本行,對水平方向的待識別垂直文本行進行識別操作。從而能夠采用現有的任意一種文字識別模型對其進行識別,提高垂直文本行的識別率,也能夠提高文字識別模型的適用度。
技術領域
本公開涉及圖像處理領域,尤其涉及一種垂直文本行識別方法、裝置、設備及計算機可讀存儲介質。
背景技術
由于實際應用中,很多圖像中都包括文字信息,因此,對圖像信息的文字識別應用在了越來越多的場景中。以短視頻應用軟件舉例來說,當用戶上傳視頻信息之后,該視頻信息中可能包括文字信息,需要對該文字信息進行識別,以確定該視頻是否包含違法信息,或者,可以根據文字信息對該視頻進行分類等操作。
為了實現對圖像中文字信息的識別,現有技術中一般都是使用OCR模型進行識別。但是,由于用戶的書寫以及閱讀習慣,一般OCR模型的訓練文本都是水平的文本行,而垂直方向的文本行訓練文本較少。相應地,上述方法僅能夠對水平文本行進行精準識別,其無法對垂直文本行進行識別,識別目標較為單一,適用性不強。
發明內容
本公開提供一種垂直文本行識別方法、裝置、設備及計算機可讀存儲介質,用于解決現有的文字信息識別方法無法對垂直文本行進行識別,識別目標較為單一、適用性不強的技術問題。
本公開的第一個方面是提供一種垂直文本行識別方法,包括:
獲取待識別垂直文本行,其中,所述待識別垂直文本行中文字的閱讀方向垂直與水平方向;
將所述待識別垂直文本行向預設的第一方向旋轉預設的角度,獲得旋轉后的待識別垂直文本行;
通過預設的文本分割模型對所述旋轉后的待識別垂直文本行進行分割操作,獲得至少兩個旋轉后的文字;
將所述至少兩個旋轉后的文字向預設的第二方向進行旋轉預設的角度,獲得至少兩個水平方向的文字,其中,所述第一方向與所述第二方向相反;
對所述至少兩個水平方向的文字進行拼接操作,獲得水平方向的待識別垂直文本行,對所述水平方向的待識別垂直文本行進行識別操作。
本公開的第二個方面是提供一種垂直文本行識別裝置,包括:
獲取模塊,用于獲取待識別垂直文本行,其中,所述待識別垂直文本行中文字的閱讀方向垂直與水平方向;
旋轉模塊,用于將所述待識別垂直文本行向預設的第一方向旋轉預設的角度,獲得旋轉后的待識別垂直文本行;
分割模塊,用于通過預設的文本分割模型對所述旋轉后的待識別垂直文本行進行分割操作,獲得至少兩個旋轉后的文字;
旋轉模塊,用于將所述至少兩個旋轉后的文字向預設的第二方向進行旋轉預設的角度,獲得至少兩個水平方向的文字,其中,所述第一方向與所述第二方向相反;
識別模塊,用于對所述至少兩個水平方向的文字進行拼接操作,獲得水平方向的待識別垂直文本行,對所述水平方向的待識別垂直文本行進行識別操作。
本公開的第三個方面是提供一種垂直文本行識別設備,包括:存儲器,處理器;
存儲器;用于存儲所述處理器可執行指令的存儲器;
其中,所述處理器被配置為由所述處理器執行如第一方面所述的垂直文本行識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010025426.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種液體火箭發動機液氧截止閥
- 下一篇:一種語音處理方法、介質及系統





