[發明專利]文本的識別方法、裝置、電子設備和存儲介質在審
| 申請號: | 202111425615.5 | 申請日: | 2021-11-26 |
| 公開(公告)號: | CN114140782A | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 趙瑞書 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V20/40;G06V30/148;G06V30/19;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 劉冬亮 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 識別 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供了一種文本的識別方法和裝置,其中,所述方法包括:視頻幀圖像中提取出包含至少一個文本框的文本圖像,識別出文本圖像的特征向量;根據特征向量和文本排列規則對各文本框內的文本內容進行分類得到對應的語種信息;針對各文本框內的文本內容分別選擇與各語種信息對應的文本識別算法,并根據選擇的文本識別算法對相應的文本框中的文本內容進行識別,文本內容對應的語種信息。本發明實施例解決現有的利用一種文本識別算法對包含多語種的文本內容進行識別,導致的文本識別遺漏、文本識別錯誤等識別不準確的技術問題,達到提升文本識別準確率的效果。
技術領域
本發明涉及計算機技術領域,特別是涉及一種文本的識別方法和裝置,以及一種電子設備和一種計算機可讀存儲介質。
背景技術
目前,識別圖像中的文本,需要通過兩個步驟實現。先通過檢測器檢測圖像中的文本位置,然后通過文本識別算法對具體的文本進行識別。
當使用一個文本識別算法對包括了不同語種的文本進行識別時,由于文本識別算法通常僅用于識別唯一語種的文本,會造成部分語種的文本中的部分語種被遺漏或者識別錯誤的問題,導致識別得到的結果不準確。
發明內容
本發明實施例的目的在于提供一種文本的識別方法和裝置,以及一種電子設備和一種計算機可讀存儲介質,解決了文本識別不準確的問題。具體技術方案如下:
在本發明實施例的第一方面,首先提供了一種文本的識別方法,包括:獲取待處理的視頻幀圖像;從所述視頻幀圖像中提取出文本圖像,并識別出所述文本圖像的特征向量,所述文本圖像中包含至少一個文本框;根據所述特征向量和預設的文本排列規則,對各所述文本框內的文本內容進行分類得到對應的語種信息,所述文本排列規則表示對應于各所述語種信息的文本內容在展示時所占用的字符信息;針對各所述文本框內的文本內容,分別選擇與各所述語種信息對應的文本識別算法,并根據選擇的所述文本識別算法對相應的所述文本框中的文本內容進行識別,所述文本內容對應的語種信息,與選擇的所述文本識別算法對應的語種信息相同。
可選地,所述根據所述特征向量和預設的文本排列規則,對各所述文本框內的文本內容進行分類得到對應的語種信息,包括:根據所述特征向量和所述文本排列規則,對各所述文本框內的文本內容所包含的各字符進行分類得到分類結果;將每個所述文本框對應的分類結果映射為每個所述文本框各自對應的所述語種信息。
可選地,所述根據所述特征向量和所述文本排列規則,對各所述文本框內的文本內容所包含的各字符進行分類得到分類結果,包括:將所述文本圖像輸入卷積神經網絡,得到所述文本圖像的各像素點的圖像特征向量,將所述圖像特征向量輸入循環神經網絡,得到所述像素點的文本特征向量;根據所述文本特征向量統計各所述字符占用的關聯像素點或獨立像素點的數量,所述關聯像素點為一組相鄰的像素點,且該一組相鄰的像素點具有關聯的所述文本特征向量,所述獨立像素點為與自身相鄰的像素點不具有關聯的所述文本特征向量的像素點;根據所述數量和所述文本排列規則對各所述字符進行分類得到所述分類結果。
可選地,所述文本排列規則包含所述數量所在的數量范圍與所述分類結果之間的對應關系;所述根據所述數量和所述文本排列規則對各所述字符進行分類得到所述分類結果,包括:針對各所述字符,將與所述數量所在的數量范圍具有所述對應關系的所述分類結果,作為各所述字符的分類結果。
可選地,所述將每個所述文本框對應的分類結果映射為每個所述文本框各自對應的所述語種信息,包括:針對每個所述文本框,若同一個所述文本框內各所述字符的分類結果相同,則將各所述字符的分類結果作為同一個所述文本框對應的所述語種信息;若同一個所述文本框內各所述字符的分類結果不相同,則將各所述字符的分類結果,共同作為同一個所述文本框對應的所述語種信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111425615.5/2.html,轉載請聲明來源鉆瓜專利網。





