[發明專利]公式文字自動識別方法在審
| 申請號: | 202010882612.3 | 申請日: | 2020-08-28 |
| 公開(公告)號: | CN112016460A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 樊星 | 申請(專利權)人: | 上海松鼠課堂人工智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06K9/46 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200237 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 公式 文字 自動識別 方法 | ||
本發明公開了一種公式文字自動識別方法,所述方法包括:根據自動識別觸發指令,接收待識別信息,獲取所述待識別信息中包含的待識別的公式文字的原始圖像;分析所述原始圖像是否需要進行圖像處理,并根據分析結果,輸出對應的待識別圖像;對輸出的所述待識別圖像進行公式文字的自動識別,得到識別出的公式信息;達到了自動識別公式文字的目的,提高了公式文字識別的效率,同時也提高了識別的準確率。
技術領域
本發明涉及信息識別技術領域,特別涉及一種公式文字自動識別方法。
背景技術
隨著互聯網和計算機技術的不斷發展進步,利用互聯網進行線上教育的方式也越來越多地被人們所接受,線上教育的形式也越來越多樣化。數學公式因其包含了不同的數學運算符號,在進行信息識別和數據處理時,若按照常規的文字識別方式進行處理,通常會識別出亂碼或者不能識別的情況。因此,在進行信息識別和數據處理時,針對數學公式和其他的文字,如何進行公式文字的自動識別成為目前亟待解決的問題之一。
發明內容
本發明提供一種公式文字自動識別方法,旨在正確地識別出公式和文字,提高信息識別的準確率。
本發明提供了一種公式文字自動識別方法,所述公式文字自動識別方法包括:
根據自動識別觸發指令,接收待識別信息,獲取所述待識別信息中包含的待識別的公式文字的原始圖像;
分析所述原始圖像是否需要進行圖像處理,并根據分析結果,輸出對應的待識別圖像;
對輸出的所述待識別圖像進行公式文字的自動識別,得到識別出的公式信息。
進一步地,所述分析所述原始圖像是否需要進行圖像處理,并根據分析結果,輸出對應的待識別圖像,包括:
判斷所述原始圖像的模糊程度是否達到預設模糊程度,如果是,則對所述原始圖像進行去模糊處理,將去模糊處理后的原始圖像作為待識別圖像;如果否,則將所述原始圖像作為待識別圖像;
所述對輸出的所述待識別圖像進行公式文字的自動識別,得到識別出的公式信息,包括:
從所述待識別圖像中截取單獨的每個公式各自的公式所在區域;
從所述公式所在區域中識別任一個英文字母或者任一個數字;
根據所述識別出的英文字母或者數字的書寫方向,確定所述公式所在區域中公式的書寫方向;
確定出所述公式所在區域中公式的書寫方向之后,將所述公式所在區域進行網格劃分,將所述公式所在區域劃分為由多個正方形網格構成的網格區域;
逐個對位于所述網格區域內的公式符號局部形狀進行識別,獲得每個網格區域內包括的公式符號局部形狀;
沿著所述公式的書寫方向,依序將所述網格區域內的公式符號局部形狀進行拼接,獲得位于所述公式所在區域內的、沿著所述公式的書寫方向的各個公式符號;
從預設的符號數據庫中,查找所述獲得的各個公式符號各自對應的標準符號書寫模板;
按照各個公式符號在所述公式所在區域中的位置進行拼接,獲得所述待識別圖像中所述公式所在區域對應的公式。
進一步地,所述獲取所述待識別信息中包含的待識別的公式文字的原始圖像,包括:
基于接收到的所述待識別信息,監測基于所述待識別信息觸發的選擇指令;
響應基于所述待識別信息觸發的所述選擇指令,獲取所述選擇指令映射的待識別的原始圖像。
進一步地,所述分析所述原始圖像是否需要進行圖像處理,包括:
設置對應的預設基準圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海松鼠課堂人工智能科技有限公司,未經上海松鼠課堂人工智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010882612.3/2.html,轉載請聲明來源鉆瓜專利網。





