[發明專利]基于運算符作用域和中心線的數學公式識別方法有效
| 申請號: | 202011638890.0 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN113139548B | 公開(公告)日: | 2022-05-06 |
| 發明(設計)人: | 黃勝;冉浩杉;賈艷秋;張琴 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 400065*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 運算 作用 中心線 數學公式 識別 方法 | ||
1.一種數學公式識別方法的方法,包含以下的步驟:
步驟S1:針對數學公式圖片的特點選取連通域與規則相結合的方法進行公式圖片切割,獲得單個字符圖片和字符圖片的多種坐標信息,并根據字符圖片位置信息按照自左向右、自上向下的順序排序形成字符圖片數據流;
步驟S2:利用淺層卷積神經網絡對分割得到的單個字符圖片進行字符識別,獲得單個字符圖片的類別,并更新字符圖片數據流對應字符的信息;
步驟S3:對公式結構進行識別,首先搜索公式中運算符號,判斷運算符號的類別,根據類別的不同實現對符號的作用域內的子式進行處理;獲得對運算符的作用內的子式處理之后的數據流,開始應用中心線的概念,識別公式中的上下標位置關系;
步驟S3的特征在于利用運算符號的作用域固定的特點,將不同種類運算符作用域分為三類,分別是分號、特殊運算符和普通二元運算符號,其中特殊運算符包括根號、求和符號、積分符號大符號,這些運算符有多個作用域;特殊運算符的每個作用域有自己的中心線,每個作用域的所有字符的識別可看成一個子公式的識別;
步驟S3的中心線方法的特征在于:對普通字符間上下標位置關系識別是利用字符在書寫時受四線格的約束情況提出中心線的概念;將常見字符分類為向上類、向下類、全占類和中心類,依據字符類型不同采用不同的權值來計算字符的中心線,并根據中心線的范圍閾值來判斷兩個字符或子式之間的位置關系;
假設當前字符圖片的是c,n是c的后一個字符;c左上角縱坐標是cy1,右下角縱坐標是cy2;n的左上角和右下角的縱坐標分別是ny1,ny2;center1是c的中心線的縱坐標,center2是n的中心線的縱坐標,range是c上下標出現的范圍;center1和center2的計算如下式所示:
center1=a·cy1+b·cy2 (1)
center2=a·ny1+b·ny2 (2)
式中,a和b是不同類型字符計算中心線的系數;
range的計算如下式所示:
range=(cy2-cy1)·line_height_ratio (3)
式中line_height_ratio的選取固定值為0.35;
利用下面條件判斷c和n的關系:
if(center1-range)center2(cy2-rangeny2)
n是c的上標;
if(center1+range)center2(cy2+rangeny2)
n是c的下標;
else
n在c的水平右邊;
步驟S4:輸出公式識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011638890.0/1.html,轉載請聲明來源鉆瓜專利網。





