[發明專利]公式主體定位方法、裝置、設備及計算機可讀存儲介質在審
| 申請號: | 201811611964.4 | 申請日: | 2018-12-27 |
| 公開(公告)號: | CN111400491A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 陳一帆;顏欽欽;高良才;湯幟 | 申請(專利權)人: | 北大方正集團有限公司;北大方正信息產業集團有限公司;北京大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/131 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張子青;劉芳 |
| 地址: | 100871 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 公式 主體 定位 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
1.一種公式主體定位方法,其特征在于,包括:
獲取初步定位獲得的公式整體數據;
對所述公式整體數據進行分割,獲得至少一行公式行數據;
針對每一行公式行數據,對所述公式行數據進行聚類操作,獲得至少一個待選公式主體;
去除所述待選公式主體中的非公式主體信息,獲得所述公式主體。
2.根據權利要求1所述的方法,其特征在于,所述對所述公式整體數據進行分割,獲得至少一行公式行數據,包括:
對所述公式整體數據進行水平投影;
對水平投影值大于預設的合并閾值的公式整體數據進行分割,獲得分割后的公式整體數據;
計算所述分割后的公式主體數據的投影區間間隔,將投影區間間隔小于預設的分割閾值的分割后的公式主體數據進行合并,獲得所述至少一行公式行數據。
3.根據權利要求1所述的方法,其特征在于,所述針對每一行公式行數據,對所述公式行數據進行聚類操作,獲得至少一個待選公式主體,包括:
針對每一行公式行數據,按照預設的空間順序,從所述公式行數據中選取初始種子像素;
針對各初始種子像素,將與所述初始種子像素相鄰并與所述初始種子像素具有相同性質的像素以及所述初始種子像素進行連通,獲得至少一個連通域;
針對任意兩個連通域,判斷所述任意兩個連通域的幾何中心距離是否小于預設的閾值;
若是,則合并所述任意兩個連通域,獲得至少一個待選公式主體。
4.根據權利要求1所述的方法,其特征在于,所述去除所述待選公式主體中的非公式主體信息,獲得所述公式主體,包括:
將所述待選公式主體與預設的條件詞匯表進行比對,判斷所述待選公式主體中是否包含所述條件詞匯表中的任一條件詞匯;
若是,則對所述待選公式主體中的條件詞匯進行去除。
5.根據權利要求1所述的方法,其特征在于,所述去除所述待選公式主體中的非公式主體信息,獲得所述公式主體,包括:
根據所述各待選公式主體中數據的外形以及內容特征,確定所述待選公式主體中的公式主體以及非公式主體信息;
去除所述待選公式主體中的非公式主體信息,獲得所述公式主體。
6.一種公式主體定位裝置,其特征在于,包括:
獲取模塊,用于獲取初步定位獲得的公式整體數據;
分割模塊,用于對所述公式整體數據進行分割,獲得至少一行公式行數據;
聚類模塊,用于針對每一行公式行數據,對所述公式行數據進行聚類操作,獲得至少一個待選公式主體;
去除模塊,用于去除所述待選公式主體中的非公式主體信息,獲得所述公式主體。
7.根據權利要求6所述的裝置,其特征在于,所述分割模塊包括:
投影單元,用于對所述公式整體數據進行水平投影;
分割單元,用于對水平投影值大于預設的合并閾值的公式整體數據進行分割,獲得分割后的公式整體數據;
合并單元,用于計算所述分割后的公式主體數據的投影區間間隔,將投影區間間隔小于預設的分割閾值的分割后的公式主體數據進行合并,獲得所述至少一行公式行數據。
8.根據權利要求6所述的裝置,其特征在于,所述聚類模塊包括:
選取單元,用于針對每一行公式行數據,按照預設的空間順序,從所述公式行數據中選取初始種子像素;
連通單元,用于針對各初始種子像素,將與所述初始種子像素相鄰并與所述初始種子像素具有相同性質的像素以及所述初始種子像素進行連通,獲得至少一個連通域;
判斷單元,用于針對任意兩個連通域,判斷所述任意兩個連通域的幾何中心距離是否小于預設的閾值;
合并單元,用于若是,則合并所述任意兩個連通域,獲得至少一個待選公式主體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北大方正信息產業集團有限公司;北京大學,未經北大方正集團有限公司;北大方正信息產業集團有限公司;北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811611964.4/1.html,轉載請聲明來源鉆瓜專利網。





