[發明專利]基于CAD基礎元素的電子表格結構化識別與提取方法有效
| 申請號: | 202011148183.3 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112241411B | 公開(公告)日: | 2022-07-26 |
| 發明(設計)人: | 賀耀北;劉婷婷;王永;楊云逸;李瑜;李文武 | 申請(專利權)人: | 湖南省交通規劃勘察設計院有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/25 |
| 代理公司: | 湖南兆弘專利事務所(普通合伙) 43008 | 代理人: | 周長清 |
| 地址: | 410200 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cad 基礎 元素 電子表格 結構 識別 提取 方法 | ||
1.一種基于CAD基礎元素的電子表格結構化識別與提取方法,其特征在于,步驟包括:
步驟S1:打開AutoCAD讀入待輸出圖紙文件的文件數據;
步驟S2:用戶框選構成表格形式的直線和文本對象,分別存為文本對象集合和直線對象集合;
步驟S3:對于選擇幾種所有的直線,兩兩之間計算交點,將交點存入交點集;按照先按交點X坐標值,然后按交點Y坐標值對交點進行排序;
步驟S4:計算交點集第一個元素與最后一個元素的距離,作為輔助線長度;
步驟S5:獲得交點集所有元素的X坐標值,存入X坐標集,并按升序排列;獲得交點集所有元素的Y坐標值,存入Y坐標集,對Y坐標集按降序排列;
步驟S6:對于文本集中的每個元素,進行循環遍歷進行操作,獲得對應的結構化信息;
步驟S7:完成所有文本集元素的結構化識別后,將所有的結構化單元信息數據提取到電子表格;
所述步驟S6中,獲得對應的結構化信息的流程包括:
步驟S601:計算文本元素的中點坐標信息;
步驟S602:以中點坐標為中心點,按輔助線長度,作一根豎直輔助線;
步驟S603:計算該豎直輔助線與直線對象集合所有元素的交點,并記錄具有與中點Y坐標值正負方向最接近Y坐標值的兩個交點;
步驟S604:在Y坐標集中得到與上述兩交點Y坐標值相同的元素序號,較小的序號需加1作為該文本所占單元格的起始列編號,較大的序號作為該文本所占單元格的終止列編號;
步驟S605:以中點坐標為中心點,按輔助線長度,作一根水平輔助線;
步驟S606:計算該水平輔助線與直線對象集合所有元素的交點,并記錄具有與中點X坐標值正負方向最接近X坐標值的兩個交點;
步驟S607:在X坐標集中得到與上述兩交點X坐標值相同的元素序號,較小的序號需加1作為該文本所占單元格的起始行編號,較大的序號作為該文本所占單元格的終止行編號;
步驟S608:文本元素的文本內容,以及起點起始行編號、終止行編號、起始列編號、終止列編號,構成了一個結構化單元信息數據。
2.根據權利要求1所述的基于CAD基礎元素的電子表格結構化識別與提取方法,其特征在于,所述步驟S2中,若構成表格的元素中存在多段線、多行文字類型,先對所有對象執行分解命令,直至表格有直線和單行文本構成為止。
3.根據權利要求2所述的基于CAD基礎元素的電子表格結構化識別與提取方法,其特征在于,所述步驟S2包括:
步驟S201:獲取基本元素選擇集,存入變量Ents;
步驟S202:識別選擇集文本對象,存入Txts變量;識別選擇集直線對象,存入Lines變量。
4.根據權利要求3所述的基于CAD基礎元素的電子表格結構化識別與提取方法,其特征在于,所述步驟S3中包括:
步驟S301:計算所有線交點,存入Points變量;
步驟S302:對Points先按X升序、后按Y降序排序;即,計算表格對角線長度,存入Length變量;計算交點X坐標值表,并按升序排列,存入CorX變量;計算交點Y坐標值表,并按降序排列,存入CorY變量。
5.根據權利要求1所述的基于CAD基礎元素的電子表格結構化識別與提取方法,其特征在于,所述步驟S601中對每個文本對象Txt,中點坐標存入變量Mdipnt;所述步驟S602中以Mdipnt為中心,做長度為Length的豎直線Vline;所述步驟S603中計算Vline與Lines中所有直線的交點,并按Y坐標值降序排序,存入變量Vpnts;所述步驟S604中Vpnts中Y坐標值正、負方向分別最接近Mdipnt點Y坐標值的兩點,分別存入變量Vp1、Vp2;所述步驟S605中以Mdipnt為中心,做長度為Length的水平線Hline;所述步驟S606中計算Hline與Lines中所有直線的交點,并按X坐標值升序排序,存入變量Hpnts;所述步驟S607中Vpnts中X坐標值正、負方向分別最接近Mdipnt點X坐標值的兩點,分別存入變量Hp1、Hp2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南省交通規劃勘察設計院有限公司,未經湖南省交通規劃勘察設計院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011148183.3/1.html,轉載請聲明來源鉆瓜專利網。





