[發明專利]基于CAD基礎元素的電子表格結構化識別與提取方法有效
| 申請號: | 202011148183.3 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112241411B | 公開(公告)日: | 2022-07-26 |
| 發明(設計)人: | 賀耀北;劉婷婷;王永;楊云逸;李瑜;李文武 | 申請(專利權)人: | 湖南省交通規劃勘察設計院有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/25 |
| 代理公司: | 湖南兆弘專利事務所(普通合伙) 43008 | 代理人: | 周長清 |
| 地址: | 410200 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cad 基礎 元素 電子表格 結構 識別 提取 方法 | ||
本發明公開了一種基于CAD基礎元素的電子表格結構化識別與提取方法,包括:S1:讀入待輸出圖紙文件的文件數據;S2:用戶框選構成表格形式的直線和文本對象,分別存為文本對象集合和直線對象集合;S3:對于選擇幾種所有的直線,兩兩之間計算交點,將交點存入交點集;進行排序;S4:計算交點集第一個元素與最后一個元素的距離,作為輔助線長度;S5:獲得交點集所有元素的坐標值,按序排列;S6:對于文本集中的每個元素,進行循環遍歷進行操作,獲得對應的結構化信息;S7:完成所有文本集元素的結構化識別后,將所有的結構化單元信息數據提取到電子表格。本發明具有原理簡單、易實現、處理效率高、適用范圍廣等優點。
技術領域
本發明主要涉及到計算機輔助設計技術領域,特指一種基于CAD基礎元素的表格結構化識別與提取方法。
背景技術
CAD(Computer Aided Design)計算機輔助設計,是計算機技術的一個重要的應用領域。AutoCAD是美國Autodesk公司開發的交互式繪圖軟件,用于二維及三維設計、繪圖的系統工具,用戶可以使用它來創建、瀏覽、管理、打印、輸出、共享富含信息的設計圖形。作為通用型的制圖軟件,AutoCAD廣泛用于各個行業的設計工作。
AutoCAD圖紙設計信息主要分為圖形和表格兩大類。其中,表格主要承載各類工程數量信息,是設計表達的主要內容,對于材料預備、造價控制、進度控制等工程管理各方面具有重要作用。由于設計人員的習慣和技術資料積累,在工程實踐中有大量的表格是以基礎元素直線構成的表格線和基礎元素單行文本構成的表格內容這類形式存在。這類由基礎元素構成的表格,具有表格形式的外觀,實際上卻是直線、單行或多行文本的松散集合,沒有結構化數據,也無法與電子表格程序,如EXCEL等進行交互,制約了提高設計生產效率的提高。
有從業者也提出過嘗試采用程序對基于CAD基礎元素的表格結構化識別的方法,但普遍存在算法復雜、限制條件多、識別準確度低的問題。
發明內容
本發明要解決的技術問題就在于:針對現有技術存在的技術問題,本發明提供一種原理簡單、易實現、處理效率高、適用范圍廣的基于CAD基礎元素的電子表格結構化識別與提取方法。
為解決上述技術問題,本發明采用以下技術方案:
一種基于CAD基礎元素的電子表格結構化識別與提取方法,其步驟包括:
步驟S1:打開AutoCAD讀入待輸出圖紙文件的文件數據;
步驟S2:用戶框選構成表格形式的直線和文本對象,分別存為文本對象集合和直線對象集合;
步驟S3:對于選擇幾種所有的直線,兩兩之間計算交點,將交點存入交點集;按照先按交點X坐標值,然后按交點Y坐標值對交點進行排序;
步驟S4:計算交點集第一個元素與最后一個元素的距離,作為輔助線長度;
步驟S5:獲得交點集所有元素的X坐標值,存入X坐標集,并按升序排列;獲得交點集所有元素的Y坐標值,存入Y坐標集,對Y坐標集按降序排列;
步驟S6:對于文本集中的每個元素,進行循環遍歷進行操作,獲得對應的結構化信息;
步驟S7:完成所有文本集元素的結構化識別后,將所有的結構化單元信息數據提取到電子表格。
作為本發明方法的進一步改進:所述步驟S2中,若構成表格的元素中存在多段線、多行文字類型,先對所有對象執行分解命令,直至表格有直線和單行文本構成為止。
作為本發明方法的進一步改進:所述步驟S2包括:
步驟S201:獲取基本元素選擇集,存入變量Ents;
步驟S202:識別選擇集文本對象,存入Txts變量;識別選擇集直線對象,存入Lines變量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南省交通規劃勘察設計院有限公司,未經湖南省交通規劃勘察設計院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011148183.3/2.html,轉載請聲明來源鉆瓜專利網。





