[發明專利]一種圖簽識別方法有效
| 申請號: | 200810216795.4 | 申請日: | 2008-10-17 |
| 公開(公告)號: | CN101388079A | 公開(公告)日: | 2009-03-18 |
| 發明(設計)人: | 黃天祥 | 申請(專利權)人: | 緯衡浩建科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳市萬商天勤知識產權事務所(普通合伙) | 代理人: | 顧光一;王志明 |
| 地址: | 518020廣東省深圳市羅湖*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 方法 | ||
技術領域??本發明涉及一種圖簽識別方法,尤其涉及一種基于單元格拓撲關系的CAD設計圖紙上的圖簽識別方法。
背景技術??隨著計算機輔助設計(CAD)的普及,電子圖檔在設計企業的生產和管理中發揮的作用也越來越大,受到重視的程度日益提高。許多業主在接收設計圖紙的時候,往往還要求設計企業提供與之對應的電子圖檔。電子圖檔在再利用方面有著紙質圖紙無法比擬的優勢。如果設計企業對多年來積累的電子圖檔能有效管理,能在大量的歷史圖檔中找到和當前工程設計有關的圖檔并有效利用,就能夠大大節省重新設計的時間,帶來可觀的效益。但是,海量的電子圖檔,也帶來了管理上的難題。為了把這些圖檔進行有效的分類,必須提取圖檔中的工程、專業、設計者等有效信息。
圖檔中的關鍵信息,往往存在于“圖簽”(Title?Box)中。如圖1所示,是圖紙中的圖簽的示意圖。圖簽10類似于一個表格,記錄了設計企業的信息,設計者的信息,以及工程編號,圖名等具體的工程信息,對圖檔的用途有說明作用。幾乎所有正式打印交付的圖檔都有圖簽。因此,圖簽信息對于檢索圖檔有著至關重要的作用。目前提取圖簽信息是一個重復和繁瑣的手工錄入過程,面對海量的圖檔,工作量非常大,而且容易出現人為的錯誤。
自動提取圖簽信息的研究已經有一些成果。這些研究都集中于通過定制模板來實現圖簽信息的讀取。因為同一設計單位的圖簽都具有相似的布局,因此定制模板的方式能解決相當部分圖簽的讀取問題。然而,迄今這些識別方法都是針對相對固定的圖簽格式,主要借助圖簽中的特征文字進行識別,無法解決在實際應用中出現的圖簽變化問題。這些問題包括:
●圖簽布局的變化。圖簽雖然有大致的布局,但往往沒有嚴格統一的規范;同時由于CAD繪圖方式的多樣性,設計人員也容易隨心所欲的對圖簽進行一些修改。比如,因為文字太多,存放文字的單元格被拉長、加寬或移位。這類布局的變化,會導致識別失敗。
●相似的圖簽引起的重復識別問題。許多圖簽看似相同,實際上存在變化,特別是信息的提示文字-關鍵字發生變化,使得一個模板無法同時適應多種圖簽。如果針對每一種變化制定一個模板,又容易出現重復識別的問題,即某些圖,能同時適用于多個模板。特別是圖簽格式比較多的時候,不同的模板之間很難完全區分開,這種情況非常容易發生。
●沒有關鍵字指引的單元格的識別與定位。有些單元格沒有明顯的關鍵字在附近,但是又必須準確識別。
發明內容????本發明的目的在于克服現有技術的不足,提出一種圖簽識別方法,通過對圖簽共性的提取,制定一套匹配的規則,對圖簽中的單元格進行準確定位,讀取單元格中的文字,提取出圖簽信息。
本發明公開的一種圖簽識別方法,用計算機程序自動讀取電子圖檔中的圖簽信息,包括如下步驟:
第一步,讀取所述電子圖檔中的文字和直線,再歸并所述文字和直線,然后排序;
第二步,取出一個模板;
第三步,根據所述模板的設定,尋找所述電子圖檔中的一個關鍵字及其關鍵字單元格;再重復執行如下步驟A,直到無法在所述電子圖檔中找到新的單元格或搜索范圍超出所述模板定義的范圍為止;
步驟A:以已經找到的關鍵字單元格為中心,根據所述模板設定的圖簽搜索范圍在所述電子圖檔中尋找所述已經找到的關鍵字單元格周圍的所有單元格;
記錄所述已經找到的所有單元格相互之間的拓撲關系,并與所述模板中不同關鍵字單元格之間的拓撲關系進行匹配,如果匹配成功則進入下一步,否則回到第二步,在第二步中取出下一個模板;
第四步,根據所述模板定義的關鍵字單元格與其它值單元格、混合單元格?和組單元格之間的拓撲關系,尋找所述值單元格、混合單元格和組單元格并提取其中的信息;
第五步,如果所述計算機程序中還有其他模板,則回到第二步,從所述其他模板中取出下一個模板,否則合并處理每一個模板的識別結果,消除其中重復的部分。
所述第一步中歸并所述文字和直線的方法包括:提取具有不同CAD圖元類型的文字和直線的位置和內容參數,把所有不同類型的文字和直線分別歸并為同一類型的文字和直線;把方向相同、首尾相連或中間部分重復的直線合并為一條單一的直線;把誤差范圍內略微傾斜的直線調整成為角度為0°或90°的直線。
所述第一步中排序的方法是把所有的直線和文字分別按照坐標位置排序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于緯衡浩建科技(深圳)有限公司,未經緯衡浩建科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810216795.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種生成業務單據憑證的方法及裝置
- 下一篇:一種基于領域本體的語義索引方法





