[發明專利]一種識別手寫表格的方法及裝置有效
| 申請號: | 200710178961.1 | 申請日: | 2007-12-07 |
| 公開(公告)號: | CN101452523A | 公開(公告)日: | 2009-06-10 |
| 發明(設計)人: | 劉迎建;徐明慶;王春明;王利娟 | 申請(專利權)人: | 漢王科技股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/34;G06K9/46 |
| 代理公司: | 北京集佳知識產權代理有限公司 | 代理人: | 逯長明 |
| 地址: | 100094北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 手寫 表格 方法 裝置 | ||
技術領域
本發明涉及模式識別技術,特別是涉及一種識別手寫表格的方法及裝置。?
背景技術
在模式識別領域,可識別的信息包括圖形、圖像、各種語言的字符、表格等多種形式,其中識別手寫輸入的技術作為模式識別的一個方面,得到了廣泛的應用。手寫識別技術是基于對手寫輸入筆畫的識別,把人借助某種設備輸入的信息轉換成計算機可識讀并能直接處理的形式。?
目前,手寫識別技術中應用最多的是對文字等字符的識別,字符識別和處理技術發展較早,現在已經發展到應用階段,例如手機、PDA等移動終端中手寫輸入法的應用等。而手寫字符之外的表格、圖形、框圖等在文檔中經常出現的元素在手寫識別技術方面還沒有得到充分的發展。其中,表格作為一種常用的信息表達方式,經常出現在電子文檔中,但是把表格輸入到電子文檔的方式卻很單一,是通過各種軟件編輯器(如Word、Excel等)輸入。因此,如果能把表格也通過手寫方式輸入到電子文檔中,用戶就能夠在應用手寫輸入時更方便地編輯文檔。?
發明內容
本發明所要解決的技術問題是提供一種識別手寫表格的方法及裝置,以解決目前的手寫識別技術在識別手寫表格方面不完善的問題。?
為解決上述技術問題,根據本發明提供的具體實施例,本發明公開了以下技術方案:?
一種識別手寫表格的方法,包括:?
采集原始輸入作為待分析筆畫;?
從所述待分析筆畫中識別出非文字筆畫;?
按照以下步驟將所述非文字筆畫分割為線段:計算筆畫上每個點處的角度,如果計算結果小于角度閾值,則將該點判定為折線點,兩兩折線點構成線段;其中,按照以下步驟計算筆畫上每個點處的角度:以該點為圓心、以預置閾值為半徑的圓與筆畫相交為兩點,交點與圓心相連的半徑形成的角度為該點的角度;?
判定出水平和豎直方向的線段,并判斷所述水平和豎直方向的線段是否構成封閉矩形,并且矩形內部是否至少包含一條水平線段或豎直線段;如果是,則所述構成封閉矩形的線段為表格邊界線,所述封閉矩形內部的水平或豎直線段為內部表格線;?
利用所述表格邊界線和內部表格線構建表格結構,并填充表格內容;?
其中,按照以下步驟判定出水平和豎直方向的線段:計算線段的長度、寬度和高度,將線段寬度與線段長度的比值小于豎直線段閾值的線段判定為豎直方向,將線段高度與線段長度的比值小于水平線段閾值的線段判定為水平方向;?
按照以下步驟判斷所述水平和豎直方向的線段是否構成封閉矩形,并且矩形內部是否至少包含一條水平線段或豎直線段:將豎直線段從左到右排序,構成潛在的表格列與列之間的分割線和表格的左右邊界;將水平線段從上到下排序,構成潛在的表格行與行之間的分割線和表格的上下邊界;如果水平線段中第一條線段的右端點和垂直線段中最后一條線段的上端點的距離大于重合距離閾值,或者,垂直線段中最后一條線段的下邊端點和水平線段中最后一條線段的右端點的距離大于重合距離閾值,或者,水平線段中最后一條線段的左端點和垂直線段中第一條線段的下端點的距離大于重合距離閾值,或者,垂直線段中第一條線段的上端點和水平中第一條線段的左端點的距離大于重合距離閾值,則不構成封閉矩形,否則構成封閉矩形;對于構成封閉矩形的線段,如果垂直線段的線段個數小于2,或者,水平線段的線段個數小于2,或者,垂直線段與水平線段的線段個數之和小于5,則矩形內部沒有至少包含一條水平線段或豎直線段。?
優選的,在識別非文字筆畫的步驟之前還包括:對原始輸入進行重新采樣,得到以距離均勻的點列信息表示的筆畫,作為待分析筆畫。?
優選的,按照以下步驟識別出非文字筆畫:計算筆畫的長度,將長度大于長度閾值的筆畫判定為非文字筆畫。?
優選的,在分割筆畫為線段的步驟之前還包括筆畫分組的步驟:計算非文字筆畫之間的距離,將計算結果小于成組閾值的非文字筆畫劃分為一組,分割筆畫時分別對每組筆畫進行分割;?
其中,按照以下步驟計算非文字筆畫之間的距離:以最小矩形包圍筆畫,計算兩個矩形水平方向間隔和豎直方向間隔之和。?
一種識別手寫表格的裝置,包括:?
筆畫采樣單元,用于采集原始輸入作為待分析筆畫;?
圖文分割單元,用于從所述待分析筆畫中識別出非文字筆畫;?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司,未經漢王科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710178961.1/2.html,轉載請聲明來源鉆瓜專利網。





