[發明專利]自由形式手寫文本中的分組線有效
| 申請號: | 200680018483.1 | 申請日: | 2006-05-30 |
| 公開(公告)號: | CN101208709A | 公開(公告)日: | 2008-06-25 |
| 發明(設計)人: | M·葉;H·蘇塔拓;S·拉互帕斯;C·李;M·施利曼 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 上海專利商標事務所有限公司 | 代理人: | 張政權 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自由 形式 手寫 文本 中的 分組 | ||
技術領域
本發明涉及電子墨水的自由形式手寫組織。本發明的各個方面特別適用于將自由形式電子墨水手寫組織成線。
背景技術
在全世界范圍內,計算機日常用于各種目的。隨著計算機變得普遍,計算機制造商不斷地尋求使它們更易掌握和用戶友好。一種這樣的努力是開發自然輸入法,諸如通過手寫提交數據。通過輸入筆或其它物體在數字轉換器上書寫以產生“電子墨水”,計算機用戶能摒棄與鍵盤關聯的體積大和不方便??梢栽谑褂面I盤笨拙或不便時的任何情況下,由例如巡視的醫生、建筑工地的建筑師、遞送包裹的郵遞員、在倉庫周圍走動的倉庫工人方便地使用手寫輸入。當使用鍵盤和鼠標不方便或不適合時,諸如當作者正在走動、在安靜的會議中等時,使用手寫輸入尤其有用。使用手寫輸入還是用于創建諸如算術公式、曲線、圖表和符號的某些類型的數據的符號自然選擇。
雖然在許多情況下手寫輸入比鍵盤輸入更方便,但是用電子墨水書寫的文本通常不能被大多數軟件應用程序直接操控。相反,必須對用電子墨水書寫的文本進行分析以將其轉換成另一形式,諸如ASCII字符。該分析包括手寫識別進程,該進程基于組成電子墨水文字的各個電子墨水筆劃之間的各種關系來識別字符。近年來,手寫識別算法進步顯著,但當以某一角度書寫電子墨水時,其準確度下降。類似地,當不能容易地區分各個的墨水筆劃組時,諸如當將兩個字被緊密地書寫在一起時,許多識別算法不能正確地識別電子墨水。當將電子墨水實際上是圖表時,某些識別算法也可能將電子墨水錯誤地識別為文字。
通過在使用手寫識別算法之前“解析”(例如通過分析其布局和/或“分類”)電子墨水,可大大改進許多識別算法的準確度。分類進程通常判定電子墨水筆劃是圖表的一部分(即圖表墨水筆劃)還是手寫文本的一部分(即文本墨水筆劃)。用于識別其它筆劃類型的分類算法也是可能的。布局分析進程通常將電子墨水筆劃分組成有意義的關聯,諸如文字、線和段落。
文本線是自由形式手寫中最常見的結構,并且對它們可靠檢測是更高級布局分析和語義解析的基礎。自由形式墨水筆記是諸如文本塊、圖表、曲線和符號的復雜結構的混合,并且不同結構的組合通常造成難以可靠地識別自由形式手寫中的文本的離散線。例如,圖1A表示自由形式手寫101A的潛在復雜性的示例。
圖1B僅示出將手寫文本的電子墨水筆劃分組成線的一個困難示例。手寫101B包括項目符號103A-103D以及四組手寫文本105A-105D。如觀眾將注意到的,項目符號103A對應于文本組105A,項目符號103B對應于文本組105B,項目符號103C對應于文本組105C以及項目符號103D對應于文本組105D。觀眾還將意識到組105A-105D的每一個應當被視為單個文本線。
手寫101可能會被現有的手寫解析技術錯誤地組織。例如,如該圖所示,項目符號103A-103D已經被錯誤地組織成單個垂直線。而且,文字組105A已經被組織成三個單獨線109A-109C。類似地,文字組105D已經被組織成三個單獨線111A-111C。手寫組織的該錯誤識別可使手寫識別引擎很難正確地識別例如項目符號103A-103D。
除手寫識別外,解析函數(parsing?function)可用來選擇用于編輯和其它操作的手寫文本。因此,手寫的錯誤組織可能導致在分組中選擇和操控不正確的手寫,這對用戶而言并不方便,甚至有害。
發明內容
有利的是本發明的各個方向涉及用于有效和準確地將自由形式手寫組織成線的技術。本發明的各個示例采用設計成找出將電子墨水筆劃劃分成線組并且使所得線的“優度”及其構形的一致性最大化的最簡單劃分的整體成本函數(global?costfunction)。本發明的某些實施方式基于線的線性回歸誤差以及構成該線的筆劃的水平和垂直緊密度來度量線的“優度”。筆劃分組的線一致性構形通過相鄰組之間的角度差來度量。通過本發明的各個示例,整體成本函數還考慮了通過對筆劃進行分組得到的線的數量來度量的筆劃劃分的復雜性。
對筆劃進行初始分組,并確定用于該初始分組的成本。通過本發明的某些示例,使用基于書寫筆劃的時間順序創建的一維筆劃陣列來對筆劃進行初始分組。創建該陣列的不同劃分,并通過動態編程,使用成本函數的簡化版本來標識用于該初始分組的特定劃分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680018483.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電壓凹陷產生裝置
- 下一篇:圖像處理裝置及其控制方法和存儲介質





