[發明專利]基于時序點集計算的漢字文本行書寫質量自動評價方法和系統有效
| 申請號: | 201811453492.4 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109635687B | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 仇宏斌;姜杰;許明月;吳瑤;王靜;黃峰;白曉東;李藝 | 申請(專利權)人: | 南京師范大學 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V30/182;G06V30/414 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 朱小兵 |
| 地址: | 210023 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 時序 計算 漢字 文本 行書 質量 自動 評價 方法 系統 | ||
1.一種基于時序點集計算的漢字文本行書寫質量自動評價方法,其特征在于,包括如下步驟:
步驟一、獲取點集數據:收集用戶按行書寫漢字文本產生的軌跡數據,所述軌跡數據的形式為包含時序信息的點集;所述點集用于組成筆畫;
步驟二、分行并得到行軸線:通過當前筆畫、上一筆畫和每行字的第一筆畫之間的位置關系,將所述軌跡數據分成文本行;然后將屬于一個文本行的點集擬合成一條用多項式表達的曲線,作為該文本行的行軸線;
步驟三、計算文本行框:找到文本行的左上頂點A、左下頂點B、右上頂點C和右下頂點D;用直線分別連接點A和點B、點C和點D,用本文本行的行軸線平移得到的曲線分別連接點A和點C,點B和點D,將圍成的封閉區域作為所述文本行的文本行框;
步驟四、判斷補筆:判斷當前筆畫是否在文本行框中或文本行框的延長框中;如果是,則判定當前筆畫為補筆行為,將該筆畫歸為當前文本行框中,進入后續步驟;如果不是,則返回步驟二;
步驟四、合并分行結果:判斷兩個相鄰文本行的文本行框面積重疊程度是否超過事先設定的閾值;如果超過,則將這兩個文本行的點集看作屬于同一個文本行,然后返回步驟二,得到屬于新的文本行的行軸線;如果未超過閾值,則進入步驟五;
步驟五、割字:識別一個文字行內的點集,得到多個連通域;對所述連通域進行合并與切分,得到多個區域,所述區域各包含一個單字;
步驟六、對于文本行計算行指標特征:所述行指標特征包括:
(1)行軸線穩定性:指一個文本行內各字重心與該文本行的行軸線在豎直方向上的偏差;
(2)行軸線距離穩定性,指一組相鄰文本行的行軸線間各處距離的偏差;
(3)行軸線距離均勻性:指多組相鄰文本行的行軸線兩兩間平均距離的偏差;
(4)多字的布白勻稱性:用于描述同一文本行內相鄰兩個字的字間距的偏差;
(5)左對齊程度:指每一文本行第一個字的幾何中心與第一文本行第一個字幾何中心在X軸上的偏差;
步驟七、基于行指標特征,對行書寫質量評價打分。
2.如權利要求1所述的一種基于時序點集計算的漢字文本行書寫質量自動評價方法,其特征在于,步驟二中,確定一個筆畫為一行字的第一筆畫標準為:首先確定整篇文本行的第一個筆畫為當前行的第一筆畫,當滿足分行條件后進行分行,再將新的文本行的第一筆畫作為一行字的第一筆畫。
3.如權利要求1所述的一種基于時序點集計算的漢字文本行書寫質量自動評價方法,其特征在于,步驟二中,將軌跡數據分行的條件包括兩種情況:
在X軸方向,當前筆畫在第一筆畫左邊,且上一筆畫在第一筆畫的右邊;同時,從第一筆畫到上一筆畫的距離小于從當前筆畫到上一筆畫的距離,并且當前筆畫與上一筆畫在X方向上的最遠距離和上一筆畫與第一筆畫在X方向上的最遠距離大于當前行的最長筆畫長度;
或者在X軸方向,當前筆畫在第一筆畫右邊,在上一筆畫的右邊;同時,第一筆畫到上一筆畫的距離大于到當前筆畫的距離,并且上一筆畫與當前筆畫在X方向上的最遠距離大于所設閾值,上一筆畫與第一筆畫在X方向上的最遠距離大于當前行的最長筆畫長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京師范大學,未經南京師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811453492.4/1.html,轉載請聲明來源鉆瓜專利網。





