[發(fā)明專利]版面分析方法、閱讀輔助設(shè)備、電路和介質(zhì)有效
| 申請?zhí)枺?/td> | 201910408950.0 | 申請日: | 2019-05-17 |
| 公開(公告)號: | CN109934210B | 公開(公告)日: | 2019-08-09 |
| 發(fā)明(設(shè)計)人: | 王曉松;蔡海蛟;馮歆鵬;周驥 | 申請(專利權(quán))人: | 上海肇觀電子科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 北京市漢坤律師事務(wù)所 11602 | 代理人: | 魏小薇;吳麗麗 |
| 地址: | 201203 上海市浦東新區(qū)自由*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 版面模型 文字數(shù)據(jù) 版面分析 讀取 輔助設(shè)備 坐標信息 文字行 電路 圖像 相對位置關(guān)系 數(shù)據(jù)結(jié)構(gòu) 閱讀 掃描 申請 | ||
1.一種版面分析方法,包括:
獲得圖像中的一個或多個文字行的坐標信息;
通過在數(shù)據(jù)結(jié)構(gòu)中與所述一個或多個文字行的坐標信息對應(yīng)的區(qū)域中設(shè)置文字數(shù)據(jù),生成與所述圖像對應(yīng)的版面模型,所述文字數(shù)據(jù)包括表示存在文字的數(shù)據(jù)并且與文字的語義無關(guān);以及
對所生成的版面模型進行逐掃描行的掃描以讀取所述版面模型中的所述文字數(shù)據(jù),并且基于所讀取的所述文字數(shù)據(jù)在所述版面模型中的相對位置關(guān)系,對所述版面模型進行段落劃分,所述掃描行是在水平方向上貫穿版面模型的數(shù)據(jù)行。
2.如權(quán)利要求1所述的版面分析方法,其中,獲得圖像中的一個或多個文字行的坐標信息包括:
對所述圖像進行文字識別,以獲得各個文字的坐標信息;
將相鄰文字間距小于閾值間距的文字的序列作為文字行;以及
獲得包含各個文字行的相應(yīng)矩形的坐標信息,作為所述一個或多個文字行的相應(yīng)坐標信息。
3.如權(quán)利要求1所述的版面分析方法,其中,與所述一個或多個文字行的坐標信息對應(yīng)的區(qū)域包括:由各文字行的坐標信息確定的區(qū)域以及從該文字行的坐標信息在垂直方向上擴展特定距離的區(qū)域。
4.如權(quán)利要求1所述的版面分析方法,其中,生成與所述圖像對應(yīng)的版面模型還包括:在所述數(shù)據(jù)結(jié)構(gòu)中與所述圖像的非文字區(qū)域?qū)?yīng)的區(qū)域中設(shè)置空白數(shù)據(jù),所述空白數(shù)據(jù)是表示不存在文字的數(shù)據(jù)。
5.如權(quán)利要求4所述的版面分析方法,其中,所述文字數(shù)據(jù)為“1”,所述空白數(shù)據(jù)為“0”。
6.如權(quán)利要求1所述的版面分析方法,其中,對所述版面模型進行段落劃分包括:如果相鄰前一掃描行中不存在文字數(shù)據(jù)序列與當前掃描行中的文字數(shù)據(jù)序列在水平方向上的重疊率大于閾值重疊率,則確定所述當前掃描行中的該文字數(shù)據(jù)序列屬于新段落。
7.如權(quán)利要求1所述的版面分析方法,
其中,所述文字數(shù)據(jù)包含表示文字行的高度的數(shù)據(jù),以及
其中,對所述版面模型進行段落劃分包括:如果當前掃描行中的文字數(shù)據(jù)序列的文字數(shù)據(jù)的值與相鄰前一掃描行中的文字數(shù)據(jù)序列的文字數(shù)據(jù)的值之間的差大于閾值高度差,則確定所述當前掃描行中的該文字數(shù)據(jù)序列屬于新段落。
8.如權(quán)利要求1所述的版面分析方法,其中,對所述版面模型進行段落劃分包括:如果當前掃描行中的文字數(shù)據(jù)序列與相鄰前一掃描行中的多個文字數(shù)據(jù)序列在水平方向上的重疊率均大于閾值重疊率,則確定所述當前掃描行中的該文字數(shù)據(jù)序列屬于新段落。
9.如權(quán)利要求1所述的版面分析方法,其中,對所述版面模型進行段落劃分包括:如果當前掃描行中存在多個文字數(shù)據(jù)序列與相鄰前一掃描行中的同一文字數(shù)據(jù)序列在水平方向上的重疊率均大于閾值重疊率,則確定所述當前掃描行中的所述多個文字數(shù)據(jù)序列分別屬于各自的新段落。
10.如權(quán)利要求6-9中任一項所述的版面分析方法,其中,確定所述當前掃描行中的文字數(shù)據(jù)序列屬于新段落包括:將所述當前掃描行中的該文字數(shù)據(jù)序列的坐標信息設(shè)置作為所述新段落的坐標信息。
11.如權(quán)利要求1所述的版面分析方法,其中,在對所述版面模型進行段落劃分過程中,將當前掃描行中的文字數(shù)據(jù)序列劃分到相鄰前一掃描行中的文字數(shù)據(jù)序列所屬于的段落的必要條件包括:所述當前掃描行中的文字數(shù)據(jù)序列與所述相鄰前一掃描行中的文字數(shù)據(jù)序列在水平方向上的重疊率大于閾值重疊率。
12.如權(quán)利要求1所述的版面分析方法,
其中,所述文字數(shù)據(jù)包含表示文字行的高度的數(shù)據(jù),以及
其中,在對所述版面模型進行段落劃分過程中,將當前掃描行中的文字數(shù)據(jù)序列劃分到相鄰前一掃描行中的文字數(shù)據(jù)序列所屬于的段落的必要條件包括:當前掃描行中的文字數(shù)據(jù)序列的文字數(shù)據(jù)的值與相鄰前一掃描行中的文字數(shù)據(jù)序列的文字數(shù)據(jù)的值之間的差不大于閾值高度差。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海肇觀電子科技有限公司,未經(jīng)上海肇觀電子科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910408950.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 文字數(shù)據(jù)擴充方法及系統(tǒng)
- 網(wǎng)頁數(shù)據(jù)顯示的轉(zhuǎn)換方法以及系統(tǒng)
- 檢索文字匹配狀態(tài)的電子裝置
- 一種電子地圖中道路文字數(shù)據(jù)的排版方法和裝置
- 一種文字數(shù)據(jù)的推薦方法、系統(tǒng)及計算機存儲介質(zhì)
- 一種基于上下文關(guān)聯(lián)的智能語義匹配方法
- 文字數(shù)據(jù)處理方法、系統(tǒng)、介質(zhì)及裝置
- 一種語音轉(zhuǎn)文字效果評價優(yōu)化方法
- 信息處理方法及設(shè)備
- 語音交互方法和裝置、電子設(shè)備及可讀存儲介質(zhì)





