[發(fā)明專利]識(shí)別PDF文件中文本框的方法、裝置及計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110184633.2 | 申請(qǐng)日: | 2021-02-08 |
| 公開(kāi)(公告)號(hào): | CN112818894A | 公開(kāi)(公告)日: | 2021-05-18 |
| 發(fā)明(設(shè)計(jì))人: | 邢振雨 | 申請(qǐng)(專利權(quán))人: | 深圳萬(wàn)興軟件有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00 |
| 代理公司: | 深圳市精英專利事務(wù)所 44242 | 代理人: | 李翔宇 |
| 地址: | 518000 廣東省深圳市南*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 識(shí)別 pdf 文件 文本框 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種識(shí)別PDF文件中文本框的方法,其特征在于,所述方法包括:
獲取目標(biāo)PDF文件,并從所述目標(biāo)PDF文件中獲取目標(biāo)對(duì)象;
解析所述目標(biāo)對(duì)象以獲取所述目標(biāo)對(duì)象的形狀,并根據(jù)所述目標(biāo)對(duì)象的形狀將所述目標(biāo)對(duì)象歸類至預(yù)設(shè)圖形集合中相應(yīng)的子集合中,其中,所述預(yù)設(shè)圖形集合包括多個(gè)對(duì)應(yīng)不同形狀的子集合;
對(duì)所述預(yù)設(shè)圖形集合進(jìn)行處理以獲得目標(biāo)預(yù)設(shè)圖形集合;
解析所述目標(biāo)預(yù)設(shè)圖形集合并判斷所述目標(biāo)預(yù)設(shè)圖形集合中的對(duì)象所對(duì)應(yīng)的圖形區(qū)域是否存在文本對(duì)象以識(shí)別出所述目標(biāo)PDF文件的文本框。
2.如權(quán)利要求1所述的識(shí)別PDF文件中文本框的方法,其特征在于,所述解析所述目標(biāo)對(duì)象以獲取所述目標(biāo)對(duì)象的形狀,并根據(jù)所述目標(biāo)對(duì)象的形狀將所述目標(biāo)對(duì)象歸類至預(yù)設(shè)圖形集合中相應(yīng)的子集合中的步驟,包括:
解析所述目標(biāo)對(duì)象并判斷所述目標(biāo)對(duì)象的形狀;
若所述目標(biāo)對(duì)象的形狀為矩形,則將所述目標(biāo)對(duì)象歸類至所述預(yù)設(shè)圖形集合中的矩形集合;
若所述目標(biāo)對(duì)象為包含線條的非封閉圖形,則將所述目標(biāo)對(duì)象歸類至所述預(yù)設(shè)圖形集合中的線條集合;
若所述目標(biāo)對(duì)象不為矩形且不為包含線條的非封閉圖形,則將所述目標(biāo)對(duì)象歸類至所述預(yù)設(shè)圖形集合中的其它圖形集合。
3.如權(quán)利要求2所述的識(shí)別PDF文件中文本框的方法,其特征在于,所述若所述目標(biāo)對(duì)象為包含線條的非封閉圖形,則將所述目標(biāo)對(duì)象歸類至所述預(yù)設(shè)圖形集合中的線條集合的步驟之后,還包括:
讀取所述線條集合并判斷所述線條集合中線條的方向,其中,所述線條集合中包含多個(gè)線條;
將沿X軸方向平行的線條兩兩組合為第一平行線以及將沿Y軸方向平行的線條兩兩組合為第二平行線以獲得多組所述第一平行線和多組所述第二平行線;
讀取所述第一平行線,并對(duì)于每一組所述第一平行線,判斷在所述多組第二平行線中是否存在與自身相交的第二平行線;
若在所述多組第二平行線中存在與自身相交的第二平行線,則確認(rèn)由相交的第一平行線和第二平行線所圍成的重合區(qū)域的面積;
若所述重合區(qū)域的面積大于預(yù)設(shè)面積,則將相交的第一平行線和第二平行線組合成矩形并歸類至所述矩形集合。
4.如權(quán)利要求3所述的識(shí)別PDF文件中文本框的方法,其特征在于,所述對(duì)所述預(yù)設(shè)圖形集合進(jìn)行處理以獲得目標(biāo)預(yù)設(shè)圖形集合的步驟,包括:
對(duì)所述矩形集合中的矩形排序以獲得中間矩形集合;
讀取所述中間矩形集合中的矩形,并對(duì)于所述中間矩形集中的每一個(gè)矩形,判斷在所述中間矩形集合中是否存在與其自身完全重合的矩形;
若在所述中間矩形集合中存在與自身完全重合的矩形,則將兩個(gè)重合的矩形合并為一個(gè)矩形;
若完成對(duì)所述中間矩形集合中所有矩形的判斷,則將所述中間矩形集合歸類至所述預(yù)設(shè)圖形集合中以獲得所述目標(biāo)預(yù)設(shè)圖形集合。
5.如權(quán)利要求1所述的識(shí)別PDF文件中文本框的方法,其特征在于,所述解析所述目標(biāo)預(yù)設(shè)圖形集合并判斷所述目標(biāo)預(yù)設(shè)圖形集合中的對(duì)象所對(duì)應(yīng)的圖形區(qū)域是否存在文本對(duì)象以識(shí)別出所述目標(biāo)PDF文件的文本框的步驟,包括:
將所述目標(biāo)預(yù)設(shè)圖形集合中的不同形狀的子集合合并到目標(biāo)預(yù)設(shè)圖形集合中并根據(jù)所述目標(biāo)預(yù)設(shè)圖形集合在所述目標(biāo)PDF文件中的位置進(jìn)行排序;
讀取所述目標(biāo)預(yù)設(shè)圖形集合中的目標(biāo)子圖形和所述文本對(duì)象中的子文本對(duì)象,判斷所述目標(biāo)預(yù)設(shè)圖形集合中的每一個(gè)目標(biāo)子圖形所對(duì)應(yīng)的圖形區(qū)域內(nèi)是否存在所述子文本對(duì)象;
若所述目標(biāo)子圖形所對(duì)應(yīng)的圖形區(qū)域內(nèi)存在所述子文本對(duì)象,則將所述目標(biāo)子圖形和所述子文本對(duì)象組合為文本框,并將所述文本框歸類至文本框集合。
6.如權(quán)利要求5所述的識(shí)別PDF文件中文本框的方法,其特征在于,所述若所述目標(biāo)子圖形所對(duì)應(yīng)的圖形區(qū)域內(nèi)存在所述子文本對(duì)象,則將所述目標(biāo)子圖形和所述子文本對(duì)象組合為文本框,并將所述文本框歸類至文本框集合的步驟之后,還包括:
根據(jù)所述目標(biāo)子圖形的屬性設(shè)置與所述目標(biāo)子圖形相對(duì)應(yīng)的文本框的屬性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳萬(wàn)興軟件有限公司,未經(jīng)深圳萬(wàn)興軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110184633.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種導(dǎo)航系統(tǒng)中的文本框顯示方法及導(dǎo)航系統(tǒng)
- 一種Linux系統(tǒng)下find命令的查找方法
- 一種文本框的顯示方法及裝置
- 文本框優(yōu)化方法及裝置
- 文本框展示方法、服務(wù)器、用戶終端及存儲(chǔ)介質(zhì)
- 一種文本處理方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種文本檢測(cè)方法和裝置
- 票據(jù)信息文本框獲取方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 圖像數(shù)據(jù)結(jié)構(gòu)化方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種圖像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





