[發(fā)明專利]一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010792746.6 | 申請(qǐng)日: | 2020-08-10 |
| 公開(公告)號(hào): | CN111881883A | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 李進(jìn)文;羅寶娟;嚴(yán)京旗;周審章;卞志強(qiáng);張成棟 | 申請(qǐng)(專利權(quán))人: | 晶璞(上海)人工智能科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/34;G06K9/32 |
| 代理公司: | 北京鵬帆慧博知識(shí)產(chǎn)權(quán)代理有限公司 11903 | 代理人: | 祝遼原 |
| 地址: | 200333 上海市普*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 特征 提取 形態(tài)學(xué) 處理 表格 文檔 方法 | ||
1.一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法,其具體包括如下步驟:
步驟110,獲取文檔圖像數(shù)據(jù);
步驟120,圖像預(yù)處理;
步驟130,加載網(wǎng)絡(luò)權(quán)重文件;
步驟140,對(duì)圖像進(jìn)行形態(tài)學(xué)處理,得到當(dāng)前圖像的表格分布;
步驟150,對(duì)圖像進(jìn)行語義分割,得到當(dāng)前圖像的表格分布;
步驟160,對(duì)步驟140和150中表格分布信息進(jìn)行修正;
步驟,170結(jié)束。
2.根據(jù)權(quán)利要求1所述的一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法,其特征在于:所述步驟110獲取文檔中圖像數(shù)據(jù)的方法包括如下四種之一:
方法之一是用數(shù)碼相機(jī)拍攝得到的圖像數(shù)據(jù);
方法之二是用手機(jī)拍攝得到的圖像數(shù)據(jù);
方法之三是用掃描儀得到的圖像數(shù)據(jù);
方法之四是打開一個(gè)預(yù)先存在的包含圖像數(shù)據(jù)的文件,讀取該文件中的數(shù)據(jù)并按照標(biāo)準(zhǔn)算法解壓后得到的圖像數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法,其特征在于:所述步驟120對(duì)圖像進(jìn)行預(yù)處理,包括如下步驟:
步驟210,旋轉(zhuǎn)矯正;
步驟220,亮度均衡化;
步驟230,尺寸歸一化(設(shè)置多種寬高比);
步驟240,二值化。
4.根據(jù)權(quán)利要求1所述的一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法,其特征在于:所述步驟130加載網(wǎng)絡(luò)權(quán)重文件,包括如下步驟:
步驟310,加載網(wǎng)絡(luò)配置;
步驟320,加載權(quán)重文件。
5.根據(jù)權(quán)利要求1所述的一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法,其特征在于:所述步驟140對(duì)圖像進(jìn)行形態(tài)學(xué)處理,得到當(dāng)前圖像的表格分布,包括如下步驟:
步驟410,對(duì)步驟120處理后的圖像水平方向進(jìn)行開運(yùn)算;
步驟420,對(duì)步驟120處理后的圖像垂直方向進(jìn)行開運(yùn)算;
步驟430,合并步驟410與步驟420結(jié)果。
6.根據(jù)權(quán)利要求1所述的一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法,其特征在于:所述步驟150對(duì)圖像進(jìn)行語義分割,得到當(dāng)前圖像的表格分布,包括如下步驟:
步驟510,對(duì)圖像送入網(wǎng)絡(luò)預(yù)測,解析獲得行列線段信息(水平與垂直兩個(gè)方向的線段);
步驟520,合并步驟510處理后的信息。
7.根據(jù)權(quán)利要求1所述的一種基于卷積特征提取與形態(tài)學(xué)處理的表格文檔提取方法,其特征在于:所述驟160對(duì)步驟140和步驟150中表格分布信息進(jìn)行修正,包括如下步驟:
步驟610,對(duì)齊步驟140和步驟150處理后的圖像;
步驟620,過濾步驟140處理后的傾斜線段,合并步驟610處理后的圖像,按步驟150處理后線段延伸調(diào)整,水平線段保持單像素高度,垂直線段保持單像素寬度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于晶璞(上海)人工智能科技有限公司,未經(jīng)晶璞(上海)人工智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010792746.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種基于深度學(xué)習(xí)的醫(yī)療票據(jù)旋轉(zhuǎn)矯正方法及系統(tǒng)
- 下一篇:基于深度學(xué)習(xí)的網(wǎng)衣檢測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





