[發(fā)明專利]一種打印內(nèi)容格式化提取方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910526081.1 | 申請(qǐng)日: | 2019-06-18 |
| 公開(公告)號(hào): | CN110210455B | 公開(公告)日: | 2022-03-01 |
| 發(fā)明(設(shè)計(jì))人: | 夏莫戛;張文靜;甘玉濤;樊利紅 | 申請(qǐng)(專利權(quán))人: | 石家莊捷弘科技有限公司 |
| 主分類號(hào): | G06V30/412 | 分類號(hào): | G06V30/412 |
| 代理公司: | 北京睿智保誠專利代理事務(wù)所(普通合伙) 11732 | 代理人: | 周新楣 |
| 地址: | 050000 河北省石家莊市*** | 國省代碼: | 河北;13 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 打印 內(nèi)容 格式化 提取 方法 | ||
1.一種打印內(nèi)容格式化提取方法,其特征在于,包括以下步驟:
S1.將打印文檔的打印內(nèi)容截取轉(zhuǎn)換為打印元素,生成打印元素集;
S2.根據(jù)采樣的打印元素集設(shè)計(jì)提取元素,生成提取模版;
S3.輸入打印元素集和提取模版,利用提取引擎進(jìn)行運(yùn)算,生成格式化提取結(jié)果;
步驟S2中,所述提取模版包括提取模版名稱、多個(gè)提取元素和一組處理腳本;所述提取元素包括容器提取元素;
所述容器提取元素包括表單提取元素;所述表單提取元素中設(shè)置有多個(gè)基礎(chǔ)的文本提取元素,并且所述文本提取元素的坐標(biāo)相對(duì)于它的父容器表單提取元素;
步驟S1的具體實(shí)現(xiàn)方法為:
S1-1.使用格式化虛擬打印機(jī),將打印文檔轉(zhuǎn)換為EMF文件;
S1-2.解析EMF文件,提取坐標(biāo)和內(nèi)容,生成打印元素文檔;
S1-3.解析每個(gè)打印頁,轉(zhuǎn)換成頁面圖片;
步驟S2的具體實(shí)現(xiàn)方法為:
S2-1.使用打印格式化提取模版設(shè)計(jì)客戶端進(jìn)行處理;
S2-2.導(dǎo)入打印元素集樣本數(shù)據(jù);
S2-3.在可視化界面的輔助下,用鼠標(biāo)拖拽設(shè)置提取元素,并設(shè)置相關(guān)提取參數(shù);
S2-4.測(cè)試提取并檢查提取結(jié)果,如果不滿意則重復(fù)步驟S2-2至S2-4,直到多個(gè)同一格式的打印樣本提取結(jié)果都滿意為止;
S2-5.保存打印提取模版,并上傳到打印格式化提取服務(wù)器,綁定打印類型;
步驟S3的具體實(shí)現(xiàn)方法為:
S3-1.將生成的打印元素文檔和頁面圖片上傳到打印格式化提取服務(wù)器;
S3-2.打印格式化提取服務(wù)器根據(jù)上傳的相關(guān)打印類型調(diào)取已經(jīng)設(shè)計(jì)好的打印提取模版;
S3-3.提取引擎根據(jù)已知輸入信息運(yùn)算,自動(dòng)進(jìn)行格式化提取,并將提取結(jié)果保存到數(shù)據(jù)庫中;
步驟S3-3中,提取引擎運(yùn)行步驟為:
S3-3-1.遍歷所有頁面,并將當(dāng)前頁面的打印元素和頁面圖片封裝到一起,作為下面的輸入?yún)?shù);
S3-3-2.在當(dāng)前頁面遍歷所有的提取元素,進(jìn)行提取運(yùn)算;
提取元素是容器提取元素,則遍歷其所有子提取元素,進(jìn)行提取,并將子提取元素的提取結(jié)果組成隊(duì)列,配合此容器提取元素的關(guān)鍵詞組成鍵值對(duì)返回;
S3-3-3.將所有返回的鍵值對(duì)轉(zhuǎn)換為json格式的格式化提取結(jié)果;
S3-3-4.將格式化提取結(jié)果以參數(shù)的形式傳遞給處理腳本,由處理腳本進(jìn)行二次處理,或原封不動(dòng)的直接返回。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于石家莊捷弘科技有限公司,未經(jīng)石家莊捷弘科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910526081.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





