[發(fā)明專利]網(wǎng)頁表格數(shù)據(jù)采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201911037696.4 | 申請(qǐng)日: | 2019-10-29 |
| 公開(公告)號(hào): | CN110825944B | 公開(公告)日: | 2023-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 冼東亮;李柏;李如先 | 申請(qǐng)(專利權(quán))人: | 深圳前海環(huán)融聯(lián)易信息科技服務(wù)有限公司 |
| 主分類號(hào): | G06F16/951 | 分類號(hào): | G06F16/951 |
| 代理公司: | 深圳市精英專利事務(wù)所 44242 | 代理人: | 林燕云 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)頁 表格 數(shù)據(jù) 采集 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開了網(wǎng)頁表格數(shù)據(jù)采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),涉及數(shù)據(jù)采集技術(shù)領(lǐng)域。該方法包括:定位到網(wǎng)頁中的目標(biāo)表格;動(dòng)態(tài)且有序的讀取目標(biāo)表格的標(biāo)題字段,將讀取到的標(biāo)題字段按順序排列構(gòu)成標(biāo)題字段集;動(dòng)態(tài)且有序的循環(huán)讀取目標(biāo)表格每一行的明細(xì)數(shù)據(jù),并按照列的順序和標(biāo)題字段集中的標(biāo)題字段進(jìn)行配對(duì),形成每一行的記錄;將每一行的記錄進(jìn)行組合生成記錄集,輸出所述記錄集。該方法操作簡(jiǎn)單,不易出錯(cuò),且可動(dòng)態(tài)適應(yīng)表格字段變化。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)采集技術(shù)領(lǐng)域,尤其涉及網(wǎng)頁表格數(shù)據(jù)采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
現(xiàn)有技術(shù)中,一般對(duì)于網(wǎng)頁表格數(shù)據(jù)的采集,都是采用循環(huán)處理方式,先讀取每一行數(shù)據(jù),然后對(duì)每一列數(shù)據(jù)進(jìn)行采集,需要嚴(yán)格按照列的順序匹配到對(duì)應(yīng)的字段,上述采集方式操作繁瑣容易出錯(cuò),且無法動(dòng)態(tài)適應(yīng)表格字段的變化,字段變化了就需要同步修改程序。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了網(wǎng)頁表格數(shù)據(jù)采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),旨在解決現(xiàn)有網(wǎng)頁表格數(shù)據(jù)采集方法操作繁瑣、容易出錯(cuò)、無法動(dòng)態(tài)適應(yīng)表格字段變化等問題。
本發(fā)明實(shí)施例提供一種基于標(biāo)題行的網(wǎng)頁表格數(shù)據(jù)采集方法,其包括:
定位到網(wǎng)頁中的目標(biāo)表格;
動(dòng)態(tài)且有序的讀取目標(biāo)表格的標(biāo)題字段,將讀取到的標(biāo)題字段按順序排列構(gòu)成標(biāo)題字段集;
動(dòng)態(tài)且有序的循環(huán)讀取目標(biāo)表格每一行的明細(xì)數(shù)據(jù),并按照列的順序和標(biāo)題字段集中的標(biāo)題字段進(jìn)行配對(duì),形成每一行的記錄;
將每一行的記錄進(jìn)行組合生成記錄集,輸出所述記錄集。
優(yōu)選的,所述定位到網(wǎng)頁中的目標(biāo)表格,包括:
采用預(yù)設(shè)的定位表達(dá)式對(duì)網(wǎng)頁中的目標(biāo)表格進(jìn)行定位。
優(yōu)選的,采用預(yù)設(shè)的定位表達(dá)式對(duì)網(wǎng)頁中的目標(biāo)表格進(jìn)行定位,包括:
使用元素id、表類、正文、相對(duì)路徑或絕對(duì)路徑中的一種或幾種條件進(jìn)行定位。
優(yōu)選的,還包括:
當(dāng)目標(biāo)表格的標(biāo)題字段發(fā)生變化時(shí),重新動(dòng)態(tài)且有序的讀取目標(biāo)表格的標(biāo)題字段,將讀取到的標(biāo)題字段按順序排列構(gòu)成新的標(biāo)題字段集;
重新動(dòng)態(tài)且有序的循環(huán)讀取目標(biāo)表格每一行的明細(xì)數(shù)據(jù),并按照列的順序和新的標(biāo)題字段集中的標(biāo)題字段進(jìn)行配對(duì),形成每一行的記錄;
將每一行的記錄進(jìn)行組合生成新的記錄集,輸出所述記錄集。
優(yōu)選的,所述動(dòng)態(tài)且有序的循環(huán)讀取目標(biāo)表格每一行的明細(xì)數(shù)據(jù),并按照列的順序和標(biāo)題字段集中的標(biāo)題字段進(jìn)行配對(duì),形成每一行的記錄,包括:
逐列讀取目標(biāo)表格中每一行的明細(xì)數(shù)據(jù);
每讀取到一列的明細(xì)數(shù)據(jù),將該列的明細(xì)數(shù)據(jù)與對(duì)應(yīng)列的標(biāo)題字段進(jìn)行配對(duì);
當(dāng)配對(duì)完一行中所有列的明細(xì)數(shù)據(jù),則將對(duì)應(yīng)行的配對(duì)結(jié)果進(jìn)行組合,形成該行的記錄。
優(yōu)選的,所述每讀取到一列的明細(xì)數(shù)據(jù),將該列的明細(xì)數(shù)據(jù)與對(duì)應(yīng)列的標(biāo)題字段進(jìn)行配對(duì),包括:
若該列的明細(xì)數(shù)據(jù)為空,則將對(duì)應(yīng)列的標(biāo)題字段配對(duì)的明細(xì)數(shù)據(jù)設(shè)置為空。
優(yōu)選的,所述表格為行列整齊的標(biāo)準(zhǔn)表格。
本發(fā)明實(shí)施例還提供一種基于標(biāo)題行的網(wǎng)頁表格數(shù)據(jù)采集裝置,其包括:
定位單元,用于定位到網(wǎng)頁中的目標(biāo)表格;
標(biāo)題字段讀取單元,用于動(dòng)態(tài)且有序的讀取目標(biāo)表格的標(biāo)題字段,將讀取到的標(biāo)題字段按順序排列構(gòu)成標(biāo)題字段集;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海環(huán)融聯(lián)易信息科技服務(wù)有限公司,未經(jīng)深圳前海環(huán)融聯(lián)易信息科技服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911037696.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種高徑厚比雙疊片的制備方法
- 下一篇:一種效率高且方便操控的鐵罐覆膜裝置
- 版式表格的結(jié)構(gòu)處理方法和系統(tǒng)
- 多欄多列表格的展示方法
- 一種在移動(dòng)端展示長(zhǎng)表格的交互方法及系統(tǒng)裝置
- 一種在移動(dòng)端縱向展示長(zhǎng)表格的交互方法及系統(tǒng)裝置
- 一種在移動(dòng)端橫向展示長(zhǎng)表格的交互方法及系統(tǒng)裝置
- 表格圖像解析方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種針對(duì)PDF文檔表格提取優(yōu)化方法及系統(tǒng)
- 一種自動(dòng)生成表格數(shù)據(jù)的方法及裝置
- 一種批量合并表格內(nèi)容的方法、系統(tǒng)、裝置和存儲(chǔ)介質(zhì)
- 表格渲染顯示方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





