[發(fā)明專利]電子表格數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110685527.2 | 申請日: | 2021-06-21 |
| 公開(公告)號: | CN113553326A | 公開(公告)日: | 2021-10-26 |
| 發(fā)明(設(shè)計)人: | 郭正昇;羅奕航 | 申請(專利權(quán))人: | 深圳市金蝶天燕云計算股份有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/28 |
| 代理公司: | 廣州華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 陳小娜 |
| 地址: | 518051 廣東省深圳市南山區(qū)粵海街道高*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 電子表格 數(shù)據(jù)處理 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種電子表格數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)。所述方法包括:獲取待處理的目標電子表格;獲取目標電子表格中各個單元格的單元格特征,基于單元格特征對目標電子表格中單元格進行區(qū)域劃分,得到多個目標單元格區(qū)域;獲取候選表格組合策略集合中各個候選表格組合策略對應的表格評價分數(shù),從候選表格組合策略集合中獲取表格評價分數(shù)滿足表格條件的候選表格組合策略,作為目標表格策略;將目標表格策略所對應的單元格區(qū)域關(guān)聯(lián)關(guān)系對目標電子表格所對應的單元格進行分類,得到各個類別所對應的目標子表格,對目標子表格進行結(jié)構(gòu)化信息提取,得到目標子表格對應的結(jié)構(gòu)化信息。采用本方法能夠提高電子表格數(shù)據(jù)處理的準確性。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種電子表格數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著數(shù)據(jù)處理技術(shù)的發(fā)展,電子表格數(shù)據(jù)處理是數(shù)據(jù)處理技術(shù)中的重要分支,也得到了快速的發(fā)展。電子表格不但能夠用于在電子設(shè)備中輸入輸出、顯示數(shù)據(jù),也能夠用于幫助用戶制作各種復雜的電子表格文檔,進行數(shù)據(jù)計算,并能對輸入的數(shù)據(jù)中復雜統(tǒng)計算后顯示。因其應用的便利性和高效性,得到了廣泛的應用,如何準確地處理電子表格數(shù)據(jù)顯得尤為重要。
然而,目前的電子表格往往存在含有多級表頭、一張表格內(nèi)含多個子表格,結(jié)構(gòu)靈活多變的情況,傳統(tǒng)的電子表格數(shù)據(jù)處理方法對于結(jié)構(gòu)復雜靈活多變的表格,存在處理效率低的問題。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠提高電子表格數(shù)據(jù)處理效率的電子表格數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)。
一種電子表格數(shù)據(jù)處理方法,所述方法包括:獲取待處理的目標電子表格;獲取所述目標電子表格中各個單元格的單元格特征,基于所述單元格特征對所述目標電子表格中單元格進行區(qū)域劃分,得到多個目標單元格區(qū)域;獲取候選表格組合策略集合中各個候選表格組合策略對應的表格評價分數(shù),從所述候選表格組合策略集合中獲取表格評價分數(shù)滿足表格條件的候選表格組合策略,作為目標表格策略;所述候選表格組合策略集合包括多個候選表格組合策略,所述候選表格組合策略為將具有關(guān)聯(lián)關(guān)系的單元格區(qū)域組合成所述目標電子表格對應的子表格的策略;將所述目標表格策略所對應的單元格區(qū)域關(guān)聯(lián)關(guān)系對所述目標電子表格所對應的單元格進行分類,得到各個類別所對應的目標子表格。
在其中一個實施例中,所述獲取所述目標電子表格中各個單元格的單元格特征,基于所述單元格特征對所述目標電子表格中單元格進行區(qū)域劃分,得到多個目標單元格區(qū)域包括:獲取所述目標電子表格中各個單元格的單元格特征,基于所述單元格特征,從候選單元格類別集合中確定所述單元格對應的目標單元格類別;將目標單元格類別相同的連續(xù)單元格進行合并,得到多個目標單元格區(qū)域。
在其中一個實施例中,所述獲取所述目標電子表格中各個單元格的單元格特征,基于所述單元格特征,從候選單元格類別集合中確定所述單元格對應的目標單元格類別包括:確定待確定特征的當前單元格以及所述當前單元格對應的相鄰單元格;將所述當前單元格的單元格數(shù)據(jù)屬性信息與所述相鄰單元格的單元格數(shù)據(jù)屬性信息進行比較,得到比較結(jié)果;基于所述比較結(jié)果得到所述當前單元格對應的單元格特征。
在其中一個實施例中,所述獲取所述目標電子表格中各個單元格的單元格特征,基于所述單元格特征,從候選單元格類別集合中確定所述單元格對應的目標單元格類別包括:獲取所述目標電子表格中各個單元格的單元格特征,將所述單元格特征輸入到單元格類別分類模型中,所述單元格類別分類模型輸出所述候選單元格類別集合中各個候選單元格類別對應的類別可能度;所述候選單元格類別集合包括表頭類別、數(shù)據(jù)類別、數(shù)據(jù)組標識類別或者附屬類別中的至少一個;從所述候選單元格類別集合中篩選得到類別可能度大于類別可能度閾值的候選單元格類別,作為所述單元格對應的目標單元格類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市金蝶天燕云計算股份有限公司,未經(jīng)深圳市金蝶天燕云計算股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110685527.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





