[發(fā)明專利]一種文檔對比方法及裝置有效
| 申請?zhí)枺?/td> | 201611265983.7 | 申請日: | 2016-12-31 |
| 公開(公告)號: | CN108268884B | 公開(公告)日: | 2023-06-16 |
| 發(fā)明(設(shè)計)人: | 周好沖;王學(xué)武;李平立 | 申請(專利權(quán))人: | 方正國際軟件(北京)有限公司;方正國際軟件有限公司 |
| 主分類號: | G06F18/22 | 分類號: | G06F18/22;G06F16/30 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文檔 對比 方法 裝置 | ||
本發(fā)明公開一種文檔對比方法及裝置,該方法包括:將修訂文檔和原文檔進(jìn)行內(nèi)容對比,確定所述修訂文檔和所述原文檔的最長公共字符串;根據(jù)所述最長公共字符串分別對所述修訂文檔和所述原文檔進(jìn)行段落定位,確定在所述修訂文檔和原文檔中存在對應(yīng)關(guān)系的段落;針對所述修訂文檔中任意一個非對應(yīng)段落,將所述非對應(yīng)段落與所述原文檔進(jìn)行內(nèi)容對比,根據(jù)對比結(jié)果確定所述非對應(yīng)段落的修改類型用以準(zhǔn)確識別不同文檔之間的差異。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種文檔對比方法及裝置。
背景技術(shù)
現(xiàn)有技術(shù)中,對于簡短內(nèi)容地比較,插入文字和刪除文字這樣的差異可以準(zhǔn)確地標(biāo)出,段落移動的情況也基本上沒有問題;但是對于長篇或復(fù)雜的內(nèi)容比較,段落向上(向下)移動的類型可能就不能準(zhǔn)確判斷,段落的概念也可能被破壞,從而導(dǎo)致插入文字和刪除文字類型的判斷也不夠準(zhǔn)確,另外對于段落拆分和組合、段落部分拷貝、大范圍的剪切粘貼的類型尚無分析。
綜上,現(xiàn)有的文檔對比方法尚存不足,對比結(jié)果也不夠準(zhǔn)確。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種文檔對比方法及裝置,用以解決現(xiàn)有技術(shù)中存在文檔對比結(jié)果不夠準(zhǔn)確的問題。
本發(fā)明方法包括一種文檔對比方法,該方法包括:將修訂文檔和原文檔進(jìn)行內(nèi)容對比,確定所述修訂文檔和所述原文檔的最長公共字符串;
根據(jù)所述最長公共字符串分別對所述修訂文檔和所述原文檔進(jìn)行段落定位,確定在所述修訂文檔和原文檔中存在對應(yīng)關(guān)系的段落;
針對所述修訂文檔中任意一個非對應(yīng)段落,將所述非對應(yīng)段落與所述原文檔進(jìn)行內(nèi)容對比,根據(jù)對比結(jié)果確定所述非對應(yīng)段落的修改類型。
基于同樣的發(fā)明構(gòu)思,本發(fā)明實施例進(jìn)一步地提供一種文檔對比裝置,該裝置包括:
確定單元,用于將修訂文檔和原文檔進(jìn)行內(nèi)容對比,確定所述修訂文檔和所述原文檔的最長公共字符串;
段落定位單元,用于根據(jù)所述最長公共字符串分別對所述修訂文檔和所述原文檔進(jìn)行段落定位,確定在所述修訂文檔和原文檔中存在對應(yīng)關(guān)系的段落;
對比單元,用于針對所述修訂文檔中任意一個非對應(yīng)段落,將所述非對應(yīng)段落與所述原文檔進(jìn)行內(nèi)容對比,根據(jù)對比結(jié)果確定所述非對應(yīng)段落的修改類型。
本發(fā)明實施例提出的文檔對比方法首先做的是對整篇文檔內(nèi)容對比,然后根據(jù)最長公共字符串對原文檔和修訂文檔的段落進(jìn)行定位,確定修訂文檔中各段落和原文檔的各段落的位置存在對應(yīng)關(guān)系的段落,當(dāng)段落定位完成之后,繼續(xù)用段落組與原文檔進(jìn)行對比,確定匹配段落的移動(或剪切粘貼),兩篇文檔對應(yīng)段落中的差異(插入或刪除),段落拆分、組合,以及段落部分拷貝等,最后根據(jù)以上所提的不同類型,使用不同顏色進(jìn)行標(biāo)注展示比較結(jié)果,可見,本發(fā)明實施例提供的方法可以對長篇或復(fù)雜的內(nèi)容進(jìn)行比較,段落向上(向下)移動的類型也可以得到準(zhǔn)確地判斷。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例提供的一種文檔對比方法流程示意圖;
圖2為本發(fā)明實施例提供的一種原文檔和修訂文檔的段落對應(yīng)的示意圖;
圖3為本發(fā)明實施例提供的一種原文檔和修訂文檔的段落拆分組合的示意圖;
圖4為本發(fā)明實施例提供的一種原文檔和修訂文檔內(nèi)容對比示意圖一;
圖5為本發(fā)明實施例提供的一種文字插入刪除的文檔對比結(jié)果示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于方正國際軟件(北京)有限公司;方正國際軟件有限公司,未經(jīng)方正國際軟件(北京)有限公司;方正國際軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611265983.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





