[發明專利]一種ppt文檔的對比方法有效
| 申請號: | 202011586576.2 | 申請日: | 2020-12-28 |
| 公開(公告)號: | CN112529111B | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 孫永毫;徐強 | 申請(專利權)人: | 廣東國粒教育技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/583;G06F40/289;G06V10/74 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 盧澤明 |
| 地址: | 519000 廣東省珠海市高新區唐家灣鎮金唐*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 ppt 文檔 對比 方法 | ||
1.一種ppt文檔的對比方法,其特征在于,包括:
S1、獲取新舊PPT文件;
S2、對所述S1中獲取的新舊PPT文件進行對比處理,獲取新舊ppt文本文字或圖片內容的相似度,生成對比結果文件;所述S2包括:
文件轉換、獲取文件的MD5值;獲取新舊ppt文件中幻燈片存在差異的頁碼;比較文字;比較圖像;計算文本文字的相似度S;形成對比結果文件;
所述比較文字具體為:
通過e-iceblue軟件工具包,加載ppt文件,同時根據不相同的頁碼集合獲取頁碼對應的ppt幻燈片;
通過e-iceblue軟件包中的Shape方式獲取不相同頁碼的幻燈片下的段落文字,并去除空行;
通過diff_main算法,找到兩個文本之間的差異,并將差異值記錄存放在集合當中;
在差異頁的頁碼當中創建幻燈片,并添加說明差異的內容;
所述比較圖像具體為:
通過e-iceblue軟件工具包,加載ppt文件,同時根據不相同的頁碼集合獲取頁碼對應的ppt幻燈片;
通過e-iceblue軟件包中的SlidePicture和BufferedImage對象,獲取不相同頁碼中的幻燈片下的圖像;
通過均值哈希算法,實現比較圖像指紋的方式,對比兩張圖片是否相同,記錄相同圖片的數目;
通過數目計算ppt文件圖片的引用率,引用率=相同圖片的數目/新ppt的圖片總數;
所述獲取新舊ppt文件中幻燈片存在差異的頁碼具體為:
利用POI和java中的AWT軟件包,通過創建BufferedImage對象,將幻燈片轉換成圖片,圖象的尺寸為原來PPT的每頁的尺寸;
通過MD5算法,獲取每張圖片MD5值,通過MD5值來判斷兩張圖片是否相同;
將圖片完全不同的頁碼記錄存儲到頁碼集合當中。
2.根據權利要求1所述的ppt文檔的對比方法,其特征在于,所述文件轉換具體為:集成libreoffice工具使文件轉換成.pptx文件格式。
3.根據權利要求2所述的ppt文檔的對比方法,其特征在于,所述獲取文件的MD5值具體為:通過‘MD5’算法獲取文件的‘MD5’值,通過‘MD5’值是否相等來判斷兩個文件是否相同。
4.根據權利要求1所述的ppt文檔的對比方法,其特征在于,所述計算文本文字的相似度S具體為:
通過Segment方法,對段落文本進行分詞處理,并確定所述新PPT文件的特征詞;
文本相似度計算判定,通過余弦相似度計算,即計算兩個向量的夾角余弦值來評估他們的相似度:
已知向量a=(x1,y1),向量b=(x2,y2),
其中a·b=x1x2+y1y2,
5.根據權利要求4所述的ppt文檔的對比方法,其特征在于,所述形成對比結果文件具體為:
在ppt末尾生成一張幻燈片,用于標注插入文字總相似度和圖像比較的結果;
通過poi方式去除結果文件中產生的水印標記。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東國粒教育技術有限公司,未經廣東國粒教育技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011586576.2/1.html,轉載請聲明來源鉆瓜專利網。





