[發明專利]一種基于OCR文字識別技術的PPT復現方法有效

申請號：	202010040969.7	申請日：	2020-01-15
公開（公告）號：	CN111275048B	公開（公告）日：	2023-04-18
發明（設計）人：	吳振東;李銳;金長新	申請（專利權）人：	山東浪潮科學研究院有限公司
主分類號：	G06V30/148	分類號：	G06V30/148;G06F40/166
代理公司：	濟南信達專利事務所有限公司 37100	代理人：	闞恭勇
地址：	250000 山東省濟***	國省代碼：	山東;37
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于 ocr 文字識別技術 ppt 復現方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供一種基于OCR文字識別技術的PPT復現方法，屬于圖片復現技術領域，本發明通過手機攝像頭或其他設備，將直接拍攝或上傳的PPT展示頁面的圖片，通過OCR文字識別技術和Python語言，將圖片中的PPT展示頁面復現成近似的.pptx文件。大大節約了用戶復現的時間，并提高所生成.pptx文件的質量。

技術領域

本發明涉及圖片復現技術，尤其涉及一種基于OCR文字識別技術的PPT復現方法。

背景技術

OCR(optical?character?recognition)文字識別是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符，然后用字符識別方法將形狀翻譯成計算機文字的過程。

PPT是演示文稿軟件，用戶可以在投影儀或者計算機上進行演示，也可以將演示文稿打印出來，制作成膠片，以便應用到更廣泛的領域中。

在實際生活中，經常會在所觀看的視頻中、所參加的會議中看到一些別人所展示的PPT頁面，如果想要將其重現，需要截圖或拍照，然后花費一定的時間和精力重新按照圖片中的樣式進行復現。

發明內容

為了解決以上技術問題，本發明提出了一種基于OCR文字識別技術和Python語言來實現的PPT復現方法，為用戶提供了便利，節約用戶時間。

本發明的技術方案是：

一種基于OCR文字識別技術的PPT復現方法，通過手機攝像頭或其他設備，將直接拍攝或上傳的PPT展示頁面的圖片，通過OCR文字識別技術和Python語言的實現所構造的系統，將圖片中的PPT展示頁面復現成近似的.pptx文件。

總體分為兩個階段，第一階段是利用OCR文字識別技術，將原圖片PPT頁面上的標題、副標題、文本、樣式、字體、圖片等元素進行識別；第二階段是利用Python語言來復現PPT，利用python-pptx庫對第一階段所識別的內容進行對應的排列組合，生成一個近似于原圖中PPT頁面的.pptx文件。

進一步的，

OCR文字識別模型由大量帶有pptx頁面的圖片訓練生成，不僅可以提取文字內容，還可以提取圖片中各個元素的基本信息，例如：字號、字體、字體顏色、背景色、藝術字類型、所在PPT頁面的位置，圖像所占PPT頁面大小比例，圖表類型等。該模型的輸入是JPG或PNG格式的圖片，輸出為Json文件。

Python程序主要利用了Python-pptx庫來實現。通過Json文件中各個模塊的位置信息和具體內容、樣式，通過對應指令來生成對應PPT頁面，輸出的.pptx文件頁面與在OCR文字識別模型中輸入的圖片中含有的PPT頁面近似。Python程序的輸入是Json文件，輸出是.pptx文件。

再進一步的，

第一部分，OCR文字識別包括如下步驟：

步驟1，圖像輸入：讀取用戶所上傳的圖片。

步驟2，去除冗余：程序首先識別出圖片中的PPT頁面，將其余部分視為冗余，直接去除掉，將圖片中的PPT頁面視為接下來要處理的圖片，并對該圖片進行傾斜矯正。

步驟3，去除噪聲：去除圖片中的干擾因素，非正常像素點；

步驟4，版面分析：分析圖片中的每一個元素，例如：標題、文本、圖片、藝術字、圖表、形狀、公式等；

步驟5，字符(圖片)切割：將版面分析出每個的元素切割成單個模塊；

步驟6，字符識別和標注標簽：將每個模塊的信息，輸入至已訓練好的OCR模型中，識別出該模塊對應的文字內容、字體大小、字體樣式、所在位置點坐標等信息進行標注；若該模塊是圖片，則只對該模塊的位置信息進行記錄；若該模塊是圖表，則需要在ppt元素庫中找到同樣的圖表樣式；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于山東浪潮科學研究院有限公司，未經山東浪潮科學研究院有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010040969.7/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：探測參考信號傳輸方法及相關產品
下一篇：測試方法、裝置、計算機設備及計算機可讀存儲介質

同類專利

專利分類

G 物理

G06 計算；推算；計數

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】