[發明專利]一種基于OCR文字識別技術的PPT復現方法有效
| 申請號: | 202010040969.7 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111275048B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 吳振東;李銳;金長新 | 申請(專利權)人: | 山東浪潮科學研究院有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06F40/166 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 闞恭勇 |
| 地址: | 250000 山東省濟*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ocr 文字 識別 技術 ppt 復現 方法 | ||
本發明提供一種基于OCR文字識別技術的PPT復現方法,屬于圖片復現技術領域,本發明通過手機攝像頭或其他設備,將直接拍攝或上傳的PPT展示頁面的圖片,通過OCR文字識別技術和Python語言,將圖片中的PPT展示頁面復現成近似的.pptx文件。大大節約了用戶復現的時間,并提高所生成.pptx文件的質量。
技術領域
本發明涉及圖片復現技術,尤其涉及一種基于OCR文字識別技術的PPT復現方法。
背景技術
OCR(optical?character?recognition)文字識別是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,然后用字符識別方法將形狀翻譯成計算機文字的過程。
PPT是演示文稿軟件,用戶可以在投影儀或者計算機上進行演示,也可以將演示文稿打印出來,制作成膠片,以便應用到更廣泛的領域中。
在實際生活中,經常會在所觀看的視頻中、所參加的會議中看到一些別人所展示的PPT頁面,如果想要將其重現,需要截圖或拍照,然后花費一定的時間和精力重新按照圖片中的樣式進行復現。
發明內容
為了解決以上技術問題,本發明提出了一種基于OCR文字識別技術和Python語言來實現的PPT復現方法,為用戶提供了便利,節約用戶時間。
本發明的技術方案是:
一種基于OCR文字識別技術的PPT復現方法,通過手機攝像頭或其他設備,將直接拍攝或上傳的PPT展示頁面的圖片,通過OCR文字識別技術和Python語言的實現所構造的系統,將圖片中的PPT展示頁面復現成近似的.pptx文件。
總體分為兩個階段,第一階段是利用OCR文字識別技術,將原圖片PPT頁面上的標題、副標題、文本、樣式、字體、圖片等元素進行識別;第二階段是利用Python語言來復現PPT,利用python-pptx庫對第一階段所識別的內容進行對應的排列組合,生成一個近似于原圖中PPT頁面的.pptx文件。
進一步的,
OCR文字識別模型由大量帶有pptx頁面的圖片訓練生成,不僅可以提取文字內容,還可以提取圖片中各個元素的基本信息,例如:字號、字體、字體顏色、背景色、藝術字類型、所在PPT頁面的位置,圖像所占PPT頁面大小比例,圖表類型等。該模型的輸入是JPG或PNG格式的圖片,輸出為Json文件。
Python程序主要利用了Python-pptx庫來實現。通過Json文件中各個模塊的位置信息和具體內容、樣式,通過對應指令來生成對應PPT頁面,輸出的.pptx文件頁面與在OCR文字識別模型中輸入的圖片中含有的PPT頁面近似。Python程序的輸入是Json文件,輸出是.pptx文件。
再進一步的,
第一部分,OCR文字識別包括如下步驟:
步驟1,圖像輸入:讀取用戶所上傳的圖片。
步驟2,去除冗余:程序首先識別出圖片中的PPT頁面,將其余部分視為冗余,直接去除掉,將圖片中的PPT頁面視為接下來要處理的圖片,并對該圖片進行傾斜矯正。
步驟3,去除噪聲:去除圖片中的干擾因素,非正常像素點;
步驟4,版面分析:分析圖片中的每一個元素,例如:標題、文本、圖片、藝術字、圖表、形狀、公式等;
步驟5,字符(圖片)切割:將版面分析出每個的元素切割成單個模塊;
步驟6,字符識別和標注標簽:將每個模塊的信息,輸入至已訓練好的OCR模型中,識別出該模塊對應的文字內容、字體大小、字體樣式、所在位置點坐標等信息進行標注;若該模塊是圖片,則只對該模塊的位置信息進行記錄;若該模塊是圖表,則需要在ppt元素庫中找到同樣的圖表樣式;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東浪潮科學研究院有限公司,未經山東浪潮科學研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010040969.7/2.html,轉載請聲明來源鉆瓜專利網。





