日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種電子檔版式文件閱讀順序分析的方法在審

專利信息
申請號: 201410488102.2 申請日: 2014-09-22
公開(公告)號: CN104268127A 公開(公告)日: 2015-01-07
發明(設計)人: 張斌;張曉博;張寶亮 申請(專利權)人: 同方知網(北京)技術有限公司
主分類號: G06F17/21 分類號: G06F17/21;G06F17/30
代理公司: 北京天奇智新知識產權代理有限公司 11340 代理人: 劉黎明
地址: 100084 北京市海淀區清華園清華*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 電子 版式 文件 閱讀 順序 分析 方法
【說明書】:

技術領域

本發明涉及信息技術領域,尤其涉及一種電子檔版式文件閱讀順序分析的方法。

背景技術

PDF(Portable?Document?Format,便攜式文件格式)是Adobe公司發展出來的一種文件格式,它的優點在于跨平臺,能保留文件原有的格式(Layout),高質量和保真的進行原始文件和格式的呈現,但是PDF是非結構化的數據存儲格式,對于進行PDF文件中文本的信息檢索或PDF格式轉換為其它流式格式文件,提取出來的文本信息并非是按文件的閱讀順序輸出,可能存在后序的內容提前出現在輸出的文本中。

專利申請號為2010105591353的專利申請文件公開了識別版面閱讀順序的方法,包括:讀取待識別版面,并分析版面以得到版面布局信息和字符文本對象和圖像對象的對象屬性;根據版面布局信息和對象屬性,將字符文本對象合并為文本段落并將圖形對象識別為圖像段落;采用全局遞歸切割與局部先后順序判定相結合的方式來確定文本段落和圖像段落的閱讀順序,其中,通過投影來進行全局切割,對于全局切割之后仍包含多個段落的分組,采用局部判定方法來判斷段落的先后順序。此方法使用的遞歸劃分法在縱向有一定缺陷,容易出現模棱兩可的塊劃分。

專利申請號為2004100914343的專利申請文件公開了一種基于內容的對報紙版面進行文字閱讀順序恢復的方法,該方法是針對處理復雜報紙版面存在丟失閱讀順序且內容不具有篇章獨立性的缺陷的問題來以圖論理論進行數學建模,把文字塊的鄰接關系表示為有向圖,并把有向圖拆分轉化為加權二分圖,采用自然語言處理技術計算二分圖邊權值,通過最優匹配得到多個連續序列,每個序列再根據文字塊樣式信息分割成多個子序列,子序列對應內容的連接即是獨立篇章的具有閱讀順序的文字流。此方法使用了復雜的圖論算法和自然語言處理技術。

為了解決上述問題本申請文件提供了一種針對版式文件進行聚類分析,并按照拓撲排序的方法進行閱讀順序分析和識別的方法。

發明內容

為解決上述技術問題,本發明的目的是提供一種針對版式文件進行聚類分析,并按照拓撲順序的方法進行閱讀順序分析和識別的方法,該方法通過識別物理塊的拓撲順序,即可實現快速高效準確的判定邏輯順序。方法簡單高效、準確率高。

本發明的目的通過以下的技術方案來實現:

提取PDF文件中原始信息;

識別頁眉、頁腳,并對相鄰文本內容進行合并,得到行內容;

對文本行內容進行塊合并,得到文本塊內容;

對相鄰圖片進行合并,得到圖片塊內容;

對路徑信息進行分析,得到水平方向的分割線;

將文本快內容和圖片塊內容進行X方向投影,得到水平分隔塊內容;

以文本塊內容、圖片塊內容、水平分隔線、表格及水平分隔塊內容物理信息為元素,進行拓撲排序,得到PDF文件的閱讀順序;

通過閱讀順序基礎對文本塊內容進行分段識別;

輸出XML格式文本。

與現有技術相比,本發明的一個或多個實施例可以具有如下優點:

該方法針對版式文件進行聚類分析,按照拓撲排序的方法進行閱讀順序分析和識別的方法,同時對輸出內容進行XML格式化話輸出,方便進行PDF格式文件的檢索和格式轉換。

附圖說明

附圖用來提供對本發明的進一步理解,并且構成說明書的一部分,與本發明的實施例共同用于解釋本發明,并不構成對本發明的限制。在附圖中:

圖1是電子檔版式文件閱讀順序分析的方法流程圖;

圖2是PDF原始文件結構圖;

圖3是原始文本信息結構圖;

圖4是文本行合并、頁眉頁腳識別和分隔行識別效果圖;

圖5是文本塊效果結構圖;

圖6是閱讀順序分析效果圖;

圖7是邏輯段落效果結構圖;

圖8是XML輸出圖;

圖9是包含圖片和表格的閱讀順序分析效果圖;

圖10是三欄的PDF文件閱讀順序效果圖。

具體實施方式

為使本發明的目的、技術方案和優點更加清楚,下面將結合實施例及附圖對本發明作進一步詳細的描述。

如圖1所示,是電子檔版式文件閱讀順序分析的方法流程,包括以下步驟:

提取PDF文件中原始信息;

識別頁眉、頁腳,并對相鄰文本內容進行合并,得到行內容;

對文本行內容進行塊合并,得到文本塊內容;

對相鄰圖片進行合并,得到圖片塊內容;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同方知網(北京)技術有限公司,未經同方知網(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410488102.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91精品系列| 午夜影院色| 日韩精品久久久久久久酒店| 精品99在线视频| av午夜剧场| 国产乱码精品一区二区三区中文| 久久99精品国产麻豆婷婷| 国产999精品视频| 欧美一区二区三区三州| 精品中文久久| 国产综合亚洲精品| 丰满少妇在线播放bd日韩电影| 97人人模人人爽人人喊小说| 国产二区三区视频| 精品久久9999| 国产69精品久久99的直播节目 | 狠狠色噜噜狠狠狠狠88| 二区三区视频| 亚洲久色影视| 强制中出し~大桥未久在线播放| 美日韩一区| 亚洲精品日本无v一区| 天天干狠狠插| 国产乱xxxxx97国语对白| 精品一区二区三区影院| 精品一区电影国产| 91精品国产综合久久婷婷香| 国产女人和拘做受视频免费| 日韩av在线一区| 精品国产区一区二| 伊人精品一区二区三区| 亚洲欧美日本一区二区三区| 狠狠色噜噜综合社区| 亚洲欧美一区二区精品久久久| 亚洲欧美日韩国产综合精品二区| 一区二区三区欧美视频| 亚洲国产午夜片| 国产69精品久久久久按摩| 国产在线干| 国产日韩欧美精品| 国产理论片午午午伦夜理片2021 | 93久久精品日日躁夜夜躁欧美| 久久国产精品免费视频| 久久99精品国产一区二区三区| 99久久婷婷国产综合精品草原| 亚洲第一天堂无码专区| 亚洲天堂国产精品| 国产精品一区在线播放| 欧美激情精品一区| 男女午夜影院| 国产精品久久91| 国产一二区精品| 麻豆精品国产入口| 日日夜夜一区二区| 日韩精品中文字幕久久臀| 国产97在线播放| 国产香蕉97碰碰久久人人| 欧美老肥婆性猛交视频| aaaaa国产欧美一区二区 | 亚洲国产一区二区精华液| av午夜影院| 久久99精品国产麻豆婷婷洗澡| 国产69精品久久久久久野外| 亚洲三区在线| 99精品少妇| 日韩精品一区二区三区免费观看| 国产三级在线视频一区二区三区| 国产日韩欧美自拍| 99精品欧美一区二区三区美图| 99精品视频一区| 黄色国产一区二区| 国久久久久久| 91av中文字幕| 亚洲欧洲日韩在线| 国产真裸无庶纶乱视频| 国产精品免费专区| 国产精品一区二区麻豆| 午夜wwww| 午夜影院伦理片| 一区二区三区中文字幕| 欧美精品一区久久| 狠狠躁日日躁狂躁夜夜躁| 国产日韩精品一区二区三区| 欧美日韩久久一区| 偷拍久久精品视频| 97人人揉人人捏人人添| 国产一区二区播放| 狠狠色很很在鲁视频| 国产欧美二区| 538国产精品| 国产一区二三| 欧美精品在线视频观看| 日韩av在线影院| 国产精品一区在线观看| 99国产精品99久久久久久粉嫩| 91精品系列| 96国产精品视频| 欧美亚洲精品一区二区三区| 国产视频一区二区在线| 日韩欧美视频一区二区| 精品在线观看一区二区| 欧美一区二区免费视频| 欧美一区亚洲一区| 免费超级乱淫视频播放| 午夜影院毛片| 国产精品乱码久久久久久久久| 国产区精品区| 黄色国产一区二区| 精品久久久久久久久亚洲| free性欧美hd另类丰满| 日本99精品| 欧美日韩国产在线一区二区三区| 日韩av在线中文| 久久精品爱爱视频| 亚洲精品久久久久玩吗| 亚洲国产日韩综合久久精品| 99精品少妇| 午夜毛片影院| 国产精品久久久视频| 国产午夜亚洲精品午夜鲁丝片| 久久久久亚洲精品| 国产欧美一区二区三区四区| 国产精品久久91| 91av精品| 热re99久久精品国99热蜜月| 日本激情视频一区二区三区| 亚洲w码欧洲s码免费| 91精品一区二区中文字幕| 日韩一级视频在线| 久久精品一| 性old老妇做受| 91精品一区在线观看| 国产区精品区| 亚洲欧美另类综合| 国产精品国外精品| 国产婷婷色一区二区三区在线| 99视频一区| 狠狠搞av| 四虎国产精品久久| 欧美亚洲国产日韩| 久久99精品久久久野外直播内容| 国产视频精品一区二区三区| 国产精品一区二区免费| 国产一二区在线| 国产在线一二区| 996久久国产精品线观看| 亚洲欧美自拍一区| 久久五月精品| 国产精品9区| 91视频国产一区| 欧美精品久| 欧美一区二区三区视频在线观看| 久久99国产精品久久99| 91精品婷婷国产综合久久竹菊| 亚洲国产99| 99国产精品9| 精品国产91久久久| 456亚洲精品| 国内少妇偷人精品视频免费| 国产精品9区| 亚洲1区在线观看| 国产精品久久久久久久四虎电影| 精品国产91久久久久久久| 日韩国产精品一区二区| 欧美极品少妇xx高潮| 国产精品乱码一区二区三区四川人| 久久精品色欧美aⅴ一区二区| 国产欧美日韩精品一区二区三区| 国产一区二区三级| 91福利试看| 四虎国产精品永久在线| 欧美精选一区二区三区| 欧美中文字幕一区二区| 91超碰caoporm国产香蕉| 二区三区免费视频| 538国产精品一区二区| 国产精品尤物麻豆一区二区三区| 欧美一区二区久久| 国产精品亚洲а∨天堂123bt| 国内精品99| 精品久久香蕉国产线看观看gif | 日韩久久精品一区二区三区| 亚洲欧美自拍一区| 国产精品一区二区在线观看免费| 亚洲国产精品91| 国产亚洲久久| 午夜一区二区视频| 欧美久久一区二区三区| 午夜亚洲国产理论片一二三四| 国产女人和拘做受视频免费| 一区二区久久精品| 国产美女三级无套内谢| 激情久久精品| 国产91一区二区在线观看| 国产精品一区二区av麻豆| 国产欧美一区二区精品久久| 亚洲一二三在线| 国产精品电影一区二区三区| 一区二区免费在线观看| 欧美一区二区三区激情| 日韩精品免费一区二区在线观看| 日本一区午夜艳熟免费| 欧美一区二区三区免费视频| 国产欧美一区二区三区精品观看| 国产在线精品一区| 88国产精品视频一区二区三区| 国产精欧美一区二区三区久久| 欧美乱战大交xxxxx| 天堂av一区二区三区| 波多野结衣巨乳女教师| 国产精品欧美日韩在线| 国产高清在线精品一区二区三区| 欧美hdfree性xxxx| 国产一区2| 久久99精品一区二区三区| 女人被爽到高潮呻吟免费看| 欧美精品在线一区二区| 久久精品色欧美aⅴ一区二区| 91久久精品国产亚洲a∨麻豆| 欧美福利三区| 亚洲精品久久久久www| 69久久夜色精品国产69乱青草| 亚洲欧美国产一区二区三区| 国产精品一区久久人人爽| 亚洲精品91久久久久久| 午夜av电影网| 日韩一区二区中文字幕| 福利电影一区二区三区| 在线视频不卡一区| 欧美激情片一区二区| 午夜av免费观看| 国产欧美一区二区三区免费看| 欧美一区二三区人人喊爽| 亚洲国产精品麻豆| 国产一区二区视频在线| 国产在线精品一区二区| 精品少妇一区二区三区免费观看焕| 久久99精品国产一区二区三区| 99久久精品免费看国产交换| 日韩欧美一区精品| 欧美亚洲视频二区| 国产午夜伦理片| 麻豆91在线| 激情久久精品| 国产一区不卡视频| 国产精品女人精品久久久天天|