日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種列表識別方法與系統有效

專利信息
申請號: 201310455068.4 申請日: 2013-09-29
公開(公告)號: CN104517106B 公開(公告)日: 2017-11-28
發明(設計)人: 許燦輝;湯幟;徐劍波;陶欣 申請(專利權)人: 北大方正集團有限公司;北京方正阿帕比技術有限公司
主分類號: G06K9/20 分類號: G06K9/20;G06K9/62
代理公司: 北京三聚陽光知識產權代理有限公司11250 代理人: 寇海俠
地址: 100871 北京市*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 列表 識別 方法 系統
【說明書】:

技術領域

發明涉及電子文檔格式轉換技術領域,具體地說是一種列表識別方法與系統。

背景技術

根據版式文檔的生成過程,文檔是數據和結構的集合,具體包括內容數據、物理結構和邏輯結構。文檔分析是對文檔物理結構進行抽取,而文檔理解則是在物理結構和邏輯結構之間建立映射關系。在實際應用中,移動設備的可讀性需求使物理和邏輯結構的恢復尤為重要。頁面內列表的檢測及識別是文檔理解的重點之一。列表具有其獨立的邏輯功能,需要對其進行物理劃分和邏輯標簽標定。但列表從視覺上與正文文本段的特征十分近似,且列表首行的前導符號變化多樣,列表續行不具備明顯的可區分性特征,根據規則的方法其識別效果不能滿足實際需求。

列表是文檔的重要組成部分,如何準確地識別列表及其列表中的內容,對版式文檔的分析尤其重要。現有技術中有一些識別并轉換版式文檔中列表的方法,如使用一組規則來檢測基于矢量圖形的文檔中的至少一個列表。模式檢測邏輯標識可能開始列表的各字符、符號、數字、字母和/或圖像。另外的模式檢測邏輯確定列表是否存在。該系統可以標識和分析標項目符號的列表、標號的或標字母的列表、以及作為兩者的任意組合的嵌套列表。該方案的不足在于沒有考慮列表的鄰域信息,鄰域信息包括文本模式、縮進基本、標點、對齊等特征,當文檔頁面中存在多個列表時,該方案不能識別列表續行和列表首行的上下文關系,文檔整體的識別效果不理想。

發明內容

為此,為此,本發明所要解決的技術問題在于現有技術中的列表識別方法不能識別列表續行和列表首行的上下文關系,從而提出一種可以識別列表首行和續行的基于概率圖模型的列表識別方法。

為解決上述技術問題,本發明的提供一種列表識別方法與系統。

一種列表識別方法,包括以下步驟:

對原始版式文檔內的元數據信息進行解析和分析,提取頁面內基本圖元;

對所述基本圖元進行分割,提取頁面內分割文本行,并得到分割片;

針對所述分割片構造出無向圖;

根據所述基本圖元的屬性,檢測前導符號的縮進特征;

根據所述縮進特征、所述分割片的局部特征以及分割片之間的鄰域關系特征,訓練學習模型,獲得模型參數,建立列表識別模型;

調用所述列表識別模型對所需的文檔進行列表識別,得到識別結果。

所述的列表識別方法,所述根據所述縮進特征、所述分割片的局部特征以及分割片之間的鄰域關系特征,訓練學習模型,獲得模型參數,建立列表識別模型的過程中,所述學習模型為條件隨機場模型,過程包括:

提取所述無向圖中每個分割片的局部特征,進行分類,然后將分類得分轉化為偽概率,作為條件隨機場模型的一元特征函數;

根據無向圖鄰域關系,提取分割片之間的鄰域關系特征作為二元特征函數。

所述的列表識別方法,所述對所述基本圖元進行分割,提取頁面內分割文本行,并得到分割片的過程中,將文本行中連續的文本分割到一個分割片中。

所述的列表識別方法,所述提取頁面內分割文本行時,采用聚類方法。

所述的列表識別方法,在所述針對所述分割片構造出無向圖的過程中,根據所述分割片的鄰域關系構造無向圖。

所述的列表識別方法,在所述構造無向圖的過程中,采用最小生成樹方法構造無向圖。

所述的列表識別方法,所述根據所述基本圖元的屬性,檢測前導符號的縮進特征的過程,包括檢測所述前導符號縮進級別、縮進量以及與其他前導符號縮進是否一致。

所述的列表識別方法,所述分割片的局部特征包括分割片的長寬比、歸一化面積、縮進級別、圖像紋理特征。

所述的列表識別方法,所述提取所述無向圖中每個分割片的局部特征,進行分類,然后將分類得分轉化為偽概率的過程,包括:通過SVM分類器進行分類,選擇RBF徑向基核函數,將分類得分轉化為偽概率。

所述的列表識別方法,所述縮進特征包括前導符號縮進級別、縮進量以及與其他前導符號縮進是否一致。

一種列表識別系統,包括:

提取單元:對原始版式文檔內的元數據信息進行解析和分析,提取頁面內基本圖元;

分割單元:對所述基本圖元進行分割,提取頁面內分割文本行,并得到分割片;

構造單元:針對所述分割片構造出無向圖;

檢測單元:根據所述基本圖元的屬性,檢測前導符號的縮進特征;

建模單元:根據所述縮進特征、所述分割片的局部特征以及分割片之間的鄰域關系特征,訓練學習模型,獲得模型參數,建立列表識別模型;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京方正阿帕比技術有限公司,未經北大方正集團有限公司;北京方正阿帕比技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310455068.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91夜夜夜| 少妇av一区二区三区| 国产品久精国精产拍| 国产69精品久久久久app下载| 国产一卡二卡在线播放| 日韩精品一区在线观看 | 亚洲国产精品麻豆| 国产亚洲精品久久久久久久久动漫 | 国产一区二区伦理片| 日韩欧美一区精品| 一本大道久久a久久精品| 久99精品| 国产精品对白刺激在线观看| 国产精品久久久久久久久久久久久久久久| 亚洲欧美国产精品va在线观看| 中文字幕日本精品一区二区三区| 日韩欧美一区二区在线视频| 午夜毛片在线观看| 99久久精品免费看国产免费粉嫩| 亚洲欧美精品suv| 久久国产欧美日韩精品| 国产亚洲久久| 中文字幕一区二区三区乱码| 国产欧美二区| 对白刺激国产对白精品城中村| 91精品国产影片一区二区三区| 91av中文字幕| 国产伦精品一区二区三区免| 日韩av在线播| 欧美综合国产精品久久丁香| 国产99久久九九精品免费| 狠狠躁夜夜躁人人爽天天天天97| 岛国黄色av| 91视频国产一区| 午夜电影网一区| 日韩亚洲欧美一区| 国产99久久久久久免费看| 国产精品v欧美精品v日韩| 热re99久久精品国99热蜜月| 国产黄色一区二区三区| 久久精品视频一区二区| 日韩国产精品一区二区| 亚洲精品日本久久一区二区三区| 国产精品一区在线播放| 国产91一区| 国产99久久久久久免费看| 99国产精品9| 日日噜噜夜夜狠狠| 欧美日韩一区二区三区在线播放 | 91精品国产九九九久久久亚洲| 亚洲四区在线| 国产精品亚州| 午夜天堂在线| 亚洲国产精品入口| 久久综合伊人77777麻豆| 99精品视频一区二区| 国产91九色在线播放| 日韩av在线影视| 亚洲免费永久精品国产| 国产999在线观看| 中文字幕一区三区| 国产精品欧美一区二区三区奶水| 国产精欧美一区二区三区久久久| 正在播放国产一区二区| 97精品久久人人爽人人爽| 欧美日韩国产在线一区| 狠狠色噜噜狠狠狠狠综合久| 国产精品久久久不卡| 狠狠色噜噜狠狠狠888奇米| 久久99精品国产麻豆宅宅| 激情久久一区二区三区| 亚洲乱码av一区二区三区中文在线:| 中文字幕一区2区3区| 97久久超碰国产精品红杏| 国产伦精品一区二区三区电影 | 国产精品久久久久久久新郎| 久久99精品一区二区三区| 欧美高清视频一区二区三区| 夜夜躁日日躁狠狠久久av| 国产精品久久免费视频在线| 欧美国产三区| 午夜裸体性播放免费观看| 精品国产九九| 国产日韩欧美精品一区| 国产欧美精品一区二区三区-老狼| 国产精品天堂网| 午夜精品999| 少妇久久免费视频| 日本一区午夜艳熟免费| 国产一级片大全| 午夜黄色网址| 国产剧情在线观看一区二区| 国产精品一级片在线观看| 狠狠色噜噜狠狠狠狠| 亚洲国产一区二区久久久777| 亚洲国产精品入口| 91精品丝袜国产高跟在线| 亚洲乱码一区二区三区三上悠亚 | 少妇高潮一区二区三区99小说| 国产精品亚洲第一区| 狠狠躁夜夜躁xxxxaaaa| 美女被羞羞网站视频软件| 国产午夜亚洲精品午夜鲁丝片| 午夜欧美a级理论片915影院| 99久久国产综合精品女不卡| 久久九九国产精品| 日韩午夜毛片| 性少妇freesexvideos高清bbw| 99爱国产精品| 午夜av男人的天堂| 欧美亚洲精品suv一区| 欧美日韩国产精品一区二区| 一区二区三区欧美精品| 国产日韩欧美亚洲| 久久免费视频一区| 狠狠色噜噜狠狠狠狠88| 国产精品九九九九九九| 久久九九亚洲| 日韩精品乱码久久久久久| 一区二区三区中文字幕| 国产区91| 精品99免费视频| 欧美久久久一区二区三区| 欧美一区二区三区久久综合| 久久久精品欧美一区二区| 欧美一级免费在线视频| 精品视频久| 欧美一区二区三区性| 欧美日韩不卡视频| 国产精品高潮呻吟视频| 久久精品国产精品亚洲红杏| 精品国产伦一区二区三区| 国产一区二区麻豆| 91精品一区二区在线观看 | 国产精品乱码一区二区三区四川人 | 国产精品免费观看国产网曝瓜| 国产精品一区亚洲二区日本三区| 99久久国产综合精品女不卡| 国产精品视频久久久久久久| a级片一区| 国产一区二区三级| 一区二区国产盗摄色噜噜| 国产日韩欧美二区| 鲁一鲁一鲁一鲁一鲁一av| 猛男大粗猛爽h男人味| 鲁丝一区二区三区免费观看| 国产精品国外精品| 国产品久久久久久噜噜噜狼狼| 国内精品99| 国产精品乱战久久久| 国产精品国产三级国产aⅴ下载| 欧美精品国产一区二区| 在线国产91| 免费看欧美中韩毛片影院| 精品国产亚洲一区二区三区| 精品一区在线观看视频| 精品国产伦一区二区三区| 亚洲欧美国产日韩色伦| 亚洲国产精品网站| 欧美一区二区三区免费在线观看| 亚洲国产精品网站| 免费观看xxxx9999片| 天摸夜夜添久久精品亚洲人成 | 日本一区二区三区在线视频| 日韩精品午夜视频| 狠狠色狠狠色88综合日日91| 91亚洲欧美强伦三区麻豆| 色一情一乱一乱一区免费网站| 日本一区二区三区电影免费观看| 免费a一毛片| 国产一区二区三区网站| 国产日韩欧美色图| 96国产精品| 日本少妇高潮xxxxⅹ| 91精品国产91热久久久做人人| 亚洲一区精品视频| 国产精品久久久久久久久久不蜜月| 香蕉av一区二区三区| 久久福利免费视频| 日韩av一区二区在线播放| 国产高潮国产高潮久久久91| 亚洲区在线| 中文字幕一区2区3区| 久久久精品视频在线| 99精品视频一区| 91香蕉一区二区三区在线观看| 国产在线拍偷自揄拍视频 | 九九视频69精品视频秋欲浓| 国产精品禁18久久久久久| 搡少妇在线视频中文字幕| 浪潮av色| 538在线一区二区精品国产| 97视频精品一二区ai换脸| 色婷婷综合久久久中文一区二区| 国产一级片网站| 精品一区二区三区视频?| 久久久久偷看国产亚洲87| 中文字幕一级二级三级| 99re热精品视频国产免费| 国产美女一区二区三区在线观看| 国产在线精品二区| 少妇精品久久久久www蜜月| 久久99国产精品视频| bbbbb女女女女女bbbbb国产| 久久精品一二三四| 91波多野结衣| 香港三日三级少妇三级99| 少妇自拍一区| 午夜av电影院| 国产精品麻豆一区二区| 国产精品电影一区二区三区| 国产精品一区二区麻豆| 中文字幕视频一区二区| 亚洲精品久久久久www| 97欧美精品| 国产精品第56页| 国产精品亚州| 国产三级在线视频一区二区三区| 久久一二区| 欧美日韩一区在线视频| 三级午夜片| 久久婷婷国产香蕉| 国产午夜精品av一区二区麻豆| 99精品少妇| 久久夜色精品亚洲噜噜国产mv| 91久久国产露脸精品国产| 久久婷婷国产香蕉| 国产一区=区| 国产一区二区高潮| 国产在线一二区| 国产精品自拍在线观看| 国产精品99在线播放| 天天干狠狠插| 欧美综合国产精品久久丁香| 久久天堂国产香蕉三区| 国产精品自产拍在线观看桃花| 91一区在线观看| 国产一区三区四区| 国产一区二区三区小说| 97久久超碰国产精品| 国产在线拍偷自揄拍视频 | 99国产精品免费| 国产精品一区二区av麻豆| 三级视频一区| 国产精品一区一区三区| freexxxxxxx|