日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于圖像處理與序列標(biāo)注的學(xué)術(shù)文獻(xiàn)語(yǔ)義再結(jié)構(gòu)化方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 201510768902.4 申請(qǐng)日: 2015-11-12
公開(kāi)(公告)號(hào): CN105260727B 公開(kāi)(公告)日: 2018-09-21
發(fā)明(設(shè)計(jì))人: 陸偉;丁恒;方龍 申請(qǐng)(專利權(quán))人: 武漢大學(xué)
主分類(lèi)號(hào): G06K9/00 分類(lèi)號(hào): G06K9/00
代理公司: 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 代理人: 魏波
地址: 430072 湖*** 國(guó)省代碼: 湖北;42
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 基于 圖像 處理 序列 標(biāo)注 學(xué)術(shù) 文獻(xiàn) 語(yǔ)義 結(jié)構(gòu) 方法
【權(quán)利要求書(shū)】:

1.基于圖像處理與序列標(biāo)注的學(xué)術(shù)文獻(xiàn)語(yǔ)義再結(jié)構(gòu)化方法,其特征在于,包括以下步驟:

步驟1:將學(xué)術(shù)文獻(xiàn)轉(zhuǎn)化為圖像形式,并對(duì)其進(jìn)行版式分析;首先進(jìn)行灰度化、二值化、輪廓獲取、外輪廓、建立rtree空間索引,再利用空間索引對(duì)相互覆蓋的文本區(qū)塊進(jìn)行融合,最終獲得符合學(xué)術(shù)文獻(xiàn)邏輯結(jié)構(gòu)的區(qū)塊;

步驟2:利用圖像識(shí)別技術(shù)和OCR技術(shù)對(duì)每個(gè)符合學(xué)術(shù)文獻(xiàn)邏輯結(jié)構(gòu)的區(qū)塊進(jìn)行識(shí)別;其中圖像識(shí)別技術(shù)將邏輯區(qū)塊分類(lèi)為文本、圖像、表格三類(lèi),對(duì)于識(shí)別為圖像和表格的區(qū)塊將以JPG格式保存為圖像,對(duì)于文本區(qū)塊采用開(kāi)源OCR工具Tesseract將圖像轉(zhuǎn)換為機(jī)器可讀的純文本;

步驟3:利用自然語(yǔ)言處理中的序列標(biāo)注模型,對(duì)步驟2中識(shí)別出來(lái)的區(qū)塊進(jìn)行標(biāo)簽序列轉(zhuǎn)換;

利用條件隨機(jī)場(chǎng)模型對(duì)步驟2識(shí)別出來(lái)的文本區(qū)塊進(jìn)行序列標(biāo)注,其具體實(shí)現(xiàn)包括以下子步驟:

步驟3.1:預(yù)處理;主要是對(duì)文本格式的數(shù)據(jù),進(jìn)行句子切分、分詞、詞法分析;

步驟3.2:特征抽取,抽取文本塊在一篇文章里面的相對(duì)位置作為特征P,包括頭部,文章主體以及文章結(jié)尾;將數(shù)字標(biāo)題以及段落特征作為特征T,通過(guò)檢測(cè)文獻(xiàn)的數(shù)字開(kāi)頭行判斷是否是小標(biāo)題;標(biāo)點(diǎn)符號(hào)以及特殊符號(hào)作為特征M; 文本塊的長(zhǎng)度作為特征L,每個(gè)文本塊包含的詞的數(shù)量;文獻(xiàn)中字體的大小作為特征F以及文本塊的起始坐標(biāo)作為特征C;CRF是序列標(biāo)注問(wèn)題,所以在特征抽取時(shí)會(huì)得到一個(gè)序列,即對(duì)于每一個(gè)文本區(qū)塊標(biāo)記,它的所有上下文文本塊的邏輯結(jié)構(gòu)順序得到的標(biāo)記結(jié)果構(gòu)成了一個(gè)標(biāo)記序列S=(P+T+M+L+F+C);

步驟3.3:對(duì)特征抽取得到的特征文件進(jìn)行處理,得到每一個(gè)序列標(biāo)注的標(biāo)注結(jié)果,然后對(duì)標(biāo)注結(jié)果進(jìn)行查全、查準(zhǔn)評(píng)價(jià);

步驟3.4:利用序列標(biāo)注的結(jié)果對(duì)文本區(qū)塊進(jìn)行融合,最終獲得符合學(xué)術(shù)文獻(xiàn)邏輯結(jié)構(gòu)的文本區(qū)塊;

步驟4:對(duì)序列標(biāo)注得到的文獻(xiàn)邏輯結(jié)構(gòu)結(jié)果進(jìn)行優(yōu)化,得到最終的文獻(xiàn)邏輯結(jié)構(gòu)。

2.根據(jù)權(quán)利要求1所述的基于圖像處理與序列標(biāo)注的學(xué)術(shù)文獻(xiàn)語(yǔ)義再結(jié)構(gòu)化方法,其特征在于:步驟2的具體實(shí)現(xiàn)包括以下子步驟:

步驟2.1:首先對(duì)數(shù)據(jù)源進(jìn)行預(yù)處理;源數(shù)據(jù)是已經(jīng)轉(zhuǎn)換為圖像格式的學(xué)術(shù)文獻(xiàn);預(yù)處理主要是減少圖像中的無(wú)用信息,包括灰度化、降噪、二值化;

步驟2.2:特征提取和降維;對(duì)于每個(gè)邏輯結(jié)構(gòu)區(qū)塊,提取該區(qū)塊的寬度W、高度H,并利用OPENCV輪廓提取算法獲取所有輪廓和輪廓對(duì)應(yīng)的面積,并采用K閾值法計(jì)算輪廓面積對(duì)于K的數(shù)量C1和小于K的數(shù)量C2,利用OPENCV直線檢測(cè)算法計(jì)算區(qū)塊包含的長(zhǎng)度大于區(qū)塊2/3的水平直線數(shù)量C3和高度大于區(qū)塊2/3的垂直直線數(shù)量C4;利用OPENCV多維直方圖算法提取步驟2.1中未二值化處理的圖像區(qū)塊的3通道直方圖向量V1、V2、V3;使用BOW算法對(duì)區(qū)塊進(jìn)行BOW編碼獲得特征向量V4,BOW編碼維度為3000,對(duì)V4使用PCA進(jìn)行降維處理獲得500維特征向量V5;最終每個(gè)區(qū)塊的特征F=(W,H,C1,C2,C3,C4,V1,V2,V3,V5);

步驟2.3:進(jìn)行分類(lèi)器設(shè)計(jì)、訓(xùn)練和實(shí)際識(shí)別;對(duì)分類(lèi)器進(jìn)行訓(xùn)練,使用SVM和Adaboost算法進(jìn)行有監(jiān)督訓(xùn)練,得到訓(xùn)練分類(lèi)模型M,該模型用于識(shí)別邏輯區(qū)塊類(lèi)型,邏輯區(qū)塊類(lèi)型包括文本、圖像、表格;

步驟2.4:對(duì)識(shí)別出的圖像區(qū)塊和表格區(qū)塊使用Tesseract進(jìn)行OCR并獲取置信得分S1,以S1和分類(lèi)模型M的分類(lèi)概率得分S2做線性插值計(jì)算,計(jì)算公式為Sum=(1-a)*S1+a*S2,其中Sum表示求和結(jié)果,a為調(diào)控參數(shù),以最終得分作為分類(lèi)依據(jù),得分高于閾值L的區(qū)塊被視作分類(lèi)正確;對(duì)分類(lèi)結(jié)果進(jìn)行參數(shù)a調(diào)整,提高分類(lèi)結(jié)果的準(zhǔn)確性;

步驟2.5:對(duì)分類(lèi)正確的區(qū)塊中圖像和表格區(qū)塊直接保存為JPG格式圖片,對(duì)于其中的文本區(qū)塊使用Tesseract進(jìn)行OCR文字識(shí)別,將圖像中包含的文字識(shí)別出來(lái),保存為文本格式。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201510768902.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū);

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 最新国产一区二区| 国产精品视频久久久久久| 久久人91精品久久久久久不卡| 欧美精品在线观看一区二区| 国产99网站| 国产精品久久久久久久妇女| 欧美日韩中文国产一区发布| 国产精品一级在线| 99riav3国产精品视频| 久久婷婷国产麻豆91天堂徐州| 日韩精品一区二区av| 午夜看片网| 国产精品你懂的在线| av不卡一区二区三区| 午夜精品一区二区三区三上悠亚 | 日韩毛片一区| 一级女性全黄久久生活片免费| 免费看欧美中韩毛片影院| 青苹果av| 国产精品国外精品| 欧美国产一二三区| 亚洲精品久久久久999中文字幕| 久久国产精品免费视频| 人人要人人澡人人爽人人dvd| 91性高湖久久久久久久久_久久99| 久久国产欧美一区二区三区免费| 日韩精品一区二区不卡| 国产女人和拘做受视频免费| 日本一区二区三区免费播放| 国产精品丝袜综合区另类| 亚洲一区二区国产精品| 国产精品一区不卡| 国产女人与拘做受免费视频| 日韩精品少妇一区二区在线看| 欧美一区二区三区久久精品视 | 日韩欧美高清一区| 91国产在线看| 日本美女视频一区二区三区| 国产一区在线视频播放| 午夜wwwww| 精品免费久久久久久久苍| 久久69视频| 96精品国产| 午夜三级电影院| 91久久一区二区| 国产精品久久久久久久龚玥菲 | 理论片高清免费理伦片| 国产第一区在线观看| 视频二区狠狠色视频| 精品国产区| 欧美日韩偷拍一区| 欧美精品日韩一区| 国产在线精品二区| 久久综合二区| 羞羞视频网站免费| 国产精品一区二区免费视频| 亚洲精品色婷婷| 久久99精品一区二区三区| 福利片91| 麻豆视频免费播放| 亚洲一区2区三区| 热久久一区二区| 国内精品久久久久久久星辰影视| 福利电影一区二区三区| 免费观看xxxx9999片| 色一情一乱一乱一区免费网站| 亚洲欧美一卡二卡| 高清人人天天夜夜曰狠狠狠狠| 国产伦精品一区二区三区无广告| 欧美精品在线观看视频| 亚洲国产精品第一区二区| 91一区在线| 香港三日本8a三级少妇三级99| 欧美日韩精品在线一区二区| 久久艹国产精品| 欧美精品久久一区二区| 91中文字幕一区| 日本xxxx护士高潮hd| 国产在线一区二区视频| 制服丝袜视频一区| 中文无码热在线视频| 麻豆视频免费播放| 91免费视频国产| 欧美日韩国产午夜| 亚洲午夜国产一区99re久久| 国产精品一区二区三区在线看| 国产精品视频一区二区在线观看| 日本美女视频一区二区三区| 欧美在线视频二区| 国产农村乱色xxxx| 日本一区二区三区中文字幕 | 免费看大黄毛片全集免费| 国产精品久久久爽爽爽麻豆色哟哟| 久久久久亚洲最大xxxx| 国产区二区| 欧美日韩国产一级| 91精品久| 91福利视频导航| 日韩欧美一区二区在线视频| 鲁丝一区二区三区免费| 亚洲精品久久久久不卡激情文学| 国产精品第56页| 综合久久色| 国产精品美乳在线观看| 久久青草欧美一区二区三区| 亚洲欧美国产一区二区三区| 91精品久久久久久| 欧美一区二区三区片| 69久久夜色精品国产69乱青草 | 素人av在线| 国产精品一区二区在线观看免费| 性欧美激情日韩精品七区| 91精品啪在线观看国产线免费| 色妞www精品视频| 欧美精品五区| 在线精品国产一区二区三区| 精品国产乱码久久久久久久| 亚洲自拍偷拍一区二区三区| 午夜一区二区视频| 国产黄色一区二区三区| 97久久精品一区二区三区观看| 国产伦高清一区二区三区| 91久久综合亚洲鲁鲁五月天 | 欧美日韩九区| 中文字幕一区二区三区四| 国产精品高潮呻吟三区四区| 欧美精品xxxxx| 日本一区午夜艳熟免费| 久久99久久99精品蜜柚传媒| 国产欧美一区二区三区在线播放| 99精品小视频| 国产精品久久久久激情影院| 亚州精品国产| 午夜三级大片| 999国产精品999久久久久久| 欧美一区二区色| 欧美精品日韩精品| 国产一区三区四区| 日本一区二区电影在线观看| 国产午夜伦理片| 亚洲四区在线| 国产精品视频二区三区| 黄毛片在线观看| 色婷婷噜噜久久国产精品12p| 久精品国产| 国产精品欧美一区二区三区奶水| 精品中文久久| 91精品国产九九九久久久亚洲| 欧美一区二区三区视频在线观看| 夜夜夜夜曰天天天天拍国产| 久爱视频精品| 国产日韩欧美精品| 国产91色综合| 午夜爽爽爽男女免费观看| 亚洲国产精品一区二区久久,亚洲午夜 | 国产aⅴ一区二区| 91丝袜国产在线播放| 国产suv精品一区二区4| 中文字幕在线一二三区| 91片在线观看| 国产精品电影免费观看| 狠狠色狠狠色合久久伊人| 色婷婷综合久久久久中文| 久久国产精品久久| 国产亚洲精品久久久久久网站| 亚洲欧美中日精品高清一区二区| 国产精品一区二区毛茸茸| 国产精品久久99| 91精品国产一区二区三区| 久久久精品免费看| 国产精品久久国产三级国电话系列 | 久久夜色精品国产亚洲| 97人人澡人人添人人爽超碰| 91精品一区二区中文字幕| 欧美日韩精品中文字幕| 7799国产精品久久99| 久99精品| 国产日本一区二区三区| 国产一区二区三区黄| 一区二区中文字幕在线| 99久久免费精品国产免费高清| 欧美精品日韩一区| 日韩午夜三级| 老女人伦理hd| 久久久久久国产一区二区三区| 91人人爽人人爽人人精88v| 欧美激情视频一区二区三区| 热99re久久免费视精品频软件| 国产一二区在线| 亚洲精品国产一区二区三区| 欧美日韩九区| 国产aⅴ一区二区| 一本色道久久综合亚洲精品图片| 欧美精品xxxxx| 欧美日韩精品不卡一区二区三区| 国产午夜精品一区二区三区欧美| 国产亚洲欧美日韩电影网| 91偷拍网站| 久久99亚洲精品久久99| 欧美一级久久久| 国产精品二十区| 日韩精品一区二区三区在线| 999久久久国产| 91精品久久久久久| 国产一a在一片一级在一片| 亚洲欧美日韩国产综合精品二区| 国产精品6699| 国产精品亚洲一区| 亚洲国产精品女主播| 精品久久久久99| 国产精品视频二区三区| 欧美高清视频一区二区三区| 日日噜噜夜夜狠狠| 国产乱码一区二区| 538国产精品| 国产一区二区视频免费在线观看| 国产一区网址| 91国产在线看| 国产伦理精品一区二区三区观看体验| 国产毛片精品一区二区| 亚洲美女在线一区| 亚洲码在线| 日韩亚洲精品视频| 狠狠色噜噜狠狠狠888奇米| 国产色99| 国产69精品久久99的直播节目| 久99久视频| 狠狠色噜噜狠狠狠狠2018| 久久精品入口九色| 91九色精品| 激情久久综合网| 国产农村妇女精品一区二区| 日本伦精品一区二区三区免费| 91精品啪在线观看国产手机| 免费a级毛片18以上观看精品| 国内偷拍一区| 欧美日韩久久精品| 美女脱免费看直播| 2023国产精品久久久精品双| 欧美一区二区三区片| 国产在线精品一区二区| 国产精品久久久久久久久久久不卡| 狠狠色狠狠综合久久| 国产在线一区观看| 91福利视频免费观看| 李采潭伦理bd播放|