日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種文檔實(shí)體抽取方法、系統(tǒng)及計(jì)算機(jī)存儲(chǔ)介質(zhì)在審

專利信息
申請(qǐng)?zhí)枺?/td> 202210902548.X 申請(qǐng)日: 2022-07-29
公開(kāi)(公告)號(hào): CN114973265A 公開(kāi)(公告)日: 2022-08-30
發(fā)明(設(shè)計(jì))人: 馬永亮;秦晉;周明 申請(qǐng)(專利權(quán))人: 北京瀾舟科技有限公司
主分類號(hào): G06V30/148 分類號(hào): G06V30/148;G06V30/418;G06F40/295
代理公司: 深圳市智享知識(shí)產(chǎn)權(quán)代理有限公司 44361 代理人: 馮彬彬
地址: 100000 北京市海淀*** 國(guó)省代碼: 北京;11
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 文檔 實(shí)體 抽取 方法 系統(tǒng) 計(jì)算機(jī) 存儲(chǔ) 介質(zhì)
【說(shuō)明書(shū)】:

發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種文檔實(shí)體抽取方法、系統(tǒng)及計(jì)算機(jī)存儲(chǔ)介質(zhì),包括以下步驟:獲取文檔,對(duì)文檔進(jìn)行預(yù)處理得到文檔中的文本、文本位置和文檔圖片;獲取預(yù)設(shè)問(wèn)題,所述預(yù)設(shè)問(wèn)題對(duì)應(yīng)至少一個(gè)未知實(shí)體,對(duì)文本、文本位置和文檔圖片進(jìn)行向量化編碼并拼接得到文本表示矩陣,并基于文本表示矩陣獲得至少一對(duì)對(duì)應(yīng)于預(yù)設(shè)問(wèn)題中未知實(shí)體的開(kāi)始位置和結(jié)束位置的組合;判斷每對(duì)組合中的開(kāi)始位置和結(jié)束位置是否匹配,若是,抽取該開(kāi)始位置和結(jié)束位置之間的文本作為對(duì)應(yīng)未知實(shí)體的實(shí)體抽取結(jié)果。通過(guò)利用文本、布局和圖像等各個(gè)特征的信息,來(lái)減少一些特征對(duì)實(shí)體抽取結(jié)果的錯(cuò)誤影響,提高實(shí)體抽取的準(zhǔn)確度。

技術(shù)領(lǐng)域

本發(fā)明涉及文檔解析領(lǐng)域,其特別涉及一種文檔實(shí)體方法、系統(tǒng)及計(jì)算機(jī)存儲(chǔ)介質(zhì)。

背景技術(shù)

目前針對(duì)文檔解析技術(shù)有基于啟發(fā)式規(guī)則的,也有基于深度學(xué)習(xí)的方法,其中基于啟發(fā)式規(guī)則的方法需要大量的人工參與,基于經(jīng)驗(yàn)總結(jié)規(guī)則,而通常得到的規(guī)則并沒(méi)有很好的泛化性,這通常導(dǎo)致當(dāng)換一個(gè)領(lǐng)域的文檔,總結(jié)的規(guī)則往往就失效了;而目前其他基于深度學(xué)習(xí)的方法,大都是基于單一模態(tài)深度學(xué)習(xí)網(wǎng)絡(luò)模型,或者進(jìn)行多模態(tài)的簡(jiǎn)單組合,它們通常依賴于人工標(biāo)記的訓(xùn)練樣本,而不能充分利用大規(guī)模未標(biāo)記樣本進(jìn)行訓(xùn)練,或者依賴預(yù)訓(xùn)練的圖像模型或自然語(yǔ)言模型,并不考慮文本、布局和圖像信息的聯(lián)合訓(xùn)練,以及不同模態(tài)的作用強(qiáng)度,同時(shí)針對(duì)單個(gè)文本對(duì)應(yīng)多個(gè)實(shí)體的情況,現(xiàn)有方法不能很好的解決。

發(fā)明內(nèi)容

為了解決實(shí)體抽取不精準(zhǔn)的問(wèn)題,本發(fā)明提供一種文檔實(shí)體抽取方法、系統(tǒng)及計(jì)算機(jī)存儲(chǔ)介質(zhì)。

本發(fā)明為解決上述技術(shù)問(wèn)題,提供如下的技術(shù)方案:一種文檔實(shí)體抽取方法,包括以下步驟:

獲取文檔,對(duì)文檔進(jìn)行預(yù)處理得到文檔中的文本、文本位置和文檔圖片;

獲取預(yù)設(shè)問(wèn)題,所述預(yù)設(shè)問(wèn)題對(duì)應(yīng)至少一個(gè)未知實(shí)體,對(duì)文本、文本位置和文檔圖片進(jìn)行向量化編碼并拼接得到文本表示矩陣,并基于文本表示矩陣獲得至少一對(duì)對(duì)應(yīng)于預(yù)設(shè)問(wèn)題中未知實(shí)體的開(kāi)始位置和結(jié)束位置的組合;

判斷每對(duì)組合中的開(kāi)始位置和結(jié)束位置是否匹配,若是,抽取該開(kāi)始位置和結(jié)束位置之間的文本作為對(duì)應(yīng)未知實(shí)體的實(shí)體抽取結(jié)果。

優(yōu)選地,利用pdf解析工具和/或OCR技術(shù)對(duì)文檔進(jìn)行預(yù)處理。

優(yōu)選地,對(duì)文本、文本位置和文檔圖片進(jìn)行向量化編碼并拼接得到文本表示矩陣,并基于文本表示矩陣獲得至少一對(duì)對(duì)應(yīng)于預(yù)設(shè)問(wèn)題中未知實(shí)體的開(kāi)始位置和結(jié)束位置的組合包括以下步驟:

基于多模態(tài)預(yù)訓(xùn)練模型,分別對(duì)文本、文本位置和文檔圖片進(jìn)行特征向量化編碼獲得文本向量、布局向量以及視覺(jué)向量,按照預(yù)設(shè)規(guī)則進(jìn)行拼接得到N*D維的文本表示矩陣,其中N表示文本token的數(shù)量,D表示每一個(gè)文本token的維度;

基于文本表示矩陣,判斷每個(gè)文本token是否是對(duì)應(yīng)于預(yù)設(shè)問(wèn)題中未知實(shí)體的開(kāi)始位置或結(jié)束位置,得到至少一個(gè)備選的開(kāi)始位置和至少一個(gè)備選的結(jié)束位置;

對(duì)上述判斷得到的備選的開(kāi)始位置和結(jié)束位置進(jìn)行兩兩組合。

優(yōu)選地,基于多模態(tài)預(yù)訓(xùn)練模型,分別對(duì)文本、文本位置和文檔圖片進(jìn)行特征向量化編碼獲得文本向量、布局向量以及視覺(jué)向量包括以下具體步驟:

對(duì)應(yīng)文本采用WordPiece得到文本token,并對(duì)應(yīng)各文本token生成文本向量;

基于使用ResNet-FPN作為視覺(jué)編碼器的主干網(wǎng)絡(luò),將文檔圖片縮放到預(yù)定大小并由主干網(wǎng)絡(luò)通過(guò)平均池化轉(zhuǎn)化為固定尺寸,之后展平獲得視覺(jué)向量;

布局向量采用視覺(jué)的邊界框進(jìn)行表示,將文本位置以坐標(biāo)形式表示并縮放到0-1000之間,使用兩個(gè)向量層去編碼x軸和y軸的位置特征,基于標(biāo)準(zhǔn)化的第i個(gè)文本/視覺(jué)標(biāo)記的邊界框布局向量層把邊界框特征拼接起來(lái)構(gòu)成布局向量。

優(yōu)選地,按照預(yù)設(shè)規(guī)則進(jìn)行拼接是先將文本向量、布局向量在維度為1的方向進(jìn)行拼接,再將視覺(jué)向量與拼接后的文本向量和布局向量在維度為0的方向進(jìn)行拼接。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京瀾舟科技有限公司,未經(jīng)北京瀾舟科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210902548.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū);

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 91福利视频导航| 亚洲欧美国产中文字幕| 日韩久久电影| 久久福利免费视频| 久久国产精品首页| 欧美色综合天天久久| 亚洲欧美国产精品久久| 欧美在线一级va免费观看| 91福利视频导航| 男女视频一区二区三区| 亚洲欧美日韩另类精品一区二区三区 | 欧美久久一区二区三区| 一区二区三区四区中文字幕| 日韩av在线资源| 亚洲第一区国产精品| 狠狠色噜噜狠狠狠狠色综合久老司机| 91精品一区二区中文字幕| 国产一区二区播放| 欧美在线一级va免费观看| 久久99中文字幕| 久久久久久国产一区二区三区| 久久精品男人的天堂| 免费毛片**| 91视频国产一区| 欧美髙清性xxxxhdvid| 国产午夜亚洲精品| 麻豆精品国产入口| 亚洲国产欧洲综合997久久,| 国产精品99一区二区三区| 欧美精品一区二区性色| 91精品啪在线观看国产| 久久久精品a| 国产欧美精品一区二区在线播放| 躁躁躁日日躁网站| 国产日产精品一区二区| 午夜精品一区二区三区三上悠亚| 伊人欧美一区| 日韩精品一区二区免费| 亚洲国产欧美一区二区丝袜黑人| 国产一区二区午夜| 狠狠色丁香久久综合频道| 国产99视频精品免视看芒果| 久久综合伊人77777麻豆最新章节 一区二区久久精品66国产精品 | 视频一区欧美| 日韩av在线电影网| 狠狠色成色综合网| 狠狠色狠狠色综合久久第一次| 国产丝袜在线精品丝袜91| 精品国产仑片一区二区三区| 久久综合伊人77777麻豆最新章节| 亚洲乱亚洲乱妇28p| 亚洲日韩aⅴ在线视频| 欧美精品一区二区久久久| 日韩国产精品一区二区| 欧美日韩亚洲三区| 激情久久综合网| 精品国产乱码久久久久久虫虫 | 久久久久久久亚洲国产精品87| 午夜爱爱电影| 久久aⅴ国产欧美74aaa| 亚洲国产偷| 99爱国产精品| 亚洲精品老司机| 夜夜躁人人爽天天天天大学生 | 国产清纯白嫩初高生视频在线观看| 欧美日韩亚洲另类| 欧美日韩国产123| 国产乱人伦精品一区二区| 蜜臀久久99精品久久一区二区| 强制中出し~大桥未久在线播放| 精品国产一区二区三| 国产精品自产拍在线观看桃花| 国产91在线播放| 97久久精品人人做人人爽| 鲁丝一区二区三区免费观看| 国产一区www| 国产精品6699| 亚日韩精品| 91看黄网站| 欧美三级午夜理伦三级中视频| 93精品国产乱码久久久| 精品综合久久久久| 精品久久综合1区2区3区激情 | 国产一区二区三区色噜噜小说| 99久久夜色精品| 亚洲欧洲另类精品久久综合| 国产午夜精品一区二区三区最新电影| 91国内精品白嫩初高生| 狠狠色噜噜狠狠狠狠黑人| 99久久精品一区字幕狠狠婷婷 | 一区二区三区四区视频在线| yy6080影院旧里番乳色吐息| 国产精品一区二区av日韩在线| 国产精品免费不卡| 国产91丝袜在线熟| 91精品丝袜国产高跟在线| 国产超碰人人模人人爽人人添| 欧洲在线一区| 在线亚洲精品| 国产精品日韩在线观看| 国产精品禁18久久久久久| 狠狠色噜噜狠狠狠狠777| 国产一区=区| 妖精视频一区二区三区| 99精品欧美一区二区三区美图| 最新国产精品自拍| 日本一区二区三区中文字幕| 国产精品电影一区| 97久久精品人人做人人爽50路| 91麻豆国产自产在线观看hd| 91精品综合在线观看| 久久国产麻豆| 日韩av中文字幕在线免费观看| 午夜精品999| 日韩av一二三四区| 国产69精品99久久久久久宅男| 精品视频久| av午夜剧场| 国产乱xxxxx97国语对白| 精品国产区| 999久久久国产| 国产精品自产拍在线观看蜜| 国产区二区| 国产91九色在线播放| 日本一区二区欧美| 日本高清二区| 午夜欧美影院| 精品久久久影院| 国产伦高清一区二区三区| 久久久久久久国产| 亚洲国产精品一区在线| 狠狠躁夜夜躁人人爽天天天天97| 国产偷国产偷亚洲清高| 国内精品99| 伊人久久婷婷色综合98网| 亚洲福利视频二区| 久久密av| 国产日产精品一区二区| 国产精品久久免费视频| 日韩国产精品久久久久久亚洲| 国产精品不卡一区二区三区| 91一区二区在线观看| 国产欧美日韩另类| 免费高潮又黄又色又爽视频| 少妇久久精品一区二区夜夜嗨| 中文字幕日本精品一区二区三区| 亚洲第一天堂无码专区| 国产日韩欧美亚洲综合| 亚洲va国产2019| 玖玖国产精品视频| 日本美女视频一区二区三区| 欧美髙清性xxxxhdvid| 国产精品一区二| 日韩欧美精品一区二区三区经典| 亚洲va欧美va国产综合先锋| 久久久久久亚洲精品| 国产伦高清一区二区三区| 精品国产一区在线| 欧美日韩综合一区二区| 蜜臀久久99精品久久久| 男女午夜爽爽| 国产日韩欧美亚洲| 国产精品天堂网| 精品99在线视频| 久久福利视频网| 久久人做人爽一区二区三区小说| 福利视频亚洲一区| 国产欧美一区二区三区免费视频| 96国产精品视频| 国产麻豆91视频| 国产精品免费专区| 欧美高清一二三区| 久草精品一区| 国产精品日产欧美久久久久| 亚洲一区二区福利视频| 欧美日韩国产123| 久久久久亚洲国产精品| 欧美67sexhd| 国产亚洲精品久久久久久久久动漫| 日韩av一二三四区| free性欧美hd另类丰满| 亚洲精品主播| 99国产精品久久久久| 精品国产一二区| 欧美髙清性xxxxhdvid| 午夜影皖精品av在线播放| 国产欧美精品一区二区三区-老狼 国产精品一二三区视频网站 | 亚洲伊人久久影院| 欧美精品国产精品| 久久福利免费视频| 综合久久激情| 国产二区三区视频| 国产精品18久久久久白浆| 国产一级自拍片| 国产乱码一区二区| 午夜wwww| 精品国产一区二区三区免费| 日本护士hd高潮护士| 日韩精品免费一区| 少妇久久精品一区二区夜夜嗨| 欧美3p激情一区二区三区猛视频 | 夜色av网站| 九色国产精品入口| 国产一区免费在线| 国产在线视频二区| 十八无遮挡| 海量av在线| 亚洲精品www久久久| 91久久香蕉| 亚洲国产欧美一区二区三区丁香婷| 婷婷嫩草国产精品一区二区三区| 国产呻吟高潮| 夜夜嗨av色一区二区不卡| 日本一区免费视频| 欧美综合在线一区| 亚洲国产一区二区久久久777| 国产欧美一区二区精品性| 国产精品日韩视频| 日本精品一区二区三区在线观看视频| 人人要人人澡人人爽人人dvd| 亚洲欧洲国产伦综合| 精品福利一区二区| 中出乱码av亚洲精品久久天堂| 日韩一级在线视频| 欧美乱战大交xxxxx| 久久久久久久国产| 日本一区二区电影在线观看| 久久久久久久亚洲视频| 处破大全欧美破苞二十三| 欧美乱妇在线视频播放| 欧美日韩精品在线一区| 国产精品视频一区二区三| 日韩无遮挡免费视频| 日本伦精品一区二区三区免费| 午夜看片网站| 久久九精品| 夜夜躁日日躁狠狠久久av| 99国产精品9| 国产91丝袜在线播放动漫| 狠狠躁日日躁狂躁夜夜躁| 国产麻豆精品久久| 欧美日韩亚洲国产一区| 99国精视频一区一区一三| 日韩精品一区二区不卡| 娇妻被又大又粗又长又硬好爽| 国产精品久久久久久久久久不蜜月 |