日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于預(yù)訓(xùn)練模型和位置信息的文本結(jié)構(gòu)化方法在審

專利信息
申請?zhí)枺?/td> 202110454738.5 申請日: 2021-04-26
公開(公告)號: CN112989836A 公開(公告)日: 2021-06-18
發(fā)明(設(shè)計(jì))人: 蔡婷婷;葉琪;阮彤;張維彥;鄭紅 申請(專利權(quán))人: 華東理工大學(xué)
主分類號: G06F40/295 分類號: G06F40/295;G06F16/951
代理公司: 暫無信息 代理人: 暫無信息
地址: 200237 *** 國省代碼: 上海;31
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 訓(xùn)練 模型 位置 信息 文本 結(jié)構(gòu) 方法
【說明書】:

發(fā)明公開了一種基于預(yù)訓(xùn)練語言模型和位置信息的文本結(jié)構(gòu)化方法。本發(fā)明包括以下步驟:步驟1:從新聞網(wǎng)站爬取文本作為原語料交由人工標(biāo)注,并對其進(jìn)行預(yù)處理;步驟2:使用預(yù)處理后的文本訓(xùn)練BERT?CRF來識別姓名、性別、體貌特征、身高等通用實(shí)體;步驟3:將每條文本中的通用實(shí)體作為輸入,訓(xùn)練多標(biāo)簽分類模型BERT?Dense,輸出每個(gè)實(shí)體所屬的相關(guān)人群類型;步驟4:以相關(guān)人群姓名作為主體詞,根據(jù)文本的結(jié)構(gòu)特性,基于位置特征獲取該主體詞的屬性,得到最終的多主體文本結(jié)構(gòu)化。本發(fā)明適用于領(lǐng)域性的多主體文本結(jié)構(gòu)化任務(wù),通過分層結(jié)構(gòu)化和基于位置信息組成多元組的方式,有效提高對新聞文本結(jié)構(gòu)化的準(zhǔn)確率和效率。

技術(shù)領(lǐng)域

本發(fā)明屬于自然語言處理技術(shù)領(lǐng)域,尤指一種基于預(yù)訓(xùn)練模型和位置信息的文本結(jié)構(gòu)化方法。

背景技術(shù)

隨著信息科技的快速發(fā)展,生活中海量的新聞案件信息都以文本的形式存在。面對日益增長的大量文本數(shù)據(jù),目前業(yè)務(wù)人員面臨的問題是需要花費(fèi)很多時(shí)間在閱讀文本上。如今,自然語言處理技術(shù)也有了一定的發(fā)展成果,因此,自動化抽取非結(jié)構(gòu)化文本中的關(guān)鍵信息點(diǎn),并將其以結(jié)構(gòu)化的形式展示,不僅能夠使業(yè)務(wù)人員免于閱讀大量的文本,節(jié)省時(shí)間和人力,而且是后期的數(shù)據(jù)挖掘如串并相似案件等工作的良好基礎(chǔ)。

近年來,預(yù)訓(xùn)練語言模型被廣泛應(yīng)用于自然語言處理任務(wù)中。預(yù)訓(xùn)練模型通過自監(jiān)督的方式從大規(guī)模無監(jiān)督數(shù)據(jù)中學(xué)習(xí)單詞在特定上下文中的文本表征,再通過微調(diào)應(yīng)用于具體的任務(wù)中。預(yù)訓(xùn)練語言模型有諸多優(yōu)點(diǎn):1)是一種遷移學(xué)習(xí)的應(yīng)用,隱式地學(xué)習(xí)到了通用的語法語義知識;2)可以將從開放領(lǐng)域?qū)W到的知識遷移到下游任務(wù),以改善低資源任務(wù);3)在幾乎所有自然語言處理任務(wù)中都取得了目前最佳的成果;4)可擴(kuò)展性強(qiáng),在處理一個(gè)新任務(wù)時(shí),只需要利用該任務(wù)的標(biāo)注數(shù)據(jù)進(jìn)行微調(diào)即可。

在實(shí)際應(yīng)用場景中,以搶劫事件為例,大部分新聞案件文本中都包含多個(gè)相關(guān)人員的信息,如一段文本中可能存在多個(gè)目擊者姓名,目擊者性別,目擊者體貌特征,搶劫者姓名,搶劫者性別等。目前主流的文本結(jié)構(gòu)化方法將其形式化為命名實(shí)體識別任務(wù),將預(yù)訓(xùn)練語言模型BERT作為特征提取器,再通過條件隨機(jī)場(CRF)解碼來直接識別相關(guān)人員的各種屬性,然而這種方式會存在兩個(gè)問題。1)命名實(shí)體識別的標(biāo)簽類別過多,導(dǎo)致模型性能下降;2)無法形成如目擊者1姓名,目擊者1性別,目擊者1體貌特征,目擊者2姓名,目擊者2性別,目擊者2體貌特征,搶劫者1姓名,搶劫者1性別,搶劫者2姓名,搶劫者2性別等的多元組形式,因而無法實(shí)現(xiàn)多主體文本的結(jié)構(gòu)化。

綜上所述,本交叉領(lǐng)域亟需設(shè)計(jì)一種新的文本結(jié)構(gòu)化方法來解決上述問題。

發(fā)明內(nèi)容

有鑒于此,本發(fā)明提供了一種基于預(yù)訓(xùn)練模型和位置信息的文本結(jié)構(gòu)化方法。第一,解決直接識別相關(guān)人員屬性導(dǎo)致命名實(shí)體識別標(biāo)簽類別數(shù)量過多的問題,本發(fā)明采用分層結(jié)構(gòu)化的方法,先使用BERT-CRF來識別文本中的姓名、性別、體貌特征、身高等通用實(shí)體,再對這些實(shí)體構(gòu)建多標(biāo)簽分類模型BERT-Dense,將其分別關(guān)聯(lián)到不同的相關(guān)人群類型,如目擊者、搶劫者、被搶者等。第二,解決無法形成以相關(guān)人員姓名為主體的多元組形式,本發(fā)明把相關(guān)人群姓名作為主體詞,根據(jù)文本的結(jié)構(gòu)特性,基于位置特征來獲取該主體詞的屬性。

本發(fā)明的技術(shù)路線實(shí)現(xiàn)形式為:首先,從新聞網(wǎng)站爬取搶劫事件文本作為原始語料交由人工標(biāo)注,并對其進(jìn)行預(yù)處理;其次,使用預(yù)處理后的文本訓(xùn)練BERT-CRF來識別姓名、性別、體貌特征、身高等通用實(shí)體;再次,將這些實(shí)體作為輸入,將目擊者、搶劫者、被搶者等相關(guān)人群類型作為類別標(biāo)簽,訓(xùn)練多標(biāo)簽分類模型BERT-Dense,旨在將通用實(shí)體分別關(guān)聯(lián)到不同的相關(guān)人群類型;最終,以相關(guān)人群姓名作為主體詞,根據(jù)文本的結(jié)構(gòu)特性,基于位置特征獲取該主體詞的屬性,得到最終的多主體文本結(jié)構(gòu)化。

本發(fā)明以搶劫新聞案件多主體文本結(jié)構(gòu)化為例,亦可用于其他事件的多主體文本結(jié)構(gòu)化。具體步驟為:

S1、從新聞網(wǎng)站爬取事件文本進(jìn)行人工標(biāo)注,得到文本結(jié)構(gòu)化的有監(jiān)督數(shù)據(jù)集A,并對該數(shù)據(jù)集進(jìn)行預(yù)處理作為后續(xù)模型的輸入。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東理工大學(xué),未經(jīng)華東理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110454738.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 一区二区不卡在线| 91一区二区三区在线| 国产精品日韩视频| 亚洲欧美国产精品久久| 国产伦精品一区二区三区免费下载| 91精品福利观看| 黄色av中文字幕| 欧美老肥婆性猛交视频| 96国产精品视频| 91高跟紫色丝袜呻吟在线观看| 91精品福利在线| 99日本精品| 91av一区二区三区| 在线观看v国产乱人精品一区二区 国产日韩欧美精品一区二区 | 中文无码热在线视频| 国产一区日韩欧美| 99精品欧美一区二区| 99精品偷拍视频一区二区三区| 在线观看欧美日韩国产| 国产精品国产三级国产播12软件 | 亚洲欧美一区二区三区1000| 精品久久不卡| 久久国产精品免费视频| 中文字幕日韩有码| 欧美乱妇在线视频播放| 欧美精品国产一区| 色一情一乱一乱一区免费网站| 国产一区二| 精品久久久久久亚洲综合网 | 国产精选一区二区| av中文字幕一区二区| 国产品久精国精产拍| 国产一区正在播放| 91免费看国产| 日本高清一二三区| 99久久婷婷国产综合精品电影| 黑人巨大精品欧美黑寡妇| 99国产精品一区| 国产欧美一区二区精品性| 日韩av中文字幕在线| 国产亚洲综合一区二区| 91免费国产视频| 国产69精品久久久久999小说| 欧美一区二区三区黄| www色视频岛国| 日韩av三区| 亚洲精品中文字幕乱码三区91| 国产日产精品一区二区| 小萝莉av| 综合久久一区| 欧美一区免费| 香港三日本三级三级三级| 国产黄色网址大全| 99国产超薄丝袜足j在线观看| 久久综合二区| 国产不卡一二三区| 国产欧美www| 亚洲自拍偷拍一区二区三区| 91精品啪在线观看国产线免费| 性xxxxfreexxxxx交| 欧美日本91精品久久久久| 国产精品影音先锋| 国产二区不卡| 香蕉久久国产| 淫片免费看| 亚洲精品国产精品国自产网站按摩| 三上悠亚亚洲精品一区二区| 精品国产伦一区二区三区| 欧洲国产一区| 欧美激情午夜| 一区二区三区欧美精品| 99热久久这里只精品国产www| 国产精品伦一区二区三区在线观看 | 国产88av| 国产区二区| 国产一区二区三区乱码| 国产精品久久久久久久新郎| 国产在线播放一区二区| 国产精品视频免费一区二区| 香蕉免费一区二区三区在线观看| 久久99久国产精品黄毛片入口 | 国产精品女人精品久久久天天| 亚洲欧洲一二三区| 久久精品国产亚洲一区二区| 99久久久久久国产精品| 午夜看片网站| 欧美日韩中文字幕一区二区三区| 欧美一区二区精品久久911| 国产大片一区二区三区| 狠狠插影院| 色妞妞www精品视频| 99国产精品| 欧美一区二区三区免费视频| 久久97国产| 69精品久久| 欧美精品一区二区久久| 91亚洲国产在人线播放午夜| 国产88在线观看入口| 欧美极品少妇xx高潮| 久久99国产视频| 国产天堂一区二区三区| bbbbb女女女女女bbbbb国产| 欧美精品五区| 99久久精品免费视频| 国产高清在线观看一区| 欧美激情在线免费| 久久精品麻豆| 97久久超碰国产精品红杏| 国产精品99久久久久久宅男| 久久久精品视频在线| 日本一区二区在线观看视频| 免费看农村bbwbbw高潮| 午夜免费av电影| 亚洲精品一区二区三区98年| 真实的国产乱xxxx在线91| 国产91在| 日本高清h色视频在线观看| 欧美日韩偷拍一区| 日韩av在线播放网址| 四虎影视亚洲精品国产原创优播| 国产精品一区二区久久乐夜夜嗨| 久久精品国产亚洲7777| 26uuu亚洲电影在线观看| 欧美精品中文字幕亚洲专区| 国产不卡三区| 欧美性二区| 正在播放国产一区二区| 美女直播一区二区三区| 亚洲国产精品一区在线观看| 国产日韩欧美精品一区二区 | 97人人揉人人捏人人添| 国产精品久久久久久久久久不蜜月| 日韩精品中文字幕一区| 欧美一区二区三区免费看| 91视频国产一区| www亚洲精品| 国产精品电影一区二区三区| 久久精视频| 欧美日韩一区二区三区四区五区 | 一区二区欧美视频| 日日夜夜一区二区| 国产欧美精品一区二区三区小说 | 欧美综合国产精品久久丁香| 国产清纯白嫩初高生在线观看性色| 亚洲欧美日韩视频一区| 精品999久久久| 久久久精品欧美一区二区| 亚洲一区2区三区| 午夜影院激情| 中文字幕一区二区三区乱码视频 | 91精品www| 91精品第一页| 精品久久久久久久久亚洲| 日本一区二区高清| 亚洲一区2区三区| 日韩在线一区视频| 国产目拍亚洲精品区一区| 欧美三级午夜理伦三级中视频| 欧美精品一区免费| 奇米色欧美一区二区三区| 456亚洲精品| 亚洲1区2区3区4区| 国产综合久久精品| 日韩欧美精品一区二区三区经典| 狠狠色狠狠色88综合日日91| 在线精品国产一区二区三区88 | 日韩精品一区二区久久| 国产精品乱战久久久| 精品国产乱码久久久久久虫虫| 日韩一区二区中文字幕| 国产97在线播放| 国产韩国精品一区二区三区 | 91亚洲精品国偷拍自产| 日韩av中文字幕在线免费观看| 欧美精品日韩| 国产91在线拍偷自揄拍| 国产二区不卡| 日韩精品一区二区不卡| 99视频国产在线| 一区二区三区欧美精品| 国产不卡网站| 99精品黄色| 福利电影一区二区三区| 亚洲1区在线观看| 99精品黄色| 91久久国产视频| 少妇又紧又色又爽又刺激视频网站| 欧美日韩一区电影| 欧美国产在线看| 亚洲精品久久久久一区二区| 国产1区2区视频| 国产中文字幕一区二区三区| 一级女性全黄久久生活片免费 | 中文乱码字幕永久永久电影| 国产精品免费一区二区区| 久久免费视频一区| 午夜激情影院| 国产欧美一区二区三区在线看| av国产精品毛片一区二区小说| 国产精品96久久久久久久| 欧美日韩激情在线| 97久久国产亚洲精品超碰热 | 久久精品99国产精品亚洲最刺激| 亚洲欧美另类综合| 99久久婷婷国产综合精品草原| 国偷自产中文字幕亚洲手机在线| 国产在线拍偷自揄拍视频| 91社区国产高清| 国产盗摄91精品一区二区三区| 久久亚洲精品国产一区最新章节| 欧美日韩中文字幕一区二区三区 | 亚洲码在线| 精品国产免费久久| 国产91精品一区二区麻豆亚洲| 国产一区二区在线91| 国产高清不卡一区| 国内久久久久久| 欧美日韩一区二区三区四区五区六区 | 欧美日韩国产免费观看| 国产欧美视频一区二区三区| 久99久视频| 国产一区二区伦理| 亚洲日韩aⅴ在线视频| 久久精品欧美一区二区| 国产日韩欧美精品一区二区| 亚州精品中文| 午夜社区在线观看| 99久久精品国| 日韩欧美高清一区| 亚洲精品乱码久久久久久国产主播| 精品久久久影院| 精品一区二区三区影院| 午夜国内精品a一区二区桃色| 日韩av中文字幕一区二区| 国产偷自视频区视频一区二区| 日韩午夜三级| 99爱国产精品| 国产欧美亚洲一区二区| 国产日韩一二三区| 日韩欧美国产高清91| 91麻豆精品国产91久久久久推荐资源| 国产一区www| 日韩精品久久久久久久的张开腿让| 欧美日韩国产色综合一二三四| 午夜激情在线| 欧美freesex极品少妇|