日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于XLNet的新聞文本地域提取的方法及系統有效

專利信息
申請號: 202011009623.7 申請日: 2020-09-23
公開(公告)號: CN111967267B 公開(公告)日: 2022-06-21
發明(設計)人: 童逸琦;馬濤;倪斌;汪姿如;莊福振 申請(專利權)人: 中科(廈門)數據智能研究院
主分類號: G06F40/295 分類號: G06F40/295;G06F40/289;G06F16/951;G06N3/04;G06N3/08;G06N20/00
代理公司: 廈門致群財富專利代理事務所(普通合伙) 35224 代理人: 劉兆慶
地址: 361000 福建省*** 國省代碼: 福建;35
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 xlnet 新聞 文本 地域 提取 方法 系統
【說明書】:

發明公開了一種基于XLNet的新聞文本地域提取的方法及系統,其方法包括如下步驟:S1、利用互聯網上獲取海量未標注生語料,輸入XLNet預訓練模型中進行預訓練;S2、將預處理后的數據輸入到步驟S1預訓練好的XLNet預訓練模型中進行編碼,將編碼后的隱狀態輸入到BiLSTM+CRF模型中進行識別,輸出識別后的地域實體;S3、地域實體消歧;S4、地域實體匯總;S5、地域主體補全操作;其系統包括地域實體識別模塊、實體拼接模塊、地域消歧義模塊和地域匯總模塊,地域實體識別模塊由XLNet預訓練模型和BiLSTM+CRF模型組成。本發明的二階段訓練過程克服了現有技術存在的預訓練階段和訓練階段存在使用模式不一致的問題,解決了傳統的自回歸模型無法同時學習上下文信息的痛點,實現了完整建模。

技術領域

本發明涉及計算機技術領域,特別涉及一種基于XLNet的新聞文本地域提取的方法及系統。

背景技術

新聞文本的地域屬性蘊含了新聞事件發生的地點,是對新聞事件進行統計、分析的重要參考維度,因此利用計算機實現對新聞文本地域的自動抽取,對下游任務如推薦系統、輿情分析、文本摘要等具有非常重要的推動作用。目前主流的地域提取方法包括機器學習方法和深度學習方法,這兩種方法都需要人工標注的地域實體數據集進行訓練。

BERT+BiLSTM+CRF模型就是(雙向轉換的編碼預訓練模型+雙向長短期記憶網絡+條件隨機場模型)深度學習方法中的一種,但BERT模型存在如下缺點:1、預訓練階段采用引入遮掩標記來遮掩15%的詞,但在訓練階段不含有這些被加入遮掩標記的詞,導致預訓練階段和訓練階段存在使用模式不一致的情況;2、在預訓練階段,隨機遮掩的15%詞之間是條件獨立的,不存在關聯,但自然語言的詞之間有些是存在關聯的,導致模型的性能損失,無法同時學習上下文信息;3、只能對固定長度的文本序列進行建模,而新聞文本通常是長文本序列,導致無法對其進行完整建模。

發明內容

為解決上述問題,本發明提供了一種基于XLNet的新聞文本地域提取的方法及系統。

本發明采用以下技術方案:

一種基于XLNet的新聞文本地域提取的方法,包括如下步驟:

S1、預訓練:利用爬蟲技術從互聯網上獲取海量未標注生語料,對所述未標注生語料進行去噪聲和預處理操作后,輸入XLNet預訓練模型中進行預訓練;

S2、訓練:a、在BIOES標注框架下,人工標注形成帶標簽的中文新聞文本地域語料庫用作模型訓練語料,b、對所述模型訓練語料進行通用的數據預處理流程,c、將預處理后的數據輸入到所述步驟S1預訓練好的XLNet預訓練模型中進行編碼,d、將編碼后的隱狀態輸入到BiLSTM+CRF模型中進行識別,輸出層輸出識別后的地域實體;

S3、地域實體消歧:構建省/市二級同一地名知識庫,將所述地域實體與所述知識庫進行匹配映射,進行消歧;

S4、地域實體匯總:a、統計所述地域實體的長度、在文本中出現的次數以及位置,并將這三個統計信息通過非線性變換分別轉換成人工特征,b、采用成對比較法,利用所述人工特征構建特征矩陣,c、計算所述特征矩陣的主特征向量,所述主特征向量上每一維的值對應著所述地域實體的主地域權重,d、對所述主地域權重進行歸一化指數函數操作,并按照所述主地域權重大小降序排序,僅保留前3個權重最大的地域實體;

S5、補全:利用爬蟲技術爬取中國的行政區劃信息,構建省/市/縣(區)三級的中國地域知識庫,對所述步驟S4所得的前3個權重最大的地域實體進行補全操作,所述補全操作采用最大匹配算法。

進一步地,步驟S2中的所述人工標注的方法為:B代表地域的開始,I代表地域的中間,E代表地域的結尾,S代表單個字符,O代表無關字符。

進一步地,所述步驟S2還包括:e、地域拼接:利用所述地域實體在文本中的位置,采用地域拼接算法對地域主體信息進行拼接。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科(廈門)數據智能研究院,未經中科(廈門)數據智能研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011009623.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩精品中文字幕一区二区三区 | 久久艹国产精品| 国产三级国产精品国产专区50| 大桥未久黑人强制中出| 欧美日韩精品在线播放| 黄色国产一区二区| 国产精品国产三级国产专区55| 99er热精品视频国产| 午夜剧场a级片| 好吊妞国产欧美日韩软件大全| 亚洲伊人久久影院| 久久99久国产精品黄毛片入口| 国产精品自拍在线观看| 综合国产一区| 国产免费区| 国产日韩欧美自拍| 欧美日韩一区二区三区不卡视频| 国产精品自产拍在线观看蜜| 欧美极品少妇xx高潮| 欧美极品少妇xxxxⅹ| 91国内精品白嫩初高生| 国产69精品久久久久按摩| 午夜影院伦理片| 国产一区免费在线| 国产乱人激情h在线观看| 亚洲精品国产一区| 午夜码电影| 狠狠色综合久久丁香婷婷| 国产午夜伦理片| 日本一区二区三区电影免费观看| 午夜wwww| 免费午夜在线视频| 8x8x国产一区二区三区精品推荐| 精品国产一区二区三区忘忧草| 国产麻豆精品一区二区| 亚洲国产精品二区| 欧美在线免费观看一区| 欧美色图视频一区| 国产大片黄在线观看私人影院| 97人人模人人爽人人喊38tv | 国产一区二区三区中文字幕| 国产精品高潮呻吟三区四区| 欧美日韩一区二区三区四区五区六区| 午夜看片在线| 国产欧美一区二区在线| 久久午夜精品福利一区二区 | 国产日韩欧美中文字幕| 国产精品国产三级国产专区53| 亚洲欧洲日韩av| 欧美一区二区在线不卡| 久久精品一| 日韩国产精品久久| 国产视频精品久久| 欧美一级不卡| 国产一区二区精品在线| 欧美网站一区二区三区| 亚洲欧美国产日韩综合| 精品一区二区三区影院| 久久国产欧美日韩精品| 久久久久久久久久国产精品| 欧美日韩一区电影| 欧美一区二区色| 国产精品偷伦一区二区| 欧美日韩国产一区二区三区在线观看| 色午夜影院| 午夜av资源| 亚洲精品久久久久999中文字幕| 精品国产鲁一鲁一区二区三区| 国产日韩欧美在线一区| 久久99国产综合精品| 91夜夜夜| 国产精品一区二区人人爽| 91午夜精品一区二区三区| 少妇中文字幕乱码亚洲影视| 九九国产精品视频| 国产一级一区二区三区| 97久久精品人人做人人爽| 色噜噜狠狠狠狠色综合久| 在线国产一区二区| 国产精品久久久久久久久久久杏吧| 亚洲欧美日韩另类精品一区二区三区 | 精品一区在线观看视频 | 91理论片午午伦夜理片久久 | 午夜精品一区二区三区三上悠亚| 91在线一区二区| 国产精品无码永久免费888| 国产婷婷一区二区三区久久| 狠狠躁日日躁狂躁夜夜躁av| 国产69精品久久久久777| 欧美一区二区三区久久久| 精品久久一区| 乱子伦农村| 日韩午夜三级| 久久久午夜爽爽一区二区三区三州| 国内久久精品视频| 亚洲福利视频二区| 首页亚洲欧美制服丝腿| 久久精品男人的天堂| 国产大片黄在线观看私人影院| 精品国产1区2区| 国产精品电影一区| 亚洲精品国产精品国自| 欧美精品一区二区三区四区在线| 欧美一区视频观看| 国产精品19乱码一区二区三区| 国产精品免费观看国产网曝瓜| 4399午夜理伦免费播放大全| 久久综合久久自在自线精品自| 国产精品美女www爽爽爽视频| 欧美亚洲精品suv一区| 国产一区二区视频免费在线观看 | 在线国产一区二区三区| 亚洲高清国产精品| 日本美女视频一区二区| 亚洲精品国产精品国产| 欧美精品一区久久| 日韩精品中文字幕一区二区三区| 免费看农村bbwbbw高潮| 国产精品乱综合在线| 国产一级片一区| 国产精自产拍久久久久久蜜| 国产乱人伦精品一区二区三区| 国产一区观看| 97精品久久久午夜一区二区三区| 韩漫无遮韩漫免费网址肉| 国产一区二区伦理| 欧美乱码精品一区二区| 国产欧美三区| 国产色99| 538在线一区二区精品国产| 99国产精品一区| 91超薄丝袜肉丝一区二区| 亚洲精品久久久久玩吗| 97人人澡人人爽91综合色| 97精品超碰一区二区三区| 91一区二区三区在线| 国产精品一区在线观看你懂的| 午夜精品一区二区三区三上悠亚 | 久久婷婷国产麻豆91天堂徐州| 国产日韩欧美色图| 欧洲在线一区| 丝袜诱惑一区二区三区| 欧美日韩国产色综合一二三四| 亚洲网久久| 岛国精品一区二区| 欧美性受xxxx狂喷水| 国产日韩一区二区在线| 精品一区二区三区影院| 国产在线视频二区| 国产精品伦一区二区三区级视频频| 精品中文久久| 国产精品亚发布| 亚州精品中文| 亚洲精欧美一区二区精品| 综合色婷婷一区二区亚洲欧美国产 | 国产欧美日韩综合精品一| 久久综合二区| 国产精品欧美久久| 亚洲精品主播| 免费超级乱淫视频播放| 亚洲久色影视| 亚洲在线久久| 性色av香蕉一区二区| 亚洲国产偷| 欧美精品一区久久| 亚洲国产欧美一区| 精品国产一区二| 久久久精品99久久精品36亚| 国产一区二区精品在线| 日韩av在线网址| 97香蕉久久国产超碰青草软件| 国产精品视频久久| 在线视频国产一区二区| 国产精品一级在线| 国产高清在线精品一区二区三区| 福利视频亚洲一区| 99精品国产一区二区三区麻豆| 欧美一区二三区| **毛片免费| 久久久精品久久日韩一区综合| 精品特级毛片| 97久久超碰国产精品| 香蕉av一区| 国产69精品久久久久999小说| 99国产精品久久久久| 91久久国产露脸精品国产护士| 国产www亚洲а∨天堂| 免费久久一级欧美特大黄| 国产乱对白刺激在线视频| 6080日韩午夜伦伦午夜伦| 夜夜精品视频一区二区| 国产欧美一区二区三区免费| 欧美久久一区二区三区| 国产高清在线精品一区二区三区| 久久99精品国产麻豆宅宅| 国产精品日韩一区二区三区| 国产精品美女www爽爽爽视频| 99国产精品欧美久久久久的广告| 亚洲第一天堂无码专区| 亚洲国产aⅴ精品一区二区16| 国产偷国产偷亚洲清高| 欧美一区二三区人人喊爽| 97久久精品人人做人人爽50路| 亚洲国产精品一区在线| 日韩一区二区精品| 精品国产一区二区三区高潮视 | 91精品福利观看| 精品久久国产视频| 97久久国产精品| 欧美精品在线视频观看| 国产品久精国精产拍| xxxx在线视频| 欧美亚洲视频二区| xxxx18hd护士hd护士| 久久九九国产精品| 右手影院av| 日韩av一区不卡| 欧美日韩一区二区高清| 激情久久综合| 久久人人爽爽| 国产一区二区播放| 亚洲va国产2019| 91丝袜国产在线播放| 亚洲精品456在线播放| 狠狠色噜噜狠狠狠狠2021免费| 欧美在线视频二区| 欧美一区二区精品久久911| 欧美久久久一区二区三区| 欧美日韩一区二区三区69堂| 中文字幕一二三四五区| 欧美激情图片一区二区| 久久青草欧美一区二区三区| 91久久精品在线| 午夜激情在线| 色午夜影院| 99国产精品免费| 在线国产精品一区| 久久中文一区二区| 一区二区三区日韩精品| 性欧美激情日韩精品七区| 好吊色欧美一区二区三区视频| 精品国产一区二区三区国产馆杂枝| 久久国产精久久精产国| 国产午夜精品一区理论片飘花| freexxxxxxx| 超碰97国产精品人人cao|